4.6.2 Az etika beillesztése a tervbe: cserélje ki, finomítsa és csökkentse

Tedd kísérlet humánusabb helyett kísérletek nem kísérleti vizsgálatok, finomítás a kezelések, és csökkenti a résztvevők száma.

A második kísérlet, amelyet a digitális kísérletek megtervezésében szeretnék ajánlani, az etikát érinti. Mint a Restivo és a van de Rijt kísérlet a barnstars a Wikipédia mutatja, a költségcsökkenés azt jelenti, hogy az etika egyre fontosabb része lesz a kutatási tervezésnek. A 6. fejezetben ismertetett humán kutatási témákkal foglalkozó etikai kereteken túl a digitális kísérleteket készítő kutatók más forrásokból származó etikai ötletekre is támaszkodhatnak: az etikai kísérleteket kifejlesztett etikai elvek alapján. Különösen a humán kísérleti technika alapelveiről szóló Russell and Burch (1959) című könyvében három olyan alapelvre tettek javaslatot, amelyek az állatkísérleteket irányítják: helyettesítik, finomítják és csökkentik. Szeretném azt javasolni, hogy a három R-t kissé módosított formában is felhasználhatjuk az emberi kísérletek tervezésének irányításához. Különösen,

  • Cserélje: Cserélje le a kísérleteket kevésbé invazív módszerekkel, ha lehetséges.
  • Szűkítés: finomítsa a kezelést, hogy minél ártalmatlan legyen.
  • Csökkentés: Csökkentse a kísérletben résztvevők számát, amennyire csak lehetséges.

Annak érdekében, hogy ezek a három R beton legyenek és megmutassák, hogyan tudnak jobb és humánusabb kísérleti tervezéshez vezetni, leírom egy online kísérletet, amely etikus vitát eredményezett. Aztán elmondom, hogy a három R konkrét és gyakorlati változtatásokat javasol a kísérlet kialakításában.

Az egyik legtanulmányozottabb digitális térbeli kísérletet Adam Kramer, Jamie Guillroy és Jeffrey Hancock (2014) vezette, és emlegetett fertőzésnek hívták. A kísérlet a Facebookon zajlott, és a tudományos és a tudományos gyakorlati kérdések. Abban az időben a Facebookhoz való kapcsolódás domináns módja a Facebook hírcsatornáinak algoritmikusan szerkesztett Facebook állapotfrissítése. A Facebook néhány kritikusa azt javasolta, hogy mivel a News Feed leginkább pozitív posztokat - barátait mutatja be a legfrissebb pártjukról - ez a felhasználók számára szomorúságot okozhat, mivel életük kevésbé izgalmasnak tűnt összehasonlítva. Másrészt talán épp ellenkezőleg a hatás: talán látni fogja, hogy a barátod jól érezze magát, boldoggá válik. Annak érdekében, hogy ezeket a versengő hipotéziseket kezeljük -, és hogy továbbfejlesszük annak a megértését, hogy egy személy érzelmeit hogyan befolyásolja barátai érzelmei - Kramer és munkatársai kísérletet végeztek. Egy hétig mintegy 700 000 felhasználót csoportosítottak négy csoportba: egy "negativitáscsökkentett" csoport, akinek a negatív szavakkal (pl. "Szomorú") lévő hozzászólásokat véletlenszerűen blokkolták a hírforrásban; egy "pozitivitáscsökkentett" csoport, akinek a pozitív szavakkal (pl. "boldog") álló hozzászólásokat véletlenszerűen blokkolták; és két kontrollcsoportot. A "negativitáscsökkentett" csoport kontrollcsoportjában a posztokat véletlenszerűen blokkolták ugyanolyan sebességgel, mint a "negativitáscsökkentett" csoportot, de az érzelmi tartalmat tekintet nélkül. A "pozitivitáscsökkentő" csoport kontroll csoportját párhuzamosan állítottuk össze. Ennek a kísérletnek a megtervezése azt mutatja, hogy a megfelelő kontrollcsoport nem mindig változatlan. Inkább néha a kontrollcsoport kezeléseket kap a pontos kutatási kérdés megteremtése érdekében. Minden esetben a hírcsatorna blokkolt bejegyzései továbbra is a felhasználók rendelkezésére álltak a Facebook honlap más részein keresztül.

Kramer és munkatársai azt találták, hogy a pozitivitáscsökkentő állapotban lévő résztvevőknél a status-frissítések pozitív szavainak százalékos aránya csökkent, és a negatív szavak aránya nőtt. Másrészt a negativitást csökkentett állapotban lévő résztvevők esetében a pozitív szavak aránya nőtt, a negatív szavak pedig csökkentek (4.24. Ábra). Azonban ezek a hatások meglehetősen kicsiek voltak: a kezelések és kontrollok között a pozitív és a negatív szó közötti különbség 1000 bejegyzésből állt.

4.24. Ábra: Érzelmi fertőzés bizonyítéka (Kramer, Guillory és Hancock, 2014). A negativitást csökkentett állapotban résztvevők kevésbé negatív szavakat és pozitívabb szavakat használtak, és a pozitivitás csökkentett állapotban résztvevők több negatív szót és kevesebb pozitív szót használtak. A bárok becsült standard hibákat jeleznek. Kramer, Guillory és Hancock (2014), 1. ábra.

4.24. Ábra: Érzelmi fertőzés bizonyítéka (Kramer, Guillory, and Hancock 2014) . A negativitást csökkentett állapotban résztvevők kevésbé negatív szavakat és pozitívabb szavakat használtak, és a pozitivitás csökkentett állapotban résztvevők több negatív szót és kevesebb pozitív szót használtak. A bárok becsült standard hibákat jeleznek. Kramer, Guillory, and Hancock (2014) , 1. ábra.

Mielőtt megbeszélnék a kísérlet által felvetett etikai kérdéseket, három tudományos kérdést szeretnék leírni a fejezet korábbi részei közül néhányat felhasználva. Először is nem világos, hogy a kísérlet tényleges részletei hogyan kapcsolódnak az elméleti igényekhez; más szavakkal, vannak kérdések a konstrukciós érvényességgel kapcsolatban. Nem egyértelmű, hogy a pozitív és negatív szóösszegek valójában a résztvevők érzelmi állapotának jó indikátora, mert (1) nem világos, hogy az emberek által küldött szavak jó érzelmek az érzelmeiknek és (2) nem hogy a kutatók által használt érzelem-elemzési technika megbízhatóan befolyásolja az érzelmeket (Beasley and Mason 2015; Panger 2016) . Más szóval, az elővigyázatos jel rossz lehet. Másodszor, a kísérlet megtervezése és elemzése nem mond le semmit arról, hogy ki volt a leginkább érintett (azaz nincs a kezelés hatásainak heterogenitása), és mi lehet a mechanizmus. Ebben az esetben a kutatók rengeteg információval rendelkeztek a résztvevőkről, de lényegében elemzésként kezelték őket. Harmadszor, a hatás mérete ebben a kísérletben nagyon kicsi; a kezelés és az ellenőrzési viszonyok közötti különbség 1000 szóból áll. A könyvében Kramer és munkatársai azt állítják, hogy ennek a méretnek a hatása azért fontos, mert több száz millió ember fér hozzá napi hírforrásukhoz. Más szavakkal, azzal érvelnek, hogy még ha a hatások is kicsiek minden egyes ember számára, ezek összességében nagyok. Még ha el is fogadja ezt az érvet, még mindig nem világos, hogy ez a mérethatás fontos-e az általánosabb tudományos kérdéssel kapcsolatban az érzelmek elterjedésével kapcsolatban (Prentice and Miller 1992) .

Ezen tudományos kérdések mellett néhány nappal azután, hogy ezt a cikket közzétették az Országos Tudományos Akadémia című folyóiratban , hatalmas felháborodást jelentett mind a kutatók, mind a sajtó iránt (a vita részleteit részletesen ismertetem a 6. fejezetben ). A vitában felvetett kérdések miatt a folyóirat ritka "szerkesztői aggodalomra ad okot" (Verma 2014) meg a kutatás etikájáról és etikai felülvizsgálatáról (Verma 2014) .

Tekintettel arra, hogy az Emocional Contagion háttere, most szeretném megmutatni, hogy a három R konkrét, gyakorlati fejlesztéseket javasolhat a valódi tanulmányokhoz (függetlenül attól, hogy az adott kísérlet etikájáról személyesen gondolkodik). Az első R helyettesítés : a kutatóknak lehetőségük van arra, hogy a kísérleteket kevésbé invazív és kockázatos technikákkal helyettesítsék. Például, ahelyett, hogy randomizált, kontrollált kísérletet vezetne be, a kutatók kihasználhatnák a természetes kísérletet . A 2. fejezetben leírtak szerint a természetes kísérletek olyan helyzetek, amikor valami történik a világon, amely megközelíti a kezelések véletlenszerű hozzárendelését (pl. Lottó, hogy eldöntsék, ki lesz a katonaságra tervezve). A természetes kísérlet etikai előnye, hogy a kutatónak nem kell kezelnie a kezeléseket: a környezet ezt teszi az Ön számára. Például, szinte az Emotional Contagion kísérletével párhuzamosan Lorenzo Coviello et al. (2014) kihasználta az Emotional Contagion természetes kísérletnek nevezhető módszert. Coviello és munkatársai azt fedezték fel, hogy az emberek több negatív szót és kevesebb pozitív szót szednek napokon, amikor esik. Ezért az időjárásban bekövetkező véletlenszerű változások segítségével képesek voltak megvizsgálni a Hírcsatornában bekövetkező változások hatását anélkül, hogy beavatkoznának. Olyan volt, mintha az időjárás kísérgetett volna nekik. Az eljárásuk részlete egy kicsit bonyolult, de itt a legfontosabb célunk, hogy természetes kísérlet segítségével Coviello és munkatársai képesek voltak megismerni az érzelmek terjedését, anélkül, hogy saját kísérletüket kellene végrehajtaniuk.

A három R-közül a második finomítja : a kutatóknak törekedniük kell a kezelésük finomítására, hogy ártalmatlanná tegyék őket. Például, ahelyett, hogy blokkolná a pozitív vagy negatív tartalmat, a kutatók pozitív vagy negatív tartalmat növelhetnek. Ez a felgyorsító terv megváltoztatta volna a résztvevők hírszöveteinek érzelmi tartalmát, de a kritikusok egyik aggályával foglalkozott volna: a kísérletek miatt a résztvevők a hírforrásban fontos információkat tudtak elszalasztani. A Kramer és munkatársai által használt terv szerint a fontos üzenet olyan valószínűséggel blokkolódik, mint amely nem létezik. Azonban a feljavító tervek szerint az eltávolítandó üzenetek azok, amelyek kevésbé fontosak.

Végül a harmadik R csökkent : a kutatóknak arra kell törekedniük, hogy a kísérletben résztvevők számát a tudományos cél eléréséhez szükséges minimálisra csökkentsék. Az analóg kísérletekben ez természetesen a résztvevők magas változó költségei miatt következett be. De a digitális kísérletekben, különösen a nulla változó költségűeknél, a kutatóknak nem kell szembesülniük a kísérletük méretével kapcsolatos költségkorláttal, és ez szükségtelenül nagy kísérletekhez vezethet.

Például Kramer és munkatársai felhasználhattak előkezelési információkat a résztvevőkről - például az előkezelés utáni viselkedésre -, hogy elemzésüket hatékonyabbá tegyék. Pontosabban, a pozitív szavak arányának összehasonlítása a kezelési és kontroll körülmények között, Kramer és munkatársai összehasonlíthatják a pozitív szavak arányának változását a feltételek között; olyan megközelítést, amelyet néha vegyes tervezésnek neveznek (4.5. ábra), és néha differenciál-különbségek becslõnek nevezik. Ez azt jelenti, hogy a kutatók minden egyes résztvevő számára létrehozhattak egy változási pontszámot (utókezelési magatartás \(-\) előkezelési viselkedés), majd összehasonlították a résztvevők változási pontszámát a kezelés és az ellenőrzési körülmények között. Ez a differenciál-különbség megközelítés statisztikailag hatékonyabb, ami azt jelenti, hogy a kutatók ugyanazt a statisztikai megbízhatóságot érhetik el sokkal kisebb minták felhasználásával.

A nyers adatok nélkül nehéz pontosan tudni, hogy mennyivel hatékonyabb lenne a különbség-különbségek becslése ebben az esetben. De más hasonló kísérleteket is megvizsgálhatunk egy durva ötletért. Deng et al. (2013) számolt be arról, hogy a különbség-különbségek becslõjének egy formáját használva képesek becsléseik varianciájára körülbelül háromszor különbözõ online kísérletekben kb. 50% -kal csökkenteni; hasonló eredményeket jelentettek Xie and Aurisset (2016) . Ez az 50% -os varianciacsökkentés azt jelenti, hogy az Emotional Contagion kutatók képesek lettek volna a minták felére csökkenteni a mintát, ha kicsit más elemzési módszert alkalmaztak. Más szóval, az elemzés apró változtatásával 350 000 embert lehetett volna megtakarítani a kísérletben való részvételben.

Ezen a ponton kíváncsiak lehetnek arra, hogy a kutatók miért törődjenek azzal, ha 350.000 ember szükségtelenül érzelmi fertőzésben van. Az Emotional Contagion két sajátossága van, amelyek a túlzott méretű problémát érintik, és ezeket a jellemzőket számos digitális mező-kísérlet osztja meg: (1) bizonytalanság áll fenn arról, hogy a kísérlet legalább néhány résztvevőt károsít-e, és (2) nem volt önként. Úgy tűnik, ésszerűnek kell tartani olyan kísérleteket, amelyeknek ezek a tulajdonságai a lehető legkisebbek.

Nyilvánvaló, hogy a kísérlet méretének csökkentése nem jelenti azt, hogy nem kellene nagy, nulla változó költségű kísérleteket végrehajtania. Ez csak azt jelenti, hogy a kísérletek nem lehetnek nagyobbak, mint a tudományos cél eléréséhez. Egy fontos módszer annak biztosítására, hogy egy kísérlet megfelelő méretű legyen, teljesítményelemzést végez (Cohen 1988) . Az analóg korban a kutatók általában teljesítményelemzést végeztek annak biztosítására, hogy tanulmányaik ne legyenek túl kicsiek (azaz alul-táplált). Most azonban a kutatóknak teljesítményelemzést kell végezniük annak biztosítására, hogy tanulmányaik ne legyenek túlságosan nagyok (pl. Túlzott teljesítmény).

Összefoglalva, a három R's-replace, refine, and reduce-provides olyan alapelveket, amelyek segíthetnek a kutatóknak az etika kialakításában a kísérleti tervekben. Természetesen az Emotional Contagion mindezen lehetséges változásai kompromisszumokat vezetnek be. Például a természetes kísérletekből származó bizonyítékok nem mindig olyan tisztaek, mint a randomizált kísérletekből, és a tartalom növelése logisztikailag nehezebb megvalósítani, mint a tartalom blokkolását. Tehát a változtatásokra való utalás célja nem más, más kutatók döntéseinek feltárása volt. Inkább azt illusztrálta, hogyan lehet a három R-et alkalmazni egy reális helyzetben. Tény, hogy a kompromisszumok kérdése mindig a kutatási tervezés során jön létre, és a digitális korszakban ezek a kompromisszumok egyre inkább etikai megfontolásokkal járnak. Később a 6. fejezetben olyan alapelveket és etikai kereteket fogalmazok meg, amelyek segíthetnek a kutatóknak megérteni és megvitatni ezeket a kompromisszumokat.