4.6.2 енгізіңіз: ауыстырыңыз, тазартыңыз және азайтыңыз

Емес-эксперименттік зерттеулер эксперименттер ауыстыру емдеу нақтылау, сондай-ақ қатысушылардың санын қысқарту арқылы эксперимент көп адамгершілік жеткізіңіз.

Сандық эксперименттерді жобалау туралы ұсынатын екінші кеңестің этикасы туралы. Уикипедиядағы Barnstars арналған Restivo және van de Rijt эксперименттері көрсеткендей, шығындар төмендейді, этика зерттеу жобасының маңызды бөлігі болып табылады. 6-тарауда суреттейтін адамдық тақырыпты зерттеуге бағытталған этикалық шеңберлерден басқа, цифрлы эксперименттерді құрастырған зерттеушілер этикалық идеяларды басқа көзден де шығара алады: жануарлармен тәжірибе жүргізуге арналған этикалық қағидалар. Атап айтқанда, гуманистік тәжірибе техникасының принциптері Russell and Burch (1959) жануарларды зерттеуге бағыттайтын үш қағидатты ұсынды: ауыстыру, тазалау және азайту. Мен осы үш R-ны адам түріндегі эксперименттердің дизайнын жүргізу үшін - сәл өзгертілген түрінде де пайдалануға болады деп ұсынғым келеді. Сондай-ақ,

  • Ауыстыру: Мүмкін болса, аз инвазивті әдістермен эксперименттерді ауыстырыңыз.
  • Тазалау: емдеуді мүмкіндігінше зиянсыз ету үшін тазалаңыз.
  • Кішірейту: тәжірибеңіздегі қатысушылардың санын мүмкіндігінше азайту.

Бұл үш Р-ны нақты жасау және олар әлдеқайда жақсы және гуманистік экспериментальды дизайнға қалай жетуге болатынын көрсету үшін, мен этикалық пікірталас тудыратын онлайн-өріс экспериментін суреттеймін. Содан кейін, мен үш R эксперимент жобалау нақты және практикалық өзгерістер қалай ұсынамын сипаттаңыз.

Ең әдептілікпен талқыланған цифрлық далалық эксперименттердің бірі Adam Kramer, Джейми Гиллру және Джеффри Хэнкок (2014) өткізген және «Эмоционалдық шалдығу» деп аталды. Эксперимент Facebook-да өтті және ғылыми және практикалық сұрақтар. Пайдаланушылардың Facebook-пен өзара әрекеттесуінің басымдықтары Facebook-дегі достардың Facebook-дағы күй жаңартуларының жаңартылған алгоритмдер жиынтығы болды. Facebook-тің кейбір сыншыларының пікірінше, News Feed-те көбінесе жағымды пост-достар өздерінің соңғы партияларын көрсетіп отырады - бұл пайдаланушыларға қайғылы жағдай тудыруы мүмкін, өйткені олардың өмірі өмірге қарағанда салыстырмалы түрде қызықты емес. Екінші жағынан, әсері мүлдем керісінше: мүмкін, досыңыздың жақсы уақытты көріп, сізді бақытты сезінуі мүмкін. Осы бәсекелес гипотезаларды шешу үшін және оның эмоциясының адамның эмоцияларына қалай әсер ететінін түсіну үшін - Крамер мен әріптестер эксперимент жүргізді. Олар бір аптада төрт топқа 700 000-ға жуық пайдаланушыны орналастырды: «жағымсыз» топқа, олар үшін теріс сөздермен (мысалы, «қайғылы») хабарлар «News Feed» -те пайда болған кезде кездейсоқ бұғатталған; оң сөздермен (мысалы, «бақытты») посттаздықпен қысқартылған «позитивтілік» тобы кездейсоқ бітелді; және екі бақылау тобы. «Неліктен азайтылған» топ үшін бақылау тобында посттар «теріс-азайтылған» топпен қатар, бірақ эмоциялық мазмұнға қарамастан, кездейсоқ бұғатталған. «Позитивтіліктің төмендеуі» тобының бақылау тобы параллельді түрде жасалды. Бұл эксперименттің құрастырылуы тиісті бақылау тобы әрқашан өзгеріссіз болатындығын көрсетеді. Қайта, кейде бақылау тобы зерттеу сұрағын қажет ететін нақты салыстыруды жасау үшін ем алады. Барлық жағдайларда Жаңалықтар арнасынан бөгелген хабарламалар Facebook веб-сайтының басқа бөліктері арқылы пайдаланушыларға қол жетімді болды.

Крамер және әріптестер позитивтіліктің төмендеуіне қатысушылардың өздерінің мәртебесін жаңартқан оң сөздердің пайызы азайғанын және теріс сөздер пайызының артуын анықтады. Екінші жағынан, қатысушыларға жағымсыздықты төмендету шарты бойынша жағымды сөздердің пайызы көбейіп, теріс сөздер азайды (4.24-сурет). Алайда, бұл әсерлер өте аз болды: емдеу мен бақылау арасындағы оң және теріс сөздер арасындағы айырма 1000 сөзден шамамен 1 болды.

4.24-сурет: эмоционалдық инфекциялардың анықтамасы (Kramer, Guillory, and Hancock 2014). Қатерлі іс-әрекеттерге қатысқандар теріс сөздерді және әлдеқайда оң сөздерді пайдаланып, позитивті төмендетілген жағдайға қатысушылардың көп теріс сөздерді қолданып, оң сөздерді аз пайдаланды. Барлар есептелген стандартты қателерді білдіреді. Kramer, Guillory және Hancock (2014) бейнелеріне сай, 1-сурет.

4.24-сурет: эмоционалдық инфекциялардың анықтамасы (Kramer, Guillory, and Hancock 2014) . Қатерлі іс-әрекеттерге қатысқандар теріс сөздерді және әлдеқайда оң сөздерді пайдаланып, позитивті төмендетілген жағдайға қатысушылардың көп теріс сөздерді қолданып, оң сөздерді аз пайдаланды. Барлар есептелген стандартты қателерді білдіреді. Kramer, Guillory, and Hancock (2014) бейнелеріне сай, 1-сурет.

Осы экспериментте көтерілген этикалық мәселелерді талқыламас бұрын, мен осы үш тарауды бұрынғы тараудағы кейбір идеяларды қолдана отырып, үш ғылыми мәселені сипаттағым келеді. Біріншіден, эксперимент нақты бөлшектері теориялық талаптарды қалай байланыстырады; басқаша айтқанда, жарамдылықтың құрылысы туралы сұрақтар бар. Оң және теріс сөздерді санау қатысушылардың эмоционалдық жағдайының жақсы көрсеткіші болып табылмайтындығы анық емес, себебі: (1) адамдардың айтқан сөздерінің эмоциялардың жақсы көрсеткіші екені анық емес және (2) пайдаланылған зерттеушілердің эмоцияларды сенімді жеткізуге қабілетті (Beasley and Mason 2015; Panger 2016) нақты көңіл-күйді талдау әдісін (Beasley and Mason 2015; Panger 2016) . Басқаша айтқанда, бұрмаланған сигналдың нашар шарасы болуы мүмкін. Екіншіден, эксперименттің дизайны мен талдауы бізге кімге әсер еткендігі туралы ештеңе айтпайды (яғни емдеу әсерінің біркелкілігін талдау жоқ) және механизм қандай болуы мүмкін. Бұл жағдайда зерттеушілер қатысушылар туралы көп ақпарат алды, бірақ олар талдау кезінде виджеттер ретінде қарастырылды. Үшіншіден, осы эксперименттегі әсер мөлшері өте аз болды; емдеу және бақылау шарттары арасындағы айырмашылық шамамен 1000 сөзден 1-ге тең. Өз жұмыстарында Крамер мен әріптестер бұл өлшемнің әсері маңызды екендігін дәлелдейді, себебі жүздеген миллион адам әр күн сайын өзінің жаңалықтар арнасына кіреді. Басқаша айтқанда, олар әр адамға әсер етуі мүмкін болса да, олар жиынтықта үлкен. Егер сіз осы дәлелді қабылдасаңыз да, эмоциялардың таралуы туралы жалпыға ортақ ғылыми сұрақ бойынша осы өлшемнің әсері маңызды екенін анықтау әлі анық емес (Prentice and Miller 1992) .

Осы ғылыми мәселелермен қатар, осы мақала Ұлттық Ғылымдар Академиясының материалдарында жарияланғаннан бірнеше күн өткен соң, зерттеушілер мен баспасөзден үлкен дау болды (осы пікірталастағы дәлелдерді 6-тарауда егжей-тегжейлі сипаттаңыз) ). Бұл пікірталаста туындаған мәселелер журналды этика және зерттеуге арналған этикалық шолу үдерісі туралы сирек кездесетін «алаңдаушылықтың редакциялық көрінісін» жариялады (Verma 2014) .

Эмоционалдық аурулар туралы фонды жасайтын болсақ, мен бүгінгі таңда үш R нақты зерттеулерге нақты және практикалық жетілдірулерді ұсына алатындығын (бұл эксперименттің этикасы туралы жеке ойлауыңызға қарамастан) ұсына аламын. Бірінші R алмастырады : зерттеушілер эксперименттерді мүмкіндігінше аз инвазивті және қауіпті әдістермен алмастыруға тырысуы керек. Мысалы, рандомизирленген бақыланатын эксперимент жүргізудің орнына, зерттеушілер табиғи экспериментті пайдалана алар еді. 2-тарауда сипатталғандай, табиғи эксперименттер - әлемде қандайда бір жағдай орын алса, емдеудің кездейсоқ тағайындалуына жақындаған жағдайлар (мысалы, әскери қызметке кімнің дайындалатынын анықтау үшін лотерея). Табиғи эксперименттің этикалық артықшылығы - зерттеуші емдеуді қажет етпейді: қоршаған орта сіз үшін бұл. Мысалы, эмоционалды контаминация экспериментімен дерлік бір мезгілде, Lorenzo Coviello et al. (2014) «Эмоционалдық аурулар» атты табиғи эксперимент деп аталуы мүмкін. Ковиелло мен әріптестердің айтуынша, адамдар жаңбыр жаудыратын күндерде адамдар теріс сөздер жасайды және оң сөздерді аз дейді. Сондықтан ауа-райының кездейсоқ түрленуін пайдаланып, олар News Feed-дегі өзгерістердің әсерін мүлде араласпастан зерттей білді. Ауа-райы олар үшін эксперимент жүргізгендей болды. Олардың рәсімдерінің егжей-тегжейі күрделі, бірақ біздің мақсатымыз үшін ең бастысы - табиғи эксперимент жүргізу арқылы Coviello мен әріптестері эмоциялардың таралуы туралы өздерінің эксперименттерін жүргізу қажеттілігінсіз біле алды.

Үш R-ның екіншісі нақтыланады : зерттеушілер оларды емдеу мүмкіндігін барынша зиянсыз ету үшін тазартуға тырысуы керек. Мысалы, оң немесе теріс болатын мазмұнды блоктаудың орнына, зерттеушілер оң немесе теріс болатын мазмұнды арттыра алар еді. Бұл ынталандырушы дизайн қатысушылардың жаңалықтар арнасының эмоционалдық мазмұнын өзгерткен болар еді, бірақ сыншылардың пікірінше, эксперименттер қатысушыларға өздерінің жаңалықтар арнасындағы маңызды ақпаратты жіберіп жіберуі мүмкін еді. Крамер мен әріптестердің пайдаланған дизайнымен маңызды болып табылатын хабарлама, бәлкім, жоқ сияқты бұғатталуы мүмкін. Дегенмен, күшейе түсетін дизайнмен ауыстырылған хабарлар кем маңызды болып табылады.

Соңында, үшінші R төмендейді : зерттеушілер эксперимент қатысушыларының санын олардың ғылыми мақсаттарына қол жеткізу үшін қажетті ең төменгі деңгейге дейін азайтуға тырысуы керек. Аналогтық эксперименттерде бұл, әрине, қатысушылардың жоғары айнымалы шығындарына байланысты болды. Бірақ сандық эксперименттерде, әсіресе нөлдік айнымалы құны барлар, зерттеушілер эксперимент мөлшеріне шығындардың өзіндік шектеулеріне тап болмайды және бұл қажетсіз үлкен эксперименттерге әкелуі мүмкін.

Мысалы, Крамер және оның әріптестері өздерінің қатысушылары туралы алдын ала емдеу туралы ақпаратты, мысалы, алдын-ала емдеудің мінез-құлқы туралы, оларды талдауды тиімдірек ету үшін пайдалана алады. Нақтырақ айтқанда, орнына емдеу және бақылау жағдайында оң сөздер үлесін салыстыру қарағанда, Крамер мен әріптестер жағдайлары арасындағы оң сөздер үлесінің өзгеруі салыстырғанда еді; кейде аралас дизайн деп аталады (4.5-сурет), кейде айырмашылықты айырмашылық бағалау деп атайды. Яғни, әрбір қатысушы үшін зерттеу бағасының өзгеруі (емдеуден кейінгі мінез-құлықтың \(-\) алдын-ала емделу тәртібі) жасалуы мүмкін және емдеу және бақылау жағдайындағы қатысушылардың өзгерістерін салыстырады. Бұл айырмашылықтың айырмашылықтары статистикалық тұрғыдан тиімдірек, яғни зерттеушілер әлдеқайда аз үлгілерді пайдалана отырып, бірдей статистикалық сенімді қол жеткізе алады.

Шикізат деректерінсіз, бұл жағдайда айырмашылықты бағалаудың қаншалықты тиімді екендігін дәл білу қиын. Бірақ біз қателесу идеясына байланысты басқа да эксперименттерді қарастыра аламыз. Deng et al. (2013) Айырмашылықты бағалаушы бағалау әдісін қолдана отырып, олар үш түрлі онлайн эксперименттерде олардың бағалауларының дисперсиясын шамамен 50% -ға азайта алатындығын хабарлады; ұқсас нәтижелерді Xie and Aurisset (2016) . Бұл 50% дистилляцияның төмендеуі Эмоционалдық аурулардың зерттеушілері басқа үлгідегі талдау әдісін пайдаланған жағдайда, сыныбын жартысына дейін қысқарта алатынын білдіреді. Басқаша айтқанда, талдаудың кішкене өзгерісімен 350 мың адам экспериментке қатыса алмады.

Осы сәтте зерттеушілерге не себепті 350,000 адам эмоционалдық көмекке мұқтаж болғаны туралы қамқорлық жасау керек деп ойлайтын шығарсыз. Эмоционалдық аурулардың екі ерекше ерекшелігі бар, олар өте үлкен мөлшерге сәйкес келеді және бұл мүмкіндіктер көптеген сандық далалық эксперименттермен бөліседі: (1) тәжірибе кем дегенде кейбір қатысушыларға зиян келтіре ме, және (2) қатысуға қатысты белгісіздік бар ма? ерікті емес еді. Бұл мүмкіндіктері бар эксперименттерді мүмкіндігінше аз ұстауға тырысқан жөн.

Әрине, эксперименттің көлемін азайту ниеті үлкен, нөлдік айнымалы құнды эксперименттерді іске қоспайсыз дегенді білдірмейді. Бұл жай ғана сіздің эксперименттеріңіз ғылыми мақсаттарға жету үшін сізге қарағанда үлкен болмауы керек дегенді білдіреді. Эксперименттің тиісті мөлшерде болуын қамтамасыз етудің маңызды тәсілдерінің бірі - қуат талдауын жүргізу (Cohen 1988) . Аналогтық жастағы зерттеушілер, әдетте, олардың зерттеулері тым кішкентай болғанына көз жеткізу үшін күш сараптамасын жасады (яғни қуатсыз). Алайда, қазір зерттеушілер зерттеудің тым үлкен емес екенін (мысалы, артық жұмыс істейтін) қамтамасыз ету үшін қуат талдауларын жасауы керек.

Қорытындылай келе, үш R's-зерттеушілердің этиканы экспериментальды дизайнына салуға көмектесетін принциптерді өзгерту, тазалау және азайту. Әрине, бұл Эмоционалдық ауытқуларға ықтимал өзгерістердің әрқайсысы сауда-саттықты енгізеді. Мысалы, табиғи эксперименттерден алынған дәлелдер әрдайым рандомизацияланған эксперименттерден соншалықты таза емес және мазмұнын жоғарылату мазмұнды блоктаудан гөрі логистикалық тұрғыдан қиынырақ болуы мүмкін. Осылайша, бұл өзгерістерді ұсынудың мақсаты басқа зерттеушілердің шешімдерін екінші рет ойлап табу емес. Керісінше, үш R-ның нақты жағдайға қалай қолданылатынын көрсету керек еді. Шын мәнісінде, сауда-саттық мәселесі зерттеу жобасында үнемі пайда болады, және сандық жастағы бұл сауда-саттықтар этикалық ойларға барынша тартылатын болады. Кейінірек, 6-тарауда мен зерттеушілерге осы сауда-саттықты түсінуге және талқылауға көмектесетін кейбір принциптер мен этикалық шеңберлерді ұсынамын.