4.6.2 Dizaynınıza axloqiy qoidalarni o'rnatish: o'zgartirish, yaxshilash va kamaytirish

, Non-eksperimental tadqiqotlar bilan tajribalar almashtirish muolajalar yanada takomillashtirishdan, va ishtirokchilar sonini kamaytirish orqali siz tajriba insonparvarlashtirishga.

Raqamli eksperimentlarni loyihalashtirish bo'yicha taqdim etmoqchi bo'lgan maslahatning ikkinchi qismi etika bilan bog'liq. Vikipediyada barnstars bo'yicha Restivo va van de Rijt eksperimentlari shuni ko'rsatadiki, arzon narxlardagi etika tadqiqot loyihasining tobora muhim qismi bo'lib qoladi degan ma'noni anglatadi. 6-bobda tasvirlab beradigan insoniy mavzularni tadqiq qiluvchi axloqiy me'yorlardan tashqari, raqamli eksperimentlarni ishlab chiqadigan tadqiqotchilar ham axloqiy g'oyalarni turli manbalardan olishlari mumkin: hayvonlar bilan bog'liq bo'lgan eksperimentlarni boshqarish uchun ishlab chiqilgan axloqiy me'yorlar. Xususan, Insonparvarlik eksperimental texnikasi tamoyillari bo'yicha , Russell and Burch (1959) hayvonlarni o'rganishga rahbarlik qilishi kerak bo'lgan uchta printsipni taklif qildi: o'zgartirish, tozalash va kamaytirish. Men ushbu uchta R-ni ham biroz o'zgartirilgan shaklda - inson tajribalarini loyihalash uchun ishlatish mumkinligini taklif qilmoqchiman. Jumladan,

  • O'zgartirish: Tajribalarni imkon qadar kam invaziv usullar bilan almashtiring.
  • Tozalang: davolashni iloji boricha zararsiz qilish uchun yaxshilang.
  • Kamaytirish: Tajribangizdagi ishtirokchilar sonini iloji boricha kamaytiring.

Ushbu uchta Rni aniq qilish va ular qanday qilib yaxshi va insonparvarlik eksperimental dizaynga olib kelishi mumkinligini ko'rsatish uchun, men axloqiy munozaralarni yaratgan onlayn tajriba eksperimentini tasvirlayman. Keyin, men uchta R ning eksperimentni ishlab chiqishda qanday aniq va amaliy o'zgarishlarni taklif qilishini tasvirlayman.

Eng axloqiy deb hisoblangan raqamli yarim himoyachi tajribalaridan biri Adam Kramer, Jeymi Guillroy va Jeffrey Hancock (2014) tomonidan amalga oshirildi va "hissiy kontaminatsiya" deb nomlandi. Tajriba Facebookda bo'lib o'tdi va ilmiy va amaliy savollar. O'sha paytda Facebook foydalanuvchilari Facebook-da ishlaydigan eng asosiy usuli Facebook-ning do'stlari Facebook-ning ahvolini yangilashning algoritmik yangilangan to'plamidir. "Facebook" ning ba'zi tanqidchilariga ko'ra, "News Feed" asosan o'zlarining so'nggi partiyalarini ko'rsatadigan ijobiy post-do'stlardir, bu foydalanuvchilarning o'zlarini xafa qilishiga olib kelishi mumkin, chunki ularning hayotlari taqqoslaganda kamroq qiziqarli edi. Boshqa tomondan, bu ta'sir to'liq teskarisidir: do'stingiz yaxshi vaqtni ko'rsangiz sizni baxtli his etasiz. Ushbu raqobatlashadigan farazlarni muhokama qilish va do'stlarining his-tuyg'ulariga ta'sir qilishni tushunish uchun, Kramer va uning hamkasblari tajriba o'tkazishdi. Bir hafta mobaynida taxminan 700 ming foydalanuvchi to'rt guruhga joylashdi: "Negativity-Reduced" guruhi, ular uchun salbiy so'zlar (masalan, "qayg'uli") bo'lgan xabarlar tasodifiy taqiqlangan; ijobiy so'zlar (masalan, "baxtli") bo'lgan postlar tasodifiy blokirovka qilingan; va ikkita nazorat guruhi. «Salbiy» guruhini nazorat qilish guruhida postlar tasodifiy «negativlik-qisqartirilgan» guruh bilan bir xil miqdorda bloklangan, ammo hissiy jihatdan mazmunli emas edi. "Pozitivlik bilan kamaytirilgan" guruh uchun nazorat guruhi parallel ravishda qurildi. Ushbu tajriba dizayni tegishli nazorat guruhining har doim o'zgarmasligini ko'rsatmoqda. Aksincha, ba'zida nazorat guruhi tadqiqot savolini talab qiladigan aniq taqqoslashni yaratish uchun davolanadi. Barcha holatlarda, News Feed-dan bloklangan xabarlar foydalanuvchilarning Facebook veb-saytining boshqa qismlari orqali ham mavjud edi.

Kramer va uning hamkasblari pozitivlik darajasi kamaygan holatda ishtirokchilar uchun o'zlarining maqomini yangilashdagi ijobiy so'zlarning foizini kamaytirishdi va salbiy so'zlarning foizlari oshdi. Boshqa tomondan, ishtirokchilar uchun salbiy holatning kamayishi, ijobiy so'zlarning ulushi ortdi va salbiy so'zlar kamaydi (4.24-rasm). Biroq, bu ta'sirlar juda oz edi: davolash va tekshiruvlar o'rtasida ijobiy va salbiy so'zlar o'rtasidagi farq 1000 so'zdan 1 ga yaqin edi.

Shakl 4.24: hissiy yuqumli kasalliklar (Kramer, Guillory va Hancock 2014). Negativlik darajasining pastligi ishtirokchilari salbiy so'zlarni va undan ijobiy so'zlarni kamroq ishlatishdi, va pozitivlik darajasi past bo'lgan ishtirokchilar ko'proq salbiy so'zlar va kamroq ijobiy so'zlardan foydalanganlar. Barlar taxminan standart xatoni ifodalaydi. Kramer, Guillory va Hancock (2014) dan mos keladi, 1-rasm.

Shakl 4.24: hissiy yuqumli kasalliklar (Kramer, Guillory, and Hancock 2014) . Negativlik darajasining pastligi ishtirokchilari salbiy so'zlarni va undan ijobiy so'zlarni kamroq ishlatishdi, va pozitivlik darajasi past bo'lgan ishtirokchilar ko'proq salbiy so'zlar va kamroq ijobiy so'zlardan foydalanganlar. Barlar taxminan standart xatoni ifodalaydi. Kramer, Guillory, and Hancock (2014) , 1-rasm.

Ushbu eksperimentda ko'tarilgan axloqiy masalalarni muhokama qilishdan oldin, men avvalgi bobda ilgari surgan ba'zi g'oyalarni qo'llagan holda uchta ilmiy masalalarni bayon qilmoqchiman. Birinchidan, tajribaning haqiqiy tafsilotlari nazariy talablarga qanday bog'langanligi aniq emas; Boshqacha qilib aytadigan bo'lsak, qurilishning haqiqiyligi haqida savollar mavjud. Ijobiy va salbiy so'zlar, ishtirokchilarning hissiy holatining yaxshi ko'rsatkichi ekanligi aniq emas, chunki (1) odamlarning so'zlari ularning his-tuyg'ularining yaxshi ko'rsatkichi ekanligi aniq emas va (2) foydalanadigan tadqiqotchilarning his-tuyg'ularini tahlil qilish usullari ishonchli tarzda his-tuyg'ularni kuchaytiradi (Beasley and Mason 2015; Panger 2016) . Boshqacha qilib aytadigan bo'lsak, noto'g'ri signalning yomon o'lchovi bo'lishi mumkin. Ikkinchidan, eksperimentni loyihalash va tahlil qilish bizga kimning eng ta'sirlangani haqida hech qanday ma'lumot bermaydi (ya'ni, davolash effektlarining heterojenitesini tahlil qilish yo'q) va mexanizm qanday bo'lishi mumkin. Bu holatda, tadqiqotchilar ishtirokchilar haqida juda ko'p ma'lumotlarga ega edilar, ammo ular asosan analizda vidjet sifatida ko'rib chiqildi. Uchinchidan, ushbu tajribadagi ta'sir hajmi juda kichik edi; davolash va nazorat qilish shartlari o'rtasidagi farq 1,000 so'zdan 1 ga teng. Kramer va uning hamkasblari o'z maqolalarida bu o'lchamning ta'siri muhimligini ta'kidlashadi, chunki yuzlab millionlab odamlar har kuni o'zlarining Axborot Resurslariga kirishadi. Boshqacha qilib aytganda, agar ular har bir kishi uchun kichik bo'lsa ham, ular jami darajada katta. Agar siz ushbu dalilni qabul qilsangiz ham, ushbu hissiyotning ta'siri tuyg'ularning tarqalishi haqidagi umumiy ilmiy savolga nisbatan ahamiyatga ega emasmi (Prentice and Miller 1992) .

Ushbu ilmiy savollarga qo'shimcha ravishda, ushbu maqola Milliy fanlar akademiyasining jurnallarida e'lon qilinganidan bir necha kun keyin, tadqiqotchilar va matbuotdan katta norozilik yuzaga keldi (men bu tortishuvdagi bahslarni 6-bobda batafsilroq aytib beraman) ). Ushbu munozarada ko'tarilgan masalalar jurnalni axloqiy va etik tekshirish jarayoni haqidagi noyob "tashvish izhori" nashr etilishiga olib keldi (Verma 2014) .

Ruhiy tushkunlik haqidagi fonni hisobga olgan holda, men hozirgi paytda uchta Rning haqiqiy tadqiqotlar uchun aniq va amaliy yaxshilanishlarni taklif qilishi mumkinligini namoyish qilmoqchiman (ushbu tajribaning axloqiy jihatdan shaxsan o'zi haqida o'ylashingiz mumkin). Birinchi R o'rniga : tadqiqotchilar tajriba o'rnini kamroq invaziv va xavfli texnika bilan almashtirishga harakat qilishlari kerak. Misol uchun, randomizatsiyalangan nazorat ostida tajriba o'tkazishdan ko'ra, tadqiqotchilar tabiiy eksperimentdan foydalanishi mumkin edi. 2-bobda aytib o'tilganidek, tabiiy eksperimentlar dunyoda davolanishlarning tasodifiy tayinlanishiga yaqinlashadigan vaziyatlar (masalan, harbiylar kimga qo'shilishi kerakligini aniqlash uchun lotereya). Tabiiy eksperimentning axloqiy afzalligi, tadqiqotchining davolanishga muhtoj emasligi: atrofingiz siz uchun bu ishni qiladi. Misol uchun, deyarli bir vaqtda hissiy kontagi ostida tajriba bilan, Lorenzo Coviello et al. (2014) , "tabiiy hissiyot" deb nomlanishi mumkin bo'lgan narsalarni ekspluatatsiya qilish edi. Coviello va uning hamkasblari, odamlar yomg'ir yog'ayotgan kunlarda odamlar salbiy so'zlar va kamroq ijobiy so'zlarni chop etishganini aniqladilar. Shuning uchun, ob-havoda tasodifiy o'zgarishlarni qo'llash orqali, ular News Feed-da o'zgarishlarning ta'sirini hech qanday aralashuvga hojat qoldirmasdan o'rganish imkoniga ega bo'lishdi. Ob-havo ularning tajribasini boshqarayotgan edi. Amaliyotlarining detallari biroz murakkab, ammo bizning maqsadlarimiz uchun eng muhim nuqta shundaki, tabiiy tajribani qo'llash orqali Coviello va hamkasblari o'zlarining tajribalarini amalga oshirish kerakmasdan his-tuyg'ularning tarqalishi haqida bilib olishdi.

Uch lv ikkinchi takomillashtirish hisoblanadi: tadqiqotchilar imkon ularni zararsiz qilish uchun o'z muolajalar tozalamoq intilishi kerak. Misol uchun, ijobiy yoki salbiy bo'lgan kontentni to'sib qo'yishning o'rniga, tadqiqotchilar ijobiy yoki salbiy bo'lgan tarkibni kuchaytirishi mumkin edi. Ushbu takomillashtiruvchi loyiha ishtirokchilarning axborot tarqatishlarining qiziqarli tarkibini o'zgartirishi mumkin edi, ammo tanqidchilarning fikricha, tajribalar ishtirokchilarga o'zlarining yangiliklarini etkazishda muhim ma'lumotlarni qoldirib yuborishi mumkin edi. Kramer va uning hamkasblari tomonidan qo'llanilgan dizayn bilan muhim bo'lgan xabar, bu bo'lmagan narsalarni blokirovka qilish mumkin. Shu bilan birga, loyihani kuchaytirib, joyini o'zgartiradigan xabarlar kamroq ahamiyatga ega bo'ladi.

Nihoyat, uchinchi R kamayadi : tadqiqotchilar tajriba ishtirokchilarining sonini ilmiy maqsadlariga erishish uchun zarur bo'lgan minimal darajaga kamaytirishga harakat qilishlari kerak. Analog tajribalarda, bu ishtirokchilarning o'zgaruvchan xarajatlari tufayli tabiiy ravishda sodir bo'ldi. Biroq, raqamli tajribalarda, xususan, nolinchi o'zgarmaydigan xarajatlarga ega bo'lganlar, tadqiqotchilar tajriba hajmiga nisbatan iqtisodiy cheklovlarga duch kelmaydilar va bu juda katta tajribaga olib kelishi mumkin.

Misol uchun, Kramer va uning hamkasblari o'z ishtirokchilari haqida pre-davolash ma'lumotidan foydalanishlari mumkin edi. Xususan, davolash va nazorat qilish sharoitida ijobiy so'zlarning nisbatlarini solishtirish o'rniga, Kramer va uning hamkasblari ijobiy so'zlarning nisbati o'zgarishi sharoitlari o'rtasidagi farqni solishtirishlari mumkin; ba'zan aralash dizayn (4.5-rasm) deb ataladigan yondashuv va ba'zida farqlar-farqlar kestirimi deb ataladi. Ya'ni, har bir ishtirokchi uchun, tadqiqotchilar o'zgarish balini (davolashdan keyingi davolanishdan keyin \(-\) davolashdan oldin) davolash va nazorat qilish sharoitida ishtirokchilarning o'zgarish ballarini taqqoslashlari mumkin edi. Bu farklilikni farqlash yondashuvi statistik jihatdan samaraliroqdir, ya'ni tadqiqotchilar juda kichikroq namunalar yordamida bir xil statistik ishonchga ega bo'lishlari mumkin.

Xom ma'lumotlarga ega bo'lmagan holda, bu holatda farqni aniqlashning qanday samaradorligini aniqroq bilish qiyin. Biroq, biz boshqa qo'pol fikrlarni ko'rib chiqishimiz mumkin. Deng et al. (2013) , farqlar-farqlar kestiricisi shaklini qo'llash orqali, ular uch xil onlayn eksperimentda taxminan 50% gacha bahosini kamaytirishga muvaffaq bo'lishganini; Shu natijalar Xie and Aurisset (2016) tomonidan bildirilgan. Ushbu 50% o'zgaruvchanlikni qisqartirish, hissiy kontaminatsiya tadqiqotchilarining bir oz farqli tahlil usulini qo'llagan holda, ularning namunalarini yarim qismini qisqartirishga qodir bo'lishi mumkinligini bildiradi. Boshqacha qilib aytadigan bo'lsak, tahlilning kichik o'zgarishi bilan 350 ming kishi eksperimentga jalb qilingan bo'lishi mumkin.

Shu nuqtada, tadqiqotchilarning nima uchun 350.000 kishidan ortiqcha hissiy kontaminatsiya bo'lganida g'amxo'rlik qilishiga qiziqishingiz mumkin. Ko'pgina raqamli tajribalar bilan birgalikda juda ko'p miqdordagi xavotirga duch keladigan hissiy iztiroblarning ikkita o'ziga xos xususiyati mavjud: (1) eksperiment kamida ishtirokchilarga zarar keltirishi yoki yo'qligi, va (2) ishtirok etishi haqida noaniqlik mavjud. ixtiyoriy emas edi. Ushbu xususiyatlarni imkon qadar kamroq tajribaga ega bo'lishga harakat qilish oqilona ko'rinadi.

Ma'lum bo'lishicha, tajribangizning hajmini qisqartirish istagi katta, nol o'zgaruvchi iqtisodiy tajribalarni boshqarmaslik kerak degani emas. Bu sizning tajribangiz ilmiy maqsadingizga erishishingiz uchun sizdan ko'ra katta bo'lmasligi kerak. Tajribaning tegishli darajada o'lchanganligiga ishonch hosil qilishning muhim usullaridan biri - kuchni tahlil qilish (Cohen 1988) . Analog yoshda, tadqiqotchilar, odatda, ularning ishlashi juda kichik bo'lmagan (ya'ni kuchsiz) ekanligiga ishonch hosil qilish uchun kuch-quvvat tahlilini o'tkazdilar. Biroq, hozirgi vaqtda tadqiqotchilar o'zlarining tadqiqotlari juda katta emas (ya'ni, juda kuchsiz) bo'lishini ta'minlash uchun kuch tahlilini amalga oshirishi kerak.

Natijada, uchta R's-tadqiqotchilar tadqiqotchilar o'zlarining eksperimental dizaynlariga axloqiy muhitni yaratishga yordam beradigan tamoyillarni taqdim etadilar, takomillashtiradi va kamaytiradi. Albatta, ushbu hissiyotlarning har bir o'zgarishi savdo-sotiqni keltirib chiqaradi. Misol uchun, tabiiy tajribalar dalillari tasodifiy tajribalar bilan har doim toza emas va tarkibni to'ldirish kontentni blokirovkalashdan ko'ra mazmunan yanada murakkablashishi mumkin edi. Shunday qilib, ushbu o'zgarishlarni taklif qilish maqsadi boshqa tadqiqotchilarning qarorlarini ikkinchi marta taxmin qilish emas edi. Buning o'rniga, uchta R ning realistik sharoitda qanday qo'llanilishini ko'rsatish kerak edi. Darhaqiqat, savdo-sotiq masalasi tadqiqot dizayni davomida doimo rivojlanib boradi va raqamli yoshda ushbu savdo-sotiqlar tobora ko'proq axloqiy fikrlarni o'z ichiga oladi. Keyinchalik, 6-bobda, tadqiqotchilarga ushbu savdo-sotiqlarni tushunish va muhokama qilishda yordam beradigan ba'zi printsiplar va axloqiy me'yorlar taqdim etaman.