4.6.2 jî Replace, sînordar bike, û kêm

Make ezmûna xwe însanî û li şûna tecrûbeyên bi xebatên ne-experimental, neqandina li treatments, û kêmkirina hejmara beşdaran.

The piece duyemîn şîretên ku ez dixwazim li ser dîzaynê tecrûbeyên dîjîtal bikin û fikarên etîka. Ji ber ku ezmûna Restivo û van de Rijt li ser barnstars Di Wîkîpediya de nîşan dide, kêm mesrefên wê wateyê ku etîka bibe beşekî diçe giring yên design lêkolîn. prensîpên exlaqî pêş ji bo rêberiya tecrûbeyên tevlêkirina heywanên: ji bilî çarçoveyên etîk rêberî lêkolîn mijarên mirovan ku ez ê li Chapter 6 salix de, lêkolînerên dîzaynkirina tecrûbeyên dîjîtal jî dikare li ser ramanên exlaqî ji çavkaniya cuda bikişînim. Bi taybetî jî, li prensîp, pirtûka xwe ya Technique Experimental .Zanîngeha, Russell and Burch (1959) jî Replace, sînordar bike, û kêm: sê rêgezên ku divê lêkolîn animal rêberiya pêşniyar. Ez dixwazim ji bo pêşniyar dikin ku ev sê R jî dikarin bi kar-in bê piçekî de hate guherandin form-ku pêkve design ji tecrûbeyên mirovan. Gelek rindik,

  • Replace: Replace tecrûbeyên bi rêbazên kêmtir, darîçav, heke gengaz be
  • Sînordar bike: Dîsa ji tedawiya ji bo ku ew wek, wekî gengaz
  • Kêmkirina: kêmkirina hejmara beşdaran li ezmûna xwe bi qasî ku pêkan

Ji bo ku bi beton van sê R û nîşan bide çawa ew potansiyel dikare bi design experimental baştir û însanî rê, ez ê tiştekî biceribînin warê bike ku nîqaşên exlaqî bi giştî salix. Hingê ez ê, çawa sê R ya pêşniyaz guherînên berbiçav û pratîk ji bo sêwirandina ceribandinê.

Yek ji tecrûbeyên qada digital herî exlaqî de nîqaş "rîska Emotional," ku ji aliyê Adem Kramer, Jamie Gillroy, û Jeffrey Hancock pêk hat e (2014) . Ezmûna cihê on Facebook bûn û ji aliyê mix of pirsên zanistî û pratîk de sextekarî kirin. Di wê demê de, di rê de serdest ku bikarhênerên bi Facebook dawi li News Feed, an set algorithmically Seyîdvan ji updates status Facebook ji hevalên Facebookê a user bû. Hinek rexne li Facebook pêşniyar kiribû ku ji ber ku News Feed de heye bi piranî erênî posts-hevalên nîşandana off dawî xwe party-dikare çewtiyan bikarhênerên bi xemgînî ji ber ku jiyana wan xuya li gorî kêmtir heyecan. Li aliyê din, dibe ku bandora tam berevajiyê vê ye; belkî dît hevalê xwe ku demeke baş ê ku we hest happy? Ji bo çareserkirina van de beşdar hîpoteza-û ji bo têgihîştina me ya çawa hestên mirov, bi destê hevalên wê 'jî tê jiyîn hestên-Kramer û hevalên bezî ceribandina. komeke "negatîf kêmkirin", ji bo ku peyamên bi gotinên neyînî (wek nimûne, bi xemgînî) bi korfelaqî ji bo xatirê News Feed de asteng bûn;: di lêkolînên li ser 700.000 bikarhênerên nav çar koman ji bo hefteyekê danîn a "positivity kêm" komeke ji bo ku peyamên bi gotinên erênî (wek nimûne, happy) korfelaqî asteng kirin; û du komên kontrolê. Di pula kontrolê ya ji bo "negatîf kêm" komeke, posts bi korfelaqî li rêjeya eynî wek "negatîf kêm" komeke lê bê ji bo naveroka hest asteng kirin. Koma kontrol ji bo "positivity kêm" komeke di fashion paralel hatibû avakirin. The design ji vê ezmûna h'ejmara ku koma kontrol guncaw e her tim yek bi ti guhartinên ne. Lê belê, carinan koma kontrola a tedawiyê de ji bo berhevdana teqez a question lêkolîn pêwîstiya qebûl dike. Di hemû rewşan de, peyamên ku ji News Feed de asteng bûn, hê jî ji bo bikarhênerên bi rêya aliyên din ên li ser malpera Facebook bûn.

Kramer û hevalên ku ji bo beşdaran li positivity rewşa kêm, li gorî gotinên erênî li updates statuya wan kêm bû û rêjeya ji sedî a gotinên neyînî zêdekirin. Li aliyê din jî, ji bo beşdaran li ser rewşa negatîf kêmkirin, bi rêjeya ji sedî a gotinên erênî zêdetir û rêjeya ji sedî a gotinên neyînî kêm dike (Şikil 4.23). Lê belê, ev bandorên biçûk bûn: Ferqa di gotinên erênî û neyînî di navbera dermanê û kontrola li ser 1 li 1,000 gotinên bû.

Figure 4.23: delîlên li ser rîska hest (Kramer, Guillory, û Hancock 2014). Beşek ji gotinên erênî û gotinên neyînî ji aliyê rewşa experimental. Bars çêtir texmînkirin çewtî standard.

Figure 4.23: delîlên li ser rîska hest (Kramer, Guillory, and Hancock 2014) . Beşek ji gotinên erênî û gotinên neyînî ji aliyê rewşa experimental. Bars çêtir texmînkirin çewtî standard.

Ez nirxandinek li ser aliyên zanistî yên vê ezmûna li beşa xwendinê bêhtir di dawiya beşa hoye, lê mixabin, ev ezmûneke herî ji bo di encam de nîqaşên exlaqî zanîn e. Çend roj piştî vê rojnameyê Darizandina ya National Academy of Sciences hate weşandin bû, an qerebalixa êsh ji herdu lêkolîneran û di çapemeniyê de heye. Di demeke li dora rojnameyê de li ser du xalên serekî: 1) beşdaran ti erêkirina derveyî Facebook warê-ji-service standard ji bo tedawiya ku hin raman bibe xesareke beşdaran çewtiyan û 2) xebatê de di zîndanan de ne hatibû third-party exlaqî ne bi review (Grimmelmann 2015) . Pirsên exlaqî di vê nîqaşê bû sedemê kovara bi lez biweşînin a rare "îfade redaktorî ji xema" li ser etîka û pêvajoya exlaqî ji bo vê lêkolînê de (Verma 2014) . Di salên li dû, ezmûna berdewam be çavkaniya nîqaşên dijwar û mohir dike, û ev mohir de dibe ku bandora wê li rê, ji ajotina nav sîbera gelek tecrûbeyên din ên ku ji aliyê şîrketên çêkiriye (Meyer 2014) .

Dayîn ku background li ser rîska Emotional, ez niha dixwazim ji bo ku nîşan bide ku 3 R dikare şênber, pêşketinên pratîk ji bo lêkolînên rast (tiştê ku hûn bi xwe bibe ser etîka ji vê ezmûna taybetî difikirin) pêşniyar dikin. The yekem R e Replace: lêkolîner divê hewl bidin şûna tecrûbeyên bi teknîkên kêmtir, darîçav û rîsk, heke gengaz be. Ji bo nimûne, li şûna ku bi bez ceribandina, ku lêkolînerên dikaribû ezmûneke xwezayî tê dagirkirin. Weke ku di Chapter 2 şirove, tecrûbeyên xwezayî rewşên in ku tiştek di dinyayê de ku nerxên tayînkirin random tedawî diqewime (wek nimûne, a lottery ku biryarê bide ku dê di nav leşkerî). The sûdgirtina ji ezmûneke xwezayî ew e ku, lêkolînerekî ne mecbûr rizgar dermanê; li ser jîngehê nake ku ji bo we. Bi gotineke din, bi ezmûneke xwezayî, lêkolîner dê ne pêwîst ji bo experimentally manîpulekirina News Feeds gel.

Di rastiyê de, hema hema dihizre bi ezmûna nexweşîvegirtina Emotional, Coviello et al. (2014) hat kedxwarîya çi dikare were kirin an nexweşîvegirtina ezmûna xwezayî Emotional navê. helwesta wan jî, ku zimên a teknîka navê guherbarên instrumental, e hinekî aloztir eger tu ew berê dîtîye qet. Bi vî awayî, ji bo ravekirina vê yekê jî pêwîst bû, em ava bikin. Ya yekem, fikra ku hin lêkolîneran, dibe ku bixwînim nexweşîvegirtina hest dê bibe to compare Mesajên xwe li ser rojên ku News Feed xwe ji Mesajên xwe li ser rojan de gelek erênî bû ku News Feed te pir neyînî bû. Ev nêzîkatiya wê dê fine eger armanca tenê bû ku pêşbînî li ser naveroka dilovanî ya Mesajên xwe, lê di vê ekê bi pirsgirêk e, eger Armanc ew e ku ji bo xwendina bandora sebebî ji News Feed xwe li ser Mesajên xwe. Bo bînînî pirsgirêk bi vê design, bala Thanksgiving. Li Amerîka, peyamên erênî spike û posts neyînî li ser Thanksgiving trorîstî. Bi vî awayî, li ser Thanksgiving, lêkolîner dikarin bibînin ku News Feed xwe gelek erênî bû û ku tu tiştên erênî posted wek baş. Lê belê, peyamên erênî te dikaribû ji aliyê Thanksgiving ne ji aliyê naveroka News Feed xwe de pêk hatiye. Li şûna wê, ji bo ku li gor dîtina sebebî lêkolînerên bandora divê tiştekî ku mirov ji naveroka News Feed xwe guhertin, bêyî ku rasterast guhertina hestên xwe. Cihê kêfxweşiyê ye, tiştekî wisa ku çêbûbû, her dem heye: li hewa.

Coviello û hevalên ku rojekê bi baran de li bajarê yekî wê, li gorî, kêm rêjeya wezîfeyên ku bi ser 1 puan pozîtîf in û zêdekirina rêjeya wezîfeyên ku bi ser 1 puan neyînî ne. Hingê, Coviello û hevalên xwe vê yekê ji bo lêkolîna nexweşîvegirtina hest, bêyî pêwîstîya experimentally manîpulekirina News Feed kesî şixulandin. Di rastiyę de ku ewan dikiribûne pîvana çawa Mesajên xwe ji aliyê hewayê li bajarên ku bi hevalên xwe dijîn jî tê jiyîn kirin e. Bo bînînî çima ev jî hesteke, xeyal kirin ku hûn li New York City de dijîn û tu ji hevalê xwe yê li Seattle dijî. Îcar bifikirin ku rojekê ew dest dibare li Seattle. Ev baranê li Seattle ne dê rasterast mood te tesîrê, di heman demê de ew ê News Feed xwe ji bo kêm erênî û neyînî bêtir ji ber ku ji posts hevalê te. Bi vî awayî, baran li Seattle bi korfelaqî bikevin News Feed xwe. Zivirî û ev intuition nav prosedureke îstatîstîkî pêbawer aloz û tevlihev e (û nêzîkatiya rastîn bikaranîn ji aliyê Coviello û hevalên xwe hinekî ne-standard e), da ez nîqaşeke berfirehtir di beşa bi xwendina zêdetir hoye. Ya herî girîng ku li ser Coviello bîr û nêzîkatiya hevalê xwe ev e, ku ew ji wan re hişt ku bixwînim nexweşîvegirtina hest bê ku pêdivî bi rê ve ceribandina ku wek potansîyel beşdaran bikujî, û dibe ku rewşê de ku li gelek cihên din jî tu dikarî tecrûbeyên bi din şûna teknîkên.

Duyem di 3 Rs sînordar e: lêkolîner divê hewl bidin rengî jî dermanê xwe da ku bibe sedema herî biçûk ziyanê gengaz. Ji bo nimûne, li şûna astengiyan naveroka ku yan erênî yan jî neyînî bû, lêkolînerên ku dikaribû bi naveroka ku erênî an jî neyînî bû nûkirin. Ev design bi axivit û dê naveroka hest beşdaran News Feeds guhertin, lê ev ê re peyivî, yek ji fikara ku rexnegirên îfade: ku tecrûbeyên, dikare bibe sedemê beşdaran to miss agahiyên pir girîng in News Feed xwe. Bi design bikaranîn ji aliyê Kramer û hevalên xwe, peyamek girîng e ku wek îhtîmal e ku wek yek e ku bi were astengkirin e. Lê belê, bi a design bi axivit, ku mesajên ku dê koçber bibin, dê yên ku girîngtir, kêmtir in.

Di dawiyê de, ya sêyemîn R e kêm bike: lêkolîner divê hewl ji bo kêmkirina hejmara beşdaran li ezmûna wan, heke gengaz be. Di dema borî de, ev kêmkirina xwezayî çêbû ji ber ku mesrefa variable ji tecrûbeyên analog bilind bû, ku cesaret lêkolîn to optimize design û analîzên xwe. Lê belê, dema ku e zero welat mesrefa variable li wir, lêkolîner baş a sînorkirî ji mesrefa li ser size ji ezmûna xwe rû bi rû ne, û ev xwedî potansiyeleke ku rê ji bo tecrûbeyên nezan mezin.

Ji bo nimûne, Kramer û hevalên dikarin agahî pre-dermankirina li ser beşdaran-wek pre-tedawî jî deaktîv xwe bi kar anî helwesta-ji bo ku analîzên xwe bêtir sûdwerbigrin. Bi taybetî, bêtir ji danberheva rêjeya peyvên erênî di şert û mercên dermankirinê û kontrol, Kramer û hevalên dikaribû guhertina li rêjeya peyvên erênî di navbera şert û mercên ev rêje; bi nêrîneke gelek caran ferqa-li-cudahiyên û ya ku ji nêz ve bi design têkel ku ez berê li beşa şirove dike (Şikil 4.5) related navê. Ku tê, ji bo her beşdar, lêkolînerên ku nikaribû dereceyeke guhertina (helwestên post-tedawî - helwesta pre-tedawî) afirandine û paşê ji bo hisabekî guhertina ji beşdaran di şert û mercên tedawî û kontrola bihêt. Ev nêzîkatiya cudahiya-li-cudahiyên bêhtir bandorkar e îstatîstîkî, tê wê wateyê ku lêkolîner dikare bawerî îstatîstîkî heman bikaranîna testên gelekî biçûktir bidestveanîna. Bi gotineke din, ji aliyê ewênku beşdaran ne wek "widgets", lêkolînerên gelek caran dikare bi texmînî vebir zêdetir bistînin.

Bêyî ku daneyên raw jî zehmet e ji bo dizanin bê çiqas bêhtir bandorkar a nêzîkatiya cudahiya-li-cudahiyên dê di vê rewşê de bûn. Lê belê, Deng et al. (2013) ragihand ku di sê tecrûbeyên bike li ser search engine Bing ew nikarin ji bo kêmkirina berdewam ji texmînên wan bi ser% 50 bûn, û encamên similar ji bo hin tecrûbeyên bike li Netflix ragihandin (Xie and Aurisset 2016) . Ev 50% kêmkirina berdewam tê wê maneyê ku lêkolînerên nexweşîvegirtina Emotional bibe dikaribû ku birrîn testa xwe li nîv eger ew a metodên analîza hinekî cuda tê bikaranîn bûya. Bi gotineke din, bi guhertina biçûk de di analîza, 350,000 mirovên ku hatine beşdarbûna di ezmûna xila dîtin.

Di vî warî de hûn bê dipirsin, çima lêkolîner divê xema eger 350,000 mirovên ku li nexweşîvegirtina Emotional nezan bûn. du taybetmendiyên taybetî ji rîska Emotional ku xema bi size fehş minasib, û van taybetiyan bi destê gelek tecrûbeyên qada digital parvekirin: 1) e nehatê, li ser gelo ezmûna wê ziyan ji bo qet nebe hin beşdaran çewtiyan û 2) beşdariya bû ne li wir bixwe. Di tecrûbeyên bi van her du taybetmendiyên wisa xuya dike tê tewsiye ji bo ezmûnên wek piçûk bikin.

Di encamê de, di sê R's-Replace, sînordar bike, û kêm-ne prensîbên ku dikare alîkariya lêkolînerên ava etîka nav designs experimental xwe. Bê guman, her yek ji van guhertinên muhtemel ji bo rîska Emotional naskirina bazirganî-dîmenî guherandin. Ji bo nimûne, delîlên ji tecrûbeyên xwezayî ye ne herdem wek paqij ku delîlên ku ji tecrûbeyên randomized û pirskirinê bibe hatine lojîstîkê de bêtir zehmet ji bo cîbicîkirina ji block dîtin. Bi vî awayî, bi armanca dizane van guhertinan de bû duyem-texmîn biryarên din jî lêkolîner ne. Lê belê, ev ji bo eşkerakirina çawa sê R dikare di rewşeke realîst serî bû.