2.4.3.1 Naravni eksperimenti

Naravni poskusi izkoristiti naključnih dogodkov v svetu. naključni dogodek + vedno o sistemu podatkov = naravni eksperiment

Ključ do randomiziranih kontroliranih poskusov, ki omogočajo poštene primerjave je naključnost. Vendar pa občasno kaj se dogaja v svetu, ki v bistvu pripisuje ljudem, naključno ali skoraj naključno na različna zdravljenja. Eden od najbolj očitnih primerov strategije uporabe naravnih poskusov izhaja iz raziskave Angrist (1990) , ki meri učinek vojaške službe na dobiček.

Med vojno v Vietnamu, ZDA povečala obseg svojih oboroženih sil z osnutkom. Da se odloči, katere državljani bi poklical v službo, je ameriška vlada organizirala loteriji. Vsak datum rojstva je bila zastopana na kos papirja, in ti dokumenti so bili dani v veliki stekleni kozarec. Kot je prikazano na sliki 2.5, so bile te listke sestavljen iz kozarca enega naenkrat, da se določi vrstni red, da bi se mladi moški z imenom služiti (mlade ženske niso bile predmet osnutka). Na podlagi rezultatov, so bili moški, rojeni 14. septembra imenovani prvi, moški, rojeni 24. aprila so bili imenovani drugi, in tako naprej. Konec koncev, v tej loteriji, moški, rojeni v 195 različnih dneh so bili poklicani, da storitev, medtem ko moški, rojeni v 171 dneh niso bili imenovani.

Slika 2.5: Kongresnik Alexander Pirnie (R-NY) pripravo prvo kapsulo za osnutek Selective Service 1. decembra 1969. Joshua Angrist (1990) skupaj z osnutkom loteriji s podatki o dobičku iz uprave za socialno varnost za oceno učinka služenje vojaškega roka o plačah. To je primer raziskovanja z uporabo naravne eksperiment. Vir: Wikimedia Commons

Slika 2.5: Kongresnik Alexander Pirnie (R-NY) pripravo prvo kapsulo za osnutek Selective Service 1. decembra 1969. Joshua Angrist (1990) v kombinaciji osnutek loteriji s podatki o dobičku iz uprave za socialno varnost za oceno učinka služenje vojaškega roka o plačah. To je primer raziskovanja z uporabo naravne eksperiment. Vir: Wikimedia Commons

Kljub temu, da ne bi bilo takoj očitno, osnutek loterija ima kritično podobna randomizirani nadzorovani poskus: v obeh primerih so udeleženci naključno prejemali zdravljenje. V primeru predloga loterije, če smo zainteresirani za učenje o učinkih osnutka-upravičenosti in vojaške službe na kasnejši zaslužek na trgu dela, lahko primerjamo rezultate za ljudi, katerih Birthdates so bile pod cutoff loterije (npr, September 14, april 24, itd), z rezultati za ljudi, katerih rojstni dnevi so bili po cutoff (npr februar 20, 2. december itd).

Glede na to, da je bila ta obravnava v pripravi naključno, potem lahko izmerimo učinek tega zdravljenja za vsako izid, ki je bilo izmerjeno. Na primer, Angrist (1990) združil podatke o tem, kdo je bil naključno izbran v osnutku s podatki o dobičku, ki so zbrane s strani Ministrstva za socialno varnost za sklenitev, da so bile plače belih veteranov približno 15% nižja od plače primerljivih tujih veteranov . Drugi raziskovalci so uporabili podoben trik kot dobro. Na primer, Conley and Heerwig (2011) združil podatke o tem, kdo je bil naključno izbran v osnutku s podatki v gospodinjstvu, zbranih iz raziskave leta 2000 popis in 2005 ameriški Skupnosti, in ugotovila, da ni bilo tako dolgo po osnutku malo dolgoročnega učinka služenje vojaškega roka na različnih rezultatov, kot so stanovanjski posesti (ki ima v lasti v primerjavi z najem) in stanovanjske stabilnosti (verjetnost, da se preselili v zadnjih petih letih).

Ker ta primer ponazarja, včasih socialni, politični ali naravne sile ustvariti poskusov ali skoraj poskuse, ki jih je mogoče vzvodom raziskovalci. Pogosto naravne poskusi so najboljši način za oceno vzročno-posledičnih razmerij v okoljih, kjer to ni etično in praktično teči randomiziranih kontroliranih poskusov. So pomembna strategija za odkrivanje poštene primerjave v ne-eksperimentalnih podatkov. Ta raziskovalna strategija je mogoče povzeti s to enačbo:

\ [\ text {naključno (ali pa kot da bi naključno) če} + \ text {vedno o podatkovni tok} = \ text {naravni eksperiment} \ qquad (2,1) \]

Vendar pa je analiza naravnih poskusov je precej zapleteno. Na primer, v primeru osnutka Vietnamu, ni vsak, ki je bil osnutek, upravičeni končal služijo (obstajajo različne izjeme). In, ob istem času, nekateri ljudje, ki niso bili prepiha upravičeni javil za službo. Bilo je, kot da bi v kliničnem preskušanju novega zdravila, nekateri ljudje v skupini zdravljenja ni vzamejo zdravila in nekaj ljudi v kontrolni skupini nekako dobil zdravilo. Ta problem, ki se imenuje obojestransko neupoštevanje, kot tudi mnoge druge težave so podrobneje opisane v nekaterih priporočenih odčitkov na koncu tega poglavja.

Strategija izkoriščajo naravno naključno nalogo je pred digitalno dobo, vendar je razširjenost velikega podatkov je ta strategija veliko lažje za uporabo. Ko se zavedaš, nekaj Zdravljenje je bila dodeljena naključno, lahko veliki podatkovni viri zagotavljajo podatke sklepni, ki jih potrebujete, da bi lahko primerjali rezultate za ljudi v razmerah zdravljenja in nadzora. Na primer, v svoji študiji o učinkih osnutka in služenje vojaškega roka, Angrist uporabila zapisov o dobičku iz uprave za socialno varnost; brez teh podatkov o učinkih, ne bi bilo mogoče njegov študija. V tem primeru je uprava za socialno varnost je vedno-na velik vir podatkov. Saj obstajajo bolj in bolj samodejno zbirajo viri podatkov, bomo imeli več podatkov sklepni, ki lahko meri učinke sprememb, ki jih eksogeno spremembo ustvarili.

Za ponazoritev te strategije v digitalni dobi, kaj menijo Más Moretti je (2009) elegantno raziskave o vplivu vrstnikov na produktivnost. Čeprav je na površini morda razlikuje od študije Angrist je o učinkih Vietnam osnutka, v strukturi oba sledi vzorcu v eq. 2.1.

Mas in Moretti izmeriti, kako vrstniki vplivajo na produktivnost delavcev. Po eni strani bi lahko s trdo delajo peer vodi delavce, da povečajo produktivnost zaradi pritiska vrstnikov. Ali pa, na drugi strani pa bi lahko trdo delo strokovnega pripelje druge delavce, da stiskani off še več. Najbolj očiten način študija medsebojnih učinkov na produktivnost bi bilo randomizirano kontrolirano eksperiment, kjer so delavci naključno dodelijo premiki z delavci različnih ravneh produktivnosti in nato izhaja produktivnost se meri za vsakogar. Raziskovalci pa ne nadzorujejo urnik delavcev v vsakem pravi posel, in tako Mas in Moretti morali opirati na naravni eksperiment, ki je potekala v supermarket.

Tako kot ekv. 2.1 je bila njihova študija iz dveh delov. Najprej so uporabili dnevnike iz sistema supermarket blagajni imeti natančno, posameznika, in vedno-na mero produktivnosti: število predmetov, skeniranih na sekundo. In drugič, ker je tako, da razporejanje je bil podpisan v tej veleblagovnici, imajo blizu naključno sestavi vrstniki. Z drugimi besedami, čeprav je načrtovanje blagajnikov ni določena z loterijo, da je v bistvu naključno. V praksi se je zaupanje imamo v naravnih poskusih pogosto odvisna od verodostojnosti tega ", kot, če je" naključno zahtevka. Ob prednosti tega naključnega nihanja, Mas in Moretti je pokazala, da je delo z višjimi vrstniki produktivnosti povečuje produktivnost. Poleg tega Mas in Moretti uporabili velikost in bogastvo svojega nabora podatkov preseči oceno vzrok in posledico, da razišče še dva pomembna in subtilnih vprašanj: heterogenost tega učinka (za katere je vrste delavcev učinek večji) in mehanizem za učinek (zato pa imajo visoke vrstniki produktivnost vodi k večji produktivnosti). Vrnili se bomo na teh dveh pomembnih vprašanjih-heterogenosti učinkov zdravljenja in mehanizmov v poglavju 5, ko smo razpravljali poskuse podrobneje.

Posplošitev iz študij o učinku vietnamske osnutka o plačah in študije o vplivu vrstnikov na produktivnost, Tabela 2.3 povzema druge študije, ki so to točno isto strukturo: z nizom vedno-na vir podatkov za merjenje učinka nekega dogodka . Kot Tabela 2.3 pojasnjuje, naravni poskusi so povsod, če si vedel, kako si za njih.

Tabela 2.3: Primeri naravnih poskusi z veliko virov podatkov. Vse te študije sledijo isti osnovni recept: naključno (ali kot če random) dogodek + vedno o sistemu podatkov. Glej Dunning (2012) za več primerov.
vsebinski poudarek Vir naravnega eksperimenta Vedno-na podatkih vir Navedba
Peer učinke na produktivnost razvrščanje procesov checkout podatki Mas and Moretti (2009)
nastanek prijateljstvo orkani Facebook Phan and Airoldi (2015)
Spread čustev dež Facebook Coviello et al. (2014)
Peer to peer gospodarske prenosov potres Podatki mobilne denarja Blumenstock, Fafchamps, and Eagle (2011)
vedenje osebno porabo 2013 ameriška vlada shutdown osebni podatki finance Baker and Yannelis (2015)
Ekonomski vpliv za priporočila sistemov različno podatke brskanja na Amazon Sharma, Hofman, and Watts (2015)
Vpliv stresa na nerojenega otroka 2006 Izrael, Hezbolah vojne zapisi ob rojstvu otroka Torche and Shwed (2015)
Branje obnašanje na Wikipediji Snowden razodetja Wikipedija dnevniki Penney (2016)

V praksi raziskovalci uporabljajo dva različna strategij za iskanje naravnih poskusov, ki sta lahko zelo uspešno. Nekateri raziskovalci začeli z virom vedno-na podatkih in poiščete tudi naključnih dogodkov v svetu; pa začnejo naključnih dogodkov v svetu in iščejo vire podatkov, ki zajemajo njihov vpliv. Končno, opazili, da je moč naravnih poskusov ne prihaja od zahtevnosti statistične analize, temveč iz skrbi pri odkrivanju poštena primerjava s srečo nesreči v zgodovini ustvarili.