2.4.3.1 Natural eksperimenti

Prirodni eksperimenti iskoristiti slučajnih događaja u svijetu. slučajni događaj + uvijek na sistemu podataka = prirodni eksperiment

Ključ randomizovanih eksperimenata omogućiti fer odnosu je randomizacije. Međutim, povremeno nešto događa u svijetu koja u suštini dodjeljuje ljudi slučajno ili gotovo nasumično na različite tretmane. Jedan od najjasnijih primjera strategije korištenja prirodnih eksperimenata dolazi iz istraživanja Angrist (1990) koji mjeri učinak vojne službe na zarade.

Za vrijeme rata u Vijetnamu, Sjedinjenim Američkim Državama povećao veličinu njenih oružanih snaga kroz nacrt. Kako bi se odlučiti koji građanima će biti dovedena u službi, američka vlada održala lutriji. Svaki Rođendan je predstavljao na komadu papira, i ovi radovi su bili smješteni u veliku staklenu teglu. Kao što je prikazano na slici 2.5, izvučeni su ovi ceduljica iz posude jedan po jedan kako bi se utvrdilo je kako bi se mladi ljudi biti pozvani da služe (mlade žene nisu bile predmet nacrta). Na osnovu rezultata, muškarci rođen 14. septembra su prvi put pozvao, muškarci rođen 24. aprila su se zvali drugi, i tako dalje. Na kraju, u ovoj lutriji, ljudi rođeni na 195 različitih dana bili pozvani na servis dok muškarci rođen 171 dana nisu bili pozvani.

Slika 2.5: kongresmen Alexander Pirnie (R-NY) crtanje prvi kapsula za nacrt Selektivno Servis 1. decembra, 1969. Joshua Angrist (1990) u kombinaciji nacrt lutrija sa podacima dobiti iz Uprave za socijalnu sigurnost za procjenu efekta vojne službe na zarade. Ovo je primjer istraživanja na prirodan eksperiment. Izvor: Wikipedia

Slika 2.5: kongresmen Alexander Pirnie (R-NY) crtanje prvi kapsula za nacrt Selektivno Servis 1. decembra, 1969. Joshua Angrist (1990) u kombinaciji nacrt lutrija sa podacima dobiti iz Uprave za socijalnu sigurnost za procjenu efekta vojne službe na zarade. Ovo je primjer istraživanja na prirodan eksperiment. Izvor: Wikipedia

Iako to možda nije odmah očigledna, nacrt lutrija ima kritičnu sličnost sa randomizovanih eksperiment: u obe situacije učesnici su nasumično dodijeljen dobiti tretman. U slučaju nacrta lutrije, ako smo zainteresirani za učenje o efektima nacrta podobnosti i vojnu službu na kasnijim tržištu rada zarade, možemo uporediti rezultate za ljude čije datuma rođenja, bili su ispod lutriji cutoff (npr, 14. septembar, april 24, itd) sa rezultatima za ljude čije rođendane su nakon cutoff (npr, 20. februar, 2. decembar, itd).

S obzirom da je ovaj tretman u pripremi je nasumično, možemo onda izmjeriti učinak ovog tretmana za bilo koji ishod koji je izmjerena. Na primjer, Angrist (1990) u kombinaciji sa informacijama o tome ko je slučajno odabran u nacrt sa podacima zarade koji su prikupljeni od strane Uprave za socijalnu sigurnost zaključiti da je zarada od bijele veterana bili su oko 15% manje u odnosu na zaradu od uporedive ne-veterana . Ostali istraživači su koristili sličan trik kao dobro. Na primjer, Conley and Heerwig (2011) u kombinaciji sa informacijama o tome ko je slučajno odabran u nacrt sa podacima domaćinstva prikupljaju iz Ankete 2000. popis stanovništva i 2005. američke zajednice i otkrili da tako dugo nakon nacrta, bilo je malo dugoročni efekat vojne službe na različite ishode kao što su stanovanje mandata (posjedovanje u odnosu na zakup) i stambeni stabilnost (vjerovatnoća da je preselio u prethodnih pet godina).

Kao što ovaj primjer pokazuje, ponekad društvene, političke, ili prirodne sile stvaraju eksperimente ili blizu eksperimentima koji se mogu iskoristiti od strane istraživača. Često prirodni eksperimenti su najbolji način za procjenu uzročno-posljedičnih veza u sredinama gdje to nije etički ili praktične za pokretanje randomizovanih eksperimente. Oni su važan strategije za otkrivanje fer poređenja u ne-eksperimentalnih podataka. Ova strategija istraživanja mogu se sažeti ovim jednadžbe:

\ [\ text {slučajne (ili kao da je slučajna) događaj} + \ text {uvijek na tok podataka} = \ text {prirodni eksperiment} \ qquad (2.1) \]

Međutim, analiza prirodnih eksperimenata može biti prilično nezgodno. Na primjer, u slučaju nacrta u Vijetnamu, nije svako ko je bio nacrt-podobni završili posluživanje (bilo je raznih izuzeća). A, u isto vrijeme, neki ljudi koji nisu bili izradi-podobni dobrovoljno uslugu. Bilo je to kao da je u kliničkom ispitivanju novog droge, neki ljudi u grupi tretman nije uzimaju lijek i neki ljudi u kontrolnoj grupi nekako dobio lijek. Ovaj problem, zove dvostrano nepoštovanje, kao i mnogi drugi problemi su opisani detaljnije u nekim od preporučenih očitavanja na kraju ovog poglavlja.

Strategija iskorištavanje prirodnog slučajne dodjele prethodi digitalnom dobu, ali je prevalencija velike količine podataka čini ovu strategiju mnogo lakše koristiti. Jednom kada shvatite neki tretman je nasumično, veliki izvori podataka mogu pružiti podatke ishod koja vam je potrebna kako bi se uporediti rezultate za ljude u uvjetima liječenje i kontrolu. Na primjer, u svojoj studiji o efektima nacrta i vojne službe, Angrist je iskoristio zarade zapisa iz Uprave za socijalno osiguranje; bez ove ishod podataka, njegova studija ne bi bilo moguće. U ovom slučaju, Uprava za socijalnu sigurnost je uvijek na velikim izvor podataka. Kao što postoji sve više i više automatski prikupljenih izvora podataka, mi ćemo imati više ishoda podataka koji mogu mjeriti efekti promjena stvorio egzogenim varijacije.

Za ilustraciju ove strategije u digitalnom dobu, razmotrimo Mas i Moreti (2009) elegantan istraživanja uticaja vršnjaka na produktivnost. Iako na površini može izgledati drugačije od studija Angrist je o efektima Nacrta Vijetnama, u strukturi obojica prate obrazac u EQ. 2.1.

Mas i Moretti mjeriti kako vršnjaci utječu na produktivnost radnika. S jedne strane, ima napornog radnog vršnjaka može dovesti radnike da povećaju produktivnost zbog pritisak vršnjaka. Ili, s druge strane, napornog radnog vršnjaka može dovesti druge radnike da zabušavati još više. Najjasniji način za proučavanje vršnjačke efekte na produktivnost bi randomizovanih eksperiment gdje su radnici slučajno dobio smjene sa radnicima različitih nivoa produktivnosti i onda rezultira produktivnost mjeri za svakoga. Istraživači, međutim, ne kontroliraju raspored radnika u pravom poslu, i tako Mas i Moretti morao osloniti na prirodni eksperiment koji se dogodio u supermarketu.

Baš kao i EQ. 2.1, njihova studija je imala dva dijela. Prvo, oni koristili za rezanje od supermarketu sistem imati precizan, individualni, i uvijek na mjeru produktivnosti: broj stavki skeniranih sekundi. I, drugo, zbog načina na koji raspored je učinjeno u ovom supermarketu, imaju u blizini slučajni sastav vršnjaka. Drugim riječima, iako je raspored blagajnici ne određuje lutrije, to je u suštini slučajan. U praksi, povjerenje imamo u prirodnim eksperimentima često zavisi od uvjerljivost ove "kao-ako" random tvrdnju. Iskoristivši ove slučajne varijacije, Mas i Moretti otkrili da radi sa većom vršnjacima produktivnost povećava produktivnost. Nadalje, Mas i Moretti korištena veličina i bogatstvo svojih skup da prevaziđe procjenu uzročno-posljedična istražiti još dva važna i suptilna pitanja: heterogenost ovog efekta (za koje vrste radnika je efekt veći) i mehanizam iza efekt (zašto imaju visok vršnjaka produktivnost dovesti do veće produktivnosti). Mi ćemo se vratiti u ova dva važna pitanja-heterogenost efekata tretmana i mehanizme-u Poglavlju 5, kada govorimo o eksperimente detaljnije.

Generalizacije iz studija o uticaju Nacrt Vijetnamu na zarade i studiju uticaja vršnjaka na produktivnost, Tabela 2.3 rezimira druge studije koje imaju ovu istu strukturu: pomoću uvijek na izvor podataka za mjerenje utjecaja nekog događaja . Kao Tabela 2.3 jasno, prirodni eksperimenti su svuda, ako samo znate kako da ih traže.

Tabela 2.3: Primjeri prirodnih eksperimenata koristeći velika izvora podataka. Sve ove studije prate isti osnovni recept: random (ili kao da je slučajna) događaj + uvijek na sistemu podataka. Vidi Dunning (2012) za više primjera.
suštinska fokus Izvor prirodni eksperiment Uvijek na izvor podataka citiranje
Peer efekte na produktivnost raspoređivanje procesa checkout podataka Mas and Moretti (2009)
formiranje prijateljstvo uragani Facebook Phan and Airoldi (2015)
Širenje emocija kiša Facebook Coviello et al. (2014)
Peer to peer ekonomske transfere zemljotres mobilne novac podataka Blumenstock, Fafchamps, and Eagle (2011)
ponašanje Lična potrošnja 2013 Američka vlada gašenje osobne financije podataka Baker and Yannelis (2015)
Ekonomski uticaj preporučioca sistema razne pretraživanje podataka na Amazonu Sharma, Hofman, and Watts (2015)
Utjecaj stresa na nerođene bebe 2006 Izrael-Hezbolah rata Rođen Records Torche and Shwed (2015)
Reading ponašanje na Wikipediji Snowden otkrića Wikipedia za rezanje Penney (2016)

U praksi, istraživači koriste dvije različite strategije za pronalaženje prirodnih eksperimenata, od kojih oba mogu biti plodonosan. Neki istraživači početi sa izvorom uvijek na podacima i tražiti slučajne događaje u svijetu; drugi početi sa slučajnim događajima u svijetu i tražiti izvore podataka koje obuhvataju njihov uticaj. Konačno, primijetiti da je snaga prirodnih eksperimenata ne dolazi iz sofisticiranost statističke analize, ali iz brige u otkrivanju fer odnosu kreiran od strane sreće slučajno istorije.