2.4.3.1 Dabas eksperimenti

Dabas eksperimenti izmantot izlases notikumiem pasaulē. izlases notikums + vienmēr-on datu sistēmas = dabas eksperiments

Galvenais, lai randomizētu eksperimentiem ļauj taisnīgu salīdzinājumu ir randomizācijas. Tomēr laiku pa laikam kaut kas notiek pasaulē, kas būtībā uztic cilvēkiem nejauši vai gandrīz nejauši dažādām procedūrām. Viens no skaidrākajiem apliecinājumiem stratēģijas izmantojot dabas eksperimentus nāk no izpētes Angrist (1990) , kas mēra ietekmi militāro dienestu uz peļņu.

karu Vjetnamā laikā ASV palielināja apjomu tās bruņoto spēku caur projektu. Lai izlemtu, kuru iedzīvotāji varētu saukt ekspluatācijā, ASV valdība rīkoja loteriju. Katru dzimšanas datums tika pārstāvēta papīra, un šie dokumenti tika ievietoti lielā stikla burkā. Kā redzams 2.5 attēlā, šie lapiņām tika ņemti no jar vienā laikā, lai noteiktu kārtību, ka puiši varētu saukt kalpot (jaunām sievietēm nebija pakļauti projektā). Pamatojoties uz rezultātiem, vīrieši, kas dzimuši gada 14. septembrī tika saukta pirmkārt, vīrieši, kas dzimuši gada 24. aprīlī tika saukta otrais, un tā tālāk. Galu galā, šajā loterijā, vīrieši, kas dzimuši pēc 195 dažādās dienās tika aicināti ekspluatācijā, kamēr vīrieši, kas dzimuši pēc 171 dienām netika saukta.

2.5 attēls: Kongresmenis Aleksandrs Pirnie (R-NY) izstrādājot pirmo kapsulu par Selective Service projektu 1.decembrī, 1969. Joshua Angrist (1990) apvienojumā loterijā projektu ar peļņas datiem no Sociālās apdrošināšanas pārvalde, lai novērtētu ietekmi militārā dienesta uz ieņēmumiem. Tas ir piemērs pētniecības izmantojot dabas eksperimentu. Avots: Vikipēdija

2.5 attēls: Kongresmenis Aleksandrs Pirnie (R-NY) izstrādājot pirmo kapsulu par Selective Service projektu 1.decembrī, 1969. Joshua Angrist (1990) apvienojumā loterijā projektu ar peļņas datiem no Sociālās apdrošināšanas pārvalde, lai novērtētu ietekmi militārā dienesta uz ieņēmumiem. Tas ir piemērs pētniecības izmantojot dabas eksperimentu. Avots: Vikipēdija

Lai gan tas varētu nebūt uzreiz skaidrs, loterija projekts ir kritiska līdzība ar randomizētā kontrolētā eksperimentā: abās situācijās dalībniekus pēc nejaušības principa saņēma ārstēšanu. Attiecībā uz loterijas projektā, ja mēs esam ieinteresēti uzzināt par sekām projekta neattiecināmību un militārā dienesta uz nākamajiem darba tirgus peļņu, mēs varam salīdzināt rezultātus cilvēkiem, kuru birthdates bija zem loterijas nogriešana (piemēram, 14. septembris, aprīlis 24, uc) ar rezultātiem cilvēkiem, kuru dzimšanas dienas bija pēc nogriešana (piemēram, 20. februāris, decembris 2, uc).

Ņemot vērā, ka šī ārstēšana tiek izstrādāta ir nejaušības principa, mēs varam tad pasākums efektu šī ārstēšanas jebkuru iznākumu, kas ir mērīts. Piemēram, Angrist (1990) apvienota informācija par to, kas tika nejauši izvēlēta projektā ar peļņas datus, kas tika savākti ar Sociālā nodrošinājuma pārvalde, lai secinātu, ka peļņa balto veterāni bija aptuveni 15% mazāk nekā peļņa salīdzināmu nepilsoņu veterāni . Citi pētnieki ir izmantojuši līdzīgu triks, kā arī. Piemēram, Conley and Heerwig (2011) apvienota informācija par to, kas tika nejauši izvēlēta projektā ar mājsaimniecību datiem, kas iegūti no 2000. gada tautas skaitīšanas 2005 amerikāņu Kopienas apsekojuma un konstatēja, ka tik ilgi pēc projekta, bija maz ilgtermiņa efektu militārais dienests uz dažādiem iznākumiem, piemēram, mājokļu valdījuma (pieder pret īri) un dzīvojamā stabilitāti (visticamāk, ka tā pārcēlās iepriekšējos piecos gados).

Tā kā šis piemērs ilustrē, dažreiz sociālās, politiskās vai dabas spēki radīt eksperimentus vai gandrīz eksperimentiem, kas var būt parādi pētnieki. Bieži vien dabas eksperimenti ir labākais veids, kā novērtēt cēloņu un seku attiecības uzstādījumus, ja tas nav ētiski vai praktiski darboties randomizētos kontrolētos eksperimentus. Tie ir svarīgs stratēģija atklājot taisnīgas salīdzinājumus ne-eksperimentālos datus. Šī pētniecība stratēģija var apkopot ar šo vienādojumu:

\ [\ teksts {nejauši (vai kā tad, ja izlases) gadījumā} + \ teksta {vienmēr-on datu plūsmas} = \ teksts {dabas eksperiments} \ qquad (2.1) \]

Tomēr, analizējot dabas eksperimentu var būt diezgan sarežģīta. Piemēram, gadījumā, Vjetnamas projekta, ne visi, kas bija projekta-tiesīgi beidzās apkalpo (tur bija dažādi atbrīvojumi). Un tajā pašā laikā, daži cilvēki, kuri nebija projekts-tiesīgi brīvprātīgi pakalpojumu. Tas bija kā tad, ja klīniskā pētījumā par jaunu narkotiku, daži cilvēki ārstēšanas grupā neņēma viņu zāles un daži no cilvēku kontroles grupā kaut saņēma narkotikas. Šī problēma, ko sauc par divpusējais neatbilstība, kā arī daudzas citas problēmas ir aprakstīti sīkāk dažas no ieteiktajām lasījumos beigās šajā nodaļā.

No izmantojot dabīgi izlases uzdevumu stratēģija pirms digitālās vecumu, bet izplatība lielā datu padara šī stratēģija ir daudz vieglāk izmantot. Kad tu saproti, kādu ārstēšanu ir piešķirts nejauši, lieli datu avoti var sniegt rezultātu datus, kas jums ir nepieciešams, lai salīdzinātu rezultātus cilvēkiem apstrādes un kontroles nosacījumus. Piemēram, savā pētījumā par ietekmi dienesta projektu un militāro, Angrist izmantojusi par ieņēmumiem no Sociālā nodrošinājuma pārvalde; bez šo rezultātu datiem, viņa pētījums nebūtu bijis iespējams. Tādā gadījumā Sociālā nodrošinājuma pārvalde ir vienmēr-on liels datu avots. Tā kā pastāv arvien vairāk automātiski savākti datu avotiem, mums būs vairāk rezultātu dati, kas var izmērīt izmaiņu ietekmi, ko rada eksogēnas variācijas.

Lai ilustrētu šo stratēģiju digitālajā laikmetā, pieņemsim apsvērt Mas un Moretti s (2009) elegantu pētījumus par ietekmi vienaudžiem uz produktivitāti. Lai gan uz virsmas tas varētu izskatīties citādi nekā Angrist pētījums par ietekmi Vjetnamas projektu, pēc struktūras abi sekot modeli ekv. 2.1.

Mas un Moretti mēra kā vienaudžiem ietekmē produktivitāti darbiniekiem. No vienas puses, kam ir smagi strādā vienādranga varētu radīt darba ņēmējiem, lai palielinātu to produktivitāti, jo vienādranga spiedienu. Vai, no otras puses, strādīgs peer varētu radīt citus darbiniekus klusajās vēl vairāk. Skaidrākā veidā pētīt vienaudžu ietekmi uz produktivitāti būtu randomizēts kontrolēts eksperiments, kurās darbinieki ir nejauši piešķirts maiņām ar darbiniekiem dažādu produktivitātes līmeni un tad rezultātā produktivitāte mēra ikvienam. Pētnieki, tomēr, nav kontrolēt grafiku darbinieku jebkurā reālu uzņēmējdarbību, un tāpēc Mas un Moretti bija jāpaļaujas uz dabas eksperiments, kas notika lielveikalā.

Tāpat kā ekv. 2.1, viņu pētījums bija divas daļas. Pirmkārt, viņi izmantoja baļķus no lielveikala kases sistēmas, lai būtu precīzi, indivīds, un vienmēr-on noteiktu ražīguma: skaita vienību skenētu sekundē. Un, otrkārt, tāpēc, ka tā, ka plānošanas tika noslēgts šajā lielveikalā, viņi ir tuvu izlases sastāvu vienaudžiem. Citiem vārdiem sakot, lai gan plānošanu kasieru nenosaka loterijā, tas būtībā nejauši. Praksē uzticība mums ir dabas eksperimentos bieži atkarīga ticamību šo "kā-ja" izlases prasību. Izmantojot šīs izlases variācijas, Mas un Moretti konstatēja, ka, strādājot ar augstāku produktivitāti vienaudžiem palielina ražīgumu. Turklāt Mas un Moretti izmanto lielumu un bagātību savas datu kopas, lai pārvietotos tālāk novērtēšanai cēloņu un efekta izpētīt vēl divas svarīgas un izsmalcināts jautājumiem: neviendabīgumu šajā sakarā (par kāda veida darba ņēmēju ir efekts lielāks) un mehānismu aiz efektu (kāpēc ar augstu produktivitāti vienaudžiem radīt augstāku produktivitāti). Mēs atgriezīsimies pie šiem diviem svarīgiem jautājumiem-neviendabīgumu ārstēšanas ietekmi un mehānismu-5. nodaļā, kad mēs apspriest eksperimentu sīkāk.

Vispārinot no pētījumiem par ietekmi Vjetnamas projektu par ienākumiem un pētījumu par ietekmi vienaudžiem par produktivitāti, 2.3 tabulā apkopoti citiem pētījumiem, kas ir tieši šādu pašu struktūru: izmantojot vienmēr-par datu avotu, lai novērtētu ietekmi kādu notikumu . Kā 2.3 tabula skaidri, dabas eksperimenti ir visur, ja jūs vienkārši zināt, kā viņus atrast.

2.3 tabula: Piemēri dabas eksperimentu izmanto lielus datu avotus. Visi šie pētījumi sekot pašas recepti: izlases (vai ja izlases kā) notikumu + vienmēr-on datu sistēmā. Skatīt Dunning (2012) vairāk piemēru.
materiālo fokuss Avots dabiskā eksperimenta Vienmēr-on datu avots citēšana
Peer ietekmi uz produktivitāti plānošanas process izrakstīšanās dati Mas and Moretti (2009)
draudzība veidošanās viesuļvētras Facebook Phan and Airoldi (2015)
Spread emociju lietus Facebook Coviello et al. (2014)
Peer to peer ekonomisko pārskaitījumus zemestrīce mobilo nauda dati Blumenstock, Fafchamps, and Eagle (2011)
Personal patēriņš uzvedība 2013 ASV valdība shutdown personas finanšu dati Baker and Yannelis (2015)
Ekonomiskā ietekme recommender sistēmu dažādi pārlūkošanas datus Amazon Sharma, Hofman, and Watts (2015)
Stresa ietekme uz nedzimušu bērnu 2006 Izraēlas un Hezbollah karš Birth ieraksti Torche and Shwed (2015)
Lasīšana uzvedību par Wikipedia Snowden atklāsmes Wikipedia žurnāli Penney (2016)

Praksē zinātnieki izmantot divas dažādas stratēģijas, lai atrastu dabas eksperimenti, kuras abas var būt auglīga. Daži pētnieki sākt ar vienmēr-par datu avotu un meklēt izlases notikumiem pasaulē; citiem sākt ar izlases notikumiem pasaulē un meklēt datu avotiem, kas attēlotu to ietekmi. Visbeidzot, paziņojums, ka spēks dabas eksperimentus nāk nevis no izsmalcinātība statistiskās analīzes, bet no aprūpes atklājot taisnīgu salīdzinājumu, ko rada paveicies negadījuma vēsturi.