2.4.3.1 Natural eksperimento

Natural eksperimento samantalahin ng random na mga kaganapan sa mundo. random na kaganapan + laging-on data system = natural eksperimento

Ang susi sa randomized kinokontrol eksperimento pagpapagana makatarungang paghahambing ay ang randomization. Gayunman, paminsan-minsan may mangyari sa mundo na mahalagang nagtatalaga tao nang sapalaran o halos random sa iba't-ibang treatment. Isa sa pinakamalinaw na mga halimbawa ng mga diskarte ng paggamit ng natural na mga eksperimento ay mula sa pananaliksik ng Angrist (1990) na sumusukat sa epekto ng serbisyo militar sa mga kita.

Sa panahon ng digmaan sa Vietnam, ang Estados Unidos ay nadagdagan ang laki ng armadong pwersa nito sa pamamagitan ng isang draft. Upang magpasya kung aling mga mamamayan ay tinatawag na sa serbisyo, ang US pamahalaan ay gaganapin isang lottery. Bawat petsa ng kapanganakan ay kinakatawan sa isang piraso ng papel, at mga papeles ay inilagay sa isang malaking baso jar. Tulad ng ipinapakita sa Figure 2.5, ang mga slips ng papel ay inilabas mula sa garapon nang paisa-isa upang matukoy ang pagkakasunod-sunod na ang mga batang lalaki ay tinawag na maglingkod (batang babae ay hindi napapailalim sa mga draft). Batay sa mga resulta, mga lalaki ipinanganak sa Septiyembre 14 ay tinatawag na unang, lalaki ipinanganak noong Abril 24 ay tinatawag na ikalawa, at iba pa. Sa huli, sa lottery ito, lalaki ipinanganak sa 195 iba't ibang araw ay tinawag sa paglilingkod habang ang mga tao ipinanganak sa 171 araw ay hindi pa tinatawag.

Figure 2.5: Congressman Alexander Pirnie (R-NY) pagguhit ng unang capsule para sa draft Selective Service noong Disyembre 1, 1969. Joshua Angrist (1990) pinagsama ang draft lottery na may mga kita ng data mula sa Social Security Administration upang matantya ang epekto ng militar serbisyo sa mga kita. Ito ay isang halimbawa ng pananaliksik gamit ang isang natural na eksperimento. Source: Wikimedia Commons

Figure 2.5: Congressman Alexander Pirnie (R-NY) pagguhit ng unang capsule para sa draft Selective Service noong Disyembre 1, 1969. Joshua Angrist (1990) pinagsama ang draft lottery na may mga kita ng data mula sa Social Security Administration upang matantya ang epekto ng militar serbisyo sa mga kita. Ito ay isang halimbawa ng pananaliksik gamit ang isang natural na eksperimento. Source: Wikimedia Commons

Kahit na hindi ito maaaring maging agad maliwanag, isang draft lottery ay may isang kritikal na hawig sa isang randomized kinokontrol na eksperimento: sa parehong sitwasyon kalahok ay sapalaran itinalaga upang makatanggap ng isang paggamot. Sa kaso ng lottery draft, kung kami ay interesado sa pag-aaral tungkol sa mga epekto ng draft-pagiging karapat-dapat at militar serbisyo sa mga kasunod na mga kita labor market, maaari naming ihambing kinalabasan para sa mga tao na ang birthdates ay sa ibaba ang lottery cutoff (eg, Setyembre 14, Abril 24, atbp) sa mga kinalabasan para sa mga tao na ang mga kaarawan ay ayon sa cutoff (eg, Pebrero 20, Disyembre 2, atbp).

Given na ito paggamot ng pagiging drafted ay tinanggal sapalaran itinalaga, maaari naming pagkatapos ay sukatin ang epekto ng paggamot na ito para sa anumang kinalabasan na ay sinusukat. Halimbawa, Angrist (1990) pinagsama ang impormasyon tungkol sa kung sino ay random na piniling sa draft na may mga kita ng data na nakolekta sa pamamagitan ng Social Security Administration upang tapusin na ang mga kita ng mga puting mga beterano ay tungkol sa 15% mas mababa kaysa sa mga kita ng maihahambing non-Beterano . Iba pang mga mananaliksik ay may ginagamit ng isang katulad na bilis ng kamay pati na rin. Halimbawa, Conley and Heerwig (2011) pinagsama ang impormasyon tungkol sa kung sino ay random na piniling sa draft na may data sambahayan nakolekta mula 2000 Census at 2005 American Community Survey at natagpuan na kaya mahaba pagkatapos ng draft, nagkaroon ng maliit na pang-matagalang epekto ng militar serbisyo sa iba't-ibang mga kinalabasan tulad ng pabahay tenure (pagmamay-ari versus pagrenta) at residential katatagan (posibilidad ng pagkakaroon ng inilipat sa nakaraang limang taon).

Bilang halimbawa na ito ay naglalarawan, minsan panlipunan, pampulitika, o natural na mga pwersa lumikha eksperimento o malapit-eksperimento na maaaring leveraged sa pamamagitan ng mga mananaliksik. Kadalasan natural eksperimento ay ang pinakamahusay na paraan upang tantiyahin sanhi-at-epekto relasyon sa mga setting ng kung saan ito ay hindi etikal o praktikal na tumakbo randomized kinokontrol na mga eksperimento. Ang mga ito ay isang mahalagang diskarte para sa pagtuklas ng makatwirang paghahambing sa mga di-pang-eksperimentong data. Pananaliksik na ito diskarte ay maaaring summarized sa pamamagitan ng equation na ito:

\ [\ text {random (o bilang kung random) event} + \ text {laging-on data stream} = \ text {natural eksperimento} \ qquad (2.1) \]

Gayunman, ang pagtatasa ng natural na mga eksperimento ay maaaring maging lubos na manlilinlang. Halimbawa, sa kaso ng mga Vietnam draft, hindi lahat ng tao na naging draft-karapat-dapat napunta paghahatid (mayroong isang iba't ibang mga exemptions). At, sa parehong oras, ang ilang mga tao na hindi draft-karapat-dapat nagboluntaryo para sa serbisyo. Ito ay bilang kung sa isang klinikal na pagsubok ng isang bagong gamot, ang ilang mga tao sa grupo ng paggamot ay hindi kumuha ng kanilang mga gamot at ang ilan sa mga tao sa control group sa paanuman natanggap ang gamot. Ang problemang ito, na tinatawag na magkabilaan hindi pagsunod, pati na rin ang maraming iba pang mga problema ay inilarawan sa mas malawak na detalye sa ilan sa ang inirerekumendang pagbabasa sa dulo ng kabanatang ito.

Ang diskarte ng pagkuha bentahe ng natural na nagaganap random assignment Nauuna ang digital na edad, ngunit ang pagkalat ng malaking data gumagawa ng diskarte na ito lubhang mas madaling gamitin. Sa sandaling mapagtanto mo ang ilang mga paggamot na magtalaga random, malaki pinagkukunan ng data ay maaaring magbigay ng ang kinalabasan data na kailangan mo upang ihambing ang mga resulta para sa mga tao sa paggamot at kontrol kondisyon. Halimbawa, sa kanyang pag-aaral sa mga epekto ng draft at militar serbisyo, Angrist ginawa ang paggamit ng mga kita mula sa mga talaan sa Social Security Administration; walang data na ito kinalabasan, kanyang pag-aaral ay hindi maaaring naging posible. Sa kasong ito, ang Social Security Administration ay ang laging-on big source ng data. Habang parami nang parami awtomatikong nakolekta pinagkukunan ng data umiiral, magkakaroon kami ng mas kinalabasan data na maaaring masukat ang mga epekto ng pagbabago nilikha sa pamamagitan ng exogenous pagkakaiba-iba.

Upang ilarawan ito diskarte sa digital edad, sabihin isaalang-alang ni Mas at Moretti ni (2009) eleganteng pananaliksik sa mga epekto ng mga kapantay sa produktibo. Kahit sa ibabaw ito ay maaaring naiiba kaysa sa pag-aaral ni Angrist tungkol sa mga epekto ng Vietnam Draft tumingin, sa istraktura sila parehong sundin ang mga pattern sa eq. 2.1.

Mas at Moretti sinusukat paano peers makakaapekto ang pagiging produktibo ng mga manggagawa. Sa isang banda, ang pagkakaroon ng isang hard nagtatrabaho peer maaaring humantong manggagawa upang madagdagan ang kanilang pagiging produktibo dahil sa peer presyon. O kaya naman, sa kabilang dako, ang isang hard nagtatrabaho peer maaaring humantong iba pang mga manggagawa upang panghinain ng mas maraming. Ang clearest paraan sa pag-aaral peer epekto sa pagiging produktibo ng gagawin maging isang randomized kinokontrol na eksperimento kung saan manggagawa ay sapalaran itinalaga sa shifts sa mga manggagawa ng iba't ibang mga antas ng pagiging produktibo at pagkatapos ay nagreresulta produktibo ay sinusukat para sa lahat. Mananaliksik, gayunpaman, ay hindi kontrolin ang iskedyul ng mga manggagawa sa anumang tunay na negosyo, at iba pa Mas at Moretti ay umasa sa isang natural na eksperimento na kung saan kinuha lugar sa isang supermarket.

Katulad ng eq. 2.1, ang kanilang pag-aaral ay nagkaroon ng dalawang bahagi. Una, ginamit nila ang mga log mula sa sistema ng supermarket checkout na magkaroon ng isang tiyak na, mga indibidwal, at laging-on na sukatan ng pagiging produktibo: ang bilang ng mga item scan sa bawat segundo. At, pangalawa, dahil sa mga paraan na pag-iiskedyul ng ay tapos na sa supermarket na ito, sila ay may malapit random komposisyon ng mga kapantay. Sa ibang salita, kahit na ang pag-iiskedyul ng Kahero ay hindi nasusukat sa isang loterya, ito ay mahalagang random. Sa pagsasanay, ang ating pagkakatiwala sa natural na mga eksperimento madalas hinges sa ang pagkatotoo ng mga ito "as-kung" random claim. Ang pagkuha bentahe ng ito random na pagkakaiba-iba, Mas at Moretti natagpuan na nagtatrabaho na may mas mataas peers produktibo ay nagdaragdag produktibo. Dagdag dito, Mas at Moretti ginagamit ang laki at kayamanan ng kanilang dataset upang ilipat sa kabila ng kuru-kuro ng sanhi-at-epekto upang galugarin dalawang mas mahalaga at banayad na mga isyu: heterogeneity ng epekto na ito (para sa kung aling mga uri ng mga manggagawa ay ang epekto mas malaki) at mekanismo sa likod ng mga epekto (kung bakit ay pagkakaroon ng mataas na produktibo peers humantong sa mas mataas na produktibo). Susubukan naming bumalik sa mga ito ng dalawang mahalagang mga isyu-heterogeneity ng mga epekto ng paggamot at mga mekanismo-in Chapter 5 kapag usapan namin eksperimento nang mas detalyado.

Generalizing mula sa pag-aaral sa epekto ng Vietnam Draft sa mga kita at ang pag-aaral ng epekto ng mga kapantay sa pagiging produktibo, Table 2.3 summarizes iba pang mga pag-aaral na ito ay may eksaktong parehong istraktura: ang paggamit ng isang laging-on data source upang masukat ang epekto ng ilang mga kaganapan . Bilang Table 2.3 ginagawang malinaw, natural na mga eksperimento ay lahat ng dako kung ikaw lamang malaman kung paano hanapin ang mga ito.

Table 2.3: Mga halimbawa ng mga natural na mga eksperimento gamit big pinagkukunan ng data. Ang lahat ng mga pag-aaral sundin ang parehong basic recipe: random (o bilang kung random) kaganapan + laging-on data system. Tingnan Dunning (2012) para sa higit pang mga halimbawa.
mahalagang focus Source ng mga natural na eksperimento Always-on data source banggit
Peer epekto sa pagiging produktibo iiskedyul ng proseso checkout data Mas and Moretti (2009)
friendship formation hurricanes Facebook Phan and Airoldi (2015)
Pagkalat ng emosyon ulan Facebook Coviello et al. (2014)
Peer to peer-ekonomiyang transfers lindol mobile data pera Blumenstock, Fafchamps, and Eagle (2011)
Personal consumption pag-uugali 2013 US government shutdown personal na pananalapi data Baker and Yannelis (2015)
Economic epekto ng recommender systems iba-iba data sa pag-browse sa Amazon Sharma, Hofman, and Watts (2015)
Epekto ng stress sa hindi pa isinisilang sanggol 2006 Israel-Hezbollah digmaan talaan birth Torche and Shwed (2015)
Nagbabasa pag-uugali sa Wikipedia Snowden revelations Wikipedia logs Penney (2016)

Sa pagsasanay, ang mga mananaliksik gamitin ang dalawang iba't ibang mga diskarte para sa paghahanap ng natural na mga eksperimento, ang parehong na maaaring maging kapaki-pakinabang. Ang ilang mga mananaliksik magsimula sa mga laging-on data source at hanapin para sa random na mga kaganapan sa mundo; iba magsimula sa random na mga kaganapan sa mundo at hanapin para sa mga pinagkukunan ng data na makuha ang kanilang mga epekto. Sa wakas, napansin na ang lakas ng natural na mga eksperimento ay dumating hindi mula sa kabutihang-asal ng statistical analysis, ngunit mula sa pag-aalaga sa pagtuklas ng isang makatarungang paghahambing na ginawa ng isang masuwerte aksidente ng kasaysayan.