2.4.3 approximating eksperimento

translation na ito ay nilikha sa pamamagitan ng isang computer. ×

2.4.3 approximating eksperimento

Maaari naming tinatantiya ang mga eksperimento na wala o hindi maaaring gawin. Ang dalawang pamamaraang lalo na nakikinabang sa mga malalaking pinagmumulan ng data ay natural na mga eksperimento at pagtutugma.

Ang ilang mahahalagang pang-agham at patakaran na tanong ay pananahilan. Halimbawa, ano ang epekto ng isang programa sa pagsasanay sa trabaho sa sahod? Ang isang mananaliksik na sinusubukang sagutin ang tanong na ito ay maaaring ihambing ang mga kita ng mga tao na nag-sign up para sa pagsasanay sa mga hindi. Ngunit gaano karami ang pagkakaiba sa sahod sa pagitan ng mga pangkat na ito dahil sa pagsasanay at kung magkano ang dahil sa mga bago na pagkakaiba sa pagitan ng mga taong nag-sign up at yaong hindi? Ito ay isang mahirap na tanong, at ito ay isa na hindi awtomatikong umalis na may higit pang data. Sa madaling salita, ang pag-aalala tungkol sa posibleng mga pagkakaiba-iba na preexisting ay hindi gaanong gaano karami ang manggagawa sa iyong data.

Sa maraming mga sitwasyon, ang pinakamatibay na paraan upang tantyahin ang sanhi ng epekto ng ilang paggamot, tulad ng pagsasanay sa trabaho, ay upang magpatakbo ng isang randomized na kinokontrol na eksperimento kung saan ang isang mananaliksik ay sapalarang naghahatid ng paggamot sa ilang mga tao at hindi sa iba. Itatalaga ko ang lahat ng kabanata 4 sa mga eksperimento, kaya dito tutukuyin ko ang dalawang estratehiya na maaaring magamit sa di-eksperimentong data. Ang unang diskarte ay nakasalalay sa paghanap ng isang bagay na nangyayari sa mundo na sapalarang (o halos sapalarang) ay nagtatalaga ng paggamot sa ilang tao at hindi sa iba. Ang ikalawang diskarte ay depende sa istatistikang pagsasaayos ng di-eksperimentong data sa isang pagtatangka na i-account para sa mga naunang pagkakaiba sa pagitan ng mga ginawa at hindi natanggap ang paggamot.

Ang isang may pag-aalinlangan ay maaaring claim na ang parehong mga diskarte ay dapat na iwasan dahil nangangailangan sila ng malakas na mga pagpapalagay, mga pagpapalagay na mahirap upang masuri at na, sa pagsasanay, ay madalas na lumabag. Habang nagkakasundo ako sa pag-aangkin na ito, sa palagay ko napakalayo pa rin ito. Totoong totoo na ito ay mahirap na mapagkakatiwalaan na gumawa ng mga pang-unawa na dahilan mula sa di-pang-eksperimentong data, ngunit sa palagay ko ay hindi nangangahulugang hindi natin dapat subukan. Sa partikular, ang mga di-eksperimentong pamamaraang makatutulong kung maiiwasan ka ng logistical constraint sa pagsasagawa ng isang eksperimento o kung ang mga hadlang sa etika ay nangangahulugan na ayaw mong magpatakbo ng isang eksperimento. Karagdagan pa, ang mga di-eksperimentong pamamaraan ay maaaring makatulong kung nais mong samantalahin ang data na umiiral upang mag-disenyo ng isang randomized kinokontrol na eksperimento.

Bago magpatuloy, dapat ding tandaan na ang paggawa ng mga salungat sa pananahilan ay isa sa mga pinaka masalimuot na paksa sa panlipunang pananaliksik, at isa na maaaring humantong sa matinding at emosyonal na debate. Sa anong mga sumusunod, magbibigay ako ng maasahin na paglalarawan ng bawat paraan upang maitayo ang intuwisyon tungkol dito, pagkatapos ay ilalarawan ko ang ilan sa mga hamon na lumalabas kapag ginagamit ang diskarte. Ang karagdagang mga detalye tungkol sa bawat pamamaraan ay magagamit sa mga materyales sa dulo ng kabanatang ito. Kung balak mong gamitin ang alinman sa mga pamamaraang ito sa iyong sariling pananaliksik, lubos kong inirerekomenda ang pagbasa ng isa sa maraming mahusay na mga libro sa pananahilan ng pananahilan (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

Ang isang diskarte sa paggawa ng mga salungat na pananahilan mula sa di-eksperimentong data ay upang maghanap ng isang kaganapan na random na nakatalaga ng paggamot sa ilang mga tao at hindi sa iba. Ang mga sitwasyong ito ay tinatawag na natural na eksperimento . Ang isa sa mga pinakamalinaw na halimbawa ng isang natural na eksperimento ay mula sa pananaliksik ni Joshua Angrist (1990) sumusukat sa epekto ng mga serbisyong militar sa kita. Sa panahon ng digmaan sa Vietnam, pinalaki ng Estados Unidos ang laki ng kanyang mga armadong pwersa sa pamamagitan ng draft. Upang makapagpasiya kung aling mga mamamayan ang tatawagan sa serbisyo, ang gobyerno ng Estados Unidos ay nanindigan ng isang loterya. Ang bawat petsa ng kapanganakan ay isinulat sa isang piraso ng papel, at, tulad ng ipinakita sa tayahin 2.7, ang mga piraso ng papel na ito ay napili nang isa-isa upang matukoy ang pagkakasunud-sunod kung saan ang mga kabataang lalaki ay tatawaging maglingkod (mga kabataang babae ay hindi napapailalim sa draft). Batay sa mga resulta, ang mga lalaking isinilang noong Setyembre 14 ay unang tinawag, ang mga lalaki na isinilang noong Abril 24 ay tinatawag na pangalawa, at iba pa. Sa huli, sa loterya na ito, ang mga lalaki na isinilang sa 195 iba't ibang araw ay inimbento, habang ang mga lalaki na ipinanganak sa 171 araw ay hindi.

Figure 2.7: Ang unang kapsula ng Kongresista na si Alexander Pirnie (R-NY) para sa draft ng Selective Service noong Disyembre 1, 1969. Pinagsama ni Joshua Angrist (1990) ang draft lottery na may data ng kita mula sa Social Security Administration upang tantiyahin ang epekto ng serbisyo militar sa kita. Ito ay isang halimbawa ng pagsasaliksik gamit ang natural na eksperimento. Pinagmulan: US Selective Service System (1969) / Wikimedia Commons .

Bagaman hindi ito maaaring maging maliwanag, isang draft lottery ay may kritikal na pagkakatulad sa isang randomized na kinokontrol na eksperimento: sa parehong mga sitwasyon, ang mga kalahok ay random na nakatalaga upang makatanggap ng paggamot. Upang pag-aralan ang epekto ng randomized na paggamot na ito, kinuha ni Angrist ang isang laging malaking sistemang datos: ang US Social Security Administration, na nagtitipon ng impormasyon sa halos bawat kita ng Amerika mula sa trabaho. Sa pamamagitan ng pagsasama-sama ng impormasyon tungkol sa kung sino ang random na napili sa draft loterya na may mga data ng kita na nakolekta sa mga talaan ng administratibong pamahalaan, sinabi ni Angrist na ang mga kita ng mga beterano ay halos 15% na mas mababa kaysa sa kita ng mga katulad na di-beterano.

Tulad ng inilalarawan ng halimbawang ito, kung minsan ang mga pwersang panlipunan, pampulitika, o natural na nagtatakda ng paggamot sa paraang magagamit ng mga mananaliksik, at kung minsan ang mga epekto ng mga pagpapagamot na ito ay nakuha sa laging-sa mga malalaking pinagmumulan ng data. Ang diskarte sa pananaliksik na ito ay maaaring summarized tulad ng sumusunod: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

Upang ilarawan ang estratehiya na ito sa digital age, isaalang-alang natin ang isang pag-aaral ni Alexandre Mas at Enrico Moretti (2009) na sinubukang tantyahin ang epekto ng pagtatrabaho sa mga produktibong kasamahan sa pagiging produktibo ng isang manggagawa. Bago makita ang mga resulta, ito ay nagkakahalaga ng pagturo na may magkasalungat na mga inaasahan na maaaring mayroon ka. Sa isang banda, maaari mong asahan na ang pagtatrabaho sa mga produktibong kasamahan ay humahantong sa isang manggagawa upang madagdagan ang kanyang pagiging produktibo dahil sa panggigipit ng kasamahan. O, sa kabilang banda, maaari mong asahan na ang pagkakaroon ng matitingkad na kapantay ay maaaring humantong sa isang manggagawa na maging malungkot dahil ang gawain ay gagawin pa rin ng kanyang mga kapantay. Ang pinakamalinaw na paraan upang mag-aral ng mga epekto ng peer sa pagiging produktibo ay isang randomized na kinokontrol na eksperimento kung saan ang mga manggagawa ay sapalarang nakatalaga sa mga shift sa mga manggagawa ng iba't ibang mga antas ng pagiging produktibo at pagkatapos ay ang resultang produktibo ay sinukat para sa lahat. Gayunpaman, hindi sinusunod ng mga mananaliksik ang iskedyul ng mga manggagawa sa anumang tunay na negosyo, at sa gayon ay umasa si Mas at Moretti sa isang natural na eksperimento na kinasasangkutan ng mga cashier sa supermarket.

Sa ganitong partikular na supermarket, dahil sa pag-iiskedyul ng paraan at ang paraan na nagbabago ng overlap, ang bawat cashier ay may magkakaibang mga katrabaho sa iba't ibang oras ng araw. Dagdag pa, sa partikular na supermarket, ang pagtatalaga ng mga cashier ay walang kaugnayan sa pagiging produktibo ng kanilang mga kapantay o kung gaano abala ang tindahan. Sa ibang salita, kahit na ang pag-iiskedyul ng mga cashier ay hindi natutukoy ng isang loterya, parang ang mga manggagawa kung minsan ay random na nakatalaga upang magtrabaho sa mga mataas (o mababa) na mga kapantay ng pagiging produktibo. Sa kabutihang palad, ang supermarket na ito ay mayroon ding digital-age checkout system na sinusubaybayan ang mga item na ang bawat cashier ay nag-scan sa lahat ng oras. Mula sa data ng pag-log sa pag-check na ito, si Mas at Moretti ay nakalikha ng isang tumpak, indibidwal, at palaging sukatan ng pagiging produktibo: ang bilang ng mga item na na-scan sa bawat segundo. Ang pagsasama-sama ng dalawang bagay na ito-ang natural na pagkakaiba-iba sa pagiging produktibo ng peer at ang palaging sukatan ng pagiging produktibo-tinantiya ni Mas at Moretti na kung ang isang cashier ay nakatalaga sa mga katrabaho na 10% mas produktibo kaysa sa average, ang kanyang pagiging produktibo ay tataas ng 1.5% . Dagdag dito, ginamit nila ang sukat at kayamanan ng kanilang data upang tuklasin ang dalawang mahahalagang isyu: ang heterogeneity ng epekto na ito (Para sa kung anong uri ng mga manggagawa ang mas malaki ang epekto?) At ang mga mekanismo sa likod ng epekto (Bakit ang pagkakaroon ng mataas na produktibo na mga kapantay ay humantong sa mas mataas na produktibo?). Susubukan naming bumalik sa dalawang mahalagang isyu na ito-ang heterogeneity ng mga epekto sa paggamot at mga mekanismo-sa kabanata 4 kapag tinalakay namin ang mga eksperimento nang mas detalyado.

Pangkalahatan mula sa dalawang pag-aaral na ito, ang talahanayan 2.3 ay nagbubuod sa iba pang mga pag-aaral na may ganitong istraktura: gamit ang isang pinagmulan ng pinagmulan ng data upang sukatin ang epekto ng ilang mga random na pagkakaiba-iba. Sa pagsasagawa, ang mga mananaliksik ay gumagamit ng dalawang magkaibang estratehiya para sa paghahanap ng mga natural na eksperimento, na parehong maaaring maging mabunga. Ang ilang mga mananaliksik ay nagsisimula sa isang laging pinagmulan ng data at naghahanap ng mga random na kaganapan sa mundo; ang iba ay nagsimula ng isang random na kaganapan sa mundo at hanapin ang mga mapagkukunan ng data na makuha ang epekto nito.

Talahanayan 2.3: Mga Halimbawa ng Mga Eksperimento na Likas na Paggamit ng Mga Pinagmulan ng Malaking Data
Ang tumpak na pokus	Pinagmulan ng natural na eksperimento	Palaging pinagmulan ng data	Sanggunian
Ang mga epekto ng peer sa pagiging produktibo	Proseso ng pag-iskedyul	Data ng checkout	Mas and Moretti (2009)
Pagbuo ng pagkakaibigan	Hurricanes	Facebook	Phan and Airoldi (2015)
Pagkalat ng damdamin	Ulan	Facebook	Lorenzo Coviello et al. (2014)
Ang mga paglipat na pang-ekonomiya sa peer-to-peer	Lindol	Data ng pera ng pera	Blumenstock, Fafchamps, and Eagle (2011)
Pag-uugali ng personal na pagkonsumo	2013 Pag-shutdown ng pamahalaan ng US	Personal na data ng pananalapi	Baker and Yannelis (2015)
Epekto ng ekonomiya ng mga sistema ng mga nagmumungkahi	Iba-iba	Pag-browse ng data sa Amazon	Sharma, Hofman, and Watts (2015)
Epekto ng stress sa mga hindi pa isinisilang na sanggol	2006 Israel-Hezbollah digmaan	Mga tala ng kapanganakan	Torche and Shwed (2015)
Binabasa ang pag-uugali sa Wikipedia	Snowden revelations	Mga log ng Wikipedia	Penney (2016)
Mga epekto sa pag-eehersisyo	Panahon	Mga tracker sa kalusugan	Aral and Nicolaides (2017)

Sa talakayan sa ngayon tungkol sa natural na mga eksperimento, naiwan ko ang isang mahalagang punto: ang pagpunta mula sa kung ano ang katangian na ibinigay sa kung ano ang gusto mo ay maaaring maging medyo nakakalito. Bumalik tayo sa halimbawa ng draft sa Vietnam. Sa kasong ito, interesado si Angris sa pagtantya sa epekto ng serbisyong militar sa kita. Sa kasamaang palad, ang serbisyo militar ay hindi nakatalaga nang random; sa halip ito ay na-draft na random na itinalaga. Gayunpaman, hindi lahat ng na-draft ay nagsilbi (mayroong iba't ibang mga exemptions), at hindi lahat ng naglilingkod ay drafted (mga tao ay maaaring magboluntaryo upang maglingkod). Dahil ang pag-draft ay random na itinalaga, ang isang mananaliksik ay maaaring magtantya sa epekto ng pagiging draft para sa lahat ng tao sa draft. Ngunit ayaw ni Cristo na malaman ang epekto ng pagiging draft; gusto niyang malaman ang epekto ng paglilingkod sa militar. Gayunpaman, upang magawa ang pagtantya na ito, kinakailangan ang mga karagdagang pagpapalagay at komplikasyon. Una, kailangan ng mga mananaliksik na ang tanging paraan na ang naka-draft na mga kita na naapektuhan ay sa pamamagitan ng serbisyong militar, isang palagay na tinatawag na pagbabawal sa pagbubukod . Ang palagay na ito ay maaaring mali kung, halimbawa, ang mga taong na-draft ay nanatili sa paaralan na upang maiwasan ang paglilingkod o kung ang mga tagapag-empleyo ay mas malamang na umakupa ng mga taong na-draft. Sa pangkalahatan, ang paghihigpit sa pagbubukod ay isang kritikal na palagay, at kadalasan ay mahirap patunayan. Kahit na ang pagbabawal sa pagbubukod ay tama, imposible pa rin na tantyahin ang epekto ng paglilingkod sa lahat ng tao. Sa halip, ang mga mananaliksik ay maaari lamang tantyahin ang epekto sa isang partikular na subset ng mga lalaki na tinatawag na complier (mga lalaki na magsisilbi kapag drafted, ngunit hindi magsisilbi kapag hindi drafted) (Angrist, Imbens, and Rubin 1996) . Ang mga tagatustos, gayunpaman, ay hindi ang orihinal na populasyon ng interes. Pansinin na ang mga problemang ito ay lumitaw kahit na sa relatibong malinis na kaso ng draft lottery. Ang isang karagdagang hanay ng mga komplikasyon ay lumabas kapag ang paggamot ay hindi itinalaga ng isang pisikal na loterya. Halimbawa, sa pag-aaral ni Mas at Moretti ng mga cashier, ang mga karagdagang tanong ay lumitaw tungkol sa palagay na ang pagtatalaga ng mga kapantay ay talagang random. Kung ang mga palagay na ito ay labis na lumabag, maaari itong maging bias ang kanilang mga pagtatantya. Upang tapusin, ang natural na mga eksperimento ay maaaring maging isang malakas na diskarte para sa paggawa ng mga pang-unawa ng pananahilan mula sa di-pang-eksperimentong data, at malaking mga mapagkukunan ng data ay nagdaragdag ng aming kakayahang mag-capitalize sa natural na mga eksperimento kapag nangyari ito. Gayunpaman, maaaring mangailangan ito ng mahusay na pag-aalaga-at kung minsan ay malakas na mga pagpapalagay-upang pumunta sa kung anong kalikasan ang ibinigay sa pagtatantya na gusto mo.

Ang pangalawang estratehiya na gusto kong sabihin sa iyo tungkol sa paggawa ng mga pang-unawa ng pananahilan mula sa di-pang-eksperimentong data ay depende sa istatistikang pagsasaayos ng mga di-eksperimentong data sa pagtatangkang ipaliwanag ang mga pagkakaiba sa pagitan ng mga nagawa at hindi tumanggap ng paggamot. Mayroong maraming mga diskarte tulad ng pagsasaayos, ngunit ako ay tumutok sa isang tinatawag na pagtutugma . Sa pagtutugma, ang tagapagpananaliksik ay tumingin sa pamamagitan ng di-pang-eksperimentong data upang lumikha ng mga pares ng mga tao na katulad maliban na ang isa ay nakatanggap ng paggamot at ang isa ay hindi. Sa proseso ng pagtutugma, ang mga mananaliksik ay talagang din pruning ; ibig sabihin, itinapon ang mga kaso kung saan walang halatang tugma. Kaya, ang pamamaraang ito ay mas tumpak na tinatawag na matching-and-pruning, ngunit magpapatuloy ako sa tradisyunal na termino: pagtutugma.

Ang isang halimbawa ng kapangyarihan ng pagtutugma ng mga estratehiya na may napakalaking hindi pang-eksperimentong pinagmumulan ng data ay mula sa pananaliksik sa pag-uugali ng mamimili ni Liran Einav at mga kasamahan (2015) . Interesado sila sa mga auction na nagaganap sa eBay, at sa paglalarawan sa kanilang trabaho, tutukan ko ang epekto ng presyo ng pagsisimula ng auction sa mga kinalabasan ng auction, tulad ng presyo ng pagbebenta o ang posibilidad ng isang benta.

Ang pinaka-walang muwang paraan upang tantyahin ang epekto ng panimulang presyo sa presyo ng pagbebenta ay ang simpleng kalkulahin ang pangwakas na presyo para sa mga auction na may iba't ibang mga panimulang presyo. Ang pamamaraan na ito ay pagmultahin kung gusto mong hulaan ang presyo ng pagbebenta na ibinigay sa panimulang presyo. Ngunit kung ang iyong katanungan ay may kinalaman sa epekto ng panimulang presyo, ang ganitong pamamaraan ay hindi gagana sapagkat ito ay hindi batay sa makatarungang paghahambing; ang mga auction na may mas mababang mga panimulang presyo ay maaaring magkaiba sa mga may mas mataas na panimulang presyo (halimbawa, maaaring ito ay para sa iba't ibang uri ng mga kalakal o kasama ang iba't ibang uri ng mga nagbebenta).

Kung nalalaman mo na ang mga problema na maaaring lumabas kapag gumagawa ng mga pang-unawa na dahilan mula sa di-eksperimentong data, maaari mong laktawan ang walang muwang na diskarte at isaalang-alang ang pagpapatakbo ng eksperimentong patlang kung saan mo ibebenta ang isang partikular na item-sabihin, isang golf club-na may isang nakapirming hanay ng mga parameter ng auction-sabihin, libreng pagpapadala at auction bukas para sa dalawang linggo-ngunit sa sapalarang itinalaga na mga panimulang presyo. Sa pamamagitan ng paghahambing sa mga nagresultang kinalabasan ng merkado, ang field na ito ay nag-aalok ng isang napakalinaw na pagsukat ng epekto ng panimulang presyo sa presyo ng pagbebenta. Ngunit ang pagsukat na ito ay nalalapat lamang sa isang partikular na produkto at hanay ng mga parameter ng auction. Ang mga resulta ay maaaring naiiba, halimbawa, para sa iba't ibang uri ng mga produkto. Kung wala ang isang matibay na teorya, mahirap matutungin mula sa nag-iisang eksperimento sa buong hanay ng mga posibleng eksperimento na maaaring tumakbo. Dagdag pa, ang mga eksperimento sa field ay sapat na mahal na magiging infeasible upang patakbuhin ang bawat pagkakaiba-iba na maaari mong subukan.

Kabaligtaran sa mga walang muwang at pang-eksperimentong pamamaraang, kinuha ng Einav at mga kasamahan ang isang ikatlong diskarte: pagtutugma. Ang pangunahing lansihin sa kanilang diskarte ay upang matuklasan ang mga bagay na katulad ng mga eksperimento sa larangan na nangyari sa eBay. Halimbawa, ang figure 2.8 ay nagpapakita ng ilan sa 31 mga listahan para sa eksaktong parehong golf club-isang Taylormade Burner 09 Driver-na ibinebenta ng eksaktong parehong nagbebenta - "budgetgolfer." Gayunpaman, ang mga listahang 31 na ito ay may bahagyang iba't ibang mga katangian, tulad ng iba't ibang panimulang presyo, petsa ng pagtatapos, at bayad sa pagpapadala. Sa madaling salita, ito ay parang "budgetgolfer" ay nagpapatakbo ng mga eksperimento para sa mga mananaliksik.

Ang mga listahan ng Taylormade Burner 09 Driver na ibinebenta ng "budgetgolfer" ay isang halimbawa ng isang naitugmang hanay ng mga listahan, kung saan ang eksaktong parehong item ay ibinebenta ng eksaktong parehong nagbebenta, ngunit sa bawat oras na may bahagyang iba't ibang mga katangian. Sa loob ng napakalaking mga tala ng eBay ay may literal na daan-daang libo ng mga tugmang hanay na kinasasangkutan ng milyun-milyong mga listahan. Kaya, sa halip na ikumpara ang pangwakas na presyo para sa lahat ng mga auction na may isang ibinigay na panimulang presyo, ang Einav at mga kasamahan kumpara sa mga katugmang hanay. Upang pagsamahin ang mga resulta mula sa mga paghahambing sa loob ng mga daan-daang libong matched set na ito, muling ipinahayag ng Einav at mga kasamahan ang panimulang presyo at pangwakas na presyo sa mga tuntunin ng halaga ng sanggunian ng bawat item (halimbawa, ang average na presyo ng pagbebenta). Halimbawa, kung ang Taylormade Burner 09 Driver ay may reference na halaga na $ 100 (batay sa mga benta nito), pagkatapos ay isang panimulang presyo ng $ 10 ang ipapahayag bilang 0.1 at isang pangwakas na presyo ng $ 120 bilang 1.2.

Figure 2.8: Isang halimbawa ng isang naitugmang hanay. Ito ang eksaktong parehong golf club (isang Taylormade Burner 09 Driver) na ibinebenta ng eksaktong parehong tao ("budgetgolfer"), ngunit ang ilan sa mga benta ay ginanap sa ilalim ng iba't ibang mga kondisyon (hal., Iba't ibang mga panimulang presyo). Einav et al. (2015) ng pahintulot mula sa Einav et al. (2015) , tayahin 1b.

Tandaan na ang Einav at mga kasamahan ay interesado sa epekto ng pagsisimula ng presyo sa mga resulta ng auction. Una, gumamit sila ng linear regression upang tantiyahin na ang mas mataas na panimulang presyo ay bumababa sa posibilidad ng isang benta, at ang mas mataas na panimulang presyo ay nagdaragdag sa huling presyo ng pagbebenta (kondisyon sa isang pagbebenta na nagaganap). Sa pamamagitan ng kanilang mga sarili, ang mga pagtatantya na ito na naglalarawan ng isang linear na relasyon at na-average sa lahat ng mga produkto-ay hindi lahat na kawili-wili. Pagkatapos, ginamit ng Einav at mga kasamahan ang napakalaking sukat ng kanilang data upang lumikha ng iba't ibang mas mahuhusay na pagtatantya. Halimbawa, sa pamamagitan ng pagtantya ng epekto nang hiwalay para sa iba't ibang iba't ibang mga panimulang presyo, napag-alaman nila na ang relasyon sa pagitan ng panimulang presyo at presyo ng pagbebenta ay nonlinear (figure 2.9). Sa partikular, para sa pagsisimula ng mga presyo sa pagitan ng 0.05 at 0.85, ang panimulang presyo ay napakaliit na epekto sa presyo ng pagbebenta, isang paghahanap na ganap na napalampas ng kanilang unang pagtatasa. Dagdag dito, sa halip na averaging sa lahat ng mga item, tinantya ng Einav at mga kasamahan ang epekto ng pagsisimula ng presyo para sa 23 iba't ibang mga kategorya ng mga item (hal., Pet supplies, electronics, at sports memorabilia) (figure 2.10). Ang mga pagtatantya na ito ay nagpapakita na para sa mas natatanging mga bagay-tulad ng memorabilia-starting price ay may mas maliit na epekto sa posibilidad ng isang pagbebenta at mas malaking epekto sa huling presyo ng pagbebenta. Dagdag pa, para sa higit pang mga bagay na nakapag-komodikato-tulad ng mga DVD-ang simulang presyo ay halos walang epekto sa huling presyo. Sa ibang salita, ang isang average na pinagsasama ang mga resulta mula sa 23 iba't ibang mga kategorya ng mga item hides mahalagang pagkakaiba sa pagitan ng mga item na ito.

Figure 2.9: Relasyon sa pagitan ng presyo ng simula ng auction at posibilidad ng isang benta (a) at presyo ng pagbebenta (b). Mayroong halos isang linear na relasyon sa pagitan ng panimulang presyo at posibilidad ng pagbebenta, ngunit isang nonlinear na relasyon sa pagitan ng panimulang presyo at presyo ng pagbebenta; para sa pagsisimula ng mga presyo sa pagitan ng 0.05 at 0.85, ang panimulang presyo ay napakaliit na epekto sa presyo ng pagbebenta. Sa parehong mga kaso, ang relasyon ay karaniwang independiyenteng ng halaga ng item. Inangkop mula sa Einav et al. (2015) , mga numero 4a at 4b.

Figure 2.10: Mga pagtatantya mula sa bawat kategorya ng mga item; ang solid dot ay ang pagtatantya para sa lahat ng mga kategorya na magkakasama (Einav et al. 2015) . Ang mga pagtatantya na ito ay nagpapakita na para sa mas natatanging mga bagay-tulad ng memorabilia-ang panimulang presyo ay may mas maliit na epekto sa posibilidad ng isang pagbebenta ( $x$ -axis) at mas malaking epekto sa huling presyo ng pagbebenta ( $y$ -aksis). Inangkop mula sa Einav et al. (2015) , tayahin 8.

Kahit na ikaw ay hindi partikular na interesado sa mga auction sa eBay, kailangan mong humanga ang paraan na figure 2.9 at figure 2.10 ay nag-aalok ng isang mas mahusay na pag-unawa sa eBay kaysa sa simpleng mga pagtatantya na naglalarawan ng isang linear na relasyon at pagsamahin ang maraming iba't ibang mga kategorya ng mga item. Dagdag pa, bagaman magiging posible ang pang-agham upang makabuo ng mas mahuhusay na mga pagtatantya sa mga eksperimentong field, ang gastos ay maaaring maging imposible sa gayong mga eksperimento.

Tulad ng mga likas na eksperimento, may ilang mga paraan na tumutugma ay maaaring humantong sa masamang mga pagtatantya. Sa palagay ko ang pinakamalaking pag-aalala sa pagtutugma ng mga pagtatantya ay maaari silang maging pinapanigla ng mga bagay na hindi ginamit sa pagtutugma. Halimbawa, sa kanilang mga pangunahing resulta, nagawa ng Einav at kasamahan ang eksaktong pagtutugma sa apat na katangian: numero ng ID ng nagbebenta, kategorya ng item, pamagat ng item, at subtitle. Kung ang mga item ay naiiba sa mga paraan na hindi ginamit para sa pagtutugma, pagkatapos ito ay maaaring lumikha ng isang hindi patas na paghahambing. Halimbawa, kung ang "budgetgolfer" ay bumaba ng mga presyo para sa Taylormade Burner 09 Driver sa taglamig (kapag ang mga golf club ay hindi gaanong kilala), maaari itong lumitaw na ang mas mababang presyo ng simula ay humantong sa mas mababang presyo sa huling presyo, sa katunayan ito ay isang artepakto ng seasonal variation in demand. Ang isang diskarte sa pagtugon sa pag-aalala na ito ay sinusubukan ang maraming iba't ibang mga uri ng pagtutugma. Halimbawa, ang paulit-ulit na pag-aaral ng Einav at mga kasamahan habang binabago ang window ng oras na ginagamit para sa pagtutugma (naitugmang mga hanay ang mga item sa pagbebenta sa loob ng isang taon, sa loob ng isang buwan, at kasabay nito). Sa kabutihang palad, nakita nila ang katulad na mga resulta para sa lahat ng mga bintana ng oras. Ang isang karagdagang pag-aalala sa pagtutugma arises mula sa interpretasyon. Ang mga pagtatantya mula sa pagtutugma ay nalalapat lamang sa katugmang data; hindi sila nalalapat sa mga kaso na hindi maitugma. Halimbawa, sa pamamagitan ng paglilimita sa kanilang pananaliksik sa mga item na mayroong maraming listahan, ang Einav at mga kasamahan ay tumutuon sa mga propesyonal at semi-propesyonal na nagbebenta. Kung gayon, kapag binigyang-kahulugan ang mga paghahambing na ito dapat nating tandaan na nalalapat lamang ito sa subset na ito ng eBay.

Ang pagtutugma ay isang makapangyarihang diskarte para sa paghahanap ng mga makatarungang paghahambing sa di-eksperimentong data. Sa maraming mga sosyal na siyentipiko, ang pagtutugma ay nakadarama ng pangalawang pinakamahusay sa mga eksperimento, ngunit iyon ay isang paniniwala na maaaring mabago, bahagyang. Ang pagtutugma sa napakalaking data ay maaaring mas mahusay kaysa sa isang maliit na bilang ng mga eksperimento sa patlang kapag (1) heterogeneity sa mga epekto ay mahalaga at (2) ang mga mahahalagang variable na kinakailangan para sa pagtutugma ay sinusukat. Ang Table 2.4 ay nagbibigay ng ilang iba pang mga halimbawa ng kung paano ang pagtutugma ay maaaring gamitin sa mga malalaking pinagkukunan ng data.

Talaan 2.4: Mga Halimbawa ng Pag-aaral na Gumagamit ng Pagtutugma sa Mga Pinagmumulan ng Malaking Data
Ang tumpak na pokus	Malaking data source	Sanggunian
Epekto ng mga shootings sa karahasan ng pulisya	Mga stop-and-frisk record	Legewie (2016)
Epekto ng Setyembre 11, 2001 sa mga pamilya at kapitbahay	Mga talaan ng pagboto at mga talaan ng donasyon	Hersh (2013)
Panlipunang panlipunan	Data ng pag-aampon ng komunikasyon at produkto	Aral, Muchnik, and Sundararajan (2009)

Sa wakas, ang pagtatantya ng mga epekto ng pananahilan mula sa di-eksperimentong data ay mahirap, ngunit ang mga diskarte tulad ng natural na mga eksperimento at statistical na mga pagsasaayos (halimbawa, pagtutugma) ay maaaring gamitin. Sa ilang mga sitwasyon, ang mga pamamaraang ito ay maaaring masama nang mali, ngunit kung maingat na italaga, ang mga pamamaraang ito ay maaaring maging isang kapaki-pakinabang na pandagdag sa pang-eksperimentong diskarte na inilalarawan ko sa kabanata 4. Dagdag pa, ang dalawang pamamaraang ito ay tila lalong nakikinabang sa paglago ng laging- on, malaking data system.