2.4.3 kausa eksperimento

Mahimo natong gibana-bana ang mga eksperimento nga wala kanato o dili mahimo. Ang duha ka pamaagi nga labi nga nakabenepisyo gikan sa dagkong mga tinubdan sa datos mao ang natural nga mga eksperimento ug pagkaparis

Ang pipila ka importante nga pangutana sa siyensiya ug palisiya maoy hinungdan. Pananglitan, unsa ang epekto sa usa ka programa sa pagbansay sa trabaho sa suhol? Ang usa ka tigdukiduki nga misulay sa pagtubag niini nga pangutana mahimong ikomparar ang mga kinitaan sa mga tawo nga mipirma alang sa pagbansay niadtong wala. Apan unsa ang kalainan sa bisan unsang kalainan sa suholan sa taliwala niining mga pundok tungod sa pagbansay ug unsa kini ka dako tungod sa kaniadto nga mga kalainan tali sa mga tawo nga nagparehistro ug niadtong wala? Kini usa ka malisud nga pangutana, ug usa kini nga dili awtomatik nga mawala uban ang dugang nga datos. Sa laing pagkasulti, ang kabalaka mahitungod sa posible nga mga panagkalahi nga mga panaglahi bisan kung unsa ka daghang mga mamumuo ang anaa sa imong datos.

Sa daghang mga sitwasyon, ang pinakalig-on nga paagi sa pagtantiya sa sangputanan nga epekto sa pipila nga pagtambal, sama sa pagbansay sa trabaho, mao ang pagpadagan sa usa ka nagkalain-laing kontrolado nga eksperimento diin ang usa ka tigdukiduki anam-anam nga naghatag sa pagtambal sa pipila ka mga tawo ug dili sa uban. Akong igugol ang tanan nga kapitulo 4 ngadto sa mga eksperimento, busa dinhi ako mag-focus sa duha ka estratehiya nga magamit uban sa dili eksperimentong datos. Ang unang estratehiya nagdepende sa pagtan-aw sa usa ka butang nga nahitabo sa kalibutan nga ang random (o dulom nga random) nag-assign sa pagtambal sa pipila ka mga tawo ug dili sa uban. Ang ikaduha nga estratehiya nag-agad sa estratehikong pag-adjust sa dili eksperimento nga datos sa usa ka paningkamot sa pag-asoy alang sa nag-una nga mga kalainan tali sa mga nahimo ug wala makadawat sa pagtambal.

Ang usa nga magduhaduha tingali moingon nga kining mga estratehiya kinahanglang likayan tungod kay nagkinahanglan kini og kusganong mga panghunahuna, mga pangagpas nga malisud sa pagsusi ug nga, sa praktis, kanunay nga gilapas. Samtang ako nahiuyon sa niini nga pag-angkon, sa akong hunahuna kini usa ka gamay kaayo. Tinuod gayud nga kini lisud nga makahimo sa mga hinungdan sa pagbanabana gikan sa dili eksperimento nga datos, apan sa akong hunahuna wala kini nagpasabut nga dili gayud kita mosulay. Sa partikular, ang mga dili eksperimental nga mga pamaagi makatabang kung ang pagpugong sa logistik makapugong kanimo sa pagpahigayon og usa ka eksperimento o kon ang mga pagpugong sa etika nagpasabot nga dili nimo gusto nga magpadagan og eksperimento. Dugang pa, ang mga dili eksperimental nga pamaagi makatabang kung gusto nimo pahimuslan ang mga datos nga naglungtad na aron sa pagdesinyo sa usa ka randomized controlled experiment.

Sa dili pa mopadayon, angay usab nga hinumdoman nga ang paghimo sa mga gibana-bana nga panghimatuud usa sa labing komplikado nga mga hilisgutan sa sosyal nga panukiduki, ug ang usa nga mahimong mosangput sa mainiton ug emosyonal nga debate. Sa unsa nga kasunod, ako mohatag og malaumon nga paghulagway sa matag pamaagi aron sa pagtukod sa panan-aw mahitungod niini, nan akong ihulagway ang pipila sa mga hagit nga motumaw sa dihang gamiton kana nga paagi. Ang dugang nga mga detalye mahitungod sa matag pamaagi anaa sa mga materyales sa katapusan niini nga kapitulo. Kung nagplano ka nga mogamit sa bisan hain niini nga mga pamaagi sa imong kaugalingon nga panukiduki, girekomenda ko ang pagbasa sa usa sa daghang maayo nga mga basahon sa hinungdan nga paghukom (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

Ang usa ka pamaagi sa paghimo sa mga gibanabanang panghimatuud gikan sa dili eksperimento nga datos mao ang pagpangita alang sa usa ka panghitabo nga sa walay pagkasayod gihatag sa pagtambal ngadto sa pipila ka mga tawo ug dili sa uban. Kini nga mga sitwasyon gitawag nga natural nga eksperimento . Usa sa labing klarong mga pananglitan sa usa ka natural nga eksperimento nagagikan sa panukiduki ni Josue Angrist (1990) pagsukod sa epekto sa serbisyo sa militar sa kinitaan. Atol sa gubat sa Vietnam, ang Estados Unidos nagdugang sa gidak-on sa iyang mga armadong pwersa pinaagi sa usa ka draft. Aron makahukom kung unsang mga lungsoranon ang pagatawgon sa serbisyo, ang gobyerno sa Estados Unidos nagpahigayon og usa ka loterya. Ang matag petsa sa pagkatawo gisulat sa usa ka piraso nga papel, ug, sama sa gipakita sa hulagway 2.7, kini nga mga piraso sa papel gipili matag usa aron mahibal-an ang pagkasunod-sunod diin ang batan-ong mga lalaki tawagon aron moserbisyo (ang batan-ong mga babaye dili sakop ngadto sa draft). Base sa mga resulta, ang mga lalaki nga natawo sa Septyembre 14 ang una nga gitawag, ang mga lalaki nga natawo sa Abril 24 gitawag nga ikaduha, ug uban pa. Sa katapusan, niining loterya, ang mga lalaki nga natawo sa 195 ka lainlaing mga adlaw gi-draft, samtang ang mga lalaki nga natawo sa 171 ka adlaw wala.

Gihulagway ni Joshua Angrist (1990) ang draft lottery sa mga datos sa kinitaan gikan sa Social Security Administration aron sa pagtantiya sa epekto sa serbisyo sa militar sa kinitaan. Kini usa ka pananglitan sa panukiduki nga naggamit sa natural nga eksperimento. Source: US Selective Service System (1969) / Wikimedia Commons.

Gihulagway ni Joshua Angrist (1990) ang draft lottery sa mga datos sa kinitaan gikan sa Social Security Administration aron sa pagtantiya sa epekto sa serbisyo sa militar sa kinitaan. Kini usa ka pananglitan sa panukiduki nga naggamit sa natural nga eksperimento. Source: US Selective Service System (1969) / Wikimedia Commons .

Bisag dili kini dayag nga makita, ang usa ka lottery draft adunay usa ka kritikal nga kaamgiran sa usa ka randomized controlled nga eksperimento: sa duha ka mga sitwasyon, ang mga sumasalmot random nga gi-assign sa pagdawat sa usa ka pagtambal. Aron matun-an ang epekto niining piniling pagtratar, si Angrist mipahimulos sa kanunay nga dagkong sistema sa datos: ang US Social Security Administration, nga nagkolekta sa impormasyon sa halos matag kita sa Amerikano gikan sa trabaho. Pinaagi sa paghiusa sa kasayuran mahitungod kung kinsa ang gipili nga random diha sa draft loterya nga adunay mga datos sa kinitaan nga nakolekta sa mga rekord sa pang-administratibo nga mga rekord, si Angrist mihinapos nga ang kita sa mga beterano mga 15% nga mas ubos kay sa kita sa susama nga dili mga beterano.

Ingon sa gipakita niini nga pananglitan, usahay ang mga pwersa sa sosyal, politikal, o kinaiyanhon nga paghatag og mga pagtambal sa usa ka paagi nga mahimong mapugngan sa mga tigdukiduki, ug usahay ang mga epekto niini nga mga pag-atiman madakpan kanunay-sa dagkong mga tinubdan sa datos. Kini nga estratehiya sa panukiduki mahimo nga gisumada sama sa mosunod: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

Sa pag-ilustrar niini nga estratehiya sa digital age, atong hisgotan ang usa ka pagtuon ni Alexandre Mas ug Enrico Moretti (2009) nga nagsulay sa pag-estimate sa epekto sa pagtrabaho uban sa mga produktibo nga kauban sa trabaho sa usa ka trabahador. Sa dili pa makita ang mga resulta, angay nga ipunting nga adunay magkasumpaki nga mga pagdahum nga mahimo nimo. Sa usa ka bahin, mahimo nimong ipaabut nga ang pagtrabaho uban sa mabungahon nga mga kaubanan magdala sa usa ka trabahante aron madugangan ang iyang pagkamabungahon tungod sa pagpamugos sa kaubanan. O, sa pihak nga bahin, mahimo nga ginapaabot mo nga ang pag-angkon sang mga kaupod nga mga kaupod mahimo mag-agi sa isa ka trabahador nga mag-untat bangud ang buluhaton pagahimoon sang iya mga kaupod gihapon. Ang labing klaro nga paagi sa pagtuon sa mga epekto sa kaabtik sa produksyon mao ang usa ka randomized controlled nga eksperimento diin ang mga trabahante random nga gi-assign sa pagbalhin uban sa mga trabahante nga lainlaig lebel sa produktibo ug dayon ang resulta nga produktibo gisukod alang sa tanan. Apan ang mga tigdukiduki wala makontrol sa iskedyul sa mga mamumuo sa bisan unsa nga tinuod nga negosyo, ug busa si Mas ug Moretti kinahanglan nga mosalig sa natural nga eksperimento nga naglangkob sa mga cashier sa usa ka supermarket.

Niini nga partikular nga supermarket, tungod sa paagi nga gihimo ang pag-iskedyul ug ang pamaagi nga nag-usab-usab, ang matag cashier adunay nagkalainlain nga mga kauban sa trabaho sa nagkalainlaing oras sa adlaw. Dugang pa, niining partikular nga supermarket, ang assignment sa mga cashier wala'y kalabutan sa pagka-produktibo sa ilang mga kaubanan o unsa ka busy ang tindahan. Sa laing pagkasulti, bisan ang pag-iskedyul sa mga cashier wala mahibal-an sa usa ka loterya, sama ra nga ang mga trabahante usahay gibutang sa mga gimbuhaton nga taas (o ubos) nga mga kaedad sa produksyon. Maayo na lang, kini nga supermarket usab adunay digital-age checkout system nga nagsusi sa mga butang nga ang matag cashier nag-scan sa tanang panahon. Gikan sa kini nga datos sa pag-check log, si Mas ug Moretti nakahimo sa paghimo sa usa ka tukma, tagsa-tagsa, ug kanunay nga sukdanan sa pagka-produktibo: ang gidaghanon sa mga item nga gitan-aw kada segundo. Ang paghiusa niining duha nga mga butang-ang natural nga pagkalahi sa produksyon sa kaedad ug sa kanunay nga sukod sa pagka-produktibo-Si Mas ug si Moretti nagbanabana nga kung ang usa ka cashier gi-assign nga mga katrabaho nga 10% mas produktibo kay sa aberids, ang iyang abot sa produksyon sa 1.5% . Dugang pa, gigamit nila ang gidak-on ug kabuhong sa ilang datos aron masusi ang duha ka importante nga mga isyu: ang heterogeneity niini nga epekto (Alang sa unsa nga matang sa mga mamumuo ang epekto mas dako?) Ug ang mga mekanismo nga nagpaluyo sa epekto mas taas nga produksyon?). Mobalik kita niining duha ka importante nga mga isyu-ang heterogeneity sa mga epekto sa pagtambal ug mga mekanismo-sa kapitulo 4 sa dihang kita maghisgot sa mga eksperimento sa dugang nga detalye.

Ang pag-generalize gikan sa duha ka pagtuon, ang talaan 2.3 nag-summarize sa uban pang mga pagtuon nga adunay susama nga istruktura: gamit ang kanunay-on nga tinubdan sa datos aron sukdon ang epekto sa pipila ka nagkalain-lain nga kalainan. Sa praktis, ang mga tigdukiduki naggamit sa duha ka nagkalainlain nga estratehiya alang sa pagpangita sa natural nga mga eksperimento, nga ang duha mahimong mabungahon Ang ubang mga tigdukiduki magsugod sa usa ka kanunay nga kasayuran sa datos ug mangita alang sa mga sulagma nga panghitabo sa kalibutan; ang uban nagsugod sa usa ka random nga panghitabo sa kalibutan ug sa pagpangita sa mga tinubdan sa datos nga makuha sa epekto niini.

Table 2.3: Mga Ehemplo sa Natural nga mga Eksperimento Paggamit sa Mga Tinubdan sa Big Data
Talagsaong pokus Tinubdan sa natural nga eksperimento Kanunay nga gigikanan sa datos Reference
Mga epekto sa kaabtik sa produksyon Proseso sa pag-iskedyul Checkout data Mas and Moretti (2009)
Pagporma sa panaghigalaay Mga bagul Facebook Phan and Airoldi (2015)
Pagkaylap sa emosyon Ulan Facebook Lorenzo Coviello et al. (2014)
Pag-uswag sa ekonomiya sa mga kaubanan Linog Mga datos sa mobile money Blumenstock, Fafchamps, and Eagle (2011)
Personal nga kinaiya sa konsumo 2013 pagsira sa gobyerno sa US Personal nga data sa panalapi Baker and Yannelis (2015)
Epekto sa ekonomiya sa mga sistema sa rekomendasyon Nagkalainlain Pag-abli sa mga datos sa Amazon Sharma, Hofman, and Watts (2015)
Epekto sa stress sa wala pa matawo nga mga bata 2006 Israel-Hezbollah gubat Mga rekord sa pagkatawo Torche and Shwed (2015)
Pagbasa nga kinaiya sa Wikipedia Mga pagpadayag sa Snowden Mga log sa Wikipedia Penney (2016)
Mga epekto sa pag-ehersisyo Panahon Fitness trackers Aral and Nicolaides (2017)

Diha sa panaghisgutan sa hilabihan mahitungod sa mga natural nga mga eksperimento, wala nako gibilin ang usa ka importante nga punto: ang pagbiya gikan sa unsa nga kinaiyahan nga gihatag ngadto sa unsay imong gusto usahay mahimong malisud. Mobalik kita sa sumbanan sa Vietnam. Niini nga kaso, si Angrist interesado sa pagtantiya sa epekto sa serbisyo sa militar sa kinitaan. Sa walay palad, ang serbisyo militar wala gi-assign sa sulud; hinuon kini nga gi-draft nga random nga gi-assign. Apan, dili tanan nga gigahin nag-alagad (adunay nagkalainlain nga mga eksepsiyon), ug dili tanan nga nag-alagad nahimo (ang mga tawo mahimong moboluntaryo sa pagserbisyo). Tungod kay ang gi-draft usa nga gi-assign, usa ka tigdukiduki mahimo nga magbanabana sa epekto nga gi-draft alang sa tanan nga mga tawo diha sa draft. Apan si Angrist dili gusto nga mahibal-an ang epekto nga gi-draft; gusto niyang mahibal-an ang epekto sa pagserbisyo sa militar. Apan, aron mahatagan kini nga pagbanabana, gikinahanglan ang dugang nga mga panghunahuna ug komplikasyon. Una, ang mga tigdukiduki kinahanglan nga maghunahuna nga ang bugtong paagi nga ang gi-draft nga naka-apekto nga kinitaan mao ang pinaagi sa serbisyo sa militar, usa ka pangagpas nga gitawag nga pagpugong sa pagpugong . Kini nga pangagpas mahimong sayup kon, pananglitan, ang mga lalaki nga gi-draft na nagpabilin sa eskwelahan nga dugay aron malikayan ang pag-alagad o kung ang mga amo dili kaayo mag-hire og mga lalaki nga gi-draft. Sa kinatibuk-an, ang pagpugong sa pagpahigawas usa ka kritikal nga pangagpas, ug kasagaran lisud ang pagsusi. Bisan kon husto ang pagpugong sa pagpugong, dili mahimo ang pag-estimate sa epekto sa pag-alagad sa tanang tawo. Hinuon, ang mga tigdukiduki makahimo lamang sa pagtantiya sa epekto sa usa ka piho nga tipik sa mga lalaki nga gitawag nga compliters (mga lalaki nga mag-alagad sa diha nga gi-draft, apan dili mag-alagad kung dili mag-draft) (Angrist, Imbens, and Rubin 1996) . Apan ang mga kompaniya dili mga orihinal nga interes sa katawhan. Matikdi nga kini nga mga problema moabut bisan pa sa medyo limpyo nga kaso sa draft loterya. Ang usa ka dugang nga mga komplikasyon motumaw sa diha nga ang pagtambal dili gihatag sa usa ka pisikal nga loterya. Pananglitan, sa pagtuon ni Mas ug ni Moretti sa mga cashier, dugang nga mga pangutana ang mitungha mahitungod sa paghunahuna nga ang assignment sa mga kaubanan sa pagkatinuod nga random. Kung kini nga pag-asoy kusganong gilapas, kini mahimong makadaut sa ilang mga pagbanabana. Sa pagtapos, ang natural nga mga eksperimento mahimong usa ka gamhanan nga estratehiya sa paghimo sa mga pag-angkon sa mga panghimatuud gikan sa dili eksperimento nga datos, ug ang dagkong mga tinubdan sa datos nagdugang sa atong abilidad sa pagpahimulos sa natural nga mga eksperimento kung mahitabo kini. Bisan pa niana, kini tingali nagkinahanglan og dako nga pag-amping-ug usahay lig-on nga mga panghunahuna-sa pag-adto gikan sa unsa nga kinaiya nga gihatag sa banabana nga gusto nimo.

Ang ikaduha nga estratehiya nga gusto nakong isulti kanimo mahitungod sa paghimo sa mga gibana-bana nga mga sangputanan gikan sa dili eksperimentong datos nag-agad sa istatistikong pag-adjust sa dili eksperimento nga mga datos sa paningkamot sa pag-asoy sa preexisting nga mga kalainan tali niadtong nahimo ug wala makadawat sa pagtambal. Adunay daghan nga mga pag-adjust nga pamaagi, apan mag-focus ako sa usa nga gitawag nga pagtutugma . Sa pagparis, ang tigdukiduki nagatan-aw sa dili eksperimento nga datos aron sa paghimo sa mga pares sa mga tawo nga susama gawas nga ang usa nakadawat sa pagtambal ug ang usa wala. Sa proseso sa pagparis, ang mga tigdukiduki sa tinuod usab nga pagpul-ong ; nga mao, ang pagsalikway sa mga kaso diin walay klaro nga panagsama. Busa, kini nga pamaagi mas tukma nga gitawag nga matching-and-pruning, apan magpabilin ako sa tradisyonal nga termino: pagkapares.

Usa ka pananglitan sa gahum sa pagparis sa mga estratehiya uban ang dinaghang dili pang-eksperimentong mga tinubdan sa datos nagagikan sa panukiduki sa kinaiya sa mga mamamalit ni Liran Einav ug mga kaubanan (2015) . Sila interesado sa mga auction nga nahitabo sa eBay, ug sa paghulagway sa ilang trabaho, akong ipunting ang epekto sa pagsugod nga presyo sa pagsugod sa mga pagsubasta, sama sa presyo sa pagbaligya o ang posibilidad sa usa ka pagbaligya.

Ang labing walay puy-anan nga paagi sa pag-estimate sa epekto sa pagsugod nga presyo sa presyo sa pagbaligya mao lamang ang pagkalkulo sa katapusang presyo sa mga subasta nga adunay nagkalainlaing mga presyo sa pagsugod. Kini nga pamaagi mahimong maayo kung gusto nimo nga matagna ang presyo sa pagbaligya nga gihatag sa pagsugod nga presyo. Apan kung ang imong pangutana kabahin sa epekto sa pagsugod nga presyo, nan kini nga pamaagi dili molihok tungod kay kini wala gipasukad sa mga patas nga pagtandi; Ang mga auction nga adunay mas ubos nga presyo sa pagsugod tingali lahi gikan niadtong adunay mas taas nga presyo sa pagsugod (pananglitan, mahimo kini alang sa lainlaing matang sa mga butang o naglakip sa nagkalainlain nga matang sa mga tigbaligya).

Kon nahibal-an mo na ang mga problema nga mahimong motungha sa paghimo sa mga hinungdan nga mga pagbanabana gikan sa dili eksperimento nga datos, mahimo nimong laktawan ang walay hinungdan nga paagi ug ikonsiderar ang pagpadagan sa eksperimento sa field diin ikaw magbaligya sa usa ka piho nga butang -kon, usa ka golf club-nga adunay usa ka Ang mga pasalig sa subasta sa ligid-ingon, ang libreng pagpadala ug pag-auction bukas sulod sa duha ka mga semana-apan pinaagi sa random assign nga pagsugod nga mga presyo. Pinaagi sa pagtandi sa resulta nga resulta sa merkado, kini nga field experiment magahatag sa usa ka tin-aw kaayo nga pagsukod sa epekto sa pagsugod nga presyo sa presyo sa pagbaligya. Apan kini nga sukod magamit lamang ngadto sa usa ka partikular nga produkto ug set sa mga pasubasta. Ang mga resulta mahimong lahi, pananglitan, alang sa nagkalainlain nga matang sa mga produkto. Kung walay usa ka lig-on nga teorya, kini lisud nga ipasabot gikan sa usa ka eksperimento ngadto sa bug-os nga kutay sa posible nga mga eksperimento nga mahimo unta nga pagdagan. Dugang pa, ang mga eksperimento sa kapatagan igo nga mahal nga kini mahimong dili mahimo sa pagpadagan sa matag kausaban nga gusto nimo nga sulayan.

Sukwahi sa walay kasinatian ug mga pamaagi sa eksperimento, ang Einav ug mga kaubanan mikuha sa usa ka ikatulo nga paagi: pagkapares. Ang pangunang lansis sa ilang estratehiya mao ang pagdiskobre sa mga butang nga susama sa mga eksperimento sa uma nga nahitabo na sa eBay. Pananglitan, ang numero 2.8 nagpakita sa pipila sa 31 nga listahan alang sa eksaktong parehas nga golf club-usa ka Taylormade Burner 09 Driver-nga gibaligya sa tukmang parehas nga namaligya- "budgetgolfer." Bisan pa, kining 31 nga listahan adunay gamay nga nagkalainlain nga mga kinaiya, sama sa nagkalainlain nga pagsugod bili, petsa sa pagtapos, ug bayad sa pagpadala. Sa laing pagkasulti, kini ingon nga ang "budgetgolfer" nagpadagan sa mga eksperimento alang sa mga tigdukiduki.

Kini nga mga listahan sa Taylormade Burner 09 Driver nga gibaligya sa "budgetgolfer" usa ka pananglitan sa usa ka katugbang nga mga lista, diin ang eksaktong susama nga butang gibaligya sa tukma nga parehas nga magbabaligya, apan sa matag panahon nga may gamay nga nagkalainlain nga mga kinaiya. Sulod sa kaylap nga troso sa eBay adunay literal nga gatusan ka libong matched sets nga naglangkob sa minilyon nga listahan. Busa, kay sa pagtandi sa katapusang bili sa tanan nga mga auction nga adunay usa ka gipangayo nga presyo sa pagsugod, ang Einav ug mga kaubanan nagtandi sa sulod nga mga panagsama. Aron mahiusa ang mga resulta gikan sa pagtandi sa sulod niini nga gatusan ka libong matched nga mga set, ang Einav ug mga kaubanan mipahayag sa pagsugod sa presyo ug katapusang presyo sa termino sa reference nga bili sa matag butang (pananglitan, ang average nga presyo sa pagbaligya). Pananglitan, kung ang Taylormade Burner 09 Driver adunay usa ka reference nga $ 100 (base sa gibaligya niini), nan ang usa ka pagsugod nga presyo sa $ 10 ipahayag ingon nga 0.1 ug usa ka katapusan nga presyo nga $ 120 isip 1.2.

Figure 2.8: Usa ka pananglitan sa usa ka katugbang nga set. Kini ang eksaktong sama nga golf club (usa ka Taylormade Burner 09 Driver) nga gibaligya sa eksaktong pareho nga tawo (budgetgolfer), apan ang pipila niini nga mga pagpamaligya gihimo ubos sa nagkalainlain nga mga kondisyon (e.g., lainlaing mga presyo sa pagsugod). Gikuha pag-usab pinaagi sa pagtugot gikan sa Einav et al. (2015), numero 1b.

Figure 2.8: Usa ka pananglitan sa usa ka katugbang nga set. Kini ang eksaktong sama nga golf club (usa ka Taylormade Burner 09 Driver) nga gibaligya sa sama nga tawo ("budgetgolfer"), apan ang pipila niini nga mga pagpamaligya gihimo ubos sa nagkalainlain nga kondisyon (pananglitan, nagkalain-laing mga presyo sa pagsugod). Gikuha pag-usab pinaagi sa pagtugot gikan sa Einav et al. (2015) , numero 1b.

Hinumdomi nga ang Einav ug mga kaubanan interesado sa epekto sa pagsugod sa presyo sa subasta. Una, gigamit nila ang linear regression sa pagbana-bana nga ang mas taas nga pagsugod nga mga presyo nagakunhod sa kalagmitan sa usa ka pagbaligya, ug nga ang mas taas nga pagsugod nga mga presyo nagdugang sa katapusan nga presyo sa pagbaligya (kondisyon sa usa ka pagbaligya nga mahitabo). Pinaagi sa ilang kaugalingon, kini nga mga pagbanabana-nga naghulagway sa usa ka linear nga relasyon ug na-average sa tanan nga mga produkto-dili tanan nga makapaikag. Dayon, gigamit ni Einav ug mga kauban ang dako nga gidak-on sa ilang mga datos sa pagmugna og nagkalainlain nga labaw nga mga talan-awon. Pananglitan, pinaagi sa pagbana-bana sa epekto nga gilain alang sa nagkalainlain nga nagkalainlaing presyo sa pagsugod, ilang nakita nga ang relasyon tali sa pagsugod nga presyo ug presyo sa baligya dili linya (numero 2.9). Sa partikular, sa pagsugod sa mga presyo tali sa 0.05 ug 0.85, ang pagsugod nga presyo gamay kaayo nga epekto sa presyo sa pagbaligya, ang usa nga nakakaplag nga hingpit nga napalta sa ilang unang pagsusi. Dugang pa, imbes mag-average sa tanan nga mga butang, gibanabana sa Einav ug mga kauban ang epekto sa pagsugod nga presyo alang sa 23 ka lainlaing mga kategoriya sa mga butang (pananglitan, pet supplies, electronics, ug sports memorabilia) (numero 2.10). Kini nga mga banabana nagpakita nga alang sa mas talagsaon nga mga butang-sama sa presyo sa pagsugod sa memorabilia adunay mas gamay nga epekto sa posibilidad sa usa ka pagbaligya ug mas dako nga epekto sa katapusan nga presyo sa pagbaligya. Dugang pa, alang sa dugang komodified nga mga butang-sama sa mga DVD-ang pagsugod nga presyo halos walay epekto sa katapusang presyo. Sa laing pagkasulti, ang kasagaran nga naghiusa sa mga resulta gikan sa 23 ka lainlaing mga kategoriya sa mga butang nagtago sa mga importante nga kalainan tali niining mga butanga.

Figure 2.9: Relasyon tali sa auction nga nagsugod nga presyo ug kalagmitan sa usa ka baligya (a) ug baligya nga bili (b). Adunay adunay usa ka linear nga relasyon tali sa pagsugod nga presyo ug posibilidad sa pagbaligya, apan ang usa ka dili linya nga relasyon tali sa pagsugod nga presyo ug presyo sa pagbaligya; tungod sa pagsugod sa presyo tali sa 0.05 ug 0.85, ang pagsugod nga presyo gamay kaayo nga epekto sa presyo sa pagbaligya. Sa duha nga mga kaso, ang mga relasyon wala mag-agad sa bili sa butang. Gikuha gikan sa Einav et al. (2015), numero 4a ug 4b.

Figure 2.9: Relasyon tali sa auction nga nagsugod nga presyo ug kalagmitan sa usa ka baligya (a) ug baligya nga bili (b). Adunay adunay usa ka linear nga relasyon tali sa pagsugod nga presyo ug posibilidad sa pagbaligya, apan ang usa ka dili linya nga relasyon tali sa pagsugod nga presyo ug presyo sa pagbaligya; tungod sa pagsugod sa presyo tali sa 0.05 ug 0.85, ang pagsugod nga presyo gamay kaayo nga epekto sa presyo sa pagbaligya. Sa duha nga mga kaso, ang mga relasyon wala mag-agad sa bili sa butang. Gikuha gikan sa Einav et al. (2015) , numero 4a ug 4b.

Figure 2.10: Mga pagtantiya gikan sa matag kategoriya sa mga butang; ang lig-on nga tuldok mao ang banabana sa tanang mga kategoriya nga gipundok (Einav et al. 2015). Kini nga mga banabana nagpakita nga alang sa mas talagsaon nga mga butang-sama sa memorabilia-ang pagsugod nga presyo adunay gamay nga epekto sa probabilidad sa usa ka pagbaligya (x-axis) ug usa ka mas dako nga epekto sa katapusan nga presyo sa pagbaligya (y-axis). Gikuha gikan sa Einav et al. (2015), numero 8.

Figure 2.10: Mga pagtantiya gikan sa matag kategoriya sa mga butang; ang lig-on nga tuldok mao ang banabana sa tanang mga kategoriya nga gipundok (Einav et al. 2015) . Kini nga mga banabana nagpakita nga alang sa mas talagsaon nga mga butang-sama sa memorabilia-ang pagsugod nga presyo adunay mas gamay nga epekto sa probabilidad sa usa ka pagbaligya ( \(x\) -axis) ug usa ka mas dako nga epekto sa katapusan nga presyo sa pagbaligya ( \(y\) -axis). Gikuha gikan sa Einav et al. (2015) , numero 8.

Bisag dili ka interesado sa mga subasta sa eBay, kinahanglang imong madayeg ang paagi nga ang numero nga 2.9 ug ang numero 2.10 nagtanyag og mas maayong pagsabut sa eBay kay sa yano nga pagbanabana nga naghulagway sa usa ka linear nga relasyon ug nagkombinar sa daghang lainlaing mga kategoriya sa mga butang. Dugang pa, bisan kini mahimo nga siyentipiko nga makamugna niining mas daghan nga mga estima uban sa mga eksperimento sa kapatagan, ang gasto makahimo sa ingon nga mga eksperimento sa imposible imposible.

Sama sa natural nga mga eksperimento, adunay daghang mga paagi nga ang pagtandi mahimong mosangput sa dili maayo nga mga pagbana-bana. Sa akong hunahuna ang pinakadako nga kabalaka sa pagtakdo sa mga gibana-bana mao nga sila mahimong mapihigon pinaagi sa mga butang nga wala gigamit sa pagparis. Pananglitan, sa ilang nag-unang resulta, ang Einav ug mga kaubanan naghimo sa eksaktong pagtutugma sa upat nga mga kinaiya: numero sa ID sa magbenta, kategoriya sa item, titulo sa item, ug subtitle. Kung ang mga butang lahi sa mga paagi nga wala gigamit alang sa pagparis, nan kini makahimo sa dili makatarungan nga pagtandi. Pananglitan, kung ang "budgetgolfer" gipaubos ang mga presyo alang sa Taylormade Burner 09 Driver sa tingtugnaw (sa dihang ang mga golf club dili kaayo popular), nan kini mahimo nga makita nga ang mas ubos nga presyo sa pagsugod magdala ngadto sa ubos nga katapusan nga mga presyo, nga sa pagkatinuod kini usa ka kinaadman sa seasonal nga kalainan sa panginahanglan. Ang usa ka pamaagi sa pagsulbad niini nga kabalaka mao ang pagsulay sa daghang nagkalainlain nga mga matang sa pagtugma. Pananglitan, gibalikbalik sa Einav ug mga kaubanan ang ilang pag-analisar samtang nagkalainlain ang window sa oras nga gigamit alang sa pagpareha (ang mga gipatong nga mga hugpong naglakip sa mga butang nga gibaligya sa sulod sa usa ka tuig, sulod sa usa ka bulan, ug kasamtangan). Maayo na lang, nakita nila ang susama nga mga resulta alang sa tanan nga mga bintana sa panahon. Ang usa ka dugang nga kabalaka sa pagtandi gikan sa paghubad. Ang gibana-bana gikan sa katugbang magamit lamang sa gipaangay nga datos; sila dili magamit sa mga kaso nga dili matupngan. Pananglitan, pinaagi sa paglimite sa ilang panukiduki sa mga butang nga adunay daghang mga lista, ang Einav ug mga kauban nag-focus sa propesyonal ug semi-propesyonal nga mga tigbaligya. Busa, sa paghubad niining mga pagtandi kinahanglan naton hinumdoman nga kini magamit lamang sa kini nga tipiganan sa eBay.

Ang pagkapares usa ka gamhanan nga estratehiya alang sa pagpangita sa patas nga pagtanding sa dili eksperimento nga datos. Alang sa daghang sosyal nga mga siyentipiko, ang pagkapareha nahibal-an nga ikaduha sa pinakamaayo sa mga eksperimento, apan kana usa ka pagtuo nga mahimong usbon, gamay. Ang pagkapareha sa dagkong mga datos mahimong mas maayo kay sa usa ka diyutay nga gidaghanon sa mga eksperimento sa kapatagan kung (1) ang heterogeneity sa mga epekto mahinungdanon ug (2) ang mga mahinungdanong mga baryable nga gikinahanglan alang sa pagsukod gisukod. Ang Tabel 2.4 naghatag sa ubang mga pananglitan kon unsaon nga ang pag-gamit mahimong magamit sa dagkong tinubdan sa datos.

Table 2.4: Mga Pananglitan sa Mga Pagtuon nga Naggamit sa Pagkapareha sa Mga Tinubdan sa Big Data
Talagsaong pokus Dakong tinubdan sa datos Reference
Epekto sa pagpamusil sa kapintasan sa kapulisan Mga stop-and-frisk nga mga rekord Legewie (2016)
Epekto sa Septembre 11, 2001 sa mga pamilya ug mga silingan Mga rekord sa pagboto ug mga donasyon nga rekord Hersh (2013)
Pananglitan sa katilingban Pagkomunikar ug produkto nga pagsagop sa produkto Aral, Muchnik, and Sundararajan (2009)

Sa konklusyon, ang pagbana-bana sa mga hinungdan nga mga epekto gikan sa dili eksperimento nga mga datos lisud, apan ang mga pamaagi sama sa natural nga mga eksperimento ug mga pag-adjust sa istatistiks (pananglitan, ang pagparis) mahimong gamiton. Sa pipila ka mga sitwasyon, kini nga mga pamaagi mahimong sayup nga sayop, apan kung itan-ay pag-ayo, kining mga pamaagi mahimo nga usa ka mapuslanon nga katimbang sa eksperimental nga pamaagi nga akong gihulagway sa kapitulo 4. Dugang pa, kining mga duha ka mga pamaagi daw gipalabi nga makatabang sa pagtubo sa kanunay- on, dagko nga sistema sa datos.