2.4.3.2 samsvörun

Lokað búa sanngjörn samanburð með pruning burtu tilvikum.

Fair samanburður getur komið frá annaðhvort slembiröðuðum rannsóknum eða náttúrulegum tilraunum. En, það eru margar aðstæður þar sem þú getur ekki keyrt hugsjón tilraun og náttúran hefur ekki veitt náttúrulega tilraun. Í þessum stillingum, besta leiðin til að búa til sanngjarn samanburður er samsvörun. Í samsvörun rannsakandinn lítur út utan tilrauna gögn til að búa til pör af fólki sem eru svipuð nema að maður hefur fengið meðferð og einn hefur ekki. Í því ferli samsvörun, vísindamenn eru reyndar einnig pruning; það er hent þeim tilvikum þar sem engin augljós samanburður. Þannig að þessi aðferð væri réttara kölluð passa-og-pruning, en ég ætla að standa með hefðbundnum tíma: samsvörun.

Falleg dæmi um mátt passa aðferðir með gríðarlegu ekki tilrauna gögn heimildum koma frá rannsóknum á hegðun neytenda með Liran Einav og samstarfsmenn (2015) . Einav og samstarfsmenn höfðu áhuga á uppboð á sér stað á eBay, og lýsa starfi sínu, skal ég leggja áherslu á einn tiltekinn þáttur: Áhrif Auction upphaf verði á útkomu útboðsins, svo sem söluverði eða líkur á sölu.

The barnaleg leiðin til að svara spurningunni um áhrif byrjun verð á söluverði væri að einfaldlega reikna endanlegt verð fyrir uppboð með mismunandi verð byrjun. Þessi nálgun væri fínt ef þú vilt einfaldlega að spá fyrir um söluverð tilteknu atriði sem hafði verið sett á eBay með tilteknu byrjun verð. En ef spurningin er hvað er áhrif byrjun verð á niðurstöðum markaði þessa aðferð mun ekki virka vegna þess að það er ekki byggt á sanngjörnum samanburði; útboðin með lægri byrjunarskammti verði gæti verið nokkuð frábrugðin uppboð með hærra upphafs verð (td þeir gætu verið til mismunandi tegundir af vörum eða eru mismunandi gerðir af seljendum).

Ef þú ert nú þegar áhyggjur um að gera sanngjarnar samanburð, gætir þú sleppa barnaleg nálgun og íhuga að keyra reit tilraun þar sem þú villt selja tiltekna atriði, segja, golfkylfu-með fasta setja af uppboði breytum-segja, sendingarkostnaður, uppboð opinn í tvær vikur, osfrv-en með handahófi sett byrja verð. Með því að bera saman leiðir markaði útkomu, þessi reitur tilraun myndi bjóða upp á mjög skýra mælingu á áhrifum byrjun verð á söluverði. En þessi mæling væri bara um eina tiltekna vöru og setja af breytum uppboði. Niðurstöðurnar gæti verið öðruvísi, til dæmis fyrir mismunandi tegundir af vörum. Án sterka kenningu, það er erfitt að framreikna út frá þessari einu tilraun fullur svið af hugsanlegum tilraunum sem gætu hafa verið keyrt. Ennfremur eru sviði tilraunir nægilega dýrt að það væri infeasible að keyra nóg af þeim upp til að ná yfir allt breytu rými á vörum og uppboð gerðum.

Í mótsögn við barnaleg nálgun og tilrauna nálgun, Einav og samstarfsmenn taka þriðja nálgun: samsvörun. Helstu bragð af stefnu þeirra er að uppgötva hluti svipaðar tilraunir sviði sem þegar hafa gerst á eBay. Til dæmis, á mynd 2.6 sýnir nokkrar af þeim 31 skráningar fyrir nákvæmlega sama golfi-a Taylormade Burner 09 Driver-seldur nákvæmlega sama seller- "budgetgolfer". Hins vegar hafa þessir listar örlítið mismunandi einkenni. Ellefu af þeim bjóða bílstjóri fyrir föstu verði $ 124,99, meðan hinn 20 eru uppboð með mismunandi lokadagsetningar. Einnig, hafa skráningar mismunandi gjöld skipum, annaðhvort $ 7,99 eða $ 9.99. Með öðrum orðum, það er eins og ef "budgetgolfer" er í gangi tilraunir til rannsakendum.

The skráningar á Taylormade Burner 09 Driver seldur "budgetgolfer" eru eitt dæmi um samsvarandi mengi skráningar, þar sem nákvæmlega sama hluturinn er seldur í nákvæmlega sama seljanda en í hvert sinn með örlítið mismunandi einkenni. Innan gríðarlegu logs eBay það eru bókstaflega hundruðir þúsunda jafnaldra setur sem felur milljónir skráningar. Svona, frekar en að bera saman endanlegt verð fyrir allar uppboð innan ákveðins byrjun verð, Einav og samstarfsmenn gera samanburð innan samsvarandi setur. Í því skyni að sameina niðurstöður úr samanburði innan þessara hundruð þúsunda jafnaldra setur, Einav og samstarfsmenn aftur tjá byrjun verð og endanlegt verð í skilmálar af viðmiðunargildi hvern hlut (td meðaltali sölu verð hennar). Til dæmis, ef Taylormade Burner 09 Driver er viðmiðunargildi á $ 100 (miðað við sölu þess), þá byrjun verð af $ 10 yrði gefið upp sem 0,1 og endanlegt verð 120 $ væri gefið upp sem 1,2.

Mynd 2.6: Dæmi um samsvarandi mengi. Þetta er nákvæmlega sama Golfklúbbur (a Taylormade Burner 09 Driver) seldur nákvæmlega sama mann (budgetgolfer), en sumir af þessum sölu voru gerðar mismunandi skilyrði (t.d. öðruvísi byrjun verð). Mynd tekin úr Einav et al. (2015).

Mynd 2.6: Dæmi um samsvarandi mengi. Þetta er nákvæmlega sama Golfklúbbur (a Taylormade Burner 09 Driver) seldur nákvæmlega sama mann ( "budgetgolfer"), en sumir af þessum sölu voru gerðar mismunandi skilyrði (td öðruvísi byrjun verð). Mynd tekin úr Einav et al. (2015) .

Muna að Einav og samstarfsmenn höfðu áhuga á áhrifum byrjun verð á niðurstöðum útboðsins. First, nota línulega aðhvarfsgreiningu þeir áætla að hærra upphafs- verð lækka líkurnar á sölu, og að hærra upphafs- hækkar endanlegt söluverð, að skilyrði sala viðburður. Við sig, þessar áætlanir-sem að meðaltali á allar vörur og ráð línulegt samband milli byrjun verð og endanleg niðurstöður-eru ekki allt sem áhugavert. En, Einav og samstarfsmenn nota líka stórfellda stærð þeirra gögn til að meta ýmis fleiri lúmskur niðurstöðum. First, Einav og samstarfsmenn gert þessar áætlanir sérstaklega fyrir hlutum af mismunandi verði og án þess að nota línulega aðhvarfsgreiningu. Þeir fundu að á meðan sambandið milli byrjun verð og líkur á sölu er línuleg, tengslin milli byrjun verð og söluverð er greinilega ekki línuleg (Mynd 2.7). Einkum til að ræsa verð milli 0,05 og 0,85, byrjun verð hefur mjög lítil áhrif á söluverð, ljós að lokið var saknað í greiningu sem hafði gert ráð fyrir línulegt samband.

Mynd 2.7: Samband milli uppboði byrjun verð og líkur á sölu (vinstri mynd) og söluverðs (hægri mynd). Það er u.þ.b. línulegt samband milli byrjun verð og líkur á sölu, en það er a non-línuleg tengsl milli byrjun verð og söluverð; til að byrja verð á milli 0,05 og 0,85, byrjun verð hefur mjög lítil áhrif á söluverð. Í báðum tilvikum eru sambönd grundvallaratriðum óháð verðmæti atriði. Þessar myndrit endurskapa mynd 4a og 4b og með Einav et al. (2015).

Mynd 2.7: Samband milli uppboði byrjun verð og líkur á sölu (vinstri mynd) og söluverðs (hægri mynd). Það er u.þ.b. línulegt samband milli byrjun verð og líkur á sölu, en það er a non-línuleg tengsl milli byrjun verð og söluverð; til að byrja verð á milli 0,05 og 0,85, byrjun verð hefur mjög lítil áhrif á söluverð. Í báðum tilvikum eru sambönd grundvallaratriðum óháð verðmæti atriði. Þessar myndrit endurskapa mynd 4a og 4b og með Einav et al. (2015) .

Í öðru lagi, frekar en að meðaltali yfir öll atriði, Einav og samstarfsmenn nota líka miklum mæli þeirra gögn til að meta áhrif byrjun verð fyrir 23 mismunandi flokka af hlutum (td gæludýr birgðir, rafeindatækni, og íþrótta Memorabilia) (mynd 2.8). Þessar áætlanir sýna að fyrir meira sérstakri atriði, svo sem Memorabilia-byrjun verð hefur minni áhrif á líkur á sölu og stærri áhrif á endanlegt söluverð. Ennfremur meira commodified atriði-ss DVD og vídeó-byrjun verð hefur nánast engin áhrif á endanlegt verð. Með öðrum orðum, að meðaltali, sem sameinar niðurstöður úr 23 mismunandi flokkum af hlutum felur mikilvægar upplýsingar um muninn á milli þessara liða.

Mynd 2.8: Niðurstöður sýndu mat úr hverjum flokki fyrir sig; solid punktur í mat fyrir alla flokka sameinuðum saman í töflu 11 (Einav et al. 2015, tafla 11). Þessar áætlanir sýna að fyrir meira sérstakri atriði, svo sem Memorabilia-the byrjun verð hefur minni áhrif á líkur á sölu (x-ás) og stærri áhrif á endanlegt söluverð (y-ás).

Mynd 2.8: Niðurstöður sýndu mat úr hverjum flokki fyrir sig; solid punktur í mat fyrir alla flokka sameinuðum saman (Einav et al. 2015, Table 11) . Þessar áætlanir sýna að fyrir meira sérstakri atriði, svo sem Memorabilia-the byrjun verð hefur minni áhrif á líkur á sölu (x-ás) og stærri áhrif á endanlegt söluverð (y-ás).

Jafnvel ef þú ert ekki sérstaklega áhuga á uppboð á eBay, þú þarft að dást á þann hátt að mynd 2.7 og mynd 2.8 bjóða auðæfi skilning á eBay en einföld línuleg mati afturför að axla línuleg sambönd og sameina margar mismunandi flokka af hlutum. Þessar hálli áætlanir sýna kraft passa í gríðarlegu gögn; þessar áætlanir hefði verið ómögulegt án gríðarlegum fjölda tilrauna sviði, sem hefði verið óhæfilega dýrt.

Að sjálfsögðu ættum við að hafa minni trú á niðurstöðum einhverju tilteknu rannsókn samsvarandi en við gerðum í niðurstöðum sambærilegri tilraun. Við mat á niðurstöðum úr hvaða samsvörun rannsókn, það eru tvö mikilvæg áhyggjur. Í fyrsta lagi verðum við að muna að við getum aðeins tryggja sanngjörn samanburð á hlutum sem voru notuð fyrir samsvörun. Í helstu niðurstöðum þeirra, Einav og samstarfsmenn gerði nákvæmlega passa á fjóra eiginleika: Seljandi kennitala, lið flokk, lið titill, og texti. Ef atriði voru öðruvísi á þann hátt sem ekki voru notuð fyrir samsvörun, sem gæti búið ósanngjarnt samanburð. Til dæmis, ef "budgetgolfer" lækkaði verð á Taylormade Burner 09 Driver í vetur (þegar Golf klúbbur eru minna vinsæl), þá gæti það birtast þessi lægri byrjunarskammti verð leiða til að lækka endanlega verð, þegar í raun þetta yrði artifact af árstíðabundin breytileika í eftirspurn. Almennt, the bestur aðferð til að þetta vandamál virðist vera að reyna margar mismunandi tegundir af samsvörun. Til dæmis, Einav og samstarfsmenn endurtaka greiningu þeirra þar Viðburður setur fela hluti á sölu innan árs, innan eins mánaðar og samtímis. Gerð tímagluggi herða dregur úr fjölda Viðburður setur, en dregur úr áhyggjum árstíðamun. Sem betur fer, að finna að þeir sem niðurstöður eru óbreytt af þessum breytingum samsvarandi viðmiðunum. Í samsvarandi bókmenntum, þessi tegund af áhyggjum er yfirleitt gefin upp observables og unobservables, en lykillinn hugmyndin er í raun að vísindamenn eru aðeins skapa réttlátar samanburð á eiginleikum sem notuð eru í samsvörun.

Annað stórt áhyggjuefni þegar túlka niðurstöðurnar er að þeir eiga aðeins við samsvarandi gögn; Þau eiga ekki við í tilvikum sem ekki jafnað saman. Til dæmis, með því að takmarka rannsóknir sínar á hlutum sem þurfti margar skráningar Einav og samstarfsmenn eru með áherslu á faglega og hálf-faglegur seljendur. Svona, þegar túlka þessar samanburð við verðum að muna að þeir eiga aðeins við þessa hlutmengi af eBay.

Samsvörun er öflugt stefna að finna sanngjarna samanburð á stórum gagnasafna. Til mörgum félagslegum vísindamenn, samsvörun finnst eins næstbesta tilraunum, en það er trú sem ætti að endurskoða, örlítið. Samsvörun í gríðarlegu gögn gæti verið betra en fáeinum tilraunum sviði þegar: 1) misleitni í áhrifum er mikilvægt og 2) það eru góðar observables fyrir samsvörun. Tafla 2.4 veitir sumum önnur dæmi um hvernig passa hægt er að nota með stóru gögnum heimildum.

Tafla 2.4: Dæmi um rannsóknir sem nota samsvörun að finna sanngjarna samanburð innan stafrænum ummerki.
efnisleg áhersla Big gögn uppspretta Citation
Áhrif shootings á ofbeldi lögreglunnar Hættu-og-Frisk færslur Legewie (2016)
Áhrif 11. september 2001 á fjölskyldur og nágranna atkvæðabækur og framlag færslur Hersh (2013)
Social smiti Samskipti og vara samþykkt gögn Aral, Muchnik, and Sundararajan (2009)

Að lokum, barnalegt aðferðir til að meta orsakatengsl áhrif frá non-tilrauna gögn eru hættuleg. Hins vegar aðferðir til að orsakatengsl mat liggja meðfram samfellu úr sterkasta veikasta, og vísindamenn geta uppgötva sanngjörn samanburð innan ekki tilrauna gögn. Vöxtur alltaf-á, stór kerfi gögn eykur getu okkar til að í raun að nota tvær núverandi aðferðum: náttúruleg tilraunir og samsvörun.