2.4.3.2 Matching

Matching létre tisztességes összehasonlításokat metszés el esetek.

Fair összehasonlítások származhat akár a randomizált, kontrollált kísérletek vagy természetes kísérletek. De vannak olyan helyzetek, amikor nem tud futni az ideális kísérlet és a természet nem adta meg a természetes kísérlet. Ezekben a beállításokat, hogy a legjobb módja annak, hogy hozzon létre egy tisztességes összehasonlítás illő. Annak megfelelő, a kutató úgy néz ki, a nem-kísérleti adatok létrehozásához pár ember, hogy hasonló, kivéve, hogy az egyik megkapta a kezelést, és az egyik nem. A folyamat során a megfelelő, a kutatók valójában is metszés; azaz, elöntve az esetekben, ahol nincs nyilvánvaló összehasonlítást. Így ez a módszer lenne pontosabban az illesztés-and-metszés, de maradok a hagyományos kifejezés: megfelelő.

Egy gyönyörű példája a hatalom a megfelelő stratégiák masszív nem kísérleti adatforrások származnak kutatás a fogyasztói magatartást Liran Einav és munkatársai (2015) . Einav és munkatársai voltak érdekeltek aukciók zajlik az eBay-en, és leírja a munkájukat, fogok összpontosítani egy sajátos szempontból: a hatása árverési kikiáltási ár az aukciós eredmények, például az eladási ár, illetve a valószínűsége, hogy egy eladó.

A naiv módon, hogy válaszoljon a kérdésre a hatása a kiindulási ár eladási ár lenne egyszerűen kiszámítani a végleges ár aukciók különböző kiindulási áron. Ez a megközelítés jó lenne, ha egyszerűen csak szeretné megjósolni az eladási ár az adott elem, hogy már fel az eBay-en egy adott kiindulási árat. De, ha a kérdés az, hogy milyen hatással van a kikiáltási ár a piaci eredmények ez a megközelítés nem működik, mert ez nem a valós összehasonlítást; Az aukciókon alacsonyabb kiindulási ára is meglehetősen eltér aukciók magasabb induló árak (pl, lehet, hogy a különböző típusú áruk vagy különböző típusú olyan eladók).

Ha már aggasztja a méltányos összehasonlítást, akkor lehet, hagyja a naiv megközelítés és úgy fut a szántóföldi kísérletben, ahol Ön is eladni egy adott tárgy, mondjuk egy golfütő-egy fix sor aukció paraméterek mondjuk, a szállítás ingyenes, árverés nyitott két hétig, stb, de véletlenszerűen meghatározott induló árak. Ha összehasonlítjuk az eredő piaci eredmények ezen a területen kísérlet kínálna egy nagyon világos hatásának mérésére a kiindulási ár eladási ár. De ez a mérés csak akkor alkalmazható egy adott termék, és állítsa be az árverési paramétereket. Az eredmények eltérő lehet, például a különböző típusú termékek. Anélkül erős elmélet, nehéz extrapolálni ettől az egyetlen kísérlet az összes lehetséges kísérletek, hogy lehetett volna futtatni. Továbbá, szántóföldi kísérletek elég drága, hogy nem lenne megvalósíthatatlan futtatni elég őket, hogy fedezze a teljes paraméter térben termékek és aukciós típusok.

Ezzel szemben a naiv megközelítés és a kísérleti megközelítés, Einav és kollégái, hogy egy harmadik megközelítés: megfelelő. A fő trükk a stratégiájuk, hogy felfedezzék a dolgokat hasonló területen kísérletek történtek eddig az eBay-en. Például 2.6 ábra mutatja, néhány 31 listák pontosan ugyanazt a golf klub a Taylormade író 09 vezetőre által értékesített pontosan ugyanaz eladó-"budgetgolfer". Azonban ezek a listák némileg eltérő jellemzőkkel. Tizenegy közülük kínál a vezető számára a fix ára 124,99 $, míg a többi 20 aukciók különböző befejező időpontját. Továbbá, a listák különböző szállítási díjak, akár $ 7,99 vagy 9,99 $. Más szóval, ez olyan, mintha "budgetgolfer" fut kísérleteket a kutatók.

A listát a Taylormade Burner 09 illesztőprogram által értékesített "budgetgolfer" egyik példája egy kiegyenlített készlet listát, ahol pontosan ugyanazt a tétel által értékesített pontosan ugyanaz eladó, de minden egyes alkalommal kicsit eltérő jellemzőkkel. A masszív naplók eBay vannak több száz ezer kiegyenlített készlet járó több millió listáját. Így ahelyett, hogy összehasonlítva a végső árat az összes aukcióra egy adott kiindulási árat, Einav és kollégái, hogy összehasonlításokat belül kiegyenlített készletek. Annak érdekében, hogy összekapcsolják ered összehasonlítások ezen belül több százezer kiegyenlített készletek, Einav és kollégái újra kifejezni a kikiáltási ár és a végső ár szempontjából a referenciaérték az egyes elemek (pl átlagos értékesítési ár). Például, ha a Taylormade Burner 09 vezetőnek a referenciaérték $ 100 (alapuló értékesítés), akkor a kikiáltási ár 10 $ lenne kifejezve 0,1 és záró ára 120 $ lenne kifejezve 1,2.

2.6 ábra: Példa egy kiegyenlített készlet. Ez pontosan ugyanaz a golf klub (a Taylormade Burner 09 Driver) által értékesített pontosan ugyanaz a személy (budgetgolfer), de ezek közül néhány az értékesítés végeztünk különböző körülmények között (például különböző kiindulási ár). Ábra vett Einav et al. (2015).

2.6 ábra: Példa egy kiegyenlített készlet. Ez pontosan ugyanaz a golf klub (a Taylormade Burner 09 Driver) által értékesített pontosan ugyanaz a személy ( "budgetgolfer"), de ezek közül néhány az értékesítés végeztünk különböző körülmények között (pl különböző kiindulási ár). Ábra vett Einav et al. (2015) .

Emlékezzünk vissza, hogy Einav és munkatársai voltak érdekeltek a hatását induló ár aukciós eredmények. Először is, a lineáris regresszió úgy becsülték, hogy a magasabb induló árak csökkentik a valószínűsége, hogy egy eladó, és hogy a magasabb induló árak növelése a végső eladási árat, feltétele a hirdetést bekövetkezését. Önmagukban ezek a becslések-, amelyeket átlagolva minden termék és lineáris összefüggés feltételezésével között induló ár és a végső eredmény-nem olyan érdekes. De Einav és kollégái is használhatják a hatalmas mérete adataikat megbecsülni a különböző finomabb megállapításokat. Először Einav és kollégáik ezeket a becsléseket külön tételek különböző árak és használata nélkül lineáris regresszió. Azt találták, hogy míg a viszony induló ár és a valószínűsége, hogy egy eladó lineáris, a kapcsolat a kikiáltási ár és eladási ár egyértelműen nem lineáris (2.7 ábra). Különösen induló árak 0,05 és 0,85, a kikiáltási ár nagyon kevés hatása eladási árat, annak megállapítása, hogy befejeződött hiányzott az elemzés, amely azt feltételezte, lineáris összefüggés.

2.7 ábra: Összefüggés aukciós induló ár és valószínűsége, hogy egy eladó (bal panel) és az eladási ár (jobb panel). Van durván között lineáris kapcsolat induló ár és a valószínűsége az értékesítés, de van egy nem-lineáris kapcsolat között induló ár és eladási ár; indítására árak 0,05 és 0,85, a kikiáltási ár nagyon kevés hatása eladási ár. Mindkét esetben, a kapcsolatok alapvetően független a tétel értékét. Ezek a grafikonok reprodukálni ábra 4a és 4b Einav et al. (2015).

2.7 ábra: Összefüggés aukciós induló ár és valószínűsége, hogy egy eladó (bal panel) és az eladási ár (jobb panel). Van durván között lineáris kapcsolat induló ár és a valószínűsége az értékesítés, de van egy nem-lineáris kapcsolat között induló ár és eladási ár; indítására árak 0,05 és 0,85, a kikiáltási ár nagyon kevés hatása eladási ár. Mindkét esetben, a kapcsolatok alapvetően független a tétel értékét. Ezek a grafikonok reprodukálni ábra 4a és 4b Einav et al. (2015) .

Másodszor, nem pedig átlagosan több mint az összes elem, Einav és kollégái is használhatják a tömeges az adatok csak becsült hatása a kikiáltási ár 23 különböző kategóriájú elemek (pl kellékek, elektronikai és sport relikviákat) (2.8 ábra). Ezek a becslések azt mutatják, hogy több ruhadarabot-, mint relikviákat-induló ár kisebb hatása van a valószínűsége, hogy egy eladó és egy nagyobb hatással van a végső eladási ár. Továbbá több áruvá tételek-, mint a DVD és videó-megkezdése ár szinte nincs hatással a végső ár. Más szóval, az átlagos, amely egyesíti eredmények 23 különböző kategóriái tételek rejt fontos információt a különbség e tételeket.

2.8 ábra: Az eredmények azt mutatták, becslések minden kategóriában külön-külön; A szilárd pont a becsült összes kategória összegyűjtjük, 11. táblázat (Einav et al. 2015, 11. táblázat). Ezek a becslések azt mutatják, hogy több ruhadarabot-, mint emléktárgyakat-kezdetén ár kisebb hatása van a valószínűsége, hogy egy eladó (x-tengely), és nagyobb hatással van a végső eladási ár (y tengely).

2.8 ábra: Az eredmények azt mutatták, becslések minden kategóriában külön-külön; A szilárd pont a becsült összes kategória összegyűjtöttük (Einav et al. 2015, Table 11) . Ezek a becslések azt mutatják, hogy több ruhadarabot-, mint emléktárgyakat-kezdetén ár kisebb hatása van a valószínűsége, hogy egy eladó (x-tengely), és nagyobb hatással van a végső eladási ár (y tengely).

Akkor is, ha nem érdekli különösebben aukciók az eBay-en, akkor van, hogy megcsodálják az is, hogy 2.7 ábra és 2.8 ábra ajánlat gazdagabb megértése eBay, mint az egyszerű lineáris regressziós becslések azt feltételezik, hogy a lineáris kapcsolatok és kombinálni különböző kategóriái elemeket. Ezek finomabb becsléseket bemutatják az erejét illő masszív adatok; Ezek a becslések lehetetlen lett volna anélkül, hogy rendkívül sok területen kísérletek, ami már megfizethetetlenül drága.

Persze, meg kell kevesebb bizalmat az eredmények adott megfelelő vizsgálat, mint azt az eredmények egy hasonló kísérletet. Az eredmények kiértékelése esetén bármilyen megfelelő tanulmány két fontos kérdéseket. Először is meg kell emlékezni, hogy csak akkor tudjuk, hogy tisztességes összehasonlítást a dolgokat, hogy használták az összehasonlításhoz. Az ő fő eredménye, Einav és kollégái azonban pontosan illő négy jellemzői: eladó azonosító száma, kívánt kategóriát, tétel címét, és a felirat. Ha a tételeket különböző módon, hogy nem használták megfelelő, hogy hozhat létre tisztességtelen összehasonlítást. Például, ha "budgetgolfer" alacsonyabb árakat Taylormade Burner 09 illesztőprogram télen (amikor golfütő kevésbé népszerű), akkor úgy tűnhet, hogy az alacsonyabb induló árak, mivel az alacsonyabb végső árak, holott ez lenne a tárgy a szezonális szükséglet változás. Általában a legjobb megoldás erre a problémára úgy tűnik, hogy megpróbálja sokféle megfelelő. Például Einav és kollégái megismétlik elemzésére, ahol kiegyenlített készlet tartalmaz, eladó egy éven belül egy hónapon belül, és egyidejűleg. Így az időablak szigorúbb csökkenti száma kiegyenlített készletek, de csökkenti aggodalmak szezonális változás. Szerencsére úgy találják, hogy az eredmények nem változtak ezek a változások a megfelelő feltételeket. A megfelelő szakirodalom az ilyen típusú aggodalom általában kifejezve észlelhetőség és unobservables, de a lényeg, tényleg, hogy a kutatókat csak létre valós összehasonlítási funkciók használt megfelelő.

A másik nagy gondja értelmezésekor találatot az, hogy csak azokra a párosított adatok; azok nem vonatkoznak azokra az esetekre, hogy nem sikerült megtalálni. Például úgy, hogy korlátozza a kutatás tételekhez már több listát Einav és kollégái összpontosítva profi és fél-profi eladók. Így értelmezésekor ezen összehasonlítások emlékeznünk kell arra, hogy csak erre a részhalmaza az eBay.

Matching egy erőteljes stratégia megtalálása tisztességes összehasonlítást nagy adatbázisok. Sok társadalomtudós, megfelelő olyan, mint a második legjobb kísérletek, de az a meggyőződés, hogy felül kell vizsgálni, egy kicsit. Matching masszív adatok lehet, hogy jobb, mint a kis számú szántóföldi kísérletek során: 1) heterogenitás hatása a fontos, és 2) vannak jó észlelhetőség az összehasonlításhoz. 2.4 táblázat ad néhány más példát arra, hogyan illő használható nagy adatforrás.

2.4 táblázat: Példák a tanulmányok, amelyek a megfelelő találni tisztességes összehasonlítást belül digitális nyomokat.
lényegi fókusz Big adatforrás Idézet
Hatása lövöldözés a rendőri erőszak Stop-and-csóvál bejegyzések Legewie (2016)
Hatása szeptember 11-2001 család és a szomszédok szavazási eredmények és adományozás rekordok Hersh (2013)
szociális fertőzés Kommunikáció és termék elfogadása adatok Aral, Muchnik, and Sundararajan (2009)

Összefoglalva, naiv megközelítés becslésére okozati hatása nem kísérleti adatok veszélyesek. Azonban stratégiák készítésére okozati becslések mentén fekvő folytonosságot a legerősebb a leggyengébb, és a kutatók felfedezni tisztességes összehasonlítást a nem-kísérleti adatokkal. A növekedés az always-on, nagy adatrendszerek növeli a képességét, hogy hatékonyan használni a két meglévő módszerek: természetes kísérletek és megfelelő.