2.4.3.2 Matching

Істерді бермейді әділ салыстыру жасау Matching.

Әділ салыстыру рандомизацияланған бақылаулы эксперименттер немесе табиғи эксперименттер, не келуі мүмкін. Бірақ, сіз тамаша эксперимент және табиғат табиғи эксперимент берген емес жұмыс істей алмайды, көптеген жағдайлар бар. Осы параметрлердің, әділ салыстыру жасау үшін ең жақсы тәсілі болып табылады сәйкес келетін. сәйкестік жылы зерттеуші бұл бір ем алды және бір емес бар қоспағанда, ұқсас адамдардың жұп құру үшін емес, эксперименттік мәліметтерді арқылы көрінеді. Сәйкестік барысында, сондай-ақ, іс жүзінде зерттеушілер кесуге болып табылады; бұл ешқандай айқын салыстыру болған жағдайда, тастар болып табылады. Осылайша, бұл әдіс сәйкестік дәлірек-мен-ораққа деп аталатын болады, бірақ мен дәстүрлі мерзімі жабысып алатындарыңыз: сәйкес келетін.

Жаппай емес эксперименттік деректер көздерімен стратегиясын сәйкес қуатын тамаша мысал Liran Einav және әріптестерімен тұтыну мінез зерттеулер келіп (2015) . Einav мен әріптестер Банкноталардың коллекционерлерi өтіп аукциондарда мүдделі болды, ал олардың жұмысын сипаттайтын, мен тағы бір ерекше қыры баса назар алатындарыңыз: аукцион әсері осындай сату бағасы немесе сату ықтималдығы ретінде аукцион қорытындысы бойынша баға бастап.

сату бағасы бойынша бастапқы бағасынан әсері туралы сұраққа жауап ең аңқау жолы ғана әр түрлі бастапқы бағасымен аукциондар бойынша қорытынды бағаны есептеу үшін болар еді. сіз жай ғана берілген бастапқы бағасы Банкноталардың коллекционерлерi киіп болатын берілген тауарды сату бағасы болжауға келсе, осы тәсіл жақсы болар еді. Егер мәселе болып табылады қандай, егер ол әділ салыстыру негізінде емес, өйткені Бірақ, нарықтық қорытындысы бойынша осы тәсілді бастапқы бағасынан әсері жұмыс істемейді; төмен бастапқы бағасымен аукциондар жоғары бастапқы бағасымен аукциондарда мүлдем өзгеше болуы мүмкін (мысалы, олар тауарларды түрлі түрлері үшін болуы немесе сатушылар әр түрлі қамтуы мүмкін).

Егер сіз әлдеқашан әділ салыстыру қабылдау туралы алаң болсаңыз, сіз тәсіл аңғалдық өткізіп және сіз нақты-айта элементін, гольф клуб бар аукцион параметрлерін-айта тіркелген жиынтығы, тегін жеткізу, аукцион сатуға еді далалық эксперимент жұмыс істеп қарастыру мүмкін , екі апта бойы ашу және т.б., бірақ кездейсоқ орнатылған бастап бағасымен. нәтижесінде алынған нарықтық нәтижелерін салыстыра отырып, осы далалық эксперимент сату бағасы бойынша бастапқы бағасынан әсері өте анық өлшеу ұсынамыз еді. Бірақ, бұл өлшеу тек бір нақты өнім мен аукцион параметрлерін жиынтығы қолданылады еді. нәтижелері, мысалы, өнімнің әр түрлі түрлері үшін, әр түрлі болуы мүмкін. күшті теориясы жоқ, ол осы бір эксперимент бастап іске қосылған болар еді ықтимал эксперименттер толық спектрін экстраполяциялау үшін қиын. Әрі қарай, далалық эксперименттер ол өнімдер мен аукцион түрлерін бүкіл параметр кеңістік жабу үшін, олардың жеткілікті іске қосу үшін бесеуi жүзеге болар еді жеткілікті қымбат.

Сәйкес: аңғалдық көзқарас және эксперименттік көзқарас айырмашылығы, Einav мен әріптестер үшінші көзқарас. олардың стратегиясының негізгі трюк өзінде Банкноталардың коллекционерлерi болған далалық эксперимент ұқсас заттарды анықтау болып табылады. Мысалы, 2.6-сурет, дәл сол гольф-клубында-бір Taylormade Оттық 09 Driver-ауқатының, дәл сол seller- «budgetgolfer» сатқан 31 листингі кейбір көрсетеді. Алайда, бұл тізімдер сәл өзгеше сипаттамалары бар. басқа 20 түрлі ақырғы күндер аукциондар, ал олардың Он, $ 124.99 белгіленген баға бойынша драйверін ұсынамыз. Сондай-ақ, тізімдер, не $ 7.99 немесе $ 9.99 түрлі жүк тасымалдау қаламақылары бар. «Budgetgolfer» зерттеушілер үшін эксперименттер жұмыс істеп тұрған болса, сондай-ақ Басқаша айтқанда, ол.

«Budgetgolfer» арқылы сатылатын Taylormade Оттық 09 драйверінің тізімдер дәл сол элемент сәл басқаша сипаттамалары бар, дәл осындай сатушы бірақ әр уақыт сатылатын листингі бар түйісетін жиынтығы, бір үлгісі болып табылады. Банкноталардың коллекционерлерi жаппай журналдарын аясында листингі миллиондаған қатысуымен түйісетін жинақтарын жүздеген мың сөзбе бар. Осылайша, орнына берілген бастапқы бағаның ішіндегі барлық аукциондар бойынша қорытынды бағаны салыстыру қарағанда, Einav мен әріптестер қанағаттандырады жиынтықтары аясында салыстыру жеткізіңіз. қанағаттандырады жинақтарын мыңдаған осы жүздеген шеңберінде салыстыру нәтижелерін біріктіру мақсатында, Einav мен әріптестер әрбір элементтің (мысалы, оның орташа сату бағасының) анықтамалық құнының тұрғысынан бастапқы бағасын және қорытынды бағасын қайта білдіреміз. Taylormade Оттық 09 Driver (оны сату негізінде) $ 100 анықтамалық мәні болса $ 120 0,1 және қорытынды бағасы 1,2 ретінде білдірді болады Мысалы, онда $ 10 бастапқы баға білдірді болады.

2.6-сурет: а қанағаттандырады жиынтығы мысал. Бұл дәл сол адамға (budgetgolfer) арқылы сатылатын, бірақ бұл сату кейбір түрлі жағдайлар (мысалы, әр түрлі бастапқы бағасы) жүргізілді, дәл осындай гольф клубы (а Taylormade Оттық 09 драйвері) болып табылады. Einav соавт алынған сурет. (2015).

2.6-сурет: а қанағаттандырады жиынтығы мысал. Бұл дәл сол адамға ( «budgetgolfer») арқылы сатылатын, бірақ бұл сату кейбір түрлі жағдайлар (мысалы, әр түрлі бастапқы бағасын) жүргізілді, дәл осындай гольф клубы (а Taylormade Оттық 09 драйвері) болып табылады. Алынған сурет Einav et al. (2015) .

Einav мен әріптестер аукцион нәтижелері туралы старт бағасы күшіне мүдделі екенін еске сала кетейік. Біріншіден, олар жоғары бастапқы бағасы сату ықтималдығы азаяды, және жоғары бастапқы бағасы болған сатуға шартты, қорытынды сату бағасын арттырмақ, деп бағаланады сызықтық пайдалана отырып Регрессия. Барлық өнімдерді орташаланған және бағасы мен қорытынды нәтижелерін-барлық қызықты емес бастап арасындағы сызықтық қарым-қатынас өз мойнына өздері, осы бағалаулар-табылатын. Бірақ, Einav мен әріптестер, сондай-ақ одан жіңішке қорытындылар түрлі бағалауға өз деректердің жаппай өлшемін қолданыңыз. Біріншіден, Einav мен әріптестер түрлі бағаның және сызықтық Регрессия пайдаланбай элементтер үшін бөлек осы есептеулер жүргізді. Олар сату бағасы мен басталу ықтималдығы арасындағы қарым-қатынастар сызықтық болып табылады, ал бастапқы бағасы мен сату бағасы арасындағы қарым-қатынас емес сызықтық (сурет 2.7) анық болып табылады. Атап айтқанда, 0,05 және 0,85 арасындағы бастапқы баға бойынша, бастапқы баға сату бағасы, сызықтық қарым-қатынас өзіне алған талдау қабылданбаған аяқталды жері бойынша өте аз әсер етеді.

аукцион Бастау бағасы мен ықтималдығы сату (сол жақ панель) және сату бағасы (оң панелі) арасындағы қатынастар: 2.7 сурет. сату бағасы мен басталу ықтималдығы арасындағы сызықтық қарым-қатынас шамамен бар, бірақ Start бағасы мен сату бағасы арасындағы сызықтық емес қарым-қатынас бар; 0,05 және 0,85 арасындағы бастапқы баға бойынша, бастапқы баға сату бағасына өте аз әсер етеді. Екі жағдайда да, қарым-қатынас элемент құнының негізінен тәуелсіз болып табылады. Бұл графиктер сурет 4А және 4В Einav т.б. көбейеді. (2015).

аукцион Бастау бағасы мен ықтималдығы сату (сол жақ панель) және сату бағасы (оң панелі) арасындағы қатынастар: 2.7 сурет. сату бағасы мен басталу ықтималдығы арасындағы сызықтық қарым-қатынас шамамен бар, бірақ Start бағасы мен сату бағасы арасындағы сызықтық емес қарым-қатынас бар; 0,05 және 0,85 арасындағы бастапқы баға бойынша, бастапқы баға сату бағасына өте аз әсер етеді. Екі жағдайда да, қарым-қатынас элемент құнының негізінен тәуелсіз болып табылады. Бұл графиктер сурет 4А және 4В жаңғыртуға Einav et al. (2015) .

Екіншіден, орнына барлық элементтерді орташаланған қарағанда, Einav мен әріптестер, сондай-ақ элементтердің (мысалы, үй жануарларына-жарақтарды, электроника және спорт ескерткіш) 23 түрлі санаттағы (2.8-сурет) үшін бастапқы бағасынан әсерін бағалауға, олардың деректер жаппай шкаласын пайдаланыңыз. Бұл есептеулер көп айрықша баптарды-мұндай ескерткіш-старт бағасы ретінде сату ықтималдығы және қорытынды сату бағасы бойынша үлкен әсері аз әсер етеді деп көрсетеді. Әрі қарай, көп commodified элементтердің-осындай DVD дискілері мен ретінде бейне-старт бағасы қорытынды бағаға дерлік әсер етпейді. Басқаша айтқанда, элементтердің 23 түрлі санаттағы нәтижелерін біріктіреді орташа осы элементтер арасындағы айырмашылықтар туралы маңызды ақпаратты жасырады.

2.8-сурет: нәтижелері әрбір санатынан сметасын көрсетті; барлық санаттары үшін бағалаудағы қатты нүкте (Кесте 11 Einav соавт., 2015), бірге Кесте 11 біріктірілген. Бұл есептеулер көп айрықша баптарды-мұндай ескерткіш-бастапқы бағасы сату (X-осі) ықтималдығын және қорытынды сату бағасы (у осьті) бойынша үлкен әсері аз әсер етеді, себебі, бұл үшін көрсетеді.

2.8-сурет: нәтижелері әрбір санатынан сметасын көрсетті; барлық санаттары үшін бағалаудағы қатты нүкте бірге біріктірілген (Einav et al. 2015, Table 11) . Бұл есептеулер көп айрықша баптарды-мұндай ескерткіш-бастапқы бағасы сату (X-осі) ықтималдығын және қорытынды сату бағасы (у осьті) бойынша үлкен әсері аз әсер етеді, себебі, бұл үшін көрсетеді.

Егер сіз Банкноталардың коллекционерлерi аукциондар әсіресе мүдделі емес, тіпті егер сіз 2,7 және 2.8-сурет ұсыныс сызықтық қатынас мойнына және көптеген баптар түрлі санаттарын біріктіру қарапайым сызықтық регрессия бағалаулар қарағанда Банкноталардың коллекционерлерi бір бай түсіну сурет жолын тамашалауға болады. Бұл неғұрлым жіңішке смета жаппай деректерді келетін қуатын суреттейді; Бұл есептеулер қымбат еді далалық тәжірибелер үлкен саны, мүмкін болмас еді.

Әрине, біз салыстырмалы эксперимент нәтижелеріне еді қарағанда кез келген нақты сәйкес келетін зерттеу нәтижелері кем сенім болуы керек. кез келген сәйкес келетін зерттеу нәтижелерін бағалау кезінде, екі маңызды деген қауіп бар. Біріншіден, біз тек сәйкес үшін пайдаланылған заттар туралы әділ салыстыру қамтамасыз ететіндей есте сақтау керек. Сатушы ID нөмірі, элемент санаты, элемент атауы, және субтитр: олардың негізгі қорытындылары жылы Einav мен әріптестер нақты төрт сипаттамаларына сәйкес келмеді. заттар сәйкестендіру үшін пайдаланылған жоқ жолдармен түрлі болса, бұл жосықсыз салыстыру жасай алар еді. «Budgetgolfer» (гольф-клубтар кем танымал) қыста Taylormade Оттық 09 драйвері бағасын төмендетті, егер шын мәнінде, бұл маусымдық туралы артефакт болар еді Мысалы, онда ол, төмен бастапқы бағасы соңғы бағасын төмендетуге әкелуі пайда алар еді сұранысқа вариация. Жалпы алғанда, бұл проблеманы жақсы көзқарас сәйкестендірудің көп түрлі көрінеді. қанағаттандырады жиынтығы мезгілде бір ай ішінде бір жыл ішінде сату элементтерді, және мыналарды қамтиды, онда Мысалы, Einav мен әріптестер олардың талдау қайталаңыз. уақыт терезе тығыз жасау қанағаттандырады жиынтығының санын азайтады, бірақ маусымдық вариация алаңдаушылық азайтады. Бақытымызға орай, олар нәтижелері сәйкес критерийлер осы өзгерістер өзгеріссіз екенін табыңыз. Сәйкес әдебиетте, алаңдаушылық бұл түрі әдетте бақылаулы мен unobservables тұрғысынан білдірді, бірақ негізгі идеясы зерттеушілер тек сәйкес пайдаланылатын мүмкіндіктер туралы әділ салыстыру құрып жатырмыз деп шын мәнінде болып табылады.

Сәйкес нәтижелерін интерпретациялау кезінде екінші ірі концерн олар тек қанағаттандырады деректерге қолданылатынын болып табылады; олар түйісетін мүмкін емес жағдайларда қолданылмайды. Мысалы, бірнеше тізімдер Einav және әріптестер кәсіби және жартылай кәсіби сатушылар назар аудара отырып, олар болған элементтерге олардың зерттеулер шектеу арқылы. Осы салыстыру түсіндіру кезінде Осылайша, біз олар тек Банкноталардың коллекционерлерi осы жиынын қолданылады екенін есте сақтау қажет.

Matching үлкен көлемді деректер әділ салыстыру табу үшін қуатты стратегиясы болып табылады. көптеген әлеуметтік ғалымдар үшін, сәйкес келетін эксперименттер екінші ұнайтынын сезінеді, бірақ бұл сәл, қайта қаралуы тиіс сенім болып табылады. 1) әсерлер біртекті маңызды болып табылады және 2) салыстыру үшін жақсы бақылаулы бар: кезінде жаппай деректерді сәйкес өріс эксперименттер саны аз қарағанда жақсы болуы мүмкін. Кесте 2.4 Сәйкес үлкен деректер көздерімен қалай қолдануға болатынын кейбір басқа да мысалдарын қамтиды.

2.4-кесте: Сандық іздері аясында әділ салыстыру таба сәйкестігін пайдалану зерттеулер мысалдары.
Мәнi бойынша фокустау Үлкен деректер көзі дәйексөз
полиция зорлық-зомбылық туралы түсірілімге әсері FRISK тоқтату және жазбалар Legewie (2016)
отбасы мен көршілеріне 11 қыркүйекте 2001 әсері дауыс беру жазбалар және қайырымдылық жазбалар Hersh (2013)
әлеуметтік жұқтыру Байланыс және өнім қабылдау деректер Aral, Muchnik, and Sundararajan (2009)

Қорытындылай келе, емес эксперименттік деректер бағалау себеп-салдарлық әсерлерін аңғалдық тәсілдері қауіпті болып табылады. әлсіз мықты ден континуума бойымен жатып себептік бағалауларды, мен зерттеушілер емес эксперименттік деректер аясында әділ салыстыру табуға болады Алайда, стратегиялар. Табиғи эксперименттер және сәйкес келетін: әрдайым бойынша, Big Data жүйелерін өсуі тиімді екі қолданыстағы әдістерін пайдалану біздің қабілетін арттырады.