2.4.3.2 Matching

Matching ishlarni yuz Azizillo tomonidan adolatli taqqoslash yaratish.

Fair taqqoslashlar nazorat randomize tajribalar yoki tabiiy tajribalar ham olib kelishi mumkin. Lekin, siz ideal tajriba ishlatish mumkin emas va tabiat tabiiy tajriba taqdim emas ko'p vaziyatlar bor. Bu sozlash, eng yaxshi yo'l adolatli taqqoslash taalukli bo'ladi yaratish. taalukli yilda tadqiqotchisi bir davolash oldi tashqari o'xshash odamlar juft yaratish non-eksperimental ma'lumotlar orqali ko'rinadi va bir emas bor. Tarjima jarayonida, tadqiqotchilar aslida ham Azizillo etiladi; bu hech qanday yaqqol taqqoslash bor ishlarni tashlab, deb. Shunday qilib, bu usul ko'proq aniq taalukli-va-Azizillo deb nomlangan bo'ladi, lekin men an'anaviy muddatga tayoq bilan olaman: taalukli.

Katta bo'lmagan eksperimental ma'lumotlar manbalari bilan strategiyasini taalukli kuchi bir go'zal misol lira Einav va hamkasblari tomonidan iste'molchi xulq haqida tadqiqot kelgan (2015) . Einav va hamkasblari eBay sodir bo'layotgan auksion manfaatdor edi, va ularning ishini tasvirlab, men bir tomoniga e'tibor beraman: bunday sotish narxi yoki sotish ehtimoli sifatida kimoshdi natijalari bo'yicha kimoshdi boshlang'ich narxi ta'siri.

sotish narxlari ustidan boshlang'ich narxi ta'siri haqida savolga javob berish uchun eng sodda yo'li oddiygina turli boshlang'ich narxlar bilan savdoga final narxini hisoblash uchun bo'ladi. Agar shunchaki bir berilgan boshlang'ich narxi bilan eBay qo'yish edi berilgan element sotish narxini oldindan bo'lsangiz, bu yondashuv yaxshi bo'lar edi. Lekin, siz savol u adolatli taqqoslash asosida emas, chunki ishlamaydi bozor yakunlari bo'yicha bu yondashuv boshlang'ich narx ta'siri nima bo'lsa; quyi boshlang'ich narxlar bilan auktsionlar oliy boshlang'ich narxlar (masalan, ular tovarlar xil turlari uchun bo'lishi yoki sotuvchilar turli xil bo'lishi mumkin) bilan auksion farq bo'lishi mumkin.

Agar adolatli taqqoslash qilish haqida allaqachon xavotirda bo'lsangiz, siz sodda yondashuv o'tish va auktsion bir belgilangan majmui bilan klubi-, ma'lum bir modda-deydi bir golf sotish edi dala tajriba yugurib ko'rib mumkin parametrlari-deb, free shipping, auktsion ikki hafta, uchun ochiq va hokazo, ammo tasodifiy boshlang'ich narxini belgilash bilan. Olingan bozor natijalarini solishtirish orqali, ushbu maydon tajriba sotish narxlari ustidan boshlang'ich narx ta'siri juda aniq o'lchash taklif edi. Lekin, bu o'lchov faqat bitta mahsulot uchun amal va auktsion parametrlari belgilangan edi. natijalar mahsulotlar xil turlari uchun, masalan, har xil bo'lishi mumkin. kuchli nazariyasi holda, bu bir tajriba ishlatish mumkin edi iloji tajribalar to'liq diapazoni o'rmalab qiyin. Bundan tashqari, dala tajribalari bu mahsulot va auktsion turlaridan butun parametr bo'sh joy qoplash uchun ulardan etarlicha yuqoriga ishlatish uchun chidamli bo'ladi, deb etarlicha qimmat.

sodda yondashuv va eksperimental yondashuv farqli o'laroq, Einav va hamkasblari uchinchi yondashuv: taalukli. ularning strategiyasining asosiy hiyla allaqachon eBay sodir bo'lishi dala tajribalari o'xshash narsalarni kashf qilish. Misol uchun, shakl 2,6 aynan bir xil golf klubi-a TaylorMade Burner-Driver oshirilmoqda aynan bir xil seller- "budgetgolfer" tomonidan 09 sotilgan 31 ro'yxatlarini ba'zi ko'rsatadi. Shu bilan birga, bu ro'yxatlari oz farq xususiyatlarga ega. 20 xil end xurmo bilan savdolarni vaqt ulardan o'n bir, $ 124,99 sobit bahoga drayverini taklif etamiz. Bundan tashqari, ro'yxatlar, turli yuk to'lovlari ega yo $ 7.99 yoki $ 9.99. "Budgetgolfer" tadqiqotchilar uchun tajribalar ishlayotgan bo'lsa, boshqa so'z bilan aytganda, u bo'ladi.

TaylorMade Burner 09 Driver ro'yxatlari "budgetgolfer" tomonidan sotiladi bir xil element bir xil sotuvchi tomonidan sotiladi ro'yxatlarini, bir mos majmui lekin oz farq xususiyatlarga har bir vaqt, bir misol bor. eBay katta jurnallar doirasida ro'yxatlarini millionlab jalb mos fotoalbomlarda yuz minglab tom ma'noda bor. Shunday qilib, o'rniga berilgan boshlang'ich narxi barcha savdoga final narxi solishtirish ko'ra, Einav va hamkasblari mos fotoalbomlarda davomida taqqoslash qilish. mos fotoalbomlarda minglab bu yuzlab doirasida taqqoslash natijalari birlashtirish maqsadida, Einav va hamkasblari har bir element (masalan, uning o'rtacha sotish narxlari) mos yozuvlar qiymati jihatidan boshlang'ich narxi va yakuniy narx qayta izhor. TaylorMade Burner 09 Driver $ 100 mos yozuvlar qiymatini bo'lsa, masalan, (uning savdo asosida), so'ngra $ 10 bir boshlang'ich narxi 0,1 sifatida ifodalanishi edi va $ 120 yakuniy narxi 1,2 sifatida ifodalanishi edi.

Rasm 2,6: a mos majmui misol. Bu aniq bir shaxsga (budgetgolfer) tomonidan sotiladigan bir xil golf klubi (a TaylorMade Burner 09 Driver), lekin bu savdo bir necha turli shart-sharoitlar (masalan, turli boshlang'ich narxi) amalga oshirildi. Einav boshq olingan rasm. (2015).

Rasm 2,6: a mos majmui misol. Bu aniq bir shaxsga ( "budgetgolfer") tomonidan sotiladigan bir xil golf klubi (a TaylorMade Burner 09 Driver), lekin bu savdo bir necha turli shart-sharoitlar (masalan, turli boshlang'ich narxi) amalga oshirildi. Olingan rasm Einav et al. (2015) .

Einav va hamkasblari auktsion yakunlari bo'yicha start narxi ta'siri ham manfaatdor ekanligi eslang. Birinchidan, chiziqli tushish yordamida ular yuqori boshlang'ich narxi sotish ehtimoli kamaytirish, deb, va oliy boshlang'ich narxi sotish yuzaga ustida shartli final sotish narxini oshirish, deb taxmin. o'zlari tomonidan, bu taxmin-barcha mahsulotlar ustidan o'rtacha va boshlang'ich narxi va yakuniy o'rtasidagi chiziqli munosabatlarni faraz barcha qiziqarli emas yakunlari-bor. Lekin, Einav va hamkasblari ham ko'proq nozik topilmalar turli xil taxmin qilish, ularning ma'lumotlar katta hajmini foydalaning. Birinchidan, Einav va hamkasblari alohida-alohida har xil narxlar ob'ektlar va chiziqli tushish holda bu bashorat qildi. Ular sotish start narxi va ehtimollik o'rtasidagi munosabatlar chiziqli esa, boshlang'ich narxi va sotish narxi o'rtasidagi munosabatlar chiziqli bo'lmagan (rasm 2,7) aniq bo'ladi, deb topildi. Xususan, 0,05 va 0.85 orasida narxlar boshlash uchun, boshlang'ich narxi sotish narxi, bir chiziqli munosabatlarni gumon qilar tahlil o'tkazib yuborilgan yakunlandi ajrimi ustidan juda kam ta'sir ko'rsatadi.

2,7 tushunishga: Aloqa savdosi (chap panel) va sotish narxi (o'ng panel) ning kimoshdi start narxi va ehtimollik o'rtasida. start narxi va sotish ehtimoli o'rtasida chiziqli munosabatlar taxminan bor, lekin start narxi va sotish narxi o'rtasidagi chiziqli bo'lmagan munosabatlar ham bordir; 0,05 va 0.85 orasida narxlar boshlash uchun, boshlang'ich narxi narxi juda oz ta'sir ko'rsatadi. Har ikki holatda ham, munosabatlar element qiymati asosan alohidadir. Ushbu grafikalar shakl 4a va 4B Einav boshq qayta. (2015).

2,7 tushunishga: Aloqa savdosi (chap panel) va sotish narxi (o'ng panel) ning kimoshdi start narxi va ehtimollik o'rtasida. start narxi va sotish ehtimoli o'rtasida chiziqli munosabatlar taxminan bor, lekin start narxi va sotish narxi o'rtasidagi chiziqli bo'lmagan munosabatlar ham bordir; 0,05 va 0.85 orasida narxlar boshlash uchun, boshlang'ich narxi narxi juda oz ta'sir ko'rsatadi. Har ikki holatda ham, munosabatlar element qiymati asosan alohidadir. Ushbu grafikalar shakl 4a va 4B qayta Einav et al. (2015) .

Ikkinchidan, aksincha, barcha ma'lumotlar ustida o'rtacha ko'ra, Einav va hamkasblari ham (masalan, chorva materiallari, elektronika va sport Xotira) ob'ektlar (2.8-rasm) 23 xil toifalari uchun boshlang'ich narxi ta'sirini baholash uchun, ularning ma'lumotlar ommaviy ko'lamini foydalaning. Ushbu kiritish ko'proq xos unsurlar-kabi memorabilia-start narxi bir sotish ehtimoli va yakuniy narxi ham katta ta'sir ustidan kichik ta'siri bor, deb ko'rsatadi. Bundan tashqari, uchun ko'proq commodified mahsulot falon DVD va video-start narxi final narxi deyarli hech qanday ta'siri bor. Boshqa so'zlar bilan aytganda, unsurlar 23 xil kategoriyalari natijalarini birlashtirgan o'rtacha ushbu ob'ektlar orasidagi farqlar haqida muhim ma'lumotlarni maxfiy qilsangiz.

2,8 tushunishga: Natijalar har bir turkumda smeta ko'rsatdi; barcha toifalari uchun smeta qattiq nuqta jadval 11 (Einav va boshq. 2015, 11-jadval), birga yig'ilgan. Ushbu kiritish ko'proq xos unsurlar-kabi memorabilia-start narxi bir sotish (x-o'qi) va yakuniy narxi (y o'qi) bo'yicha katta ta'sir ehtimoli haqida bir kichik ta'sir ega ekanligini ko'rsatadi.

2,8 tushunishga: Natijalar har bir turkumda smeta ko'rsatdi; birga yig'ilgan barcha toifalariga matndan qattiq nuqta (Einav et al. 2015, Table 11) . Ushbu kiritish ko'proq xos unsurlar-kabi memorabilia-start narxi bir sotish (x-o'qi) va yakuniy narxi (y o'qi) bo'yicha katta ta'sir ehtimoli haqida bir kichik ta'sir ega ekanligini ko'rsatadi.

Agar eBay kimoshdi savdolari, ayniqsa manfaatdor emas bo'lsa ham, siz 2.7-shakl va 2,8 taklif chiziqli munosabatlarni taxmin va ob'ektlar turli toifadagi birlashtirish oddiy chiziqli tushish smeta ortiq eBay bir boy tushuncha, shakl yo'l qoyil kerak. Bu ko'proq nozik hisob-kitoblarga ko'ra katta ma'lumotlar taalukli kuchini ko'rsatadi; bu taxmin qimmat bo'lar edi dala tajribalari katta soni, holda imkonsiz edi.

Albatta, Biz har bir muayyan taalukli o'rganish yakunlariga kam ishonch, biz teng eksperiment natijalari bo'lardik bo'lishi kerak. har qanday taalukli o'rganish natijalarini baholashda, ikki muhim xavotirlar bor. Birinchidan, biz faqat taalukli uchun ishlatildi narsalar haqida adolatli taqqoslash ta'minlash mumkin, deb eslash kerak. sotuvchi ID raqami, element toifasi, modda nomi va subtitle: ularning asosiy natijalari, Einav va hamkasblari aniq to'rt xususiyatlarini muvofiq edi. mahsulot adolatsiz taqqoslash yaratish mumkin izini tekshirish uchun ishlatiladigan emas edi yo'llar, turli edi. (Golf klublar kam mashhur bo'lgan bo'lsa) aslida bu mavsumiy bir qo'lyozmasi bo'ladi Misol uchun, agar "budgetgolfer" qishda TaylorMade Burner 09 Driver narxini pasaytirdi, u, kam boshlang'ich narxi final narxini pasaytirish sabab deb paydo bo'lishi mumkin talab o'zgarish. Umuman olganda, bu muammo uchun eng yaxshi yondashuv taalukli ko'plab turli harakat ko'rinadi. Misol uchun, Einav va hamkasblari mos silsilasini davr bir oy ichida bir yil ichida sotuvga ma'lumotlar, va o'z ichiga oladi, ularning tahlil takrorlang. vaqt oyna qattiq Making mos fotoalbomlarda sonini kamaytiradi, lekin mavsumiy o'zgarish xavotir kamaytiradi. Yaxshiyamki, ular natijalari taalukli mezonlar bu o'zgarishlar o'zgarishsiz deb topish. Taalukli adabiyotida, tashvish, bu turi odatda observables va unobservables ifodalanadi, lekin asosiy g'oya tadqiqotchilar faqat taalukli ishlatiladigan xususiyatlariga adolatli taqqoslash yaratish, albatta, bo'ladi.

taalukli natijalarini talqin ikkinchi yirik tashvish ular faqat mos ma'lumotlarga murojaat, deb; Ular mos bo'lmadi hollarda taalluqli emas. Misol uchun, Einav va hamkasblari professional va yarim professional sotuvchi urg'u berilmoqda necha ro'yxatlarini edi ob'ektlar o'z tadqiqotlarini cheklash bilan. Bu taqqoslash talqin Shunday qilib, biz ular faqat eBay bu quyi amal ekanligini unutmasligi lozim.

Matching katta ma'lumotlar adolatli taqqoslash topish uchun kuchli strategiya. ko'p ijtimoiy olimlar uchun taalukli tajribalar ikkinchi nav kabi his, lekin bir oz, qayta ko'rib chiqish kerak e'tiqod hisoblanadi. ta'siri 1) turlilik muhim va 2) taalukli uchun yaxshi muhokama qilinadi mavjud: qachon katta ma'lumotlar taalukli dala tajribalari oz sonli ko'ra yaxshiroq bo'lishi mumkin. 2.4-jadval katta ma'lumotlar manbalari bilan foydalanish mumkin taalukli qanday ba'zi boshqa misollar beradi.

2.4-jadval: raqamli izlari doirasida adolatli taqqoslash topish taalukli foydalanish tadqiqotlar misollar.
mustaqil e'tibor Big ma'lumotlar manbai tsitata
politsiya zo'ravonlik haqida otishma ta'siri yozuvlarni va frisk to'xtating Legewie (2016)
oilalar va qo'shnilar haqida 11 sentyabr, 2001 yil ta'siri Ovoz berish yozuvlar va ehson yozuvlar Hersh (2013)
ijtimoiy infeksiya Aloqa va mahsulot qabul qilish ma'lumotlar Aral, Muchnik, and Sundararajan (2009)

Shunday qilib, non-eksperimental ma'lumotlarga nedensel ta'sirini baholash uchun sodda yondashuvlar xavflidir. Biroq, kuchli dan zaif bir uzluksiz birga yotgan nedensel smetasini qilish uchun strategiyalar va tadqiqotchilar non-eksperimental ma'lumotlar doirasida adolatli taqqoslash kashf mumkin. tabiiy tajribalar va taalukli: har doim-kuni, katta ma'lumotlar tizimlarini o'sish samarali mavjud ikkita usul foydalanish qobiliyatini oshiradi.