2.4.3 yaxınlaşdırılması təcrübələr

Biz yox və ya edə bilməmiş təcrübələri təxmin edə bilərik. Böyük məlumat mənbələrindən xüsusilə faydalanan iki yanaşma təbii təcrübə və uyğunlaşma deməkdir.

Bəzi mühüm elmi və siyasi suallar səbəb olur. Məsələn, işə hazırlıq proqramının əmək haqqına təsiri nədir? Bu sorğuya cavab vermək istəyən bir tədqiqatçı təlimə imza atan insanların qazanclarını müqayisə edə bilməz. Amma bu qruplar arasındakı əmək haqqının nə qədər fərqliliyi təhsilə bağlıdır və nə qədər qeydiyyatdan keçən insanlar arasında fərq var? Bu çətin bir sualdır və avtomatik olaraq daha çox məlumat ilə üz-üzə gedə bilməz. Başqa sözlə, əvvəlcədən mövcud olan fərqlərə dair narahatlıq verdiyiniz məlumatda neçə işçinin olmasına baxmayaraq yaranır.

Bir çox hallarda, iş müalicəsi kimi bəzi müalicənin səbəb təsirini qiymətləndirmək üçün ən güclü bir üsul, tədqiqatçı təsadüfi olaraq bəzi insanlara deyil, digərlərinə müalicəni təmin edən randomizə nəzarətli bir sınaq keçirməkdir. Mən bütün fəslin 4-ə eksperimentlərə həsr edəcəyəm, buna görə burada mən eksperimental məlumatlarla istifadə edilə bilən iki strategiyaya diqqət edəcəyəm. İlk strategiya dünyada təsadüfi (və ya təxminən təsadüfi) müalicəni başqalarına deyil, bəzilərinə verən bir şey axtarır. İkinci strategiya, müalicəni edən və qəbul etməyənlər arasında əvvəllər mövcud olan fərqləri hesablamaq üçün qeyri-eksperimental məlumatların statistika olaraq tənzimlənməsindən asılıdır.

Bir skeptik iddia edə bilər ki, həm də bu strategiyaların qarşısını almaq lazımdır, çünki onlar ciddi fərziyyələr, qiymətləndirmək çətin olan fərziyyələr və praktikada tez-tez pozulur. Bu iddiaya sempatik olduğum halda, bir az uzaqlaşır deyə düşünürəm. Təsəvvür edin ki, qeyri-eksperimental məlumatlardan düzgün qiymətləndirmə aparmaq çətindir, amma bu, heç vaxt cəhd etməməyimiz deməkdir. Xüsusilə, qeyri-eksperimental yanaşmalar, maddi-texniki məhdudiyyət sizi bir sınaq keçirməməyə mane olursa və ya etik məhdudiyyətlər bir eksperimentin keçirilməsini istəmirsinizsə faydalı ola bilər. Bundan əlavə, qeyri-eksperimental yanaşmalar, təsadüfi nəzarətli bir sınaq hazırlamaq üçün artıq mövcud olan məlumatlardan istifadə etmək istəyirsinizsə faydalı ola bilər.

Davam etməzdən öncə də qeyd etmək lazımdır ki, natamam təxminlər edilməsi sosial tədqiqatlardakı ən mürəkkəb mövzulardan biridir və gərgin və emosional müzakirəyə səbəb ola bilər. Bundan sonra mən bu mövzuda intuisiya qurmaq üçün hər bir yanaşmanın optimist təsviri verəcəyəm, onda bu yanaşmanı istifadə edərkən yaranan bəzi çətinlikləri təsvir edəcəyəm. Hər bir yanaşma ilə bağlı daha ətraflı məlumatlar bu fəslin sonunda materiallarda verilir. Öz tədqiqatlarinizdə bu yanaşmalardan birini istifadə etməyi planlaşdırırsanız, nedensel nəticələrə dair bir çox mükəmməl kitablardan birini oxumağa (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

Eksperimental olmayan məlumatlardan nəticə hesablamalarına bir yanaşma təsadüfi başqalarına deyil, bəzi insanların müalicəsini təyin edən bir hadisəni axtarmaqdır. Bu vəziyyətlərə təbii təcrübələr deyilir. Təbii bir təcrübənin ən aydın nümunələrindən biri, hərbi xidmətlərin mənfəətə təsirini ölçən Joshua Angrist (1990) tədqiqatından gəlir. Vyetnam müharibəsi dövründə Birləşmiş Ştatlar silahlı qüvvələrin həcmini bir layihə ilə artırdı. Hansı vətəndaşların xidmətə çağırılacağına qərar vermək üçün ABŞ hökuməti lotereya keçirdi. Hər bir doğum tarixi bir kağız parçasına yazılmışdır və 2.7-də göstərildiyi kimi, bu kağız parçaları gənc kişilərin xidmətə çağırılacağı qaydasını müəyyən etmək üçün bir dəfə seçilmişdir (gənc qadınlar layihəyə). Nəticələrə əsasən, 14 sentyabrda dünyaya gələn kişilər ilk olaraq adlandırılıb, 24 aprel doğulan kişilər ikincidir, və s. Nəticədə, bu lotereyada, 195 gündə doğulmuş kişilərin hazırladığı, 171 gündür doğulmuş kişilər isə yox idi.

Şəkil 2.7: 1974-cü il dekabrın 1-də Seçici Xidmət layihəsi üçün ilk kapsulu təsvir edən konqresmen Aleksandr Pirni (R-NY). Joshua Angrist (1990), lotereya layihəsini Sosial Müdafiə İdarəsindən əldə edilən gəlir məlumatlarını, mənfəət haqqında. Bu təbii bir sınaqdan istifadə edərək araşdırma nümunəsidir. Mənbə: ABŞ Seçmə Xidmət Sistemi (1969) / Wikimedia Commons.

Şəkil 2.7: 1974-cü il dekabrın 1-də Seçici Xidmət layihəsi üçün ilk kapsulu təsvir edən konqresmen Aleksandr Pirni (R-NY). Joshua Angrist (1990) lotereya layihəsini Sosial Müdafiə İdarəsindən əldə edilən gəlir məlumatlarını, mənfəət haqqında. Bu təbii bir sınaqdan istifadə edərək araşdırma nümunəsidir. Mənbə: ABŞ Seçmə Xidmət Sistemi (1969) / Wikimedia Commons .

Dərhal aydın ola bilməməsinə baxmayaraq, layihə lotereyasının təsadüfi nəzarət edilən bir sınaq üçün kritik bir oxşarlığı vardır: hər iki halda da iştirakçılar təsadüfi bir müalicə almaq üçün təyin olunur. Bu təsadüfi müalicənin təsirini öyrənmək üçün, Angrist həmişə böyük məlumat sistemindən istifadə etdi: ABŞ-ın Sosial Müdafiə İdarəsi, hər birinin Amerikada işdən əldə etdiyi mənfəət haqqında məlumat toplayır. Hökumət idarəsi qeydlərində toplanan məlumatlar ilə lotereyada təsadüfi seçilən kimin haqqında məlumatları birləşdirərək, Angrist qazandığının qazanclarının müqayisəli qeyri-qazilərin qazancından təxminən 15% az olduğunu söylədi.

Bu nümunə göstərir ki, bəzən sosial, siyasi və ya təbii qüvvələr müalicələri tədqiqatçılar tərəfindən istifadə edilə bilən şəkildə müəyyənləşdirir və bəzən bu müalicələrin təsiri böyük məlumat mənbələrində saxlanılır. Bu tədqiqat strategiyası aşağıdakı kimi ümumiləşdirilə bilər: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

Rəqəmsal yaşda bu strategiyanı izah etmək üçün məhsuldar iş yoldaşları ilə işçilərin məhsuldarlığına təsirini qiymətləndirməyə çalışdıqları Alexandre Mas və Enrico Moretti (2009) tərəfindən araşdırma edək. Nəticələri görməzdən əvvəl, ola biləcək ziddiyyətli gözləntilər var. Bir tərəfdən, məhsuldar həmkarları ilə işləmək, işçi tərəfindən peer təzyiqindən ötrü onun məhsuldarlığını artırmasına səbəb olacaqdır. Və ya digər tərəfdən, çalışqan işəgötürənlər bir işçinin boşa çıxmasına səbəb ola biləcəyini gözləmək olar, çünki işi hər halda onun həmyaşıdları tərəfindən ediləcəkdir. Peer effektivliyini məhsuldarlığa yönəltmək üçün ən aydın yol, işçilərin təsadüfi olaraq müxtəlif məhsuldarlıq səviyyəsi ilə işləyən işçilərlə dəyişikliyə təyin edilmiş təsadüfi nəzarətli bir təcrübə olacaq və nəticədə məhsuldarlıq hər kəs üçün ölçülür. Tədqiqatçılar, həqiqətən, hər hansı bir real işdə işçilərin cədvəlini nəzarət etmirlər və məsələn, Mas və Moretti bir supermarketdə kassirlərin iştirak etdiyi təbii təcrübəyə əsaslanmalıdır.

Bu xüsusi supermarketdə, planlaşdırma üsulu və bir-birinə bənzəyən dəyişikliklər yolu ilə hər bir kassir günün müxtəlif vaxtlarında fərqli əməkdaşları var idi. Bundan əlavə, bu xüsusi supermarketdə kassirlərin tapşırığı onların həmyaşıdlarının məhsuldarlığına və ya mağazanın nə qədər məşğul olduğu ilə əlaqədardır. Başqa sözlə, kassirlərin planlaşdırma lotereya ilə müəyyən edilməməsinə baxmayaraq, işçilər bəzən təsadüfi yüksək (və ya aşağı) məhsuldarlıq təcrübəsi ilə işləmək üçün təyin olunmuşlar. Xoşbəxtlikdən, bu supermarketdə hər bir kassirin hər zaman tarandığını müşahidə edən rəqəmsal yaşa dair kassa sistemi var idi. Bu yoxlama məlumatlarından Mas və Moretti dəqiq, fərdi və hər zaman məhsuldarlıq ölçüsü yarada bildi: saniyədə taranan maddələrin sayı. Bu iki şeyi birləşdirərək, peer məhsuldarlığında təbii olaraq baş verən dəyişikliklər və həmişə məhsuldarlığın ölçüsü Mas və Moretti hesab edir ki, kassirə orta hesabla müqayisədə 10% daha məhsuldar olan əməkdaşları təyin edilərsə, onun məhsuldarlığı 1,5% . Bundan əlavə, iki əhəmiyyətli məsələni tədqiq etmək üçün məlumatların ölçüsünü və zənginliyini istifadə edirdilər: bu effektin heterojenliyi (işçilərin hansı növləri üçün daha böyük təsir göstərir?) Və təsirinin arxasında olan mexanizmlər (Nəyə görə yüksək məhsuldarlıq yaşıdlarına sahib olmaq yüksək məhsuldarlıq?). Təcrübələrin daha detallığını müzakirə edərkən, bu iki vacib məsələlərə - müalicə effektlərinin və mexanizmlərinin heterojenliyinə - 4-cü fəsildə qayıdacağıq.

Bu iki tədqiqatdan ümumiləşdirilən cədvəl 2.3 eyni quruluşa malik digər tədqiqatları özündə birləşdirir: bəzi təsadüfi dəyişikliklərin təsirini ölçmək üçün daim məlumat mənbəyi istifadə edir. Təcrübədə tədqiqatçılar təbii təcrübələr tapmaq üçün iki müxtəlif strategiyadan istifadə edir, həm də məhsuldar ola bilər. Bəzi tədqiqatçılar daim məlumat mənbəyi ilə başlamış və dünyada təsadüfi hadisələrə baxmalı; digərləri dünyada təsadüfi bir hadisə başlamış və onun təsirini tutan məlumat mənbələri axtarılmalıdır.

Cədvəl 2.3: Böyük məlumat mənbələri istifadə edərək təbii təcrübə nümunələri
Əsas diqqət Təbii eksperimentin mənbəyi Həmişə məlumat mənbəyi Referans
Məhsuldarlıq üstündəki təsirlər Planlaşdırma prosesi Checkout məlumatları Mas and Moretti (2009)
Dostluq formalaşması Hurricanes Facebook Phan and Airoldi (2015)
Emosiyaların yayılması Yağış Facebook Lorenzo Coviello et al. (2014)
Peer-to-peer iqtisadi köçürmələr Zəlzələ Mobil pul məlumatları Blumenstock, Fafchamps, and Eagle (2011)
Şəxsi istehlak davranışı 2013 ABŞ hökumətinin bağlanması Şəxsi maliyyə məlumatları Baker and Yannelis (2015)
Tövsiyəçi sistemlərin iqtisadi təsiri Müxtəlif Amazondakı məlumatları gözdən keçirin Sharma, Hofman, and Watts (2015)
Doğmamış doğulmuş körpələrə stressin təsiri 2006 İsrail-Hizbullah müharibəsi Doğum qeydləri Torche and Shwed (2015)
Vikipediyada oxu davranışı Snowden ayələri Vikipediya qeydləri Penney (2016)
Egzersiz mövzusunda qarşılıqlı təsirlər Hava Fitness trackers Aral and Nicolaides (2017)

Bu günə qədər təbii təcrübələrlə əlaqədar müzakirələrdə əhəmiyyətli bir nöqtəni buraxdım: təbiətin istədiyi şeyə bəzən çətin ola biləcəyini verdiyimdən gedirəm. Vyetnam nümunəsi nümunəsinə qayıdaq. Bu vəziyyətdə Angrist, hərbi xidmətin mənfəətə təsirinin qiymətləndirilməsində maraqlı idi. Təəssüf ki, hərbi xidmət təsadüfi deyil; daha doğrusu təsadüfi təyin olunmuşdur. Halbuki, hazırlanmış hər bir kəsə (müxtəlif istisnalar var idi) xidmət etdi və xidmət edən hər kəs hazırlanmamışdı (insanlar xidmət etmək üçün könüllü ola bilərdi). Taslağa alınma təsadüfi təyin edildiğinden, tədqiqatçı layihədə bütün kişilər üçün hazırlanmanın təsirini qiymətləndirə bilər. Amma Angrist hazırlanmasının təsirini bilmək istəmədi; o hərbi xidmətin təsirini bilmək istədi. Lakin, bu təxminləri etmək üçün əlavə ehtimallar və ağırlaşmalar tələb olunur. Birincisi, tədqiqatçılar hesablanmalıdır ki, işlənib hazırlanmanın yeganə üsulu mənfəətin hərbi xidmətdən keçməsi, istisnalar məhdudiyyətini nəzərdə tutan bir fərziyyədir. Məsələn, işə salınmış kişilərin xidmətdən qaçınmaq üçün daha uzun müddət məktəbdə qaldıqları və ya işəgötürənlərin işə salınan kişiləri işə götürmələri daha az olsaydı, bu fərziyyət səhv ola bilərdi. Ümumiyyətlə, istisnaların məhdudlaşdırılması kritik bir fərziyyədir və adətən yoxlamaq çətindir. Dışlama məhdudiyyəti doğru olsa belə, xidmətin bütün kişilərə təsiri hələ də mümkün deyildir. Bunun əvəzinə, tədqiqatçılar yalnız kompüter adlandırılan kişilərin xüsusi bir altındakı təsiri qiymətləndirə bilərlər (tərtib edildikdə xidmət etməyəcək amma xidmət etməyəcək kişilər) (Angrist, Imbens, and Rubin 1996) . Lakin, komponentlər maraq doğuran əhali deyildi. Diqqət yetirin ki, bu problemlər layihənin tərtibatının nisbətən təmiz halında baş verir. Müalicə fiziki bir lotereya tərəfindən təyin edilmədikdə başqa bir komplikasiya kompleksi ortaya çıxır. Məsələn Mas və Moretti'nin kassirlərin araşdırmasında, akranların təyin edilməsi əsasən təsadüfi olduğu ehtimalından əlavə suallar yaranır. Bu fərziyyət güclü şəkildə pozulduqda, onların hesablamalarına yanaşmaq olar. Təbii eksperimentlər qeyri-eksperimental məlumatlardan nəticə hesablamalarının aparılması üçün güclü bir strategiya ola bilər və böyük məlumat mənbələri meydana gəldikdə təbii təcrübələrə kapitallaşma qabiliyyətimizi artırır. Bununla belə, ehtimal ki, böyük ehtiyatlılıq və bəzən güclü fərziyyələr tələb olunur - təbiətin istədiyinizi qiymətləndirdiyini qiymətləndirmək.

Eksperimental məlumatlardan nəyə əsaslanan təxminlərin edilməsi üçün sizə bildirmək istərdim ki, ikinci strategiya, müalicəni edən və qəbul etməyənlər arasında əvvəlcədən mövcud olan fərqlər hesabına cəhddə qeyri-eksperimental məlumatları statistik olaraq tənzimləməyə bağlıdır. Bu cür tənzimləmə yanaşmaları var, amma bir uyğunlaşdırma çağırışına diqqət edəcəyəm. Eşleme zamanı, tədqiqatçı qeyri-eksperimental məlumatlardan istifadə edir ki, müalicəni alıb başqa bir şey olmadıqdan başqa bənzər insanlar yaradır. Eşleme prosesində, tədqiqatçılar həqiqətən də budama edirlər ; yəni açıq bir matç olmadığı hallarda imtina edilir. Beləliklə, bu metod daha dəqiq bir şəkildə eşleme və budama adlandırılacaq, amma ənənəvi müddətə uyğunlaşmaq lazımdır: eşleme.

Kütləvi qeyri-eksperimental məlumat mənbələri ilə uyğunlaşdırma strategiyalarının bir nümunəsi Liran Einav və iş yoldaşlarının (2015) istehlakçı davranışlarına dair araşdırmalarından gəlir. Onlar eBay-də keçirilən hərraclarda maraqlanırdılar və onların işlərini izah edərkən, mən hərracın başlanğıc qiymətinin auksion nəticələrinə, məsələn, satış qiymətinə və satış ehtimalına yönəldəcəyəm.

Başlanğıc qiymətinin satış qiymətinə təsirini qiymətləndirmək üçün ən sadə yol, müxtəlif başlanğıc qiymətləri ilə hərracların yekun qiymətini sadəcə hesablamaq olar. Başlanğıc qiyməti verilən satış qiymətini proqnozlaşdırmaq istəsən, bu yanaşma yaxşı olardı. Ancaq sualınız başlanğıc qiymətinin təsiriylə əlaqəli olarsa, bu yanaşma işləməyəcək, çünki ədalətli müqayisə edilməzdir; aşağı başlanğıc qiymətləri olan hərraclar daha yüksək başlanğıc qiymətləri olanlardan fərqli ola bilər (məsələn, müxtəlif mal növləri üçün və ya müxtəlif növ satıcılar daxil ola bilər).

Əgər qeyri-eksperimental məlumatlardan nəticə hesablamalarında ortaya çıxa biləcək problemlərdən artıq xəbərdar olsanız, sadəlövh yanaşmanı atlaya və müəyyən bir maddə satdığınız sahə təcrübəsini - məsələn, bir golf klubu - sabit İki həftə ərzində açıq satış parametrləri-deyirlər, pulsuz göndərmə və hərraclar, ancaq təsadüfi olaraq təyin edilmiş başlanğıc qiymətləri ilə. Nəticədə bazar nəticələrini müqayisə edərək, bu sahə təcrübəsi başlanğıc qiymətinin satış qiymətinə təsirini çox dəqiq bir şəkildə qiymətləndirəcəkdir. Amma bu ölçü yalnız bir məhsula və auksion parametrlərinə aiddir. Nəticələr fərqli ola bilər, məsələn, müxtəlif növ məhsullar üçün. Güclü bir nəzəriyyə olmadan, bu tək sınaqdan mümkün olan bütün mümkün sınaqlara qədər ekstrapolyasiya etmək çətindir. Bundan əlavə, sahə təcrübələri cəhd etmək istəyə biləcək hər bir dəyişməni yerinə yetirmək mümkün olmayacaq qədər kifayət qədər bahalıdır.

Sadəlövh və təcrübəli yanaşmalardan fərqli olaraq, Einav və həmkarları üçüncü yanaşma apardılar: eşleme. Onların strategiyasındakı əsas oyun, artıq eBay-də baş verən sahə təcrübələrinə oxşar şeyi tapmaqdır. Məsələn, 2.8 rəqəmi tam olaraq eyni golf klubunun - Taylormade Burner 09 Sürücüsünün tam olaraq eyni satıcının "büdcolfer" tərəfindən satıldığı üçün 31 siyahıdan bir hissəsini göstərir. Lakin bu 31 siyahı müxtəlif fərqli xüsusiyyətlərə malikdir. qiymət, son tarixləri və göndərmə haqları. Başqa sözlə, "budgetgolfer" tədqiqatçılar üçün təcrübə keçirməyidir.

Taylormade Burner 09 Sürücüsü "büdcə köməyi" ilə satılan bu siyahı, həmin maddənin tam eyni satıcı tərəfindən satıldığı, lakin hər zaman bir az fərqli xüsusiyyətlərlə satılan bir-birinə uyğun siyahıların bir nümunəsidir. EBay-nin kütləvi jurnallarında milyonlarla siyahıdan ibarət olan dəqiqləşdirilmiş dəstləri yüz minlərlə sözün var. Beləliklə, müəyyən bir başlanğıc qiyməti ilə bütün auksionların yekun qiymətini müqayisə etmək əvəzinə, Einav və həmkarları uyğunlaşdırılmış dəstələrlə müqayisədə. Einav və həmkarları, bu yüz minlərlə bərabər dəsti ilə müqayisə nəticələrini birləşdirmək üçün, hər bir maddənin (məsələn, orta satış qiyməti) başlanğıc qiymətini və yekun qiymətini yenidən qiymətləndirdi. Məsələn, əgər Taylormade Burner 09 Sürücüsü 100 dollar dəyərində (satışa əsasən) referans dəyərinə malikdirsə, onda 10 dollarlıq başlanğıc qiyməti 0,1 və son qiyməti isə 120 dollara kimi 1,2 olacaq.

Şəkil 2.8: Eşleşmiş bir setin nümunəsi. Bu eyni golf klubu (Taylormade Burner 09 Sürücü) eyni şəxs tərəfindən satılır (büdcə golf), lakin bu satışlardan bəziləri müxtəlif şərtlərdə (məsələn, müxtəlif başlanğıc qiymətləri) həyata keçirilir. Einav və digərlərinin icazəsi ilə çıxarılmışdır. (2015), şəkil 1b.

Şəkil 2.8: Eşleşmiş bir setin nümunəsi. Bu, tam eyni şəxs tərəfindən satılan eyni golf klubu (Taylormade Burner 09 Sürücü), lakin bu satışlardan bəziləri müxtəlif şərtlərdə (məsələn, müxtəlif başlanğıc qiymətləri) həyata keçirilmişdir. Einav et al. (2015) icazəsi ilə çıxarılmışdır Einav et al. (2015) , şəkil 1b.

Xatırladaq ki, Einav və həmkarları başlanğıc qiymətinin hərrac nəticələrinə təsiri ilə maraqlandılar. Birincisi, yüksək başlanğıc qiymətlərinin satış ehtimalı azaldığını və daha yüksək başlanğıc qiymətlərinin son satış qiymətini (satışa səbəb olan) artırdığını təxmin etmək üçün xətti reqressiya istifadə etmişdir. Doğrusal bir əlaqəni təsvir edən və bütün məhsullar üzərində ortalama olan bu təxminlər - özləri tərəfindən bu qədər maraqlı deyillər. Daha sonra, Einav və həmkarları, məlumatların böyük ölçüsünü müxtəlif incə qiymətləndirmələr yaratmaq üçün istifadə etdilər. Məsələn, təsiri müxtəlif başlanğıc qiymətləri üçün ayrı olaraq qiymətləndirməklə başlanğıc qiyməti ilə satış qiyməti arasındakı əlaqənin qeyri-xətti olduğunu təsbit etdi (şəkil 2.9). Xüsusilə, 0,05 ilə 0,85 arasında başlayan qiymətlər üçün başlanğıc qiyməti satış qiymətinə çox az təsir göstərmişdir, ilk analizi ilə tamamilə qaçırılmış bir nəticə. Bundan əlavə, Einav və həmkarları bütün maddələr üzrə ortalama qiymətdən daha çox 23 fərqli kateqoriyalara (məsələn, pet təchizatı, elektronika və idman xatirələri) başlanğıc qiymətinin təsirini qiymətləndirdi (şəkil 2.10). Bu təxminlər göstərir ki, daha fərqli əşyalar üçün, məsələn, xatirə qiyməti başlanğıc qiyməti satışın mümkünlüyü və satış qiymətinə daha böyük təsir göstərə bilər. Bundan əlavə, DVD-lər kimi başlanğıc qiyməti daha yaxşı əmtəələşdirilən əşyalar üçün son qiymətə demək olar ki, heç bir təsir göstərmir. Başqa sözlə, 23 fərqli kateqoriyadan olan nəticələri birləşdirən orta hesabla bu maddələr arasında əhəmiyyətli fərqlər gizlədir.

Şəkil 2.9: Hərracın başlanğıc qiyməti və satış ehtimalı (a) və satış qiyməti (b) arasındakı əlaqə. Başlanğıc qiyməti və satış ehtimalı arasında təxminən xətti bir əlaqə var, ancaq başlanğıc qiyməti ilə satış qiyməti arasında qeyri-xətti bir əlaqə; 0,05 ilə 0,85 arasında başlayan qiymətlər üçün başlanğıc qiyməti satış qiymətinə çox az təsir göstərir. Hər iki halda, əlaqələr əsasən maddə dəyərindən asılıdır. Einav et al. (2015), rəqəmlər 4a və 4b.

Şəkil 2.9: Hərracın başlanğıc qiyməti və satış ehtimalı (a) və satış qiyməti (b) arasındakı əlaqə. Başlanğıc qiyməti və satış ehtimalı arasında təxminən xətti bir əlaqə var, ancaq başlanğıc qiyməti ilə satış qiyməti arasında qeyri-xətti bir əlaqə; 0,05 ilə 0,85 arasında başlayan qiymətlər üçün başlanğıc qiyməti satış qiymətinə çox az təsir göstərir. Hər iki halda, əlaqələr əsasən maddə dəyərindən asılıdır. Einav et al. (2015) , rəqəmlər 4a və 4b.

Şəkil 2.10: hər bir kateqoriyadan olan qiymətləndirmələr; möhkəm nokta birlikdə birləşdirilmiş bütün kateqoriyalar üçün qiymətləndirmədir (Einav və s., 2015). Bu təxminlər göstərir ki, daha fərqli əşyalar üçün, məsələn, Həyəcan - Başlanğıc qiyməti satış xərcini ehtimalı (x-oxu) və son satış qiymətinə (y-ox) daha çox təsir göstərir. Einav et al. (2015), şəkil 8.

Şəkil 2.10: hər bir kateqoriyadan olan qiymətləndirmələr; möhkəm nokta birlikdə birləşdirilmiş bütün kateqoriyalar üçün qiymətləndirmədir (Einav et al. 2015) . Bu təxminlər göstərir ki, daha fərqli əşyalar üçün, məsələn, hədiyyələr - başlanğıc qiyməti satışın mümkünlüyü ( \(x\) -axis) üzərində kiçik təsir göstərir və son satış qiymətinə ( \(y\) daha böyük təsir göstərir \(y\) -axis). Einav et al. (2015) , şəkil 8.

EBay-də hərraclarda xüsusilə maraqlanmırsınızsa belə, 2.9 rəqəmi və 2.10 rəqəmi, xətti bir əlaqəni təsvir edən və bir çox müxtəlif maddə kateqoriyasını birləşdirən sadə hesablamalardan daha səmərəli bir anlayış təklif edir. Bundan əlavə, bu təcrübələrlə daha zərif qiymətləndirmələr yaratmaq üçün elmi cəhətdən mümkün olsa da, bu cür təcrübələr əsasən mümkün deyildir.

Təbii eksperimentlərdə olduğu kimi, uyğunlaşmanın bir sıra yolları pis qiymətləndirmələrə gətirib çıxara bilər. Hesab edirəm ki, uyğun qiymətləndirmələrlə bağlı ən böyük narahatlıq onlar uyğunlaşmada istifadə edilməmiş şeylər ilə qərəzli ola bilər. Məsələn, əsas nəticələrində, Einav və həmkarları dörd xüsusiyyətə tam uyğun gəldi: satıcı ID nömrəsi, maddə kateqoriya, maddə başlığı və altyazı. Öhdəliklər eşleme üçün istifadə edilməmiş yollarla fərqlənirsə, bu ədalətsiz bir müqayisə yarada bilər. Məsələn, "büdcə köməyi" qışda Taylormade Burner 09 Sürücüsü üçün qiymətləri endirdi (golf klubları daha az populyar olduqda), o zaman başlanğıc qiymətlərinin aşağı düşməsi son qiymətlərə gətirib çıxardı, əslində bu, tələb olunan mövsümi dəyişiklik. Bu narahatlığı aradan qaldırmaq üçün bir yanaşma bir çox fərqli eşleme növüdür. Məsələn, Einav və həmkarları eşleme üçün istifadə edilən vaxt pəncərəsini dəyişdirərkən təhlilini təkrarlayıblar (uyğunlaşdırılmış dəstlər bir il ərzində, bir ay ərzində və birbaşa satışda olan maddələr daxildir). Xoşbəxtlikdən, bütün zamanlar üçün oxşar nəticələr tapdılar. Eşleme ilə bağlı daha da narahatlıq təfsirdən yaranır. Eşleme hesablamaları yalnız eşleşen verilere aiddir; eşleşmeyen hallara tətbiq edilmir. Məsələn, onların tədqiqatlarını bir neçə siyahıdan olan maddələrə məhdudlaşdırmaqla, Einav və həmkarları peşəkar və yarı peşəkar satıcılara diqqət yetirirlər. Beləliklə, bu müqayisələri şərh edərkən, biz yalnız bu eBay alt kvalifikasiyasına müraciət etdiklərini unutmamalıyıq.

Eşleme, qeyri-eksperimental məlumatlarda ədalətli müqayisə tapmaq üçün güclü bir strategiyadır. Bir çox sosial elm adamına uyğunlaşma, təcrübə üçün ikinci ən yaxşı hiss edir, amma bu, bir qədər təzələnə biləcək bir inancdır. Kütləvi məlumatlarda uyğunlaşma (1) təsirlərin heterojenliyi vacibdir və (2) eşleme üçün lazım olan əhəmiyyətli dəyişənlər ölçülmüş olduqda, az miqdarda sahə təcrübəsindən daha yaxşı ola bilər. Cədvəl 2.4 böyük məlumat mənbələri ilə uyğunlaşdırılmanın necə bir sıra digər nümunələrini təqdim edir.

Cədvəl 2.4: Böyük məlumat mənbələri ilə uyğunluq istifadə edən nümunələr
Əsas diqqət Böyük məlumat mənbəyi Referans
Atışların polis şiddətinə təsiri Dur-və-bıçaqlı qeydlər Legewie (2016)
11 sentyabr 2001-ci ildəki ailələrə və qonşulara təsiri Səs qeydləri və bağış qeydləri Hersh (2013)
Sosial çatışmazlıq Rabitə və məhsulun qəbul edilməsi məlumatları Aral, Muchnik, and Sundararajan (2009)

Nəticədə, qeyri-eksperimental məlumatlardan səbəbli təsirlərin qiymətləndirilməsi çətindir, lakin təbii təcrübələr və statistik düzəlişlər (məsələn, eşleme) kimi yanaşmalar istifadə edilə bilər. Bəzi hallarda bu yanaşmalar pis yanaşa bilər, lakin diqqətlə yerləşdirildikdə, bu yanaşmalar fəsildə təsvir etdiyim eksperimental yanaşma üçün əlverişli bir nəticə ola bilər. Bundan əlavə, bu iki yanaşma həmişə davamlı inkişafın, böyük məlumat sistemləri.