2.4.3 ခန့်မှန်းခြေအားဖြင့်စမ်းသပ်ချက်

ကျနော်တို့ရှိသည်မဟုတ်သို့မဟုတ်မပွုနိုငျကွောငျးကိုစမ်းသပ်ချက်ဆုံးခနျ့မှနျးနိုငျသညျ။ အထူးသဖြင့်ကြီးမားသောဒေတာသတင်းရပ်ကွက်မှအကျိုးနှစ်ခုချဉ်းကပ်မှုကသဘာဝစမ်းသပ်ချက်များနှင့်ကိုက်ညီခြင်းဖြစ်ကြသည်။

တချို့ကအရေးကြီးသောသိပ္ပံဆိုင်ရာနှင့်မူဝါဒမေးခွန်းများကိုကြောင်းကျိုးဆက်စပ်ဖြစ်ကြသည်။ ဥပမာအားဖြင့်, လုပ်ခအပေါ်တစ်ဦးအလုပ်လေ့ကျင့်ရေးအစီအစဉ်၏အကျိုးသက်ရောက်မှုကဘာလဲ? ဤမေးခွန်းကိုဖြေဆိုရန်ကြိုးစားနေတစ်ဦးကသုတေသီမသောသူတို့ကိုအဖို့လေ့ကျင့်ရေးတက်သည်လက်မှတ်ရေးထိုးခဲ့သောလူများ၏ဝင်ငွေရရှိမှုနှိုင်းယှဉ်ပေလိမ့်မည်။ သို့သော်မည်မျှသောဤအုပ်စုများအကြားလုပ်အားခအတွက်ဆိုခြားနားချက်များ၏အကြောင်းကြောင့်သင်တန်း၏ဖြစ်ပြီးအဘယ်ကြောင့်ဆိုသော် sign up ကိုလူနှင့်မကျင့်သောသူတို့ကိုအကြား preexisting ခြားနားချက်များမည်မျှရှိသနည်း ဒါကခက်ခဲဆိုတဲ့မေးခွန်းကိုဖြစ်တယ်, ဒါကြောင့်အလိုအလျှောက်ပိုပွီးဒေတာနှင့်အတူသွားတော်မမူကြောင်းတစ်ခုဖြစ်ပါသည်။ တနည်းအားဖြင့်ဖြစ်နိုင်သမျှ preexisting ကွဲပြားမှုနဲ့ပတ်သက်တဲ့စိုးရိမ်ပူပန်သင့်ရဲ့ဒေတာ၌ရှိကြ၏မည်မျှလုပ်သားများနေပါစေပေါ်ပေါက်။

ထိုကဲ့သို့သောအလုပ်လေ့ကျင့်ရေးအဖြစ်အများအပြားအခြေအနေများ, အခြို့ကုသမှု၏ကြောင်းကျိုးဆက်စပ်အကျိုးသက်ရောက်မှုကိုခန့်မှန်းရန်အင်အားအကောင်းဆုံးလမ်းအတွက်တစ်သုတေသီကျပန်းအချို့သောလူများနှင့်မရအခြားသူများကုသမှုကယ်တင်တတ်၏ဘယ်မှာ randomized ထိန်းချုပ်ထားစမ်းသပ်မှု run ဖို့ဖြစ်ပါတယ်။ ငါစမ်းသပ်ချက်အခန်း 4 အပေါငျးတို့သမွှုပျနှံပါလိမ့်မယ်, ဒါကြောင့်ဒီနေရာမှာကျနော် Non-စမ်းသပ်ဒေတာတွေနဲ့သုံးနိုငျနှစ်ခုမဟာဗျူဟာအာရုံစိုက်ဖို့သွားတယ်။ ပထမဦးဆုံးနည်းဗျူဟာကြောင့်ကျပန်း (သို့မဟုတ်နီးပါးကျပန်း) ကမ္ဘာပေါ်မှာဖြစ်ပျက်တစ်ခုခုရှာနေပေါ်တွင်မူတည်သည်အချို့သောလူများနှင့်မရအခြားသူများကုသမှုသတ်မှတ်ပေးထားတဲ့။ ဒုတိယမဟာဗျူဟာကစာရင်းအင်းပြုကုသမှုခံယူဘူးသောသူတို့အားအကြားကွဲပြားခြားနားမှု preexisting များအတွက်အကောင့်တစ်ခုကြိုးပမ်းမှုအတွက် Non-စမ်းသပ် data တွေကိုချိန်ညှိပေါ်တွင်မူတည်သည်။

တစ်ဦးကသံသယသူတို့ခိုင်မာတဲ့ယူဆချက်, အကဲဖြတ်ရန်နှင့်အလေ့အကျင့်ထဲမှာမကြာခဏချိုးဖောက်နေကြသည်, ထိုရန်ခက်ခဲဖြစ်ကြောင်းယူဆချက်လိုအပ်ကြောင့်ဤနည်းဗျူဟာများနှစ်ခုစလုံးကိုရှောင်ရှားသင့်ကြောင်းဆိုကြသည်ပေလိမ့်မည်။ ငါသည်ဤအရေးဆိုရန်စာနာမိပါတယ်နေစဉ်, ငါကဝေးလွန်းနည်းနည်းဝင်ထင်ပါတယ်။ အဲဒါကိုယုံကြည်စိတ်ချရသော Non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ခန့်မှန်းစေပါရန်ခက်ခဲကြောင်းဆက်ဆက်မှန်ပေမယ့်ငါကျနော်တို့ကြိုးစားကြဘယ်တော့မှသင့်ကြောင်းဆိုလိုတယ်ထင်ကြပါဘူး။ ထောက်ပံ့ပို့ဆောင်ရေးသတ်စမ်းသပ်မှုတစ်ခုပို့ချရာမှသို့မဟုတ်လူ့ကျင့်ဝတ်ဆိုင်ရာအခက်အခဲကိုသင်စမ်းသပ်မှုတစ်ခုကို run ချင်ကြဘူးဆိုလိုလျှင်သင်တားဆီးမယ်ဆိုရင်အထူးသဖြင့်, Non-စမ်းသပ်ချဉ်းကပ်အထောက်အကူဖြစ်စေနိုင်ပါတယ်။ သငျသညျပြီးသားတစ်ဦး randomized ထိန်းချုပ်ထားစမ်းသပ်မှုဒီဇိုင်းနိုင်ရန်အတွက်တည်ရှိကြောင်းအချက်အလက်များ၏အားသာချက်ယူချင်တယ်ဆိုရင်နောက်ထပ် non-စမ်းသပ်ချဉ်းကပ်အထောက်အကူဖြစ်စေနိုင်ပါတယ်။

ဆက်လက်မလုပ်ဆောင်ခင်, ကကြောင်းကျိုးဆက်စပ်ခန့်မှန်းရာတွင်လူမှုရေးသုတေသနအတွက်အများဆုံးရှုပ်ထွေးသည့်အကြောင်းအရာများထဲကတစ်ခုနှင့်ပြင်းထန်သောနှင့်စိတ်ပိုင်းဆိုင်ရာဆွေးနွေးငြင်းခုံဖို့ဦးဆောင်လမ်းပြနိုင်မတဦးတည်းကြောင်းသတိပြုလည်းထိုက်သည်။ အောက်ပါအတိုင်းအဘယ်အရာ၌ငါထို့နောက်ငါချဉ်းကပ်နည်းတွေကိုအသုံးပြုတဲ့အခါပေါ်ထွန်းသောစိန်ခေါ်မှုများအချို့ကိုဖော်ပြပါမည်, အကြောင်းပင်ကိုယ်တည်ဆောက်နိုင်ရန်အတွက်တစ်ဦးချင်းစီချဉ်းကပ်မှုတစ်ခုအကောင်းမြင်ဖော်ပြချက်များကိုပါလိမ့်မယ်။ တစ်ခုချင်းစီကိုချဉ်းကပ်အကြောင်းကိုနောက်ထပ်အသေးစိတ်အချက်အလက်များကိုဤအခနျး၏အဆုံးမှာပစ္စည်းများအတွက်ရရှိနိုင်ပါသည်။ သင်သည်သင်၏ကိုယ်ပိုင်သုတေသနတွင်ဤချဉ်းကပ်မှု၏တစ်ခုခုကိုသုံးစွဲဖို့စီစဉ်ထားလျှင်, ငါအလွန်အမင်းကြောင်းကျိုးဆက်စပ်အခြအပေါ်အများအပြားအလွန်အစွမ်းထက်တဲ့စာအုပ်တွေထဲကတစ်ခုဖတ်နေအကြံပြု (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014)

Non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ခန့်မှန်းအောင်တချဉ်းကပ်ကျပန်းအခြားသူများအချို့သောလူများနှင့်မတစ်ဦးကိုကုသတာဝန်ပေးအပ်ခဲ့သည်ဖြစ်ရပ်တစ်ခုကိုရှာဖွေရန်ဖြစ်ပါသည်။ ဤရွေ့ကားအခြေအနေများကသဘာဝစမ်းသပ်ချက်ဟုခေါ်ကြသည်။ သဘာဝစမ်းသပ်မှု၏အရှင်းလင်းဥပမာတစ်ခုမှာယောရှုသည် Angrist ၏သုတေသနမှလာ (1990) ဝင်ငွေရရှိမှုအပေါ်စစ်တပ်န်ဆောင်မှုများ၏အကျိုးသက်ရောက်မှုကိုတိုင်းတာ။ ဗီယက်နမ်စစ်ပွဲကာလအတွင်းအမေရိကန်ပြည်ထောင်စုမူကြမ်းမှတဆင့်၎င်း၏လက်နက်ကိုင်တပ်ဖွဲ့များ၏အရွယ်အစားတိုးတက်လာခဲ့သည်။ ဝန်ဆောင်မှုသို့ခေါ်တော်မူလိမ့်မည်ဟုထားတဲ့နိုင်ငံသားများဆုံးဖြတ်နိုင်ဖို့အတွက်အမေရိကန်အစိုးရအနေဖြင့်ထီကျင်းပခဲ့တယ်။ တိုင်းမွေးဖွားနေ့စွဲစာရွက်တစ်ရွက်ပေါ်တွင်ရေးသားခဲ့လျှင်, ကိန်းဂဏန်း 2.7 မှာပြထားတဲ့အတိုင်းစက္ကူဤအပိုင်းပိုင်း (အမျိုးသမီးငယ်ဘာသာရပ်မဟုတ်ကြလုလင်တို့သည်အစေခံရန်ဟုခေါ်ဝေါ်ခြင်းကိုခံရလိမ့်မည်သည့်အမိန့်ကိုဆုံးဖြတ်ရန်နိုင်ရန်အတွက်တစ်ကြိမ်မှာရှေးခယျြခဲ့သညျ ) မူကြမ်းရန်။ ရလဒ်အပေါ်အခြေခံပြီး, စက်တင်ဘာလ 14 ရက်နေ့တွင်ဖွားမြင်ယောက်ျားဒါပေါ်ပထမဦးဆုံး, ဧပြီ 24 ရက်တွင်မွေးဖွားယောက်ျားဒုတိယဟုခေါ်ကြသည်ကိုချေါပွီးခဲ့ကြသည်။ 171 ရက်မွေးဖွားယောက်ျားမဟုတ်ကြစဉ်နောက်ဆုံးတွင်, ဒီထီအတွက် 195 ကွဲပြားခြားနားသောနေ့ရကျမှာမွေးဖွားယောက်ျား, ရေးဆွဲခဲ့ကြသည်။

2.7 ပုံ: ဒီဇင်ဘာ 1 ရက်တွင်ရွေးချယ်ဝန်ဆောင်မှုမူကြမ်းများအတွက်ပထမဦးဆုံးဆေးတောင့်ဆွဲကွန်ဂရက်အလက်ဇန်းဒါး Pirnie (R-NY), 1969 ခုနှစ်ယောရှုသည် Angrist (1990) စစ်မှုထမ်းများ၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းဖို့လူမှုဖူလုံရေးအုပ်ချုပ်ရေးကနေဝင်ငွေရရှိမှုဒေတာတွေနဲ့မူကြမ်းထီပေါင်းစပ် ဝင်ငွေရရှိမှုပေါ်မှာ။ ဒါကသဘာဝအစမ်းသပ်မှု အသုံးပြု. သုတေသနဥပမာတစ်ခုဖြစ်ပါတယ်။ ရင်းမြစ်: အမေရိကန်ပြည်ထောင်စုရွေးချယ်ဝန်ဆောင်မှုစနစ် (1969) / Wikimedia Commons ။

2.7 ပုံ: ဒီဇင်ဘာ 1 ရက်တွင်ရွေးချယ်ဝန်ဆောင်မှုမူကြမ်းများအတွက်ပထမဦးဆုံးဆေးတောင့်ဆွဲကွန်ဂရက်အလက်ဇန်းဒါး Pirnie (R-NY), 1969 ခုနှစ်ယောရှုသည် Angrist (1990) စစ်မှုထမ်းများ၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းဖို့လူမှုဖူလုံရေးအုပ်ချုပ်ရေးကနေဝင်ငွေရရှိမှုဒေတာတွေနဲ့မူကြမ်းထီပေါင်းစပ် ဝင်ငွေရရှိမှုပေါ်မှာ။ ဒါကသဘာဝအစမ်းသပ်မှု အသုံးပြု. သုတေသနဥပမာတစ်ခုဖြစ်ပါတယ်။ ရင်းမြစ်: အမေရိကန်ရွေးချယ်ဝန်ဆောင်မှုစနစ် (1969) / Wikimedia Commons

ဒါကြောင့်ချက်ချင်းသိသာမဖြစ်ပေမဲ့, မူကြမ်းထီတစ် randomized ထိန်းချုပ်ထားစမ်းသပ်မှုတစ်ခုအရေးပါတူညီမှုရှိပါတယ်: နှစ်ဦးစလုံးအခြေအနေများအတွက်သင်တန်းသားများကိုကျပန်းတစ်ဦးဆေးကုသမှုခံယူဖို့တာဝန်ရှိပါသည်။ အမေရိကန်လူမှုဖူလုံရေးအုပ်ချုပ်ရေး, အလုပ်အကိုင်အနေဖြင့်လုံးဝနီးပါးတိုင်းအမေရိကန်ရဲ့ဝင်ငွေရရှိမှုအပေါ်သတင်းအချက်အလက်စုဆောင်းထားတဲ့: ဤကျပန်းကုသမှု၏အကျိုးသက်ရောက်မှုကိုလေ့လာနိုင်ရန်အတွက်, Angrist ကြီးတွေဒေတာစနစ်ကအမြဲ-တခုတခုအပေါ်မှာအခွင့်ကောင်းကိုယူ။ ကျပန်းအစိုးရမဟုတ်သောအုပ်ချုပ်ရေးမှတ်တမ်းများအတွက်စုဆောင်းခံခဲ့ရသောဝင်ငွေများဒေတာတွေနဲ့မူကြမ်းထီအတွက်ရွေးချယ်ထားသည့်သူနှင့် ပတ်သက်. သတင်းအချက်အလက်များပေါင်းစပ်ပြီးအသုံးပြုပုံ Angrist စစ်ပြန်များ၏ဝင်ငွေရရှိမှုနှိုင်းယှဉ် Non-စစ်ပြန်များ၏ဝင်ငွေရရှိမှုထက် 15% လျော့နည်းခဲ့ကောက်ချက်ချခဲ့ကြသည်။

ဒီဥပမာသရုပ်ဖော်အဖြစ်, တခါတရံတွင်လူမှုရေး, နိုင်ငံရေး, ဒါမှမဟုတ်သဘာဝအတပ်ဖွဲ့တွေသုတေသီများအားဖြင့်ရေးအတွက်ခံရနိုင်ပြီး, တစ်ခါတစ်ရံတွင်ဤအကုသများ၏သက်ရောက်မှုအမြဲ-တွင်ဖမ်းမိကြသည်ကြီးတွေဒေတာသတင်းရင်းမြစ်တစ်လမ်းအတွက်ကုသ assign ။ အောက်မှာဖေါ်ပြတဲ့အတိုင်းဤသည်သုတေသနမဟာဗျူဟာအကျဉ်းချုပ်ခံရနိုင်သည် \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

ဒီဂျစ်တယ်ခေတ်၌ဤမဟာဗျူဟာကိုသရုပျဖျောဖို့, ရဲ့ Alexandre Mas နှင့် Enrico Moretti ကလေ့လာမှုကိုစဉ်းစားကြကုန်အံ့ (2009) အလုပ်သမားတစ်ဦးရဲ့ကုန်ထုတ်စွမ်းအားအပေါ်အကျိုးဖြစ်ထွန်းသောလုပ်ဖော်ကိုင်ဖက်များနှင့်အတူအလုပ်လုပ်၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းရန်ကြိုးစားခဲ့သော။ ရလဒ်မြင်နေမီ, သင်စေခြင်းငှါပဋိပက္ခဖြစ်မျှော်လင့်ချက်များရှိနေပါသည်ထွက်ညွှန်ပြကျိုးနပ်သည်။ တဖကျတှငျသငျသညျတန်ဖိုးရှိရှိလုပ်ဖော်ကိုင်ဖက်များနှင့်အတူအလုပ်လုပ်သောကွောငျ့ရွယ်တူချင်းဖိအားသူမ၏ကုန်ထုတ်စွမ်းအားတိုးမြှင့်ဖို့အလုပ်သမားဦးဆောင်လမ်းပြမယ်လို့မျှော်လင့်ထားပေလိမ့်မည်။ သို့မဟုတျ, အခြားတစ်ဖက်တွင်, သငျသညျအလုပျမည်သို့ပင်ဖြစ်စေသူမ၏ရွယ်တူချင်းအားဖြင့်ပြုသောအမှုလိမ့်မည်ဖြစ်သောကြောင့်ခက်ခဲ-အလုပ်လုပ်ရွယ်တူရှိခြင်းကိုပိတ်ဆို့တားဆီးစေမယ့်အလုပ်သမားဦးဆောင်လမ်းပြအံ့သောငှါမျှော်လင့်ထားပေလိမ့်မည်။ ကုန်ထုတ်စွမ်းအားအပေါ်သက်တူရွယ်တူသက်ရောက်မှုကိုလေ့လာရန်အရှင်းလင်းလမ်းလုပ်သားများကျပန်းကွဲပြားခြားနားသောကုန်ထုတ်လုပ်မှုအဆင့်ဆင့်၏လုပ်သားများနှင့်အတူဆိုင်းရန်တာဝန်ပေးအပ်ကြသည်ထို့နောက်ရရှိလာတဲ့ကုန်ထုတ်စွမ်းအားလူတိုင်းအတွက်တိုင်းတာသည်အဘယ်မှာရှိတစ်ဦး randomized ထိန်းချုပ်ထားစမ်းသပ်မှုဖြစ်လိမ့်မည်။ သုတေသီများသို့သော်မည်သည့်စစ်မှန်သောစီးပွားရေးလုပ်ငန်းအတွက်လုပ်သားတွေရဲ့အချိန်ဇယားကိုမထိန်းချုပ်ဘူး, ဒါကြောင့် Mas နှင့် Moretti တစ်ဦးစူပါမားကတ်မှာငွေရှင်းကောင်တာတွင်ပါဝင်သောသဘာဝစမ်းသပ်မှုအပေါ်အားကိုးခဲ့ရသည်။

ဒီအထူးသဖြင့်စူပါမားကက်များတွင်ဘာဖြစ်လို့လဲဆိုတော့အချိန်ဇယားဆွဲပြုမိသောလမ်းနှင့်ထပ်ပြောင်းရွှေ့ရသည်ကြောင်းလမ်းစီငွေရှင်းကောင်တာတွင်နေ့၏ကွဲပြားခြားနားသောအချိန်များတွင်ကွဲပြားခြားနားသောလုပ်ဖော်ကိုင်ဖက်ရှိခဲ့ပါတယ်။ ထို့ပြင်ဒီအထူးသဖြင့်စူပါမားကက်ထဲမှာငွေရှင်းကောင်တာတွင်၏တာဝနျကိုထိုသူတို့၏ရွယ်တူ၏ထုတ်လုပ်မှုစွမ်းအားသို့မဟုတ်ဘယ်လောက်အလုပ်များစတိုးဆိုင်ခဲ့မသက်ဆိုင်သောဖြစ်ခဲ့သည်။ ငွေရှင်းကောင်တာတွင်များ၏အချိန်ဇယားဆွဲထီကဆုံးဖြတ်မခံခဲ့ရသော်လည်းအလုပ်သမားများကတစ်ခါတစ်ရံတွင်ကျပန်းမြင့်မားသော (သို့မဟုတ်အနိမ့်) ကုန်ထုတ်လုပ်မှုရွယ်တူချင်းအတူအလုပ်လုပ်ရန်တာဝန်ကျလျှင်အဖြစ်တစ်နည်း, ကဖြစ်ခဲ့သည်။ ကံကောင်းထောက်မစွာ, ဒီစူပါမားကတ်ကိုလည်းတစ်ခုချင်းစီကိုငွေရှင်းကောင်တာတွင်ခပ်သိမ်းသောကာလ scan ဖတ်သောပစ္စည်းများကိုခြေရာခံတဲ့ဒစ်ဂျစ်တယ်-အသက်အရွယ်ကုန်ပစ္စည်းသည့်စနစ်ရှိခဲ့သည်။ တစ်စက္ကန့် scan ဖတ်ပစ္စည်းအရေအတွက်က: ဤကုန်ပစ္စည်းမှတ်တမ်းဒေတာကနေ, Mas နှင့် Moretti ကုန်ထုတ်စွမ်းအားတစ်ခု, တိကျသောတစ်ဦးချင်းစီနှင့်အစဉ်အမြဲ-အပေါ်အတိုင်းအတာဖန်တီးနိုင်ခဲ့တယ်။ -အရာတို့ကိုသက်တူရွယ်တူကုန်ထုတ်လုပ်မှုအတွက်သဘာဝကျကျဖြစ်ပေါ်မူကွဲနှစ်ခုပေါင်းစပ်ပြီးနဲ့ productivity-Mas နှင့် Moretti ၏အမြဲ-အပေါ်အတိုင်းအတာတခုငွေရှင်းကောင်တာတွင်ပျမ်းမျှထက် 10% ပိုမိုအကျိုးဖြစ်ထွန်းခဲ့ကြတဲ့သူလုပ်ဖော်ကိုင်ဖက်တာဝန်ပေးအပ်ခဲ့သည်ဆိုပါကသူမ၏ထုတ်လုပ်မှု 1.5% အထိတိုးမြှင့်မယ်လို့ခန့်မှန်း ။ ဖို့ဦးဆောင်လမ်းပြ (အဘယ်ကြောင့်မြင့်မားသောကုန်ထုတ်စွမ်းအားရွယ်တူရှိခြင်းပါဘူးဒီအကျိုးသက်ရောက်မှုများပင်သောင်းပြောင်းထွေလာရောနှော (အရာများအတွက်အလုပျသမားမြား၏မြိုးမြိုးပိုကြီးတဲ့အကျိုးသက်ရောက်မှုရှိသနည်း) နှင့်အကျိုးသက်ရောက်မှုနောက်ကွယ်မှယန္တရားများ: ထို့ပြင်ထိုသူနှစ်ယောက်တို့သည်အရေးကြီးသောကိစ္စရပ်များကိုလေ့လာစူးစမ်းဖို့သူတို့ရဲ့အချက်အလက်များ၏အရွယ်အစားနှင့်ပေါများကြွယ်ဝကိုအသုံးပြု ပိုမိုမြင့်မားသောကုန်ထုတ်စွမ်းအား?) ။ ကျနော်တို့ကိုပိုပြီးအသေးစိတ်အတွက်စမ်းသပ်ချက်ဆွေးနွေးရန်တဲ့အခါမှာကျနော်တို့အခနျးကွီး 4 အတွက်ယန္တရားများ-ကုသမှုဆိုးကျိုးများနှင့်ဤနှစ်ခုအရေးကြီးသောကိစ္စများ-သောင်းပြောင်းထွေလာရောနှောဖို့ပြန်လာပါလိမ့်မယ်။

အဲဒီနှစျခုလေ့လာမှုများကနေ Generalizing, စားပွဲပေါ်မှာ 2.3 ဒီတူညီတဲ့ဖွဲ့စည်းပုံမှာရှိသည်သောအခြားအလေ့လာမှုများအကျဉ်းချုပ်: အချို့ကျပန်းအပြောင်းအလဲ၏အကျိုးသက်ရောက်မှုကိုတိုင်းတာရန်အနေနဲ့အစဉ်အမြဲ-on ကိုဒေတာအရင်းအမြစ်ကိုသုံးနိုင်သည်။ လက်တွေ့တွင်သုတေသီများအသီးအနှံများနိုင်ပါတယ်နှစ်ဦးစလုံး၏သဘာဝအစမ်းသပ်ချက်ရှာဖွေနှစ်ခုကွဲပြားခြားနားသောမဟာဗျူဟာများ, ကိုအသုံးပြုပါ။ တချို့ကသုတေသီများတစ်ခုအမြဲ-on ကိုဒေတာအရင်းအမြစ်နှင့်အတူစတင်ကမ္ဘာပေါ်မှာကျပန်းဖြစ်ရပ်များကိုကြည့်; အခြားသူများကိုကမ္ဘာပေါ်မှာတစ်ဦးကိုကျပန်းဖြစ်ရပ်စတင်ရန်နှင့်၎င်း၏အကျိုးသက်ရောက်မှုကိုဖမ်းယူကြောင်းဒေတာသတင်းရင်းမြစ်ကိုရှာဖွေပါ။

စားပွဲတင် 2.3: Big Data သတင်းရပ်ကွက်များအသုံးပြုခြင်းသဘာဝစမ်းသပ်မှု၏ဥပမာများ
ထိရောက်သောအာရုံ သဘာဝကစမ်းသပ်မှု၏ရင်းမြစ် အမြဲတမ်း-on ကိုဒေတာအရင်းအမြစ် အညွှန်း
ကုန်ထုတ်စွမ်းအားအပေါ်သက်ရောက်မှု Peer စီစဉ်ခြင်းဖြစ်စဉ်ကို checkout ဒေတာ Mas and Moretti (2009)
ချစ်ကြည်ရေးဖွဲ့စည်းရေး ဟာရီကိန်း Facebook က Phan and Airoldi (2015)
စိတ်ခံစားမှုများပြန့်နှံ့ မိုးရေ Facebook က Lorenzo Coviello et al. (2014)
peer-to-peer စီးပွားရေးလွှဲပြောင်း ငလျင် မိုဘိုင်းပိုက်ဆံဒေတာ Blumenstock, Fafchamps, and Eagle (2011)
ပုဂ္ဂိုလ်ရေးစားသုံးမှုအမူအကျင့် 2013 ခုနှစ်အမေရိကန်အစိုးရကပိတ် ပုဂ္ဂိုလ်ရေးဘဏ္ဍာရေးဒေတာ Baker and Yannelis (2015)
အကြံပြုချက်များစနစ်များစီးပွားရေးအပေါ်တွင်လည်းသက်ရောက်မှု အမျိုးမျိုးသော အမေဇုံမှာ browsing data တွေကို Sharma, Hofman, and Watts (2015)
မွေးသေးသောကလေးငယ်အပေါ်စိတ်ဖိစီးမှု၏အကျိုးသက်ရောက်မှု 2006 ဣသရေလအမျိုးကို-Hezbollah စစ် မွေးဖွားခြင်းမှတ်တမ်းများ Torche and Shwed (2015)
ဝီကီပီးဒီးယားအပေါ် Reading အပြုအမူ စနိုးဒန်ဗျာဒိတ်တော်များ ဝီကီပီးဒီးယားမှတ်တမ်းများ Penney (2016)
လေ့ကျင့်ခန်းအပေါ်သက်ရောက်မှု Peer မိုးလေဝသ ကြံ့ခိုင်ရေးကိုခြေရာခံ Aral and Nicolaides (2017)

သွားသင်တစ်ခါတစ်ရံအတော်လေးလှည်စားနိုင်ပါတယ်လိုချင်တာတွေပေးခဲ့ရာသဘာဝထံမှ: သဘာဝအလျောက်စမ်းသပ်ချက်နဲ့ပတ်သက်တဲ့ဒါဝေးဆွေးနွေးမှုမှာတော့ကျွန်မအနေနဲ့အရေးကြီးသောအချက်အထဲကထွက်ခွာသွားပါတယ်။ ရဲ့ဗီယက်နမ်မူကြမ်းဥပမာထံသို့ပြန်လာကြကုန်အံ့။ ဤကိစ္စတွင်ခုနှစ်, Angrist င်ငွေအပေါ်စစ်မှုထမ်းများ၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းစိတ်ဝင်စားခဲ့သည်။ ကံမကောင်းစွာပဲစစ်မှုထမ်းကျပန်းတာဝန်ပေးမခံ, အစားကကျပန်းတာဝန်ပေးခဲ့ရေးဆွဲလျက်ရှိခဲ့သည်။ သို့သော်ရေးဆွဲခဲ့သူမဟုတ်လူတိုင်း (ကင်းလွတ်ခွင့်အမျိုးမျိုးရှိကြ၏) တာဝန်ထမ်းဆောင်နှင့်တာဝန်ထမ်းဆောင်သူကိုလူတိုင်းမ (လူတွေအစေခံရန်လုပ်အားပေးနိုင်) ရေးဆွဲခဲ့သည်။ ရေးဆွဲခံရကျပန်းတာဝန်ကျတယ်သောကြောင့်, တစ်သုတေသီမူကြမ်းထဲမှာလူအပေါင်းတို့အဘို့ရေးဆွဲထားကြောင်း၏အကျိုးသက်ရောက်မှုခန့်မှန်းနိုင်ပါ။ သို့သော် Angrist ရေးဆွဲထားကြောင်း၏အကျိုးသက်ရောက်မှုကိုသိရန်မလိုချင်ဘဲ, သူကစစ်တပ်တွင်အမှုထမ်းများ၏အကျိုးသက်ရောက်မှုကိုသိလို။ ဒီခန့်မှန်းချက်စေရန်, သို့သော်အပိုဆောင်းယူဆချက်နှင့်ပြဿနာများလိုအပ်သည်။ ပထမဦးစွာသုတေသီများထိခိုက်င်ငွေရေးဆွဲလျက်ရှိကြောင်းတည်းသောလမ်းစစ်မှုထမ်းမှတဆင့်တစ်ဦးယူဆချက်ဖယ်ချန်ကန့်သတ်ဟုခေါ်တွင်ကြောင်းယူဆဖို့လိုအပ်ပါတယ်။ ဥပမာအားဖြင့်ရေးဆွဲနေသောယောက်ျားအလုပ်ရှင်များရေးဆွဲသူယောက်ျားငှားရမ်းရန်လျော့နည်းဖွယ်ရှိဖြစ်လျှင်အမှုတော်ကိုထမ်းဆောင်ရှောင်ရှားသို့မဟုတ်နိုင်ရန်အတွက်မဟုတ်တော့ကျောင်းမှာတည်းခိုလျှင်ဤသည်ယူဆချက်ကမှားပေလိမ့်မည်။ ယေဘုယျခုနှစ်, ဖယ်ကန့်သတ်မယ့်အရေးပါယူဆချက်ဖြစ်တယ်, ဒါကြောင့်အတည်ပြုရန်များသောအားဖြင့်ခဲယဉ်းသည်။ ဖယ်ချန်ကန့်သတ်မှန်ကန်ရင်တောင်ကြောင့်လူအပေါငျးတို့အပေါ်ဝန်ဆောင်မှု၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းရန်နေဆဲမဖြစ်နိုင်ဘူး။ အဲဒီအစားသူကသုတေသီများသာ compliers (မူကြမ်းရေးဆွဲသည့်အခါအစေခံမယ်လို့ပေမယ်ရေးဆွဲမဟုတ်သည့်အခါအစေခံမဟုတ်ဘူးသူကိုယောက်ျား) လို့ခေါ်တဲ့ယောက်ျားတစ်ဦးသတ်သတ်မှတ်မှတ်များအနက်အချို့သာလျှင်အပေါ်အကျိုးသက်ရောက်မှုခန့်မှန်းနိုင်မထွက်လှည့် (Angrist, Imbens, and Rubin 1996) ။ Compliers သို့သော်အကျိုးစီးပွားမူလလူဦးရေကြဘူး။ ဒီပြဿနာတွေကိုပင်မူကြမ်းထီ၏အတော်လေးစင်ကြယ်သောအမှု၌ပျေါပေါကျကြောင်းသတိပြုပါ။ ကုသမှုရုပ်ပိုင်းဆိုင်ရာထီကတာဝန်ပေးအပ်မဟုတ်အခါပြဿနာများ၏တစ်ဦးကထပ်မံ set ကိုပျေါပေါကျ။ ဥပမာအားဖြင့်, ငွေရှင်းကောင်တာတွင်၏ Mas နှင့် Moretti ရဲ့လေ့လာမှုမှာ, အပိုဆောင်းမေးခွန်းများကိုရွယ်တူ၏တာဝနျကိုမရှိမဖြစ်လိုအပ်တဲ့ကျပန်းသောယူဆချက်နှင့်ပတ်သက်ပြီးပေါ်ထွန်း။ ဒီယူဆချက်ပြင်းပြင်းထန်ထန်ချိုးဖောက်ခံခဲ့ရလျှင်, မိမိတို့၏ခန့်မှန်းနေကြပါတယ်နိုင်ဘူး။ ကောက်ချက်ချရန်, သဘာဝစမ်းသပ်ချက် Non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ခန့်မှန်းအောင်များအတွက်အစွမ်းထက်မဟာဗျူဟာဖြစ်နိုင်ပြီး, ကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်သူတို့ဖြစ်ပေါ်သည့်အခါသဘာဝအစမ်းသပ်ချက်အပေါ်အမြတ်ထုတ်ရန်မှကျွန်တော်တို့ရဲ့စွမ်းရည်ကိုတိုးမြှင့်။ သို့ရာတွင်ထိုသို့ဖြစ်ကောင်းကြီးမြတ်စောင့်ရှောက်မှုနှင့်တခါတရံတွင်ခိုင်ခံ့သောယူဆချက်-ကိုသွားသင်လိုချင်သည့်ခန့်မှန်းချက်မှပေးထားသောအရာကိုသဘောသဘာဝကနေမလိုအပ်ပါလိမ့်မယ်။

ကျွန်မသည် non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ခန့်မှန်းအောင်ဘို့အကြောင်းကိုသင်ပြောပြချင်ပါတယ်ဒုတိယမဟာဗျူဟာပြုကုသမှုခံယူဘူးသောသူတို့အားအကြားကွဲပြားခြားနားမှု preexisting များအတွက်အကောင့်တစ်ခုကြိုးပမ်းမှုအတွက် Non-စမ်းသပ် data တွေကိုချိန်ညှိကစာရင်းအင်းပေါ်တွင်မူတည်သည်။ ထိုအရပ်၌များစွာသောထိုကဲ့သို့သောညှိနှိုင်းမှုချဉ်းကပ်သော်လည်း, ငါတယောက်ကိုခေါ်ကိုက်ညီခြင်းအပေါ်အာရုံစိုက်ပါလိမ့်မယ်။ တိုက်ဆိုင်သည့်ခုနှစ်, သုတေသီတကုသမှုလက်ခံရရှိခဲ့သည်နှင့်တဦးတည်းမဟုတ်ရှိပါတယ် မှလွဲ. ဆင်တူနေသောလူများအားလုံးကိုဖန်တီးရန် Non-စမ်းသပ် data တွေကိုတဆင့်ကြည့်ပါတယ်။ ကိုက်ညီခြင်း၏လုပ်ငန်းစဉ်များတွင်သုတေသီများသည်လည်းအမှန်တကယ် pruning ပါ၏ မထင်ရှားသောပွဲစဉ်ရှိပါတယ်ဘယ်မှာအမှုများကိုပယ်ဖြစ်ပါသည်။ ထို့ကြောင့်ဤနည်းလမ်းကပိုတိကျစွာတိုက်ဆိုင်သည့်-and တံစဉ်များကိုခေါ်တော်မူလိမ့်မည်ဟု, ဒါပေမယ့်ငါရိုးရာသက်တမ်းနှင့်အတူကပ်ပါလိမ့်မယ်: ကိုက်ညီခြင်း။

ဧရာ Non-စမ်းသပ် data တွေကိုသတင်းရင်းမြစ်နှင့်အတူမဟာဗျူဟာကိုက်ညီ၏တနျခိုးတစ်ခုမှာဥပမာအား Liran Einav နှင့်လုပ်ဖော်ကိုင်ဘက်များကစားသုံးသူအပြုအမူအပေါ်သုတေသနပြုထံမှလာ (2015) ။ သူတို့က ebay မှာအရပျကိုယူပြီးလေလံစိတ်ဝင်စားခဲ့ကြသည်, သူတို့၏အလုပ်ဖော်ပြ၌ငါကဲ့သို့သောရောင်းစျေးနှုန်းတစ်ခုသို့မဟုတ်ရောင်းချရန်များ၏ဖြစ်နိုင်ခြေအဖြစ်လေလံရလဒ်များပေါ်တွင်စျေးနှုန်းစတင်လေလံ၏အကျိုးသက်ရောက်မှုအပေါ်အာရုံစူးစိုက်ပါလိမ့်မယ်။

ရောင်းချစျေးနှုန်းအပေါ်စျေးနှုန်း စတင်. ၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းရန်အရှိဆုံးနုံလမ်းရိုးရှင်းစွာကွဲပြားခြားနားစတင်စျေးနှုန်းများနှင့်အတူလေလံများအတွက်နောက်ဆုံးစျေးနှုန်းတွက်ချက်ဖို့ဖြစ်ပါလိမ့်မည်။ သင်စတင်စျေးနှုန်းပေးထားရောင်းစျေးနှုန်းကိုခန့်မှန်းရန်လိုခဲ့လျှင်ဒီချဉ်းကပ်မှုဒဏ်ငွေပါလိမ့်မယ်။ သင်၏မေးခွန်းစတင်စျေးနှုန်း၏အကျိုးသက်ရောက်မှုစိုးရိမ်လျှင်တရားမျှတနှိုင်းယှဉ်အပေါ်အခြေမခံသောကြောင့်ဒါပေမယ့်ဖြစ်လျှင်ဤချဉ်းကပ်မှုအလုပ်လုပ်မည်မဟုတ်ပေ, အောက်ပိုင်းစတင်စျေးနှုန်းများနှင့်အတူလေလံ (ဥပမာ, သူတို့ကုန်ပစ္စည်းအမျိုးမျိုးအဘို့ဖြစ်လိမ့်သို့မဟုတ်ရောင်းသူအမျိုးမျိုးပါဝင်သည်စေခြင်းငှါ,) မြင့်မားစတင်စျေးနှုန်းများနှင့်အတူရှိသူများအနေဖြင့်အတော်လေးကွဲပြားခြားနားပါလိမ့်မယ်။

သငျသညျပြီးသား Non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ခန့်မှန်းချတဲ့အခါ, သင်နုံချဉ်းကပ်ကျော်သွားနဲ့သင်တစ်ဦးသတ်သတ်မှတ်မှတ်-ဆိုသညျကားကို item တစ်ဦးဂေါက်သီးကလပ်-နဲ့ပုံသေရောင်းမယ်လို့ဘယ်မှာလယ်စမ်းသပ်မှုအပြေးစဉ်းစားပါလိမ့်မယ်ပေါ်ထွန်းနိုငျသောပြဿနာများကိုသတိပြုမိရောက်နေတယ်ဆိုရင် လေလံ-ပြောပါ parameters များကို set ကိုအခမဲ့ရေကြောင်းနှင့်နှစ်ပတ်အတွင်း-ပေမယ်ကျပန်းတာဝန်ပေးအပ်စတင်စျေးနှုန်းများနှင့်အတူဖွင့်လေလံတင်။ ရလဒ်စျေးကွက်ရလဒ်များနှိုင်းယှဉ်ခြင်းအားဖြင့်, ဒီလယ်ကိုစမ်းသပ်မှုရောင်းချမှုစျေးနှုန်းအပေါ်စျေးနှုန်း စတင်. ၏အကျိုးသက်ရောက်မှုများဟာအလွန်ရှင်းလင်းသောတိုင်းတာခြင်းပူဇော်လိမ့်မယ်။ သို့သော်ဤတိုင်းတာခြင်းတစ်ဦးတည်းသာအထူးသဖြင့်ထုတ်ကုန်များနှင့်လေလံပွဲ parameters များကို set ကိုလျှောက်ထားမည်ဖြစ်သည်။ ရလဒ်ဥပမာထုတ်ကုန်များ၏ကွဲပြားခြားနားသောအမျိုးအစားများကိုများအတွက်ကွဲပြားခြားနားပါလိမ့်မယ်။ အားကြီးသောသီအိုရီမရှိရင်ဒါဟာပြေးပါပြီနိုင်ဖြစ်နိုင်သောစမ်းသပ်ချက်များအပြည့်အဝအကွာအဝေးဤတစ်ခုတည်းစမ်းသပ်မှုကနေ extrapolate ရန်ခက်ခဲသည်။ ထို့ပြင်လယ်ကွက်စမ်းသပ်ချက်ကြောင့်သင်ကြိုးစားကြည့်ချင်အံ့သောငှါတိုင်းအပြောင်းအလဲ run ဖို့ infeasible ဖြစ်လိမ့်မယ်လို့လုံလုံလောက်လောက်စျေးကြီးတယ်။

ကိုက်ညီခြင်း: အနုံများနှင့်စမ်းသပ်ဆဲချဉ်းကပ်ဖို့မတူဘဲ, Einav နှင့်လုပ်ဖော်ကိုင်ဘက်တစ်ဦးကိုတတိယချဉ်းကပ်နည်းယူခဲ့ပါတယ်။ သူတို့ရဲ့မဟာဗျူဟာအတွက်အဓိကလှည့်ကွက်ပြီးသား ebay မှာဖြစ်ပျက်ခဲ့ကြကြောင်းလယ်ပြင်စမ်းသပ်ချက်အလားတူအမှုအရာရှာဖွေတွေ့ရှိရန်ဖြစ်ပါသည်။ ဥပမာအားဖြင့်, ကိန်းဂဏန်း 2.8 အတိအကျတူညီဂေါက်သီးကလပ်-တစ် Taylormade Burner 09 ယာဉ်မောင်း-ဖြစ်ခြင်းအတိအကျတူညီ seller- ရောင်းချများအတွက် 31 စာရင်းများအချို့ကိုပြသထားတယ် "budgetgolfer ။ " သို့သော်ဤ 31 စာရင်းများထိုကဲ့သို့သောကွဲပြားခြားနားစတင်အဖြစ်အနည်းငယ်ကွဲပြားခြားနားသောလက္ခဏာများရှိသည် စျေးနှုန်းအဆုံးရက်စွဲများနှင့်ရေကြောင်းအခကြေးငွေ။ "budgetgolfer" ဟုအဆိုပါသုတေသီများအဘို့စမ်းသပ်ပြေးလျှင်အဖြစ်တစ်နည်းမှာ, ဖြစ်ပါတယ်။

"budgetgolfer" ရောင်းချလျက်ရှိသည့် Taylormade Burner 09 ယာဉ်မောင်းဤစာရင်းများအနည်းငယ်ကွဲပြားခြားနားသောလက္ခဏာများနှင့်အတူတဦးတည်းအတိအကျတူညီပစ္စည်းကိုအတိအကျတူညီရောင်းချသူအားဖြင့်ရောင်းချလျက်ရှိရာစာရင်းများတစ်လိုက်ဖက်ထား၏ဥပမာ, ဒါပေမယ့်တစ်ဦးချင်းစီအချိန်ဖြစ်ပါသည်။ ကို eBay ၏ကြီးမားသောမှတ်တမ်းများအတွင်းစာရင်းများသန်းပေါင်းများစွာပါဝင်သောလိုက်ဖက်အစုံထောင်ပေါင်းများစွာ၏ရာပေါင်းများစွာစာသားရှိပါတယ်။ ထို့ကြောင့်ထက်လိုက်ဖက်အစုံအတွင်းနှိုင်းယှဉ်လျှင်အားလုံးပေးထားသောစတင်စျေးနှုန်း Einav နှင့်အတူလေလံများနှင့်လုပ်ဖော်ကိုင်ဖက်များများအတွက်နောက်ဆုံးစျေးနှုန်းနှိုင်းယှဉ်။ လိုက်ဖက်အစုံထောင်ပေါင်းများစွာ၏ဤရာပေါင်းများစွာအတွင်းနှိုင်းယှဉ်ရာမှရလဒ်များကိုပေါင်းစပ်နိုင်ဖို့အတွက် Einav နှင့်လုပ်ဖော်ကိုင်ဘက်တစ်ဦးချင်းစီကို item (ဥပမာင်း၏ပျမ်းမျှအားရောင်းချစျေးနှုန်း) ၏ရည်ညွှန်းတန်ဖိုးကို၏စည်းကမ်းချက်များ၌စတင်စျေးနှုန်းနှင့်နောက်ဆုံးစျေးနှုန်းပြန်လည်ထုတ်ဖော်ပြောဆိုခဲ့သည်။ ဥပမာအားဖြင့်, လျှင် Taylormade Burner 09 ယာဉ်မောင်းပြီးတော့ $ 10 တစ်စတင်စျေးနှုန်း 0.1 နှင့် $ 120 အဖြစ် 1.2 ၏နောက်ဆုံးစျေးနှုန်းအဖြစ်ထုတ်ဖော်ပြောဆိုသွားမည်ဖြစ်ကြောင်း, (၎င်း၏ရောင်းအားအပေါ်အခြေခံပြီး) $ 100 ကိုတစ်ဦးကိုကိုးကားတန်ဖိုးကိုရှိခဲ့ပါတယ်။

ပုံ 2.8: တစ်လိုက်ဖက်အစုံတခုရဲ့ဥပမာ။ ဒါကအတိအကျတူညီလူတစ်ဦး (budgetgolfer) ကရောင်းချခဲ့ရခံရပေမယ့်ဒီရောင်းအားအချို့ကွဲပြားခြားနားသောအခြေအနေများ (ဥပမာ, ကွဲပြားခြားနားသောစတင်စျေးနှုန်းများ) အရဖျော်ဖြေခဲ့ကြသည်အတိအကျတူညီဂေါက်သီးကလပ် (က Taylormade Burner 09 ယာဉ်မောင်း) ဖြစ်ပါသည်။ Einav et al ထံမှခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်ပေး။ (2015), ပုံ 1B ။

ပုံ 2.8: တစ်လိုက်ဖက်အစုံတခုရဲ့ဥပမာ။ ဒါကအတိအကျတူညီလူတစ်ဦး ( "budgetgolfer") ဖြင့်ရောင်းချခံရပေမယ့်ဒီရောင်းအားအချို့ကွဲပြားခြားနားသောအခြေအနေများ (ဥပမာ, ကွဲပြားခြားနားသောစတင်စျေးနှုန်းများ) အရဖျော်ဖြေခဲ့ကြသည်အတိအကျတူညီဂေါက်သီးကလပ် (က Taylormade Burner 09 ယာဉ်မောင်း) ဖြစ်ပါသည်။ ကနေခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်လုပ်ခြင်း Einav et al. (2015) , ပုံ 1B ။

Einav နှင့်လုပ်ဖော်ကိုင်ဘက်များလေလံတင်ရလဒ်များအပေါ်စတင်စျေးနှုန်း၏အကျိုးသက်ရောက်မှုကိုစိတ်ဝင်စားခဲ့သတိရပါ။ ပထမဦးဆုံးသူတို့ပိုမိုမြင့်မားစတင်စျေးနှုန်းများတစ်ရောင်းချများ၏ဖြစ်နိုင်ခြေလျော့နည်းကျဆင်းကြောင်းခန့်မှန်းရန် linear ဆုတ်ယုတ်သုံးနှင့်အဆင့်မြင့်စတင်စျေးနှုန်းများ (ဖြစ်ပေါ်နေရောင်းချမှုအပေါ်ခြွင်းချက်) နောက်ဆုံးရောင်းချမှုစျေးနှုန်းတိုးမြှင့်ကြောင်း။ သူတို့ကိုယ်သူတို့အားဖြင့်ဤခန့်မှန်းချက်-သော linear ဆက်ဆံရေးမျိုးကိုဖော်ပြရန်အပေါင်းတို့နှင့်ရှိသမျှသောအစိတ်ဝင်စားဖို့မဟုတ်ထုတ်ကုန်-များမှာကျော်ပျမ်းမျှနေကြသည်။ ထို့နောက် Einav နှင့်လုပ်ဖော်ကိုင်ဘက်များကပိုသိမ်မွေ့ခန့်မှန်းချက်အမျိုးမျိုးကိုဖန်တီးရန်သူတို့ရဲ့အချက်အလက်များ၏ကြီးမားသောအရွယ်အစားကိုအသုံးပြုခဲ့သည်။ ဥပမာအားဖြင့်, ကွဲပြားခြားနားသောစတင်စျေးနှုန်းများအမျိုးမျိုးများအတွက်သီးခြားအကျိုးသက်ရောက်မှုကိုခန့်မှန်းအားဖြင့်သူတို့ကစျေးနှုန်းနှင့်ရောင်းချမည့်စျေးနှုန်းကိုစတင်ကြားဆက်ဆံရေး nonlinear (ပုံ 2.9) ကြောင်းတွေ့ရှိခဲ့ပါတယ်။ အထူးသဖြင့်, 0.05 နှင့် 0,85 အကြားစျေးနှုန်းများစတင်အဘို့, စတင်စျေးနှုန်းရောင်းချမှုစျေးနှုန်းလုံးဝသူတို့ရဲ့ပထမဦးဆုံးဆန်းစစ်နေဖြင့်လွဲချော်ခဲ့တဲ့တွေ့ရှိချက်အပေါ်အနည်းငယ်သာသက်ရောက်မှုရှိပါတယ်။ ထို့ပြင်မဟုတ်ဘဲပစ္စည်းများအားလုံးအပေါ်ပျမ်းမျှထက် Einav နှင့်လုပ်ဖော်ကိုင်ဘက် 23 ကွဲပြားခြားနားသောပစ္စည်းများအမျိုးအစား (ဥပမာအိမ်မွေးတိရစ္ဆာန်ထောက်ပံ့ရေးပစ္စည်းများ, လျှပ်စစ်ပစ္စည်း, နှင့်အားကစားအမှတ်တရ) (ပုံ 2.10) အတွက်စျေးနှုန်းကိုစတင်များ၏အကျိုးသက်ရောက်မှုကိုခန့်မှန်းပါတယ်။ ဤရွေ့ကားခန့်မှန်းပိုပြီးထူးခြားတဲ့ပစ္စည်းများ-ထိုကဲ့သို့သောအမှတ်တရ-စတင်စျေးနှုန်းအဖြစ်များအတွက်ရောင်းချမှု၏ဖြစ်နိုင်ခြေများနှင့်နောက်ဆုံးရောင်းချမှုစျေးနှုန်းအပေါ်ပိုကြီးတဲ့အကျိုးသက်ရောက်မှုအပေါ်တစ်ဦးသေးငယ်အကျိုးသက်ရောက်မှုရှိကြောင်းပြသနေပါသည်။ နောက်ထပ်ပို commodified ပစ္စည်းများ-ကဲ့သို့သောအဘို့အဒီဗီဒီ-စတင်စျေးနှုန်းနောက်ဆုံးစျေးနှုန်းအပေါ်နီးပါးမျှသက်ရောက်မှုရှိပါတယ်။ တနည်းအားဖြင့်ပစ္စည်း 23 ကွဲပြားခြားနားသောအမျိုးအစားကနေရလဒ်တွေကိုပေါင်းစပ်ထားတဲ့ပျမ်းမျှအားဤပစ္စည်းများကိုအကြားအရေးကြီးသောကွဲပြားခြားနားမှုဖွက်ထားပေးသည်။

2.9 ပုံ: တစ်ရောင်းချမှု၏စျေးနှုန်းနှင့်ဖြစ်နိုင်ခြေစတင်လေလံတင်အကြားဆက်ဆံရေး (က) နှင့်ရောင်းချမှုစျေးနှုန်း (ခ) ။ စတင်စျေးနှုန်းနှင့်ဖြစ်နိုင်ခြေရောင်းချပေမယ့်စတင်စျေးနှုန်းနှင့်ရောင်းချမည့်စျေးနှုန်းအကြားတစ်ဦး nonlinear ကြားဆက်ဆံရေးများအကြားတစ်ဦး linear ဆက်ဆံရေးဟာအကြမ်းဖျင်းရှိ၏ 0.05 နှင့် 0,85 အကြားစျေးနှုန်းများစတင်အဘို့, စတင်စျေးနှုန်းရောင်းချမှုစျေးနှုန်းအပေါ်အနည်းငယ်သာသက်ရောက်မှုရှိပါတယ်။ ဖြစ်ရပ်နှစ်ခုစလုံးမှာဆက်ဆံရေးကို item တန်ဖိုးအခြေခံအားဖြင့်လွတ်လပ်တဲ့ဖြစ်ကြသည်။ Einav et al ထံမှအဆင်ပြေအောင်။ (2015), 4a နှင့် 4b ကိန်းဂဏန်းများ။

2.9 ပုံ: တစ်ရောင်းချမှု၏စျေးနှုန်းနှင့်ဖြစ်နိုင်ခြေစတင်လေလံတင်အကြားဆက်ဆံရေး (က) နှင့်ရောင်းချမှုစျေးနှုန်း (ခ) ။ စတင်စျေးနှုန်းနှင့်ဖြစ်နိုင်ခြေရောင်းချပေမယ့်စတင်စျေးနှုန်းနှင့်ရောင်းချမည့်စျေးနှုန်းအကြားတစ်ဦး nonlinear ကြားဆက်ဆံရေးများအကြားတစ်ဦး linear ဆက်ဆံရေးဟာအကြမ်းဖျင်းရှိ၏ 0.05 နှင့် 0,85 အကြားစျေးနှုန်းများစတင်အဘို့, စတင်စျေးနှုန်းရောင်းချမှုစျေးနှုန်းအပေါ်အနည်းငယ်သာသက်ရောက်မှုရှိပါတယ်။ ဖြစ်ရပ်နှစ်ခုစလုံးမှာဆက်ဆံရေးကို item တန်ဖိုးအခြေခံအားဖြင့်လွတ်လပ်တဲ့ဖြစ်ကြသည်။ ကနေအဆင်ပြေအောင် Einav et al. (2015) , 4a နှင့် 4b ကိန်းဂဏန်းများ။

2,10 ပုံ: ပစ္စည်းတစ်ခုချင်းစီကိုအမျိုးအစားအနေဖြင့်ခန့်မှန်း; အဆိုပါအစိုင်အခဲအစက်အားလုံးအမျိုးအစားများအတွက်ခန့်မှန်းချက် (Einav et al ။ 2015) အတူတကွထို့နောက်ပါတီအသီးသီးမှဖြစ်ပါတယ်။ ဤရွေ့ကားခန့်မှန်းပိုပြီးထူးခြားတဲ့ပစ္စည်းများ-ထိုကဲ့သို့သောအမှတ်တရ-စတင်စျေးနှုန်းတစ်ဦးရောင်းရန်ရှိသည် (X-ဝင်ရိုး) ၏ဖြစ်နိုင်ခြေများနှင့်နောက်ဆုံးရောင်းချမှုစျေးနှုန်း (y ကိုဝင်ရိုး) ပေါ်ပိုကြီးတဲ့အကျိုးသက်ရောက်မှုအပေါ်တစ်ဦးသေးငယ်အကျိုးသက်ရောက်မှုရှိပါတယ်အဖြစ်အဘို့အကြောင်းပြသပါ။ Einav et al ထံမှအဆင်ပြေအောင်။ (2015), ပုံ 8 ။

2,10 ပုံ: ပစ္စည်းတစ်ခုချင်းစီကိုအမျိုးအစားအနေဖြင့်ခန့်မှန်း; အဆိုပါအစိုင်အခဲအစက်အားလုံးအမျိုးအစားများအတွက်ခန့်မှန်းချက်အတူတကွထို့နောက်ပါတီအသီးသီးမှဖြစ်ပါတယ် (Einav et al. 2015) ။ ဤရွေ့ကားခန့်မှန်းပိုပြီးထူးခြားတဲ့ပစ္စည်းများ-ထိုကဲ့သို့သောအမှတ်တရ-စတင်စျေးနှုန်းတစ်ဦးရောင်းရန်ရှိသည် (များ၏ဖြစ်နိုင်ခြေအပေါ်တစ်ဦးသေးငယ်အကျိုးသက်ရောက်မှုရှိပါတယ်အဖြစ်အဘို့အကြောင်းပြသ \(x\) -axis) နှင့်နောက်ဆုံးရောင်းချမှုစျေးနှုန်း (အပေါ်ပိုကြီးတဲ့အကျိုးသက်ရောက်မှု \(y\) -axis) ။ ကနေအဆင်ပြေအောင် Einav et al. (2015) , ပုံ 8 ။

သငျသညျ ebay မှာလေလံအတွက်အထူးစိတ်ဝင်စားနေကြသည်မဟုတ်ရင်တောင်သင်က 2.9 တွက်ဆသောလမ်းအရမ်းလေးစားမိပါတယ်နှင့် 2,10 ကမ်းလှမ်းမှုတစ်ခု linear ဆက်ဆံရေးမျိုးကိုဖော်ပြရန်နှင့်ပစ္စည်းအများအပြားကွဲပြားခြားနားသောအမျိုးအစားများပေါင်းစပ်ရိုးရှင်းတဲ့ခန့်မှန်းချက်ထက်ကို eBay ၏ချမ်းသာနားလည်မှုတွက်ဆရန်ရှိသည်။ ဒါဟာလယ်ပြင်စမ်းသပ်ချက်ဤပိုပြီးသိမ်မွေ့ခန့်မှန်းချက်ထုတ်လုပ်ဖို့သိပ္ပံနည်းကျဖြစ်နိုင်သမျှပါလိမ့်မယ်ပေမယ့်နောက်ထပ်, ကုန်ကျစရိတ်ထိုကဲ့သို့သောစမ်းသပ်ချက်မရှိမဖြစ်လိုအပ်တဲ့မဖြစ်နိုင်အောင်လိမ့်မယ်။

သဘာဝကစမ်းသပ်ချက်ကဲ့သို့ပင်တစ်ထပ်တည်းဖြစ်သောမကောင်းတဲ့ခန့်မှန်းဖို့ဦးဆောင်လမ်းပြနိုင်သောနည်းလမ်းများ၏နံပါတ်ရှိပါသည်။ ငါတိုက်ဆိုင်သည့်ခန့်မှန်းချက်နှင့်အတူအကြီးမားဆုံးစိုးရိမ်ပူပန်သူတို့တိုက်ဆိုင်သည့်အတွက်အသုံးမခံခဲ့ရသောအရာအားဖြင့် biased ခံရနိုငျသောကွောငျ့ဖွစျသညျထင်ပါတယ်။ ဥပမာအားဖြင့်, သူတို့ရဲ့အဓိကရလာဒ်များအတွက်, Einav နှင့်လုပ်ဖော်ကိုင်ဖက်များကအတိအကျလေးဝိသေသလက္ခဏာများပေါ်ကိုက်ညီခဲ့ပါ: ရောင်းချသူ ID ကိုနံပါတ်, ကို item အမျိုးအစား, ကို item ခေါင်းစဉ်နှင့်စာတန်းထိုး။ အချက်တွေကိုတိုက်ဆိုင်သည့်အတွက်အသုံးပြုကြသည်မဟုတ်ကြောင်းနည်းလမ်းတွေထဲမှာမတူညီတဲ့ဖြစ်လျှင်, သို့ဖြစ်လျှင်ဤအနေနဲ့မမျှတနှိုင်းယှဉ်ဖန်တီးနိုင်ဘူး။ "budgetgolfer" (ဂေါက်သီးကလပ်လျော့နည်းလူကြိုက်များသည့်အခါ) ဆောင်းရာသီအတွက် Taylormade Burner 09 ယာဉ်မောင်းများအတွက်စျေးနှုန်းများလျှော့ချပါလျှင်တကယ်တော့ဒီတစ်ခုရှေးဟောင်းပစ္စည်းပါလိမ့်မယ်တဲ့အခါမှာဥပမာအားဖြင့်, ထို့နောက်ကအောက်ပိုင်းစတင်စျေးနှုန်းများနောက်ဆုံးစျေးနှုန်းများကိုလျှော့ချဖို့ဦးဆောင်လမ်းပြကြောင်းပေါ်လာနိုင် ဝယ်လိုအားအတွက်ရာသီအလိုက်မူကွဲ။ ဒီစိုးရိမ်ပူပန်မှုဖြေရှင်းမှတဦးတည်းချဉ်းကပ်မှုတိုက်ဆိုင်သည့်များစွာသောအမျိုးမျိုးကြိုးစားနေသည်။ ကိုက်ညီအတှကျအသုံးပွုသညျ့အခြိနျပြတင်းပေါက်ကွဲပြားနေချိန်တွင်ဥပမာအားဖြင့်, Einav နှင့်လုပ်ဖော်ကိုင်ဘက်များကသူတို့ဆန်းစစ်ထပ်ခါတလဲလဲ (လိုက်ဖက်အစုံတစ်လအတွင်းတစ်နှစ်အတွင်းရောင်းချအပေါ်ပစ္စည်းများ, ပါဝင်သည်နှင့်ခေတ်တစ်ခေတ်) ။ ကံကောင်းထောက်မစွာ, ထိုလူအပေါင်းတို့သည်အချိန်ပြတင်းပေါက်များအတွက်အလားတူရလာဒ်များတွေ့ရှိခဲ့ပါတယ်။ ကိုက်ညီခြင်းနှင့်အတူတစ်ဦးကထပ်မံစိုးရိမ်ပူပန်မှုအနက်ထဲကနေပေါ်ပေါက်။ သာလိုက်ဖက်ဒေတာလျှောက်ထားကိုက်ညီခြင်းမှခန့်မှန်းချက်; သူတို့လိုက်ဖက်မရနိုင်တော့သောအမှုများကိုလျှောက်ထားကြပါဘူး။ ဥပမာအားဖြင့်, မျိုးစုံစာရင်းများခဲ့ပစ္စည်းများကို၎င်းတို့၏သုတေသနပြုမှုကန့်သတ်အသုံးပြုပုံ Einav နှင့်လုပ်ဖော်ကိုင်ဖက်များကပရော်ဖက်ရှင်နယ်နှင့် Semi-ပရော်ဖက်ရှင်နယ်ရောင်းသူအာရုံစိုက်နေကြသည်။ ဤအနှိုင်းယှဉ်ပြန်ဆိုသောအခါထိုသို့ကျနော်တို့ကိုသူတို့သာကို eBay ၏ဤအပိုင်းတစ်ပိုင်းကိုသာလျှင်လျှောက်ထားကြောင်းကို၎င်းအောက်မေ့ရမည်ဖြစ်သည်။

ကိုက်ညီခြင်း Non-စမ်းသပ်ဒေတာအတွက်တရားမျှတနှိုင်းယှဉ်ရှာဖွေတာများအတွက်အစွမ်းထက်မဟာဗျူဟာဖြစ်ပါတယ်။ များစွာသောလူမှုရေးသိပ္ပံပညာရှင်များစေရန်, တိုက်ဆိုင်သည့်စမ်းသပ်ချက်မှဒုတိယအကောင်းဆုံးခံစားရပေမယ့်အနည်းငယ်, ပြန်လည်ပြင်ဆင်နိုင်မယ့်ယုံကြည်ချက်ဖြစ်ပါတယ်။ (1) သက်ရောက်မှုများအတွက်ပင်သောင်းပြောင်းထွေလာရောနှောအရေးကြီးပါတယ်နှင့် (2) ကိုက်ညီခြင်းအဘို့အလိုအရေးကြီးတဲ့ variable တွေကိုတိုင်းတာခဲ့ကြသည့်အခါအကြီးအကျယ်ဒေတာအတွက်ကိုက်ညီသောလယ်စမ်းသပ်ချက်၏သေးငယ်တဲ့အရေအတွက်ကထက်ပိုကောင်းပါလိမ့်မယ်။ စားပွဲတင် 2.4 တိုက်ဆိုင်သည့်ကြီးမားသောဒေတာသတင်းရင်းမြစ်နှင့်အတူသုံးနိုငျဘယ်လိုအချို့နဲ့အခြားဥပမာပေးပါသည်။

စားပွဲတင် 2.4: အသုံးပြုမှု Big Data သတင်းရပ်ကွက်များနှင့်အတူကိုက်ညီမှုရှိသည့်ကြောင့်လေ့လာရေးဥပမာများ
ထိရောက်သောအာရုံ Big ဒေတာအရင်းအမြစ် အညွှန်း
ရဲတပ်ဖွဲ့သည်အကြမ်းဖက်မှုအပေါ်ပစ်ခတ်မှု၏အကျိုးသက်ရောက်မှု frisk ရပ်တန့်-and မှတ်တမ်းများ Legewie (2016)
မိသားစုများနှင့်အိမ်နီးချင်းများအပေါ်စက်တင်ဘာလ 11, 2001 အကျိုးသက်ရောက်မှု မဲပေးမှတ်တမ်းများနှင့်လှူဒါန်းမှုမှတ်တမ်းများ Hersh (2013)
လူမှုဘယ်လိုကူးစက် ဆက်သွယ်ရေးနှင့်ထုတ်ကုန်မွေးစားဒေတာ Aral, Muchnik, and Sundararajan (2009)

နိဂုံးချုပ်မှာတော့ Non-စမ်းသပ်ဒေတာကနေကြောင်းကျိုးဆက်စပ်ဆိုးကျိုးများခန့်မှန်းခက်ခဲသည်, ဒါပေမယ့်ထိုကဲ့သို့သောသဘာဝအစမ်းသပ်ချက်များနှင့်စာရင်းအင်းချိန်ညှိ (ဥပမာကိုက်ညီခြင်း) အဖြစ်ချဉ်းကပ်သုံးနိုင်တယ်။ အချို့သောအခြေအနေများတွင်ဤချဉ်းကပ်မှုဆိုးဆိုးရွားရွားမှားယွင်းတဲ့သွားနိုင်ပါတယ်, ဒါပေမယ့်ဂရုတစိုက်ချထားသည့်အခါဤချဉ်းကပ်မှုငါနောက်ထပ်မျြးအခနျးကွီး 4. အတွက်ကိုဖော်ပြရန်သောစမ်းသပ်ချဉ်းကပ်ဖို့အသုံးဝင်အဖြည့်နိုင်ပါတယ်, ဤနှစ်ခုချဉ်းကပ် always- ၏တိုးတက်မှုကနေအကျိုးခံစားရဖို့အထူးသဖြင့်ဖွယ်ရှိပုံပေါ် ကြီးမားတဲ့ data တွေကိုစနစ်များ, ပေါ်မှာ။