2.5 နိဂုံး

Big ဒေတာသတင်းရင်းမြစ်နေရာတိုင်းသော်လည်း, လူမှုရေးသုတေသနအဘို့ထိုသူတို့သုံးပြီးလှည်နိုင်ပါတယ်။ ကြှနျတေျာ့အတှေ့အကွုံခုနှစ်, a "ကိုအဘယ်သူမျှမအခမဲ့နေ့လည်စာ" စည်းမျဉ်းများကဲ့သို့တစ်စုံတစ်ခုဒေတာအတွက်လည်းမရှိ: သင်ကစုဆောင်းအလုပ်တွေအများကြီးအတွက်ထားကြဘူးလျှင်, သင်ဖြစ်နိုင်ပါကစဉ်းစားအလုပ်တွေအများကြီးအတွက်ထားရန်ရှိသည်သွားကြသည်နှင့် ဒါဟာခွဲခြားစိတ်ဖြာ။

ယနေ့-နှင့်ဖွယ်ရှိ၏ကြီးမားသောဒေတာသတင်းရင်းမြစ်မနက်ဖြန်-ပါလိမ့်မယ် 10 ဝိသေသလက္ခဏာများရှိသည်ဖို့လေ့ရှိပါတယ်။ ဤအရာသုံးခုကိုယေဘုယျအားဖြင့်များမှာ (သို့သော်အစဉ်အမြဲမဟုတ်) သုတေသနအတွက်အထောက်အကူဖြစ်စေ: ကြီးမားသောအစဉ်အမြဲ-on နှင့် nonreactive ။ ခုနစျပါးသုတေသနအတွက်ပြဿနာ (အမြဲမဟုတ်ပေမယ့်) ယေဘုယျအားဖြင့်ဖြစ်ကြသည်: မပြည့်စုံလက်လှမ်းမမှီ, nonrepresentative, မျော, Algorithm ကိုရှက်ကြောက်, ညစ်ပတ်ခြင်း, အထိခိုက်မခံ။ ကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်လူမှုရေးသုတေသန၏ရည်ရွယ်ချက်ဖန်တီးမကြောင့်ဤလက္ခဏာများထဲကအတော်များများနောက်ဆုံးမှာပေါ်ထွန်း။

ဤအခနျးထဲမှာအတွေးအခေါ်များအပေါ်အခြေခံပြီး, ငါကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်လူမှုရေးသုတေသနအတွက်တန်ဖိုးအရှိဆုံးဖြစ်လိမ့်မည်ဟုသုံးအဓိကနည်းလမ်းရှိပါတယ်ထင်ပါတယ်။ ပထမဦးဆုံးသူတို့ယှဉ်ပြိုင်သီအိုရီဟောကိန်းများအကြားဆုံးဖြတ်သုတေသီများကို enable နိုင်ပါတယ်။ အလုပ်၏ဤမျိုး၏ဥပမာများပါဝင်သည် Farber (2015) (နယူးယောက်တက္ကစီယာဉ်မောင်း) နှင့် King, Pan, and Roberts (2013) (တရုတ်အတွက်ဆင်ဆာ) ။ ဒုတိယအချက်အကြီးတွေဒေတာသတင်းရင်းမြစ် nowcasting မှတဆင့်ရေးမူဝါဒများအတွက်ပိုမိုကောင်းမွန်သောတိုင်းတာခြင်းကို enable နိုင်ပါတယ်။ အလုပ်၏ဤကြင်နာတခုရဲ့ဥပမာတစ်ခုဖြစ်သည် Ginsberg et al. (2009) (ဂူးဂဲလ်တုပ်ကွေး Trends) ။ နောက်ဆုံးအနေနဲ့ကြီးတွေဒေတာသတင်းရင်းမြစ်သုတေသီများစမ်းသပ်ချက်အပြေးခြင်းမရှိဘဲကြောင်းကျိုးဆက်စပ်ခန့်မှန်းစေပါကူညီပေးနိုင်ပါသည်။ အလုပ်၏ဤမျိုး၏ဥပမာများဖြစ်ကြသည် Mas and Moretti (2009) (productivity အပေါ်သက်တူရွယ်တူအကျိုးသက်ရောက်မှုများ) နှင့် Einav et al. (2015) (ကို eBay မှာလေလံအပေါ်စျေးနှုန်းစတင်အကျိုးသက်ရောက်) ။ ထိုအချဉ်းကပ်မှု၏အသီးအသီးသို့သျောလညျး, ထိုကဲ့သို့သောယှဉ်ပြိုင်ဟောကိန်းများစေသို့မဟုတ်နှစ်ခုသီအိုရီခန့်မှန်းရန်အရေးကြီးပါသည်သောအရေအတွက်၏အဓိပ္ပါယ်သည်အတိုင်း, ဒေတာမှအများကြီးရောက်စေဖို့သုတေသီများလိုအပ်လေ့ရှိတယ်။ ထို့ကြောင့်ကျွန်မကြီးတွေဒေတာသတင်းရပ်ကွက်အဘယ်သို့ပြုနိုင်သည်ကိုစဉ်းစားဖို့အကောင်းဆုံးလမ်းကိုသူတို့စိတ်ဝင်စားဖို့နှင့်အရေးကြီးသောမေးခွန်းများမေးနိုင်သူသုတေသီများကိုကူညီနိုငျသောကွောငျ့ဖွစျသညျထင်ပါတယ်။

နိဂုံးချုပ်မီ, ငါကကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်အချက်အလက်များနှင့်သီအိုရီအကြားဆက်ဆံရေးအပေါ်အရေးပါသောအကျိုးသက်ရောက်မှုရှိစေခြင်းငှါထည့်သွင်းစဉ်းစားရကျိုးနပ်သည်ဟုမထင်။ ဒါကြောင့်ယခုအချိန်အထိဤအခနျးသီအိုရီ-မောင်းနှင်ပင်ကိုယ်မူလသုတေသန၏ချဉ်းကပ်မှုခေါ်ဆောင်သွားခဲ့သည်။ သို့သော်ကြီးမားသောဒေတာသတင်းရင်းမြစ်လည်းမျက်မြင်လက်တွေ့မောင်းနှင် theorizing လုပ်ဖို့သုတေသီများကို enable ။ ဒါကလက်တွေ့ဖြစ်ရပ်မှန်များ, ပုံစံများနှင့်ပဟေဠိများသတိထားစုဆောင်းခြင်းအားဖြင့်သုတေသီများအသစ်ကသီအိုရီကိုတည်ဆောက်နိုင်, ဖြစ်ပါတယ်။ ဤသည်ကအခြားရွေးချယ်စရာ, သီအိုရီမှဒေတာများ-ပထမဦးဆုံးချဉ်းကပ်မှုအသစ်ကမရှိ, အလွန်အခိုငျအမာလို, Barneys လို Glaser နှင့် Anselm Strauss အားဖြင့်တင်ခဲ့သည်ခဲ့သည် (1967) grounded သီအိုရီအဘို့မိမိတို့ခေါ်ဆိုခအတူ။ ဒီ data-ပထမဦးဆုံးချဉ်းကပ်မှုဒီဂျစ်တယ်ခေတ်အတွက်သုတေသနပတ်လည်သတင်းစာပညာအချို့အတွက်အခိုင်အမာထားပြီးအဖြစ်သို့သော် "သီအိုရီ၏အဆုံး" ဆိုလိုပါဘူး (Anderson 2008) ။ ယင်းအစားဒေတာပတ်ဝန်းကျင်ပြောင်းလဲမှုများကိုအဖြစ်ကျနော်တို့အချက်အလက်များနှင့်သီအိုရီအကြားဆက်ဆံရေးအတွက်တစ်ဦး rebalancing မျှော်လင့်ထားသင့်ပါတယ်။ ဒေတာစုဆောင်းခြင်းစျေးကြီးရှိရာကမ္ဘာမှာတော့ကသီအိုရီကိုအများဆုံးအသုံးဝင်ပါလိမ့်မည်အကြံပြုသာဒေတာစုဆောင်းရန်အသိဖန်ဆင်းတော်မူ၏။ ဒါပေမယ့်အချက်အလက်များ၏ကြီးမားသောပမာဏပြီးသားအခမဲ့ရရှိနိုင်ပါရှိရာတစ်ကမ်ဘာပျေါတှငျကြောင့်လည်းဒေတာ-ပထမဦးဆုံးချဉ်းကပ်ကြိုးစားရန်သဘာဝကျပါတယ် (Goldberg 2015)

ငါသညျဤအခနျးမှာပြသကြသည့်အတိုင်း, သုတေသီများကလူကိုကြည့်ခြင်းဖြင့်အများကြီးသင်ယူနိုင်ပါတယ်။ လာမယ့်သုံးအခန်းကြီးမှာတော့ငါကြှနျုပျတို့ဒေတာစုဆောင်းခြင်းလိုက်လျောညီထွေဖြစ်အောင်လျှင်ပိုပြီးနှင့်ကွဲပြားခြားနားသောအရာတို့ကိုသင်ယူ, သူတို့ကိုမေးခွန်းများကို (အခန်း 3) တောင်းဆိုနေတာစမ်းသပ်ချက် (အခန်း 4) အပြေးနှင့်ပင်သူတို့ကိုနှငျ့ပတျသကျသောအားဖြင့်ပိုပြီးတိုက်ရိုက်လူတို့နှင့်အတူဆက်ဆံနိုင်ပုံကိုဖော်ပြရန်လိမ့်မယ် တိုက်ရိုက်သုတေသနလုပ်ငန်းစဉ်သည် (အခန်း 5) ၌တည်၏။