2.2 နဲ့ Big ဒေတာ

Big data တွေကိုသုတေသနပြုထက်အခြားရည်ရွယ်ချက်များအတွက်ကုမ္ပဏီများနှင့်အစိုးရများအသုံးပြုနေသူများကဖန်တီးနှင့်စုဆောင်းနေကြသည်။ သုတေသနအဘို့ဤဒေတာကိုအသုံးပြုခြင်း, ဒါကြောင့်, repurposing လိုအပ်သည်။

များစွာသောလူဒီဂျစ်တယ်ခေတ်များတွင်လူမှုရေးသုတေသနကြုံတွေ့ရသောပထမဦးဆုံးလမ်းကိုမကြာခဏကြီးတွေဒေတာကိုခေါ်တာဖြစ်ပါတယ်သောအရာကိုတဆင့်ဖြစ်ပါတယ်။ ဒီအသုံးအနှုန်း၏ကျယ်ပြန့်သုံးစွဲခြင်းနေသော်လည်းကြီးတွေဒေတာတောင်မှသည်အဘယ်အရာအကြောင်းကိုအဘယ်သူမျှမများသဘောတူညီမှုလည်းမရှိ။ သို့သော်ကြီးမားသောအချက်အလက်များ၏အသုံးအများဆုံးအဓိပ္ပာယ်တပါးသည် "3 Vs" ပေါ်တွင်အလေးပေး: Volume ကို, အရောင်းသွက်နှင့်နှုန်း။ အကြမ်းအားဖြင့်, ဒေတာတွေအများကြီးကို formats အမျိုးမျိုးနဲ့အတွက်လည်းမရှိ, ထိုသို့အဆက်မပြတ်ဖန်တီးလျက်ရှိသည်။ အချို့ဝေဖန်သူများကဤကဲ့သို့သောဝိုးတဝါးနှင့် Vacuous အဖြစ် Vs add သော်လည်းကြီးမားသောအချက်အလက်များ၏တချို့ကပရိသတ်တွေလည်းထိုကဲ့သို့သော Veracity နှင့် Value တစ်ခုကဲ့သို့အခြား "Vs" ထည့်ပါ။ အဘယ်သူသည်အဘယျသို့အဘယ်မှာရှိသည့်အခါ: အဲဒီအစား 3 "Vs" (သို့မဟုတ် 5 "Vs" ဒါမှမဟုတ် 7 "Vs") ထက်, လူမှုရေးသုတေသန၏ရည်ရွယ်ချက်, ငါသည်စတင်ရန်ပိုကောင်းတဲ့နေရာ 5 "WS" ဖြစ်ပါတယ်ထင် နှင့်အဘယ်ကြောင့်။ တကယ်တော့ကျွန်မကြီးကြီးဒေတာသတင်းရင်းမြစ်ရုံတစျခု "W" မှကိုလိုက်နာခြင်းအားဖြင့်စိန်ခေါ်မှုများနှင့်အခွင့်အလမ်းများအများအပြားဖန်တီးထင်: အဘယ်ကြောင့်။

အဆိုပါ Analog စအရွယ်များတွင်လူမှုရေးသုတေသနအတွက်အသုံးပြုခဲ့ကြသည်သောအချက်အလက်များ၏အများစုကိုသုတေသနလုပ်နေတာ၏ရည်ရွယ်ချက်ဖန်တီးခဲ့ပါတယ်။ ဒီဂျစ်တယ်ခေတ်မှာတော့သို့သော်အချက်အလက်များ၏ကြီးမားတဲ့ငွေပမာဏထိုကဲ့သို့သော, ဝန်ဆောင်မှုများပေးအမြတ်ထုတ်လုပ်နှင့်ဥပဒေများကိုစီမံခန့်ခွဲအဖြစ်, သုတေသနထက်အခြားရည်ရွယ်ချက်များအတွက်ကုမ္ပဏီများနှင့်အစိုးရများအသုံးပြုနေသူများကဖန်တီးလျက်ရှိသည်။ ကို Creative ကလူ, သို့သော်, သငျသညျသုတေသနအဘို့ဤကော်ပိုရေးရှင်းနှင့်အစိုးရဒေတာ repurpose နိုင်သည်ကိုသဘောပေါက်ပါပြီ။ Duchamp အနုပညာကိုဖန်တီးရန်တစ်ဦးကိုတွေ့အရာဝတ္ထု repurposed နည်းတူ, အခနျး 1 မှာပြန်လည်အနုပညာတစ်ခုနဲ့နှိုင်းယှဉ်ဖို့စဉ်းစား, သိပ္ပံပညာရှင်များယခုသုတေသနကိုဖန်တီးရန်ရှာတွေ့သည့်ဒေတာ repurpose နိုင်ပါတယ်။

repurposing အဘို့အခြောကြီးမားသောအခွင့်အလမ်းများရှိပါတယ်နေစဉ်, သုတေသန၏ရည်ရွယ်ချက်များအတွက်ဖန်တီးမပေးခဲ့သည့်ဒေတာကို အသုံးပြု. လည်းအသစ်သောစိန်ခေါ်မှုများတွေ့ရမယ်။ ထိုကဲ့သို့သောအထွေထွေလူမှုစစ်တမ်းအဖြစ်ရိုးရာအများပြည်သူထင်မြင်ချက်စစ်တမ်းနှင့်တကွ, ဥပမာ, ထိုကဲ့သို့သောတွစ်တာကဲ့သို့သောလူမှုမီဒီယာဝန်ဆောင်မှု, နှိုင်းယှဉ်ကြည့်ပါ။ Twitter ရဲ့အဓိကပန်းတိုင်များက၎င်း၏အသုံးပြုသူများဝန်ဆောင်မှုပေးဖို့နဲ့အမြတ်စေရန်ဖြစ်ပါသည်။ အထွေထွေလူမှုစစ်တမ်း, အခြားတစ်ဖက်တွင်, အထူးသဖြင့်အများပြည်သူထင်မြင်ချက်ကိုသုတေသနပြုဘို့, လူမှုရေးသုတေသနများအတွက်ယေဘုယျ-ရည်ရွယ်ချက်ဒေတာအတွက်အာရုံစူးစိုက်သည်။ ရည်မှန်းချက်ပန်းတိုင်၌ဤခြားနားချက်အထွေထွေလူမှုစစ်တမ်းအသုံးပြုနေသူများကဖန်တီးအဆိုပါတွစ်တာအသုံးပြုနေသူများကဖန်တီးအချက်အလက်များနှင့်ကြောင်းနှစ်ဦးစလုံးလူထုအမြင်လေ့လာနေဘို့သုံးနိုင်တယ်သော်လည်းကွဲပြားခြားနားသောဂုဏ်သတ္တိများရှိသည်သောဆိုလိုသည်။ တွစ်တာအထွေထွေလူမှုစစ်တမ်းမကိုက်ညီနိုင်မယ့်အတိုင်းအတာနှင့်မြန်နှုန်းမှာလည်ပတ်ပေမယ့်, အထွေထွေလူမှုစစ်တမ်းမတူပဲ, Twitter ကိုမပေးဂရုတစိုက်နမူနာအသုံးပြုသူများအမနှင့်အချိန်ကျော်နှိုင်းယှဉ်ထိန်းသိမ်းရန်ခက်ခဲအလုပ်မလုပ်ပါဘူး။ အဲဒီနှစျခုဒေတာသတင်းရင်းမြစ်ဒါကွဲပြားခြားနားသောကြောင့်, ကအထွေထွေလူမှုစစ်တမ်း Twitter သို့မဟုတ်အပြန်အလှန်ထက် သာ. ကောင်း၏ဟုအဓိပ္ပာယ်လုပ်မထားဘူး။ သငျသညျကမ္ဘာလုံးဆိုင်ရာခံစားချက် (ဥပမာ၏အလုပ်ချိန်နာရီအစီအမံချင်လျှင် Golder and Macy (2011) ), Twitter ကိုအကောင်းဆုံးဖြစ်ပါတယ်။ သငျသညျအမေရိကန်ပြည်ထောင်စု၌သဘောထားတွေ၏ polarization ကိုအတွက်ရေရှည်အပြောင်းအလဲများကို (ဥပမာ, ကိုနားလည်သဘောပေါက်ရန်လိုလျှင်အခြားတစ်ဖက်တွင်, DiMaggio, Evans, and Bryson (1996) ), ထို့နောက်အထွေထွေလူမှုစစ်တမ်းကိုအကောင်းဆုံးရွေးချယ်မှုဖြစ်ပါတယ်။ ပိုများသောယေဘုယျအားဖြင့်, အစားကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်ပိုကောင်းသို့မဟုတ်ပိုဆိုးအချက်အလက်များ၏အခြားသောအမျိုးအစားထက်ဖြစ်ကြောင်းငြင်းခုန်ဖို့ကြိုးစားနေခြင်းထက်, ဒီအခန်းမှာသုတေသနမေးခွန်းမျိုးကြီးတွေဒေတာသတင်းရင်းမြစ်ဆွဲဆောင်မှုဂုဏ်သတ္တိများရှိသည်နှင့်မေးခွန်းတွေအရာမျိုးကိုသူတို့မဖြစ်စေခြင်းငှါ, အရာအဘို့ရှင်းလင်းဖို့ကြိုးစားပါလိမ့်မယ် စံပြ။

ကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ်စဉ်းစားလိုက်တဲ့အခါ, များစွာသောသုတေသီများချက်ချင်းထိုကဲ့သို့သောရှာဖွေရေးအင်ဂျင်မှတ်တမ်းများနှင့်လူမှုရေးမီဒီယာ၏ရေးသားချက်များအဖြစ်ကုမ္ပဏီများ, အသုံးပြုနေသူများကဖန်တီးနှင့်စုဆောင်းအွန်လိုင်းဒေတာအာရုံစိုက်ပါ။ သို့သော်ဤကျဉ်းမြောင်းသောအာရုံကြီးတွေအချက်အလက်များ၏နှစ်ခုအခြားအရေးကြီးသတင်းရင်းမြစ်ထွက်အရွက်။ ပထမဦးစွာ ပို. ပို. ကော်ပိုရိတ်ကြီးတွေဒေတာသတင်းရင်းမြစ်ရုပ်ပိုင်းဆိုင်ရာကမ်ဘာပျေါတှငျဒစ်ဂျစ်တယ်ပစ္စည်းတွေမှလာကြ၏။ ဥပမာအားဖြင့်, ဤအခနျးတှငျ, ငါလုပ်သားရဲ့ကုန်ထုတ်စွမ်းအားသူမ၏ရွယ်တူများ၏ကုန်ထုတ်လုပ်မှုအားဖြင့်ထိခိုက်ဘယ်လိုလေ့လာဖို့စူပါမားကတ်စစ်ဆေးမှုများထွက် data တွေကို repurposed ကြောင်းလေ့လာမှုတစ်ခုအကြောင်းကိုပြောပြလိမ့်မယ် (Mas and Moretti 2009) ။ ထို့နောက်အကြာတွင်အခန်းကြီး၌ငါမိုဘိုင်းဖုန်းများအနေဖြင့်ဖုန်းခေါ်ဆိုမှုမှတ်တမ်းများကိုအသုံးပြုတဲ့သူသုတေသီများအကြောင်းကိုသင်ပြောပြလိမ့်မယ် (Blumenstock, Cadamuro, and On 2015) နှင့်လျှပ်စစ် utilities အသုံးပြုနေသူများကဖန်တီးငွေတောင်းခံဒေတာ (Allcott 2015) ။ ဤဥပမာသရုပျဖျောအဖြစ်, ကော်ပိုရိတ်ကြီးတွေဒေတာသတင်းရင်းမြစ်ရုံအွန်လိုင်းအပြုအမူထက်ပိုအကြောင်းကိုဖြစ်ကြသည်။

အွန်လိုင်းအပြုအမူအပေါ်တစ်ဦးကျဉ်းမြောင်းတဲ့အာရုံအားဖြင့်လွဲချော်ကြီးမားသောအချက်အလက်များ၏ဒုတိယအရေးကြီးသောအရင်းအမြစ်အစိုးရများအသုံးပြုနေသူများကဖန်တီးဒေတာဖြစ်ပါတယ်။ သုတေသီများအစိုးရအုပ်ချုပ်ရေးမှတ်တမ်းများကိုခေါ်တော်မူသောဤသူတို့သအစိုးရကဒေတာ, ထိုကဲ့သို့သောအခွန်မှတ်တမ်းများအဖြစ်အမှုအရာ, ကျောင်းမှတ်တမ်းများနှင့်အရေးပါသောအစာရင်းဇယားမှတ်တမ်းများ (ကလေးမွေးဖွားနှင့်သေဆုံးမှု၏ဥပမာမှတ်ပုံတင်) တို့ပါဝင်သည်။ အစိုးရများ, အချို့ကိစ္စများတွင်နှစ်ပေါင်းရာပေါင်းများစွာကဒေဤမျိုးကိုပါပြီ, လူမှုရေးသိပ္ပံပညာရှင်များနီးပါးနေသမျှကာလပတ်လုံးလူမှုရေးသိပ္ပံပညာရှင်တွေရှိခဲ့သကဲ့သို့အဘို့ထိုသူတို့အမြတ်ထုတ်ခဲ့ကြသည်။ အဘယျသို့ပြောင်းလဲသွားပြီ, သို့သော်, ကသိသိသာသာပိုမိုလွယ်ကူအစိုးရများ, စုဆောင်း transmit, စတိုးဆိုင်, နှင့်အချက်အလက်ခွဲခြမ်းစိတ်ဖြာရန်အဘို့အဖန်ဆင်းတော်မူပြီဖြစ်သော Digital ဖြစ်ပါတယ်။ ဥပမာအားဖြင့်, ဤအခနျးတှငျ, ငါသည်အလုပ်သမားဘောဂဗေဒအတွက်အခြေခံဆွေးနွေးငြင်းခုံဖြေရှင်းနိုင်ရန်အတွက်နယူးယောက်မြို့အစိုးရရဲ့ဒစ်ဂျစ်တယ်တက္ကစီမီတာကနေဒေတာတွေကို repurposed ကြောင်းလေ့လာမှုတစ်ခုအကြောင်းကိုပြောပြလိမ့်မယ် (Farber 2015) ။ ထို့နောက်အကြာတွင်အခန်းကြီး၌ငါအစိုးရ-ကောက်ယူမဲပေးမှတ်တမ်းများစစ်တမ်းတစ်ခုအတွက်အသုံးပြုခဲ့ကြသည်ဘယ်လိုသင်ပြောပြလိမ့်မယ် (Ansolabehere and Hersh 2012) နှင့်စမ်းသပ်မှုတစ်ခု (Bond et al. 2012)

ငါ repurposing ၏စိတ်ကူးကြီးတွေဒေတာရင်းမြစ်များမှသင်ယူဖို့အခြေခံကျသည်ထင်နှင့်ဒါကြီးတွေဒေတာသတင်းရင်းမြစ် (အပိုင်း 2.3) ၏ဂုဏ်သတ္တိများနှင့်မည်သို့သောဤသုတေသန (အပိုင်း 2.4) တွင်သုံးနိုငျအကြောင်းပိုမိုတိတိကျကျပြောနေတာမှီ, ငါချင်ပါတယ် repurposing အကြောင်းကိုယေဘုယျအကြံဥာဏ်နှစ်ခုအပိုငျးပိုငျးပူဇော်ရန်။ ပထမဦးစွာငါ "ကိုတွေ့ရှိခဲ့" ဒေတာနှင့် "ဒီဇိုင်း" ဒေတာများအကြားဖြစ်ခြင်းအဖြစ်ထူထောင်င့်သောဆနျ့ကငျြဘစဉ်းစားရန်သွေးဆောင်နိုင်ပါသည်။ ဒါကအနီးကပ်ရဲ့, ဒါပေမယ့်ဒါဟာအတော်လေးညာဘက်မဟုတ်ပါဘူး။ သုတေသီများရဲ့ရှုထောင့်ကနေကြီးမားတဲ့ data တွေကိုသတင်းရင်းမြစ် "တွေ့" နေကြသည်တောင်မှသျောသူတို့ပဲကောင်းကင်မှကျကြပါဘူး။ အဲဒီအစား, သုတေသီများက "တွေ့ရှိခဲ့" ဖြစ်ကြောင်းဒေတာသတင်းရပ်ကွက်အချို့ရည်ရွယ်ချက်တစ်စုံတစ်ဦးကဒီဇိုင်းနေကြသည်။ "တွေ့ရှိရ" ဒေတာတစ်စုံတစ်ဦးကဒီဇိုင်းကြသည် ဖြစ်. ငါသည်သင့်ကိုအစဉ်သင့်ရဲ့ဒေတာကိုဖန်ဆင်းသောလူများနှင့်လုပ်ငန်းစဉ်များနှင့်ပတ်သက်ပြီးတတ်နိုင်သမျှနားလည်ရန်ကြိုးစားသောအကြံပြုပါသည်။ သငျသညျဒေတာ repurposing အခါဒုတိယ,, ကမကြာခဏသင့်ရဲ့ပြဿနာများအတွက်စံပြ Datasets စိတ်ကူးပြီးတော့သင်အသုံးပြုနေသောသောတဦးတည်းနဲ့စံပြ Datasets နှိုင်းယှဉ်ဖို့အလွန်အသုံးဝင်သည်။ သင်ကိုယ်တိုင်သင့်ရဲ့ဒေတာစုဆောင်းမပြုခဲ့ပါလျှင်, သင်သည်အဘယ်သို့ချင်တယ်နှင့်အဘယ်သို့ဆိုင်သင်ရှိသည်များအကြားအရေးကြီးသောကွဲပြားမှုဖြစ်ဖွယ်ရှိရှိပါတယ်။ ထိုကွဲပြားမှုကိုသတိပွုမိသင်နှင့်သင်ရှိသည်ဒေတာကနေလေ့လာသင်ယူလို့မရဘူးနိုင်ပြီး, သင်စုဆောင်းသင့်သည်ဟုအချက်အလက်အသစ်ကိုအကြံပြုစေခြင်းငှါ, အဘယျသို့ရှင်းလင်းကူညီပေးပါမည်။

ကြှနျတေျာ့အတှေ့အကွုံခုနှစ်တွင်, လူမှုရေးသိပ္ပံပညာရှင်များနှင့်ဒေတာများသိပ္ပံပညာရှင်များအလွန်ကွဲပြားခြားနား repurposing ချဉ်းကပ်လေ့ရှိပါတယ်။ ယင်း၏အားသာချက်လျစ်လျူရှုနေစဉ်အတွင်းသုတေသနအတွက်ဒီဇိုင်းရေးဆွဲဒေတာတွေနဲ့အလုပ်လုပ်ကိုင်ဖို့နေသားတကျနေသောလူမှုရေးသိပ္ပံပညာရှင်များ, ပုံမှန်အား repurposed ဒေတာနှင့်အတူပြဿနာများကိုထောက်ပြဖို့အမြန်ဖြစ်ကြသည်။ အခြားတစ်ဖက်တွင်, ဒေတာသိပ္ပံပညာရှင်များပုံမှန်အား၎င်း၏အားနည်းချက်များကိုလျစ်လျူရှုစဉ် repurposed အချက်အလက်များ၏အကျိုးကျေးဇူးများကိုထောက်ပြအမြန်ဖြစ်ကြသည်။ သဘာဝကျကျအကောင်းဆုံးချဉ်းကပ်မှုတစ်ခုမျိုးစပ်သည်။ ဒါကသုတေသီများကြီးတွေဒေတာသတင်းရင်းမြစ်-နှစ်ဦးစလုံးကောင်းမကောင်း၏ဝိသေသလက္ခဏာများကိုနားလည်မကောင်းတဲ့-ပြီးတော့သူတို့ထံမှသင်ယူဖို့ဘယ်လောက်ထွက်တွက်ဆဖို့လိုပါတယ်ဖြစ်ပါသည်။ ထိုအကြောင်းဤအခနျး၏ကျန်ရှိသောများအတွက်အစီအစဉ်ဖြစ်ပါတယ်။ လာမယ့်အပိုင်းမှာတော့ကျနော်ကြီးတွေဒေတာသတင်းရင်းမြစ်ဆယ်ဘုံဝိသေသလက္ခဏာများကိုဖော်ပြရန်ပါလိမ့်မယ်။ ထို့နောက်အောက်ပါအပိုင်း၌ငါကဲ့သို့သော data တွေကိုနှင့်အတူကောင်းစွာအလုပ်မလုပ်နိုင်သောသုံးခုသုတေသနချဉ်းကပ်ဖော်ပြရန်ပါလိမ့်မယ်။