3.4.1 ဖြစ်တန်ရာကိန်းနမူနာ: ဒေတာစုဆောင်းနှင့်အချက်အလက်ခွဲခြမ်းစိတ်ဖြာ

အလေးရည်ရွယ်ချက်ရှိရှိနမူနာ process ကိုကြောင့်ဖြစ်ရတဲ့ပျက်ယွင်းပြန်ပြင်နိုင်ပါသည်။

ဖြစ်နိုင်ခြေနမူနာလူမျိုးအပေါင်းတို့ပါဝင်၏တစ်ဦးမသိ, Non-သုညဖြစ်နိုင်ခြေရှိသည်, အရိုးရှင်းဆုံးဖြစ်နိုင်ခြေနမူနာဒီဇိုင်းကိုလူတစ်ဦးချင်းစီပါဝင်၏တန်းတူဖြစ်နိုင်ခြေရှိပါတယ်ဘယ်မှာရိုးရှင်းတဲ့ကျပန်းနမူနာသည်အဘယ်မှာရှိသူတို့သည်ပညာမရှိကြ။ ဖြေဆိုသူစုံလင်သောသေဒဏ်စီရင် (ဥပမာ, အဘယ်သူမျှမလွှမ်းခြုံအမှားနှင့်မျှမတို့သည် non-တုန့်ပြန်) နဲ့ရိုးရှင်းတဲ့ကျပန်းနမူနာကနေတဆင့်ရွေးချယ်ထားကြသောအခါနမူနာ-အပေါ်မည်သည့်လူဦးရေ၏တစ်ဦးသေးသေးလေး version ကိုပျှမ်းမျှ-ဖြစ်သောကြောင့်, ထို့နောက်ခန့်မှန်းချက်ရိုးရှင်းတဲ့ဖြစ်ပါတယ်။

ရိုးရှင်းသောကျပန်းနမူနာမရှိသလောက်သို့သော်လက်တွေ့တွင်အသုံးပြုသည်။ အဲဒီအစားသုတေသီများရည်ရွယ်ချက်ရှိရှိကုန်ကျစရိတ်လျှော့ချရန်နှင့်တိကျမှန်ကန်မှုကိုတိုးမြှင့်နိုင်ရန်အတွက်ပါဝင်၏ညီမျှမှုဖြစ်နိုင်ခြေနှင့်အတူလူကိုရွေးပါ။ သုတေသီများရည်ရွယ်ချက်ရှိရှိပါဝင်၏ကွဲပြားခြားနားသောဖြစ်နိုင်ခြေနှင့်အတူလူကို select သောအခါချိန်ညှိအနမူနာ process ကိုကြောင့်ပေါ်ပေါက်လာတဲ့ပျက်ယွင်း undo ဖို့လိုအပ်နေပါသည်။ တနည်းအားဖြင့်ငါတို့သည်အဘယ်သို့နမူနာယဘေုယနမူနာကိုရှေးခယျြခဲ့ပုံပေါ်တွင်မူတည်သည်။

ဥပမာ, လက်ရှိလူဦးရေစစ်တမ်း (CPS) ကိုအလုပ်လက်မဲ့နှုန်းမှာခန့်မှန်းရန်ကိုအမေရိကန်အစိုးရကအသု​​ံးပြုသည်။ တစ်ခုချင်းစီကိုတစ်လနှင့် ပတ်သက်. လူပေါင်း 100,000 မျက်နှာချင်းဆိုင်ဖို့ဒါမှမဟုတ်တယ်လီဖုန်းကျော်ဖြစ်စေ, တွေ့ဆုံမေးမြန်းထားပါသည်, ထိုရလဒ်များခန့်မှန်းခြေအလုပ်လက်မဲ့နှုန်းထုတ်လုပ်ရန်အသုံးပြုကြသည်။ ဥပမာ (ထိုအစိုးရတစ်ခုချင်းစီကိုပြည်နယ်အတွင်းအလုပ်လက်မဲ့နှုန်းမှာခန့်မှန်းရန်ဆန္ဒရှိသော်လည်းကြောင်းသေးငယ်တဲ့လူဦးရေ (ဥပမာ, Rhode Island) နဲ့ပြည်နယ်များအတွက်လွန်းအနည်းငယ်ဖြေဆိုသူလိုက်လျောလို့, ကအရွယ်ရောက်ပြီးသူတစ်ဦးရိုးရှင်းသောကျပန်းနမူနာမပွုနိုငျသောကွောငျ့နဲ့ကြီးမားတဲ့လူဦးရေနှင့်အတူပြည်နယ်များမှအလွန်များ ကယ်လီဖိုးနီးယား) ။ အဲဒီအစားမတူညီတဲ့နှုန်းထားများမှာကွဲပြားခြားနားသောပြည်နယ်များအတွက် CPS နမူနာလူများ, လုပ်ငန်းစဉ်ရွေးချယ်ရေး၏ညီမျှမှုဖြစ်နိုင်ခြေနှင့်အတူ stratified နမူနာကိုခေါ်။ အ CPS ပြည်နယ်နှုန်း 2,000 ဖြေဆိုသူချင်တယ်ဆိုရင်ဥပမာ, ပြီးတော့ Rhode Island ရှိအရွယ်ရောက်ပြီးသူကယ်လီဖိုးနီးယား (California ပြည်နယ် vs 800,000 အရွယ်ရောက်ပြီးသူတစ်ဦးလျှင် 2,000 ဖြေဆိုသူ: 30.000.000 အရွယ်ရောက်ပြီးသူတစ်ဦးလျှင် 2,000 ဖြေဆိုသူ Rhode Island) တွင်အရွယ်ရောက်ပြီးသူထက်ပါဝင်၏အကြောင်းကိုအဆ 30 ပိုမိုမြင့်မားဖြစ်နိုင်ခြေရှိလိမ့်မယ်။ ကျွန်တော်တို့အကြာတွင်မြင်ရပါလိမ့်မည်သည့်အတိုင်းညီမျှမှုဖြစ်နိုင်ခြေနှင့်အတူနမူနာဒီလိုမျိုးလည်းအချက်အလက်များ၏အွန်လိုင်းသတင်းရပ်ကွက်များနှင့်အတူဖြစ်ပျက်ပေမယ် CPS မတူဘဲအနမူနာယန္တရားပုံမှန်အားဖြင့်သုတေသနပညာရှင်များကလူသိများသို့မဟုတ်ထိန်းချုပ်ထားသည်မဟုတ်။

သူ့ရဲ့နမူနာဒီဇိုင်းကိုအပ်ပေးတော်မူခြင်း, CPS တိုက်ရိုက်အမေရိကန်ကိုယ်စားလှယ်မျှမက, ဒါကြောင့်လည်းအများအပြား Rhode Island ကနေပြည်သူများနှင့်ကယ်လီဖိုးနီးယားပြည်နယ်မှလည်းအနည်းငယ်ပါဝင်သည်။ သို့အတွက်ကြောင့်နမူနာအတွက်အလုပ်လက်မဲ့နှုန်းနှင့်အတူတိုင်းပြည်အတွင်းအလုပ်လက်မဲ့နှုန်းမှာခန့်မှန်းရန်ပညာမဲ့ဖြစ်လိမ့်မည်။ အဲဒီအစားနမူနာယုတ်၏, ကအလေး Rhode Island ကနေလူကယ်လီဖိုးနီးယားမှလူမျိုးထက် သာ. ထည့်သွင်းခံရဖို့ကပိုဖွယ်ရှိသောအချက်အဘို့အကောင့်ရှိရာချိန်ယုတ်, ယူ သာ. ကောင်း၏။ သူတို့ခန့်မှန်းချက်နှင့် Rhode Island တစ်ခုချင်းစီမှလူတစ်ဦး downweighted-သူတို့ခံရမယ်လို့ခန့်မှန်းချက်အတွက်လျော့နည်းရေတွက်မယ်လို့၌ သာ. ရေတွက်မယ်လို့ upweighted- ဥပမာအားဖြင့်, ကယ်လီဖိုးနီးယားတစ်ခုချင်းစီမှပုဂ္ဂိုလ်တစ်ဦးဖြစ်လိမ့်မယ်။ အနှစ်သာရ၌, သင်အကြောင်းကိုလေ့လာသင်ယူရန်လျော့နည်းဖွယ်ရှိဖြစ်ကြောင်းလူတွေပိုပြီးစကားသံကိုပေးအပ်ထားတယ်။

ဒီကစားစရာဥပမာအားအရေးပါသောဒါပေမဲ့အများအားတလွဲမှတ်သရုပ်ဖော်: တစ်နမူနာကောင်းသောခန့်မှန်းချက်ထုတ်လုပ်နိုင်ရန်အတွက်လူဦးရေရဲ့တစ်ဦးသေးသေးလေးဗားရှင်းဖြစ်ရန်မလိုအပ်ပါဘူး။ လုံလောက်တဲ့အချက်အလက်တွေစုဆောင်းခဲ့ပုံနှင့် ပတ်သက်. လူသိများသည်လျှင်နမူနာကနေခန့်မှန်းချတဲ့အခါ, ထို့နောက်အချက်အလက်တွေကိုသုံးနိုင်တယ်။ အဆိုပါချဉ်းကပ်မှုပဲဖော်ပြခဲ့နှင့်ဖူးတဲ့ငါနည်းပညာပိုင်းဆိုင်ရာဂန္ထဝင်ဖြစ်နိုင်ခြေနမူနာမူဘောင်အတွင်းစတုရန်းနောကျဆကျတှဲ-ကျရောက်အတွက်သင်္ချာကိုဖော်ပြရန်သော။ အခုတော့ငါကတူညီတဲ့စိတ်ကူး Non-ဖြစ်နိုင်ခြေနမူနာမှလျှောက်ထားနိုင်ပါသည်ဘယ်လိုပြသပါလိမ့်မယ်။