5.2.1 က Galaxy တိရစ္ဆာန်ရုံ

က Galaxy တိရစ္ဆာန်ရုံတစ်ဦးသန်းနဂါးငွေ့တန်းခွဲခြားဖို့အများကြီး Non-ကျွမ်းကျင်သူစေတနာ့ဝန်ထမ်းများ၏ကြိုးစားအားထုတ်မှုကိုပေါင်းစပ်။

က Galaxy တိရစ္ဆာန်ရုံကီဗင် Schawinski, အတော်လေးနည်းနည်း simplifying 2007 ခုနှစ်အောက်စဖို့တက္ကသိုလ်မှနက္ခတ္တဗေဒအတွက်ဘွဲ့ရကျောင်းသားအားဖြင့်ရင်ဆိုင်ပြဿနာတစ်ခုထဲကကြီးပြင်း, Schawinski နဂါးငွေ့တန်းစိတ်ဝင်စားခဲ့သည်နှင့်နဂါးငွေ့တန်းသူတို့ရဲ့ shape သုက်ပိုးပုံသဏ္ဌာန်-ဘဲဥပုံသို့မဟုတ်အားဖြင့်ခွဲခြားနိုင်ပါတယ်လိမ်-နှင့် သူတို့၏အရောင်-အပြာသို့မဟုတ်အနီရောင်ဖြင့်ပြုလုပ်နိုင်ပါတယ်။ ထိုအချိန်တွင်နက္ခတ္တဗေဒပညာရှင်တို့တှငျအသမားရိုးကျသည်ပညာကိုကလိမ်နဂါးငွေ့တန်းကျွန်တော်တို့ရဲ့နဂါးငွေ့တန်းများကဲ့သို့, (လူငယ်ညွှန်ပြ) အရောင်အတွက်အပြာနှင့်ဘဲဥပုံနဂါးငွေ့တန်း (အသက်ကြီးညွှန်ပြ) အရောင်အတွက်အနီရောင်ကွခဲ့သည်။ Schawinski ဒီသမားရိုးကျသည်ပညာကိုသံသယ။ ထိုပုံမှန်မဟုတ်သောနဂါးငွေ့တန်း-ထိုမျှော်လင့်ထားပုံစံ-သူရာကနေတဆင့်လုပ်ငန်းစဉ်နှင့် ပတ်သက်. အရာတစ်ခုခုကိုလေ့လာသင်ယူနိုင် fit မပြုခဲ့ကြောင်းသူမြား၏စာရေးလေ့လာနေဖွငျ့ဤပုံစံယေဘုယျအားဖြင့်စစ်မှန်တဲ့ဖြစ်စေခြင်းငှါ, နေစဉ်, ခြွင်းချက်တစ်ခုသာရှိပြီးအရေအတွက်ဖြစ်နိုင်ရှိသံသယရှိသူနှင့် နဂါးငွေ့တန်းကိုဖွဲ့စည်းခဲ့သည်။

ထို့ကြောင့်အဘယ် Schawinski သမားရိုးကျသည်ပညာကိုလွှမ်းမိုးနိုင်ရန်အတွက်လိုအပ်သည့် morphologically လျှို့ဝှက်နဂါးငွေ့တန်း၏ကြီးမားသောအစုရှိ၏ အကြောင်း, လိမ်သို့မဟုတ်ဘဲဥပုံဖြစ်ဖြစ်အဖြစ်ခွဲခြားခဲ့နဂါးငွေ့တန်းဖြစ်ပါတယ်။ အဆိုပါပြဿနာ, သို့သော်, ခွဲခြားများအတွက်လက်ရှိ algorithmic နည်းလမ်းများသေးသိပ္ပံဆိုင်ရာသုတေသနအတွက်အသုံးပြုခံရဖို့လုံလောက်တဲ့ကောင်းသောမဟုတ်ကြကြောင်းရှိ၏ အခြားစကား, ရှိတာလေးတွေနဂါးငွေ့တန်း, ထိုကာလမှာကွန်ပျူတာတွေအတွက်ခက်ခဲခဲ့ကြောင်းပြဿနာတစ်ခုဖြစ်ခဲ့သည်။ ဒါကြောင့်အဘယျအလိုအပျခဲ့သောလူ့လျှို့ဝှက်နဂါးငွေ့တန်း၏ကြီးမားသောအရေအတွက်ခဲ့သည်။ Schawinski တစ်ဘွဲ့ရကျောင်းသားတစ်ယောက်ရဲ့စိတ်အားထက်သန်မှုနှင့်အတူဤခွဲခြားပြဿနာမှုများပြုလုပ်ခဲ့သည်။ ခုနစျပါး, 12 နာရီကာလ၏တစ်ဦးမာရသွန် session တစ်ခုတွင်သူသည် 50000 နဂါးငွေ့တန်းခွဲခြားနိုင်ခဲ့တယ်။ 50,000 နဂါးငွေ့တန်းတွေအများကြီးကဲ့သို့မြည်စေခြင်းငှါနေစဉ်, ဒါကြောင့်အမှန်တကယ် Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်းအတွက်မှတ်တမ်းတင်ဓါတ်ပုံများရိုက်ကူးခဲ့သောတစ်သန်းနီးပါးနဂါးငွေ့တန်း၏ခန့်သာ 5% ဖြစ်ပါတယ်။ Schawinski သူတစ်ဦးထက်ပိုအရွယ်မှာချဉ်းကပ်မှုလိုအပ်ကြောင်းသဘောပေါက်လာတယ်။

ကံကောင်းထောက်မစွာ, ကနဂါးငွေ့တန်းရှိတာလေးတွေ၏ task ကိုနက္ခတ္တဗေဒအတွက်အဆင့်မြင့်လေ့ကျင့်ရေးမလိုအပ်ပါဘူးထွက်လှည့်; သငျသညျတော်တော်လေးလျင်မြန်စွာထိုသို့ပြုမှတစ်စုံတစ်ဦးကိုဆုံးမသွန်သင်နိုင်ပါတယ်။ ရှိတာလေးတွေနဂါးငွေ့တန်းကွန်ပျူတာတွေအတွက်ခက်ခဲခဲ့ကြောင်းအလုပ်တစ်ခုကိုပင်သော်လည်းအခြားစကားကြောင့်လူသားတော်တော်လွယ်ကူပါတယ်ခဲ့သည်။ ဒီတော့အောက်စဖို့, Schawinski နှင့်သူချင်းနက္ခတ္တဗေဒပညာရှင်ခရစ် Lintott တစ်ဦးအရက်ဆိုင်၌ထိုင်နေစဉ်စေတနာ့ဝန်ထမ်းနဂါးငွေ့တန်း၏ရုပ်ပုံများကိုခွဲခြားမယ်လို့ဘယ်မှာ website တစ်ခုဖွင့်အိပ်မက်ကိုမြင်မက်။ လအနည်းငယ်အကြာတွင်က Galaxy တိရစ္ဆာန်ရုံမွေးဖွားခဲ့သည်။

က Galaxy တိရစ္ဆာန်ရုံဝက်ဘ်ဆိုက်မှာစေတနာ့ဝန်ထမ်းသင်တန်းမိနစ်အနည်းငယ်ခံယူမယ်လို့; ဥပမာအားဖြင့်, တစ်လိမ်နှင့်ဘဲဥပုံနဂါးငွေ့တန်း (ပုံ 5.2) အကြားခြားနားချက်ကိုသင်ယူခြင်း။ ဒီလေ့ကျင့်ရေးအပြီးတွင်စေတနာ့လူသိများခွဲခြားမှုနှင့်အတူ 11 15 နဂါးငွေ့တန်းရှိတာလေးတွေထို့နောက်စေတနာ့ဝန်ထမ်းတစ်ဦးရိုးရှင်းသော web-based interface ကို (ပုံ 5.3) မှတဆင့်အမည်မသိနဂါးငွေ့တန်း၏စစ်မှန်သောခွဲခြားစတင်ဖို့မယ်လို့တစ်အတော်လေးလွယ်ကူပဟေဠိ-မှန်မှန်ကန်ကန်သွားခဲ့ရသည်။ စေတနာ့ဝန်ထမ်းမှနက္ခတ္တဗေဒပညာရှင်ဖို့အသွင်ကူးပြောင်းရေးထက်နည်း 10 မိနစ်၌ယူနှင့်သာ, တစ်ဦးရိုးရှင်းသောပဟေဠိအခက်အခဲများ၏နိမ့်ဆုံးဖြတ်သန်းလိုအပ်ပေသည်။

လိမ်ခြင်းနှင့်ဘဲဥပုံ: နဂါးငွေ့တန်း၏န​​ှစ်ခုအဓိကအမျိုးအစားများဥပမာ: 5.2 ပုံ။ က Galaxy တိရစ္ဆာန်ရုံစီမံကိန်းကိုအမျိုးအစားဖို့ပိုထက် 100,000 စေတနာ့ဝန်ထမ်းထက်ပို 900.000 ပုံရိပ်တွေကိုအသုံးပြုခဲ့သည်။ source: www.galaxyzoo.org ။

လိမ်ခြင်းနှင့်ဘဲဥပုံ: နဂါးငွေ့တန်း၏န​​ှစ်ခုအဓိကအမျိုးအစားများဥပမာ: 5.2 ပုံ။ က Galaxy တိရစ္ဆာန်ရုံစီမံကိန်းကိုအမျိုးအစားဖို့ပိုထက် 100,000 စေတနာ့ဝန်ထမ်းထက်ပို 900.000 ပုံရိပ်တွေကိုအသုံးပြုခဲ့သည်။ source: www.galaxyzoo.org

ပုံ 5.3: မဲဆန္ဒရှင်တစ်ခုတည်းပုံရိပ်ခွဲခြားဖို့တောင်းရာ Input ကိုမျက်နှာပြင်။ source: www.galaxyzoo.org ။

ပုံ 5.3: မဲဆန္ဒရှင်တစ်ခုတည်းပုံရိပ်ခွဲခြားဖို့တောင်းရာ Input ကိုမျက်နှာပြင်။ source: www.galaxyzoo.org

စီမံကိန်းကိုတစ်ဦးသတင်းဆောင်းပါးထဲမှာ featured ခဲ့ပြီးနောက်က Galaxy တိရစ္ဆာန်ရုံဟာသူ့ရဲ့ကနဦးစေတနာ့ဝန်ထမ်းဆွဲဆောင်နှင့် ပတ်သက်. ခြောက်လအတွင်းစီမံကိန်းကိုထက်ပို 100,000 နိုင်ငံသားသိပ္ပံပညာရှင်တွေ, သူတို့က task ကိုခံစားခြင်းနှင့်သူတို့ကြိုတင်မဲနက္ခတ္တဗေဒကူညီပေးခငျြသောကွောငျ့ပါဝင်သူတွေကိုပါဝင်မှကြီးပွားသတည်း။ အတူတူ, ဤ 100,000 စေတနာ့ဝန်ထမ်းအမျိုးအစားခွဲခြားမှုများအများစုပါဝင်သူများတစ်အတော်လေးသေးငယ်တဲ့, Core group မှလာမယ့်အတူ, 40 ကျော်သန်းအမျိုးအစားခွဲခြားမှု၏စုစုပေါင်းလှူဒါန်းခဲ့ (Lintott et al. 2008)

အတှေ့အကွုံဘွဲ့ကြိုသုတေသနလုပ်ငန်းလက်ထောက်ငှားရမ်းသူသုတေသီတွေကချက်ချင်းဒေတာရဲ့အရည်အသွေးနဲ့ပတ်သက်ပြီးသံသယဖြစ်လိမ့်မယ်။ ဒီသံသယအကျိုးသင့်အကြောင်းသင့်ဖြစ်ပါတယ်နေစဉ်, က Galaxy တိရစ္ဆာန်ရုံစေတနာ့ဝန်ထမ်းပံ့ပိုးမှုများကိုမှန်မှန်ကန်ကန်, သန့်ရှင်း debiased နှင့်စုပေါင်းကြသောအခါ, သူတို့ကအရည်အသွေးမြင့်ရလဒ်များကိုထုတ်လုပ်နိုင်သည်ကိုပြသထားတယ် (Lintott et al. 2008) ။ ပရော်ဖက်ရှင်နယ်အရည်အသွေးမြင့်ဒေတာဖန်တီးရန်လူစုလူဝေးရတဲ့အတှကျအရေးပါသောလှည့်ကွက် redundancy ဖြစ်၏ များစွာကွဲပြားခြားနားတဲ့လူတွေဖျော်ဖြေတူညီတဲ့လုပ်ငန်းတာဝန်ရှိခြင်းဖြစ်ပါတယ်။ က Galaxy တိရစ္ဆာန်ရုံ၌, နဂါးငွေ့တန်းနှုန်း 40 ခန့်ခွဲခြားမှုရှိပါ၏ ဘွဲ့ကြိုသုတေသနလုပ်ငန်းလက်ထောက်သုံးပြီးသုတေသီများ redundancy ၏ဤအဆင့်ကိုတတ်နိုင်ထို့ကြောင့်အသီးအသီးတစ်ဦးချင်းစီခွဲခြားများ၏အရည်အသွေးနှင့်အတူအများကြီးပိုစိုးရိမ်မိရောက်ထားရန်လိုအပ်ပါတယ်ဘယ်တော့မှနိုင်ဘူး။ ထိုစေတနာ့ဝန်ထမ်းလေ့ကျင့်ရေးအတွက်ပါဝင်ခြင်းမရှိသေးပေအဘယ်သို့သူတို့ redundancy နှင့်အတူတက်သည်တို့ကိုလည်းလုပ်လေ၏။

တောင်မှနဂါးငွေ့တန်းနှုန်းမျိုးစုံခွဲခြားမှုနှင့်အတူ, သို့သော်, တစ်ဦးသဘောတူညီမှုခွဲခြားထုတ်လုပ်ရန်စေတနာ့ဝန်ထမ်းခွဲခြားမှု၏အစုပေါင်းစပ်ပြီးစားမှုဖြစ်ပါတယ်။ အလွန်ဆင်တူစိန်ခေါ်မှုများအများဆုံးလူ့တွက်ချက်မှုစီမံကိန်းများတွင်ပျေါပေါကျသောကွောငျ့, ကဉျြးခြုပျက Galaxy တိရစ္ဆာန်ရုံသုတေသီများက၎င်းတို့၏သဘောတူညီမှုခွဲခြားမှုထုတ်လုပ်ရာမှာအသုံးပြုတဲ့သောအဆင့်သုံးဆင့်ပြန်လည်သုံးသပ်ဖို့အထောက်အကူဖြစ်ပါတယ်။ ပထမဦးစွာသုတေသီအတုအယောင်ခွဲခြားမှုဖယ်ရှားခြင်းအားဖြင့်ဒေတာများ "သန့်ရှင်း" ။ ဥပမာအားဖြင့်, လူအကြိမ်ကြိမ်အတူတူပင်ကတော့ galaxy-တစ်ခုခုသူတို့ရလဒ်တွေ-ခဲ့အပေါင်းတို့သည်မိမိတို့ခွဲခြားမှုစွန့်ပစ် manipulate ဖို့ကြိုးစားနေခဲ့ကြမယ်ဆိုရင်ဖြစ်ပျက်မယ်လို့ခွဲခြားတဲ့သူ။ ဤသည်နှင့်အခြားအလားတူသန့်ရှင်းရေးအားလုံးခွဲခြားမှု၏အကြောင်းကို 4% ကိုဖယ်ရှား။

ဒုတိယအချက်မှာရှင်းလင်းပြီးနောက်, သုတေသီခွဲခြားမှုအတွက်စနစ်တကျဘက်လိုက်မှုဖယ်ရှားပစ်ရန်လိုအပ်ခဲ့ပါတယ်။ အစား၏မူလစီမံကိန်းများအတွက်စံနမူနာအတွင်း embedded ဘက်လိုက်ထောက်လှမ်းလေ့လာမှုတစ်ခုစီးရီးတဆင့်, မိုနိုခရုမ်အတွက်အချို့စေတနာ့ကတော့ galaxy ဖြင့်အရောင်-သုတေသီဝေးဘဲဥပုံနဂါးငွေ့တန်းအဖြစ်လိမ်နဂါးငွေ့တန်းခွဲခြားဖို့ထိုကဲ့သို့သောစနစ်တကျဘက်လိုက်မှုအဖြစ်အများအပြားစနစ်တကျဘက်လိုက်မှု, ရှာဖွေတွေ့ရှိ (Bamford et al. 2009) များစွာသောပံ့ပိုးမှုများကိုပျမ်းမျှစနစ်တကျဘက်လိုက်မှုကိုမရွှေ့ပါဘူးကြောင့်ဤစနစ်တကျဘက်လိုက်ဘို့ထိန်းညှိခြင်းအလွန်အရေးပါသည်, ကသာကျပန်းအမှားဖယ်ရှားပေးပါသည်။

နောက်ဆုံးအနေနဲ့ debiasing ပြီးနောက်, သုတေသီတစ်ဦးသဘောတူညီမှုခွဲခြားထုတ်လုပ်ဖို့တစ်ဦးချင်းစီခွဲခြားမှုပေါင်းစပ်ဖို့နည်းလမ်းလိုအပ်ခဲ့ပါတယ်။ အသီးအသီးကတော့ galaxy ဘို့ခွဲခြားမှုပေါင်းစပ်ဖို့အရိုးရှင်းဆုံးနည်းလမ်းအသုံးအများဆုံးခွဲခြားရှေးခယျြဖို့ဖြစ်ပါလိမ့်မည်။ သို့သော်ဤချဉ်းကပ်မှုပုံစံတစ်ခုချင်းစီကိုစေတနာ့ဝန်ထမ်းတန်းတူအလေးချိန်ပေးမည်ဖြစ်ကြောင်းနှင့်သုတေသီအချို့စေတနာ့အခြားသူများထက်ခွဲခြားမှာပိုကောင်းခဲ့ကြကြောင်းသံသယရှိ။ ထို့ကြောင့်သုတေသီများအလိုအလျောက်အကောင်းဆုံးလျှို့ဝှက်ထောက်လှမ်းသူတို့ကိုပိုပြီးအလေးချိန်ပေးရန်ကြိုးစားကြောင်းပိုမိုရှုပ်ထွေးကြားမှာတွက်ဆလုပ်ထုံးလုပ်နည်းတီထွင်ထုတ်လုပ်နိုင်ခဲ့သည်။

ထို့ကြောင့်တစ်ဦးသုံးခြေလှမ်း process ကို-သန့်ရှင်းရေးပြီးနောက် debiasing နှင့်တွက်ဆ-က Galaxy တိရစ္ဆာန်ရုံသုတေသနအဖွဲ့သဘောတူညီမှု morphological ခွဲခြားမှုအစုတခုသို့ 40 သန်းစေတနာ့ဝန်ထမ်းခွဲခြားမှုအဖြစ်ပြောင်းလဲခဲ့သည်။ ဤသူသည် Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုက Galaxy တိရစ္ဆာန်ရုံလာအောင်နှိုးဆွဖို့ကူညီပေးခဲ့ကြောင်း Schawinski အားဖြင့်ခွဲခြားအပါအဝင်ပရော်ဖက်ရှင်နယ်နက္ခတ္တဗေဒပညာရှင်များကသုံးယခင်သေးငယ်-စကေးကြိုးစားမှု, နှင့်နှိုင်းယှဉ်ပါခဲ့ကြသည့်အခါအားကြီးသောသဘောတူညီချက်တခုရှိ၏။ ထို့ကြောင့်စေတနာ့, စုစုပေါင်းအတွက်, အရည်အသွေးမြင့်ခွဲခြားမှုများကိုတတ်နိုင်နှင့်သုတေသီမတိုက်ဆိုင်နိုင်မယ့်အတိုင်းအတာမှာ (Lintott et al. 2008) ။ တကယ်တော့နဂါးငွေ့တန်း၏ထိုကဲ့သို့သောကြီးမားအရေအတွက်လူ့ခွဲခြားမှုရှိခြင်းအသုံးပြုပုံ Schawinski, Lintott နှင့်အခြားနဂါးငွေ့တန်း၏ခန့်သာ 80% ကိုမျှော်လင့်ထားပုံစံ-အပြာလိမ်နဲ့အနီရောင် elliptic နှင့်မြောက်မြားစွာစာတမ်းများအကြောင်းကိုစာဖြင့်ရေးသားခဲ့ကြအတိုင်းလိုက်နာကြောင်းပြသနိုင်ခဲ့တယ် ဒီတွေ့ရှိမှု (Fortson et al. 2011)

ဒီနောက်ခံပေးထားကျနော်တို့ယခုက Galaxy တိရစ္ဆာန်ရုံ split-လျှောက်ထား-ပေါင်းစပ်စာရွက်အများစုကလူ့တွက်ချက်မှုစီမံကိန်းများအတွက်အသုံးပြုကြောင်းတူညီသောစာရွက်အောက်ပါအတိုင်းဘယ်လိုမြင်နိုင်ပါသည်။ ပထမဦးစွာကြီးမားတဲ့ပြဿနာတုံးသို့ခွဲထွက်သည်။ ဤကိစ္စတွင်ခုနှစ်, တစ်ဦးသန်းနဂါးငွေ့တန်းရှိတာလေးတွေ၏ပြဿနာကိုတဦးတည်းနဂါးငွေ့တန်းရှိတာလေးတွေတစ်ဦးသန်းပြဿနာတွေသို့ခွဲထွက်သည်။ ထို့နောက်တစ်ဦးစစ်ဆင်ရေးလွတ်လပ်စွာအသီးအသီးအတုံးမှလျှောက်ထားသည်။ ဤကိစ္စတွင်ခုနှစ်, စေတနာ့ဝန်ထမ်းလိမ်သို့မဟုတ်ဘဲဥပုံဖြစ်ဖြစ်အဖြစ်အသီးအသီးကတော့ galaxy ခွဲခြားလိမ့်မယ်။ နောက်ဆုံးအနေနဲ့ရလဒ်တွေဟာသဘောတူညီမှုရလဒ်ထုတ်လုပ်ရန်ပေါင်းစပ်ကြသည်။ ဤကိစ္စတွင်ခုနှစ်, ပေါင်းစပ်ခြေလှမ်းအသန့်ရှင်းရေး, debiasing, အသီးအသီးကတော့ galaxy များအတွက်သဘောတူညီမှုခွဲခြားထုတ်လုပ်ရန်တွက်ဆပါဝင်သည်။ အများဆုံးစီမံကိန်းများကိုဒီယေဘုယျစာရွက်ကိုသုံးသော်လည်း, ထိုခြေလှမ်းများ၏အသီးအသီးကိုင်တွယ်ဖြေရှင်းခံရတိကျတဲ့ပြဿနာမှစိတ်ကြိုက်ရန်လိုအပ်ပါသည်။ ဥပမာအားအောက်တွင်ဖော်ပြထားသည့်လူ့တွက်ချက်မှုစီမံကိန်းတွင်, တူညီတဲ့စာရွက်နောက်တော်သို့လိုက်ကြလိမ့်မည်, သို့သော်လျှောက်ထားခြင်းနှင့်ပေါင်းစပ်ခြေလှမ်းများအတော်လေးကွဲပြားခြားနားသောဖြစ်လိမ့်မည်။

က Galaxy တိရစ္ဆာန်ရုံအသင်းများအတွက်, ဒီပထမဦးဆုံးစီမံကိန်းကယ့်အစအဦးဖြစ်ခဲ့သည်။ အလွန်လျှင်မြန်စွာသူတို့တစ်ဦးသန်းနဂါးငွေ့တန်းနီးစပ်ခွဲခြားနိုင်ခဲ့ကြတယ်ပင်သော်လည်း, ဒီစကေးနှင့် ပတ်သက်. 10 ဘီလီယံနဂါးငွေ့တန်း၏ပုံရိပ်တွေကိုထုတ်လုပ်နိုင်သည့်အသစ်များဒစ်ဂျစ်တယ်မိုဃ်းကောင်းကင်စစ်တမ်းများနှင့်အတူလုပ်ကိုင်ဖို့လုံလောက်တဲ့မဟုတ်ကြောင်းသဘောပေါက် (Kuminski et al. 2014) ။ 10000-က Galaxy တိရစ္ဆာန်ရုံ၏ 10 မှ 1 သန်းကနေတိုးကိုကိုင်တွယ်ရန်ဘီလီယံအချက်တစ်ခုအကြမ်းဖျင်း 10000 ဆပိုသင်တန်းသားများကိုစုဆောင်းဖို့လိုအပ်လိမ့်မယ်။ အင်တာနက်ပေါ်ရှိစတေနာ့ဝနျထမျးမြား၏အရအေတှကျကြီးမားသည်တောင်မှကမရ​​ေမတွက်မဟုတ်ပါဘူး။ ထို့ကြောင့်သုတေသီများသူတို့သည်အစဉ်အချက်အလက်များ၏ကြီးထွားလာပမာဏကိုင်တွယ်ရန်သွားကြသည်လျှင်သဘောပေါက်အသစ်တစ်ခု, ပို. ပင်၏အရွယ်မှာ, ချဉ်းကပ်မှုလိုအပ်ခဲ့သည်။

ထိုကွောငျ့, အဘိဓါန် Manda နဂါးငွေ့တန်းခွဲခြားရန်ကီဗင် Schawinski, ခရစ် Lintott, နဲ့ Galaxy တိရစ္ဆာန်ရုံအဖွဲ့-စတင်ပြီးဆုံးမဩဝါဒပေးကွန်ပျူတာများကိုအခြားအဖွဲ့ဝင်များနှင့်အတူ Banerji-အလုပ်လုပ်။ ပိုများသောအထူးသ, က Galaxy တိရစ္ဆာန်ရုံအသုံးပြုနေသူများကဖန်တီးလူ့ခွဲခြားမှုကိုအသုံးပြုပြီး Banerji et al. (2010) ပုံရဲ့ဝိသေသလက္ခဏာများအပေါ်အခြေခံတဲ့နဂါးငွေ့တန်း၏လူ့ခွဲခြားကြိုတင်ခန့်မှန်းနိုင်ကြောင်းစက်သင်ယူမှုပုံစံကိုတည်ဆောက်ခဲ့သည်။ ဒီစက်သင်ယူမှုပုံစံမြင့်မားတိကျမှန်ကန်မှုနှင့်အတူလူ့ခွဲခြားမှုမျိုးပွားနိုင်လျှင်, ကနဂါးငွေ့တန်းတစ်ခုမရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့အရေအတွက်ခွဲခြားဖို့က Galaxy တိရစ္ဆာန်ရုံသုတေသီများကအသုံးပြုနိုင်ပါတယ်။

ကတူညီပထမတစ်ချက်မှာရှင်းရှင်းလင်းလင်းမဖြစ်စေခြင်းငှါ, ဖြစ်သော်လည်းအဆိုပါ Banerji ၏ core နဲ့လုပ်ဖော်ကိုင်ဘက် '' ချဉ်းကပ်မှု, တကယ်တော့အများအားလူမှုရေးသုတေသနလုပ်ငန်းများတွင်အသုံးပြုနည်းစနစ်ဖို့တော်တော်လေးဆင်တူသည်။ ပထမဦးစွာ Banerji နှင့်လုပ်ဖော်ကိုင်ဖက်များကဂုဏ်သတ္တိများရဲ့အကျဉ်းချုပ်ကြောင်းကိန်းဂဏန်းတွေ features တွေကိုအစုတခုသို့တစ်ခုချင်းစီပုံရိပ်ကိုပြောင်းလဲ။ ပုံသဏ္ဍာန်အပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် Non-အဖြူ pixels ကို၏အချိုးအစား: ဥပမာ, နဂါးငွေ့တန်း၏ရုပ်တုသုံး features တွေရှိပါတယ်ဖြစ်နိုင်ပါတယ်။ မှန်ကန်သောအင်္ဂါရပ်များအရွေးချယ်ရေးပြဿနာရဲ့အရေးပါတဲ့အစိတ်အပိုင်းတစ်ခုဖြစ်တယ်, ဒါကြောင့်ယေဘုယျအားဖြင့်ဘာသာရပ်-ဧရိယာကျွမ်းကျင်မှုလိုအပ်သည်။ သာမန်အင်္ဂါရပ်အင်ဂျင်နီယာ, ပုံရိပ်နှုန်းတစ်တန်းနှင့်အတူတစ်ဒေတာ matrix ကိုအတွက်ရလဒ်များကိုနှင့်ပုံရိပ်ကိုဖော်ပြပြီးတော့သုံးကော်လံကိုခေါ်ဒါဟာပထမဦးဆုံးခြေလှမ်း။ ဒေတာ matrix ကိုနှင့်လိုချင်သော output ကိုပေးသော (ဥပမာ, image ကိုတစ်ဦးဘဲဥပုံနဂါးငွေ့တန်းအဖြစ်လူသားတစ်ဦးအားဖြင့်ခွဲခြားခဲ့ရှိမရှိ), အသုတေသီတစ်ဦးစာရင်းအင်းမော်ဒယ်-များအတွက်စံနမူနာများ parameters တွေကိုခန့်မှန်းထားသည်, တစ်ဦး Logistic ဆုတ်ယုတ်သောလူ့ခွဲခြားအခြေစိုက်ခန့်မှန်းတူတစ်ခုခု ပုံရဲ့ features တွေပေါ်မှာ။ နောက်ဆုံးအနေနဲ့အသုတေသီအသစ်နဂါးငွေ့တန်း (ပုံ 5.4) ၏ခန့်မှန်းခြေခွဲခြားမှုထုတ်လုပ်ရန်ဒီစာရင်းအင်းမော်ဒယ်အတွက် parameters တွေကိုအသုံးပြုပါတယ်။ လူမှုရေး Analog စစဉ်းစားရန်, သင်တစ်ဦးသန်းမျှရှိသောကျောင်းသားများနှင့် ပတ်သက်. လူဦးရေဆိုင်ရာသတင်းအချက်အလက်ခဲ့, သင်သူတို့ကောလိပ်မှဘွဲ့သို့မဟုတ်မရှိမရှိသိသောမြင်ယောင်ကြည့်ပါ။ သင်ဤဒေတာမှတစ်ဦး Logistic ဆုတ်ယုတ် fit နိုင်ကြောင်း, ပြီးနောက်သင်အသစ်တွေကိုကျောင်းသားများကိုကောလိပ်မှဘွဲ့ရသွားကြသည်ရှိမရှိခန့်မှန်းဖို့ရရှိလာတဲ့မော်ဒယ် parameters တွေကိုအသုံးပြုနိုင်တယ်။ စက်သင်ယူမှုတွင်ဤချဉ်းကပ်မှု-သုံးပြီးထို့နောက်အချက်အလက်အသစ်ကို-ဖြစ်ပါတယ်သင်ယူခြင်းကြီးကြပ်ဟုခေါ်ဝေါ်တံဆိပ်ကပ်နိုင်သောစာရင်းအင်းမော်ဒယ်ကိုဖန်တီးရန်ဥပမာတံဆိပ်ကပ် (Hastie, Tibshirani, and Friedman 2009)

ပုံ 5.4: ဘယ်လို Banerji et al ၏ရိုးရှင်းဖော်ပြချက်။ (2010) နဂါးငွေ့တန်းခွဲခြားလုပ်ဖို့စက်သင်ယူမှုပုံစံလေ့ကျင့်ဖို့က Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုခဲ့သည်။ နဂါးငွေ့တန်း၏ပုံများအင်္ဂါရပ်များတစ်ဦး matrix ကိုအတွက်ကူးပြောင်းခဲ့ကြသည်။ ဒီရိုးရှင်းတဲ့ဥပမာမှာသုံး features တွေပါ (ပုံတွင်အပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် Non-အဖြူ pixels ကို၏အချိုးအစား) ရှိပါတယ်။ ထို့နောက်ပုံရိပ်တွေ၏အပိုင်းတစ်ပိုင်းကိုသာလျှင်အဘို့, က Galaxy တိရစ္ဆာန်ရုံတံဆိပ်များစက်သင်ယူမှုပုံစံလေ့ကျင့်ဖို့အသုံးပြုကြပါတယ်။ နောက်ဆုံးအနေနဲ့စက်သင်ယူမှုကျန်ရှိသောနဂါးငွေ့တန်းဘို့ခွဲခြားမှုကိုခန့်မှန်းရန်အသုံးပြုသည်။ အစားလူသားတှေဟာပြဿနာကိုဖြေရှင်းဖို့ရှိခြင်းထက်, သူတို့သညျလူသားတို့ပြဿနာကိုဖြေရှင်းပေးမယ့်ကွန်ပျူတာလေ့ကျင့်ဖို့အသုံးပြုနိုင်မယ့် Datasets တည်ဆောက်ရှိသည်, သောကွောငျ့ငါဒုတိယမျိုးဆက်လူ့ကွန်ပျူတာစီမံကိန်းကိုစီမံကိန်းကဒီလိုမျိုးကိုခေါ်ပါ။ ဒီကွန်ပျူတာ-ကူညီချဉ်းကပ်မှု၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကိုသုံးပြီး data များမရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွစျသောကွောငျ့ဖွစျသညျ။

ပုံ 5.4: ဘယ်လို၏ရိုးရှင်းဖော်ပြချက် Banerji et al. (2010) နဂါးငွေ့တန်းခွဲခြားလုပ်ဖို့စက်သင်ယူမှုပုံစံလေ့ကျင့်ဖို့က Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုခဲ့သည်။ နဂါးငွေ့တန်း၏ပုံများအင်္ဂါရပ်များတစ်ဦး matrix ကိုအတွက်ကူးပြောင်းခဲ့ကြသည်။ ဒီရိုးရှင်းတဲ့ဥပမာမှာသုံး features တွေပါ (ပုံတွင်အပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် Non-အဖြူ pixels ကို၏အချိုးအစား) ရှိပါတယ်။ ထို့နောက်ပုံရိပ်တွေ၏အပိုင်းတစ်ပိုင်းကိုသာလျှင်အဘို့, က Galaxy တိရစ္ဆာန်ရုံတံဆိပ်များစက်သင်ယူမှုပုံစံလေ့ကျင့်ဖို့အသုံးပြုကြပါတယ်။ နောက်ဆုံးအနေနဲ့စက်သင်ယူမှုကျန်ရှိသောနဂါးငွေ့တန်းဘို့ခွဲခြားမှုကိုခန့်မှန်းရန်အသုံးပြုသည်။ အစားလူသားတှေဟာပြဿနာကိုဖြေရှင်းဖို့ရှိခြင်းထက်, သူတို့သညျလူသားတို့ပြဿနာကိုဖြေရှင်းပေးမယ့်ကွန်ပျူတာလေ့ကျင့်ဖို့အသုံးပြုနိုင်မယ့် Datasets တည်ဆောက်ရှိသည်, သောကွောငျ့ငါဒုတိယမျိုးဆက်လူ့ကွန်ပျူတာစီမံကိန်းကိုစီမံကိန်းကဒီလိုမျိုးကိုခေါ်ပါ။ ဒီကွန်ပျူတာ-ကူညီချဉ်းကပ်မှု၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကိုသုံးပြီး data များမရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွစျသောကွောငျ့ဖွစျသညျ။

အတွင်းအင်္ဂါရပ်တွေ Banerji et al. (2010) စက်သင်ယူမှုပုံစံ, ငါ့ကစားစရာဥပမာအဘို့ဥပမာထဲမှာတွေထက်ပိုမိုရှုပ်ထွေးခဲ့ကြ, သူမ "က de Vaucouleurs axial အချိုးအစား fit" ကဲ့သို့ features တွေကိုအသုံးပြုသူမ၏မော်ဒယ်လ် Logistic ဆုတ်ယုတ်မဟုတ်ခဲ့ကတညျးကအတုအာရုံကြောကွန်ယက်ကိုဖြစ်ခဲ့သည်။ သူမ၏အင်္ဂါရပ်တွေ, သူမ၏မော်ဒယ်နှင့်သဘောတူညီမှုသည် Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုပြီးသူမအသီးအသီးအင်္ဂါရပ်အပေါ်အလေးဖန်တီး, ထို့နောက်နဂါးငွေ့တန်းများ၏ခွဲခြားအကြောင်းဟောကိန်းများအောင်သည်ဤအလေးကိုအသုံးပွုဖို့နိုင်ခဲ့သည်။ ဥပမာအားဖြင့်သူမ၏ခွဲခြမ်းစိတ်ဖြာနိမ့်နှင့်အတူပုံရိပ်တွေ "က de Vaucouleurs axial အချိုးအစား fit" လိမ်နဂါးငွေ့တန်းဖြစ်ဖို့ပိုဖွယ်ရှိကြောင်းတွေ့ရှိခဲ့ရသည်။ ဤသူတို့သည်အလေးပေးထားသူမကကျိုးကြောင်းဆီလျော်မှန်ကန်မှုနှင့်အတူတစ်နဂါးငွေ့တန်း၏လူ့ခွဲခြားကြိုတင်ခန့်မှန်းနိုင်ခဲ့တယ်။

၏လုပျငနျး Banerji et al. (2010) ကျွန်မဒုတိယမျိုးဆက်လူ့တွက်ချက်မှုစနစ်အဘယ်သို့ခေါ်ဝေါ်သို့က Galaxy တိရစ္ဆာန်ရုံလှည့်။ ဤသူတို့သည်ဒုတိယမျိုးဆက်စနစ်များကိုစဉ်းစားရန်အကောင်းဆုံးနည်းလမ်းအစားလူသားတှေဟာပြဿနာကိုဖြေရှင်းဖို့ရှိခြင်းထက်ကြောင်း, သူတို့သညျလူသားတို့ပြဿနာကိုဖြေရှင်းပေးမယ့်ကွန်ပျူတာလေ့ကျင့်ပေးဖို့အသုံးပြုရနိုငျသော Datasets တည်ဆောက်ရှိသည်။ ကွန်ပျူတာကိုလေ့ကျင့်ပေးဖို့လိုအပ်အချက်အလက်များ၏ပမာဏကိုကဖနျတီးဖို့လူသားတစ်ဦးအစုလိုက်အပြုံလိုက်ပူးပေါင်းလိုအပ်ပါတယ်ဒါကြောင့်ကြီးမားသောစေနိုင်ပါတယ်။ က Galaxy တိရစ္ဆာန်ရုံ, အသုံးပြုတဲ့အာရုံကြောကွန်ရက်များ၏အမှု၌ Banerji et al. (2010) ယုံကြည်စိတ်ချရသောလူ့ခွဲခြားမျိုးပွားနိုင်ခဲ့တယ်တဲ့မော်ဒယ်တည်ဆောက်နိုင်ရန်အတွက်လူ့-label တပ်ထားသောဥပမာများဟာအလွန်ကြီးမားတဲ့အရေအတွက်လိုအပ်သည်။

ဒီကွန်ပျူတာ-ကူညီချဉ်းကပ်မှု၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကိုသုံးပြီး data များမရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွစျသောကွောငျ့ဖွစျသညျ။ ဥပမာ, သန်းလူ့ခွဲခြားနဂါးငွေ့တန်းနှင့်အတူတစ်သုတေသီထို့နောက်တစ်ဘီလီယံသို့မဟုတ်ပင်တစ်ထရီလီယံနဂါးငွေ့တန်းခွဲခြားဖို့အသုံးပြုနိုင်မယ့်ကြိုတင်ခန့်မှန်းချက်မော်ဒယ်တည်ဆောက်နိုင်ပါတယ်။ နဂါးငွေ့တန်း၏ကြီးမားဂဏန်းရှိပါတယ်လျှင်, လူ့ကွန်ပျူတာဟိုက်ဘရစ်ဒီလိုမျိုးတကယ်သာဖြစ်နိုင်ပါဖြေရှင်းနည်းဖြစ်ပါတယ်။ ဒီအဆုံးမဲ့တိုးချဲ့နိုင်စွမ်းသို့သော်အခမဲ့မဟုတ်ပါဘူး။ မှန်ကန်စွာလူ့ခွဲခြားမှုမျိုးပွားနိုင်သည်ကိုတည်ဆောက်ခြင်းစက်သင်ယူမှုပုံစံဟာခက်ခဲပြဿနာကိုယ်တိုင်ကဖြစ်တယ်, ဒါပေမဲ့ကံကောင်းထောက်မစွာဤခေါင်းစဉ်မှဆက်ကပ်အပ်နှံမြတ်သောစာအုပ်တွေပြီးသားရှိပါတယ် (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013)

က Galaxy တိရစ္ဆာန်ရုံအများအပြားလူ့တွက်ချက်မှုစီမံကိန်းများ၏ဆင့်ကဲဖြစ်စဉ်ကိုပြသထားတယ်။ ပထမဦးစွာတစ်သုတေသီသူ့ကိုယ်သူအားဖြင့်သို့မဟုတ်သုတေသနလုပ်ငန်းလက်ထောက် (ဥပမာ, Schawinski ၏ကနဦးခွဲခြားအားထုတ်မှု) ၏သေးငယ်တဲ့အသင်းတွေနဲ့စီမံကိန်းကကြိုးစား။ ဒီချဉ်းကပ်မှုကောင်းစွာစကေးမ​​ပါဘူးဆိုရင်, ထိုသုတေသနပညာရှင်အများအပြားကလူအမျိုးအစားခွဲခြားမှုအထောက်အကူပြုဘယ်မှာလူသားတစ်ဦးတွက်ချက်မှုစီမံကိန်းကိုပြောင်းရွှေ့နိုင်ပါတယ်။ ဒါပေမယ့်အချက်အလက်များ၏တယော volume အဘို့, စင်ကြယ်သောလူ့အားထုတ်မှုလုံလောက်လိမ့်မည်မဟုတ်ပေ။ ထိုအခြိနျတှငျ, သုတေသီများလူ့ခွဲခြားမှုထို့နောက်အချက်အလက်များ၏နီးပါးန့်အသတ်ပမာဏမှလျှောက်ထားနိုင်ပါသည်တဲ့စက်သင်ယူမှုပုံစံလေ့ကျင့်ဖို့အသုံးပြုကြပါတယ်ဘယ်မှာဒုတိယမျိုးဆက်စနစ်များကိုတညျဆောကျဖို့လိုပါတယ်။