5.2.1 က Galaxy တိရစ္ဆာန်ရုံ

က Galaxy တိရစ္ဆာန်ရုံတစ်ဦးသန်းနဂါးငွေ့တန်းခွဲခြားဖို့အများကြီး Non-ကျွမ်းကျင်သူစေတနာ့ဝန်ထမ်းများ၏ကြိုးပမ်းအားထုတ်မှုပေါင်းစပ်။

က Galaxy တိရစ္ဆာန်ရုံကီဗင် Schawinski အတော်လေးနည်းနည်း simplifying 2007 ခုနှစ်တွင်အောက်စဖို့တက္ကသိုလ်မှနက္ခတ္တဗေဒအတွက်ဘွဲ့ရကျောင်းသားအားဖြင့်ရင်ဆိုင်ခဲ့ရသည်ပြဿနာတစ်ခုထဲကကြီးပြင်း, Schawinski နဂါးငွေ့တန်းစိတ်ဝင်စားခဲ့ပါတယ်နှင့်နဂါးငွေ့တန်းသူတို့ရဲ့ shape သုက်ပိုးပုံသဏ္ဌာန်-ဘဲဥပုံသို့မဟုတ်ခြင်းဖြင့်ခွဲခြားနိုင်ပါသည်လိမ်-နှင့် သူတို့ရဲ့အရောင်-အပြာသို့မဟုတ်အနီရောင်ဖြင့်ပြုလုပ်နိုင်ပါတယ်။ ထိုအချိန်တွင်နက္ခတ္တဗေဒပညာရှင်တို့တွင်သမားရိုးကျသည်ပညာကိုကြောင်းလိမ်နဂါးငွေ့တန်းကျွန်ုပ်တို့၏နဂါးငွေ့တန်းများကဲ့သို့, (လူငယ်ကိုညွှန်း) အရောင်အတွက်အပြာတို့ဘဲဥပုံနဂါးငွေ့တန်း (အသက်ကြီးညွှန်ပြ) အနီရောင်ခဲ့ကြသည်ဖြစ်ခဲ့သည်။ Schawinski ဒီသမားရိုးကျသည်ပညာကိုသံသယ။ သူသည်ဤပုံမှန်မဟုတ်သောနဂါးငွေ့တန်း-ထိုမျှော်လင့်ထားသည့်ပုံစံ-သူရာမှတဆင့်လုပ်ငန်းစဉ်နှင့်ပတ်သက်ပြီးတစ်ခုခုသင်ယူနိုင် fit မသူတွေကိုအများကြီးလေ့လာနေဖွငျ့ဤပုံစံယေဘုယျတှငျစစျမှနျသောဖြစ်စေခြင်းငှါစဉ်ခြွင်းချက်တစ်ခုသာရှိပြီးအရေအတွက်ကိုဖြစ်ကောင်းရှိသံသယနှင့် နဂါးငွေ့တန်းကိုဖွဲ့စည်းခဲ့သည်။

ထို့ကြောင့်အဘယ်အရာကို Schawinski သမားရိုးကျသည်ပညာကိုမှောက်လှန်နိုင်ရန်အတွက်လိုအပ် morphologically လျှို့ဝှက်နဂါးငွေ့တန်း၏ကြီးမားသောထားရှိ၏ အကြောင်း, လိမ်သို့မဟုတ်ဘဲဥပုံဖြစ်စေအဖြစ်ခွဲခြားခဲ့နဂါးငွေ့တန်းဖြစ်ပါတယ်။ အဆိုပါပြဿနာ, သို့သော်, ခွဲခြားများအတွက်လက်ရှိ algorithmic နည်းလမ်းများသေးသိပ္ပံဆိုင်ရာသုတေသနအတွက်အသုံးပြုခံရဖို့လုံလောကျမကောငျးခဲ့ရ၏ တစ်နည်းအတွက်ခွဲခြားနဂါးငွေ့တန်းသောအချိန်တွင်ကွန်ပျူတာတွေအတွက်ခက်ခဲခဲ့ပါတယ်တဲ့ပြဿနာဖြစ်ခဲ့သည်။ ထို့ကြောင့်, ဘာလုပ်ဖို့လိုခဲ့သည်လူ့ -classified နဂါးငွေ့တန်း၏ကြီးမားသောအရေအတွက်ကဖြစ်ခဲ့သည်။ Schawinski တစ်ဘွဲ့ရကျောင်းသားတစ်ယောက်ရဲ့စိတ်အားထက်သန်မှုနှင့်အတူဤခွဲခြားပြဿနာပါသည်။ ခုနစျပါး 12-နာရီရက်ပေါင်းတစ်မာရသွန် session တစ်ခုမှာတော့သူ 50000 နဂါးငွေ့တန်းခွဲခြားနိုင်ခဲ့တယ်။ 50000 နဂါးငွေ့တန်းတွေအများကြီးကဲ့သို့မြည်စေခြင်းငှါနေစဉ်, ဒါကြောင့်အမှန်တကယ် Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်းများတွင်မှတ်တမ်းတင်ဓါတ်ပုံများရိုက်ကူးခဲ့သောတစ်သန်းနီးပါးနဂါးငွေ့တန်း၏ခန့်သာ 5% ဖြစ်ပါတယ်။ Schawinski သူတစ်ဦးထက်ပိုအရွယ်မှာချဉ်းကပ်မှုလိုအပ်ကြောင်းသဘောပေါက်လာတယ်။

ကံကောင်းထောက်မစွာ, ကနဂါးငွေ့တန်းရှိတာလေးတွေ၏ task ကိုနက္ခတ္တဗေဒအတွက်အဆင့်မြင့်လေ့ကျင့်ရေးမလိုအပ်ပါဘူးထွက်လှည့်; သငျသညျတော်တော်လေးလျင်မြန်စွာထိုသို့ပြုမှတစ်စုံတစ်ဦးကိုဆုံးမသွန်သင်နိုင်ပါတယ်။ ရှိတာလေးတွေနဂါးငွေ့တန်းကွန်ပျူတာတွေအတွက်ခက်ခဲခဲ့ကြောင်းအလုပ်တစ်ခုကိုပင်သော်လည်းအခြားစကားကြောင့်လူသားတော်တော်လွယ်ကူပါတယ်ခဲ့သည်။ ဒီတော့အောက်စဖို့, Schawinski နှင့်သူချင်းနက္ခတ္တဗေဒပညာရှင်ခရစ် Lintott တစ်ဦးအရက်ဆိုင်၌ထိုင်နေစဉ်စေတနာ့ဝန်ထမ်းနဂါးငွေ့တန်း၏ရုပ်ပုံများကိုခွဲခြားမယ်လို့ဘယ်မှာ website တစ်ခုဖွင့်အိပ်မက်ကိုမြင်မက်။ လအနည်းငယ်အကြာတွင်က Galaxy တိရစ္ဆာန်ရုံမွေးဖွားခဲ့သည်။

က Galaxy တိရစ္ဆာန်ရုံက်ဘ်ဆိုက်မှာစေတနာ့ဝန်ထမ်းသင်တန်းမိနစ်အနည်းငယ်ခံယူမယ်လို့; ဥပမာအားဖြင့်တစ်လိမ်ခြင်းနှင့်ဘဲဥပုံနဂါးငွေ့တန်း (ပုံ 5.2) အကြားခြားနားချက်သင်ယူခြင်း။ ဒီလေ့ကျင့်ရေးပြီးနောက်, တစ်ဦးချင်းစီစေတနာ့ဝန်ထမ်းထို့နောက်လူသိများခွဲခြားမှုနှင့်အတူ 11 15 နဂါးငွေ့တန်းခွဲခြားရိုးရှင်းသော web-based interface ကို (ပုံ 5.3) မှတဆင့်မသိသောနဂါးငွေ့တန်း၏အစစ်အမှန်ခွဲခြားစတင်မယ်လို့တစ်အတော်လေးလွယ်ကူပဟေဠိ-မှန်မှန်ကန်ကန်သွားခဲ့ရသည်။ စေတနာ့ဝန်ထမ်းထံမှနက္ခတ္တဗေဒပညာရှင်ဖို့အကူးအပြောင်းထက်နည်း 10 မိနစ်၌ ယူ. သာ, ရိုးရှင်းသောပဟေဠိအတားအဆီးနိမ့်ဆုံးဖြတ်သန်းလိုအပ်လိမ့်မယ်။

လိမ်ခြင်းနှင့်ဘဲဥပုံ: နဂါးငွေ့တန်း၏နှစ်ခုအဓိကအမျိုးအစားများဥပမာ: 5.2 ပုံ။ က Galaxy တိရစ္ဆာန်ရုံစီမံကိန်းကိုထက်ပို 900.000 ပုံရိပ်တွေခွဲခြားဖို့ထက်ပိုမို 100,000 စေတနာ့ဝန်ထမ်းကိုအသုံးပြုခဲ့သည်။ http://www.GalaxyZoo.org နှင့် Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်းထံမှခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်ပေး။

လိမ်ခြင်းနှင့်ဘဲဥပုံ: နဂါးငွေ့တန်း၏နှစ်ခုအဓိကအမျိုးအစားများဥပမာ: 5.2 ပုံ။ က Galaxy တိရစ္ဆာန်ရုံစီမံကိန်းကိုထက်ပို 900.000 ပုံရိပ်တွေခွဲခြားဖို့ထက်ပိုမို 100,000 စေတနာ့ဝန်ထမ်းကိုအသုံးပြုခဲ့သည်။ ကနေခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်လုပ်ခြင်း http://www.GalaxyZoo.org နှင့် Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်း

ပုံ 5.3: စေတနာ့ဝန်ထမ်းတစ်ခုတည်း image ကိုခွဲခြားဖို့တောင်းရာ Input ကိုမျက်နှာပြင်။ အဆိုပါ Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်းကနေပုံတစ်ပုံပေါ်အခြေခံပြီးက Chris Lintott ထံမှခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်ပေး။

ပုံ 5.3: စေတနာ့ဝန်ထမ်းတစ်ခုတည်း image ကိုခွဲခြားဖို့တောင်းရာ Input ကိုမျက်နှာပြင်။ မှပုံရိပ်တစ်ခုအပေါ်အခြေခံပြီးခရစ် Lintott ထံမှခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်လုပ်ခြင်း Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်း

စီမံကိန်းသတင်းဆောင်းပါးထဲမှာ featured ပြီးနောက်က Galaxy တိရစ္ဆာန်ရုံက၎င်း၏ကနဦးစေတနာ့ဝန်ထမ်းဆွဲဆောင်နှင့်အကြောင်းကိုခြောက်လအတွင်းစီမံကိန်းထက်ပိုမို 100,000 နိုင်ငံသားသိပ္ပံပညာရှင်များ, သူတို့က task ကိုခံစားခြင်းနှင့်သူတို့ကြိုတင်နက္ခတ္တဗေဒကူညီပေးခငျြသောကွောငျ့ပါဝင်ခဲ့သူတွေကိုပါဝင်မှကြီးပွားသတည်း။ အတူတကွဤ 100,000 စေတနာ့ဝန်ထမ်းအမျိုးအစားခွဲခြားမှုများအများစုပါဝင်သူများထဲမှတစ်ဦးအတော်လေးသေးငယ် core ကိုအုပ်စုတစုကနေလာမယ့်အတူ 40 ကျော်သန်းအမျိုးအစားခွဲခြားမှုစုစုပေါင်းလှူဒါန်းခဲ့သည် (Lintott et al. 2008)

အတှေ့အကွုံဘွဲ့ကြိုသုတေသနလက်ထောက်ငှားရမ်းသူသုတေသီများချက်ချင်းဒေတာအရည်အသွေးကိုအကြောင်းကိုသံသယဖြစ်လိမ့်မယ်။ ဒီသံသယကျိုးကြောင်းဆီလျော်ပေမယ့်က Galaxy တိရစ္ဆာန်ရုံစေတနာ့ဝန်ထမ်းပံ့ပိုးမှုများကိုမှန်မှန်ကန်ကန်, သန့်ရှင်း debiased နှင့်စုပေါင်းကြသောအခါ, သူတို့ကအရည်အသွေးမြင့်ရလဒ်များကိုထုတ်လုပ်နိုင်သည်ကိုပြသ (Lintott et al. 2008) ။ ပရော်ဖက်ရှင်နယ်အရည်အသွေး data တွေကိုဖန်တီးရန်လူစုလူဝေးရတဲ့အတှကျအရေးပါသောလှည့်ကွက်အများအပြားကွဲပြားခြားနားသောလူများကဖျော်ဖြေတူညီသောတာဝန်ရှိခြင်း, ထိုဖြစ်ပါသည်, redundancy ဖြစ်ပါတယ်။ က Galaxy တိရစ္ဆာန်ရုံမှာတော့နဂါးငွေ့တန်းနှုန်း 40 ခန့်ခွဲခြားမှုရှိပါ၏ ဘွဲ့ကြိုသုတေသနလက်ထောက်သုံးပြီးသုတေသီများ redundancy ၏ဤအဆင့်ကိုတတ်နိုင်ဘယ်တော့မှနိုင်ထို့ကြောင့်တစ်ဦးချင်းစီတဦးချင်းခွဲခြားများ၏အရည်အသွေးနှင့်အတူပိုပြီးစိုးရိမ်ပူပန်ရောက်ထားရန်လိုအပ်ပါတယ်လိမ့်မယ်။ အဆိုပါစေတနာ့ဝန်ထမ်းသင်တန်းရှိကြဘယ်အရာကိုသူတို့ redundancy နှင့်အတူတက်သည်တို့ကိုလည်းလုပ်လေ၏။

တောင်မှနဂါးငွေ့တန်းနှုန်းမျိုးစုံခွဲခြားမှုနှင့်အတူသို့သော်တစ်ဦးသဘောတူညီမှုခွဲခြားထုတ်လုပ်ရန်စေတနာ့ဝန်ထမ်းအမျိုးအစားခွဲခြားမှုများ set ကိုပေါင်းစပ်ပြီးလှည်ခဲ့ပါတယ်။ အလွန်ဆင်တူစိန်ခေါ်မှုများအရှိဆုံးလူ့တွက်ချက်မှုစီမံကိန်းများတွင်ပေါ်ထွန်းသောကြောင့်, ဒါကြောင့်အတိုချုပ်က Galaxy တိရစ္ဆာန်ရုံသုတေသီများဟာသူတို့ရဲ့သဘောတူညီမှုခွဲခြားမှုထုတ်လုပ်ရန်အသုံးပြုသောသောအဆင့်သုံးဆင့်ပြန်လည်သုံးသပ်ဖို့အထောက်အကူဖြစ်ပါတယ်။ ပထမဦးစွာသုတေသီအတုအယောင်ခွဲခြားမှုဖယ်ရှားခြင်းအားဖြင့်ဒေတာများ "သန့်ရှင်း" ။ ဥပမာအားဖြင့်, လူတွေကထပ်တလဲလဲတူညီသောနဂါးငွေ့တန်း-တစ်ခုခုသူတို့ရလဒ်-ခဲ့အပေါင်းတို့သည်မိမိတို့ခွဲခြားမှုစွန့်ပစ် manipulate ဖို့ကြိုးစားနေခဲ့ကြပါလျှင်ဖြစ်ပျက်မယ်လို့ခွဲခြားတဲ့သူ။ ဤသည်နှင့်အခြားအလားတူသန့်ရှင်းရေးအားလုံးခွဲခြားမှု၏အကြောင်းကို 4% ဖယ်ရှားခဲ့သည်။

ဒုတိယအချက်အသန့်ရှင်းရေးပြီးနောက်, သုတေသီများခွဲခြားမှုအတွက်စနစ်တကျဘက်လိုက်မှုဖယ်ရှားပစ်ရန်လိုအပ်ခဲ့ပါတယ်။ မူလစီမံကိန်းဥပမာအတွင်း embedded ဘက်လိုက်မှုထောက်လှမ်းလေ့လာမှုတစ်ခုစီးရီးမှတဆင့်မိုနိုခရုမ်အချို့စေတနာ့ဝန်ထမ်းကတော့ galaxy ဖေါ်ပြခြင်းအစားအရောင်-သုတေသီဘဲဥပုံနဂါးငွေ့တန်းအဖြစ်ဝေးလံသောကြောင်လိမ်နဂါးငွေ့တန်းခွဲခြားဖို့ထိုကဲ့သို့သောစနစ်တကျဘက်လိုက်မှုအဖြစ်အများအပြားစနစ်တကျဘက်လိုက်မှု, ရှာဖွေတွေ့ရှိ (Bamford et al. 2009) redundancy အလိုအလြောကျစနစ်တကျဘက်လိုက်မှုကိုမဖယ်ရှားပါဘူးကြောင့်ဤစနစ်တကျဘက်လိုက်မှုများအတွက်ချိန်ညှိအလွန်အရေးကြီးပါသည်; ကသာအကူအညီကျပန်းအမှားဖယ်ရှားပေးပါသည်။

နောက်ဆုံးအနေနဲ့ debiasing ပြီးနောက်, သုတေသီများတစ်ဦးသဘောတူညီမှုခွဲခြားထုတ်လုပ်နိုင်ရန်တစ်ဦးချင်းစီအမျိုးအစားခွဲခြားမှုပေါင်းစပ်ဖို့နည်းလမ်းလိုအပ်ခဲ့ပါတယ်။ အသီးအသီးကတော့ galaxy များအတွက်ခွဲခြားမှုပေါင်းစပ်ဖို့အရိုးရှင်းဆုံးနည်းလမ်းအသုံးအများဆုံးခွဲခြားရွေးချယ်ဖို့ကြပြီ။ သို့သော်ဤချဉ်းကပ်မှုပုံစံတစ်ခုချင်းစီကိုစေတနာ့ဝန်ထမ်းတန်းတူအလေးချိန်ပေးပြီမယ်လို့နှင့်သုတေသီအချို့စေတနာ့ဝန်ထမ်းအခြားသူများထက်ခွဲခြားမှာပိုကောင်းခဲ့သံသယရှိသူ။ ဒါကြောင့်သုတေသီများဟာအကောင်းဆုံး Classified detect သူတို့ကိုပိုပြီးအလေးချိန်ပေးရန်ကြိုးစားခဲ့တစ်ဦးပိုမိုရှုပ်ထွေးကြားမှာတွက်ဆလုပ်ထုံးလုပ်နည်းတီထွင်ထုတ်လုပ်နိုင်ခဲ့သည်။

ထို့ကြောင့်သုံးခြေလှမ်းဖြစ်စဉ်ကို-သန့်ရှင်းရေးပြီးနောက်, debiasing နှင့်တွက်ဆ-က Galaxy တိရစ္ဆာန်ရုံသုတေသနအဖွဲ့ကသဘောတူ morphological ခွဲခြားမှုအစုတခုသို့ 40 သန်းစေတနာ့ဝန်ထမ်းခွဲခြားမှုအဖြစ်ပြောင်းလဲခဲ့သည်။ ဤအက Galaxy တိရစ္ဆာန်ရုံအမျိုးအစားခွဲခြားမှုက Galaxy တိရစ္ဆာန်ရုံလာအောင်နှိုးဆွဖို့ကူညီပေးခဲ့ကွောငျး Schawinski အားဖြင့်ခွဲခြားအပါအဝင်ပရော်ဖက်ရှင်နယ်နက္ခတ္တဗေဒပညာရှင်တို့ကသုံးယခင်သေးငယ်-စကေးကြိုးစားမှုနှင့်အတူနှိုင်းယှဉ်ခဲ့ကြသည်အခါ, ခိုင်မာတဲ့သဘောတူညီချက်ရှိ၏။ ထို့ကြောင့်စေတနာ့ဝန်ထမ်း, စုစုပေါင်းအတွက်အရည်အသွေးမြင့်အမျိုးအစားခွဲခြားမှုများကိုတတ်နိုင်နှင့်သုတေသီများမကိုက်ညီနိုင်မယ့်အတိုင်းအတာမှာ (Lintott et al. 2008) ။ တကယ်တော့, နဂါးငွေ့တန်း၏ထိုကဲ့သို့သောကြီးမားအရေအတွက်လူ့ခွဲခြားမှုရှိခြင်းအသုံးပြုပုံ Schawinski, Lintott နှင့်အခြားနဂါးငွေ့တန်းသာ 80% ခန့်ဟာမျှော်လင့်ထားသည့်ပုံစံ-အပြာလိမ်နှင့်အနီရောင် elliptic-နှင့်မြောက်မြားစွာစာတမ်းများအကြောင်းကိုစာဖြင့်ရေးသားခဲ့ကြလိုကျနာကြောင်းပြသနိုင်ခဲ့တယ် ဒီရှာဖွေတွေ့ရှိမှု (Fortson et al. 2011)

ဒီနောက်ခံပေးထား, သငျသညျယခုက Galaxy တိရစ္ဆာန်ရုံ split-လျှောက်ထား-ပေါင်းစပ်စာရွက်အများစုလူ့တွက်ချက်မှုစီမံကိန်းများအတွက်အသုံးပြုကြောင်းတူညီသောစာရွက်အောက်ပါအတိုင်းဘယ်လိုမြင်နိုင်ပါသည်။ ပထမဦးစွာကြီးမားတဲ့ပြဿနာ Chunk သို့ခွဲထွက်သည်။ ဤကိစ္စတွင်ခုနှစ်, တစ်ဦးသန်းနဂါးငွေ့တန်းခွဲခြားများ၏ပြဿနာကိုတဦးတည်းနဂါးငွေ့တန်းခွဲခြားတစ်ဦးသန်းပြဿနာများကိုသို့ခွဲထွက်ခဲ့သည်။ ထို့နောက်တစ်ဦးစစ်ဆင်ရေးလွတ်လပ်စွာတစ်ခုချင်းစီကိုအတုံးမှလျှောက်ထားသည်။ ဤကိစ္စတွင်ခုနှစ်, စေတနာ့ဝန်ထမ်းလိမ်သို့မဟုတ်ဘဲဥပုံဖြစ်စေအဖြစ်တစ်ဦးချင်းစီကတော့ galaxy ခွဲခြား။ နောက်ဆုံးအနေနဲ့ရလဒ်တစ်ခုသဘောတူညီမှုရလဒ်ထုတ်လုပ်ရန်ပေါင်းစပ်နေကြသည်။ ဤကိစ္စတွင်ခုနှစ်, ပေါင်းစပ်ခြေလှမ်းဟာသန့်ရှင်းရေး, debiasing နှင့်တစ်ဦးချင်းစီနဂါးငွေ့တန်းတစ်ခုသဘောတူညီမှုခွဲခြားထုတ်လုပ်ရန်တွက်ဆပါဝင်သည်။ အများဆုံးစီမံကိန်းများကိုဒီယေဘုယျစာရွက်ကိုသုံးပါသော်လည်းတစ်ဦးချင်းစီခြေလှမ်းကိုင်တွယ်ခံရသီးခြားပြဿနာစိတ်ကြိုက်ခံရဖို့လိုအပ်ပါတယ်။ ဥပမာအားအောက်တွင်ဖော်ပြထားလူ့တွက်ချက်မှုစီမံကိန်းတွင်, တူညီတဲ့စာရွက်နောက်တော်သို့လိုက်ကြလိမ့်မည်, သို့သော်လျှောက်ထားခြင်းနှင့်ပေါင်းစပ်ခြေလှမ်းများအတော်လေးကွဲပြားခြားနားကြလိမ့်မည်။

က Galaxy တိရစ္ဆာန်ရုံအသင်းများအတွက်, ဒီပထမဦးဆုံးစီမံကိန်းကယ့်အစအဦးဖြစ်ခဲ့သည်။ အလွန်လျှင်မြန်စွာသူတို့တစ်ဦးသန်းနဂါးငွေ့တန်းနီးစပ်သူခွဲခြားနိုင်ခဲ့ကြတယ်သော်လည်း, ဒီစကေးနဲ့ပတ်သက်တဲ့ 10 ဘီလီယံနဂါးငွေ့တန်း၏ပုံရိပ်များထုတ်လုပ်နိုင်သည့်အသစ်များဒစ်ဂျစ်တယ်ကောင်းကင်ပြာစစ်တမ်းများနှင့်အတူအလုပ်လုပ်ရန်မလုံလောကျကြောင်းသဘောပေါက် (Kuminski et al. 2014) ။ 10000-က Galaxy တိရစ္ဆာန်ရုံ၏ 10 မှ 1 သန်းကနေတိုးကိုင်တွယ်ရန်ဘီလျံအချက်တစ်ခုအကြမ်းဖျင်း 10000 ဆပိုသင်တန်းသားများကိုစုဆောင်းဖို့လိုအပ်လိမ့်မယ်။ အင်တာနက်ပေါ်ရှိစတေနာ့ဝနျထမျးမြား၏အရအေတှကျကြီးမားသော်လည်း, ကအဆုံးမဲ့မဟုတ်ပါဘူး။ ဒါကြောင့်သုတေသီများသူတို့အချက်အလက်များ၏အစဉ်အဆက်-ကြီးထွားလာပမာဏကိုင်တွယ်ရန်သွားခဲ့ကြသည်လျှင်တစ်ဦးအသစ် ပို. ပင်၏အရွယ်မှာ, ချဉ်းကပ်မှုလိုအပ်ခဲ့သဘောပေါက်လာတယ်။

ထို့ကြောင့်, Manda အဘိဓါန် Schawinski, Lintott, နဲ့ Galaxy တိရစ္ဆာန်ရုံအဖွဲ့သည်အခြားအဖွဲ့ဝင်များနှင့်အတူ Banerji-အလုပ်လုပ် (2010) နဂါးငွေ့တန်းခွဲခြားရန်ကွန်ပျူတာများကိုဆုံးမဩဝါဒပေး -started ။ ပိုများသောအထူးသ, က Galaxy တိရစ္ဆာန်ရုံအသုံးပြုနေသူများကဖန်တီးလူ့ခွဲခြားမှုကိုအသုံးပြုပြီး, Banerji image ကို၏ဝိသေသလက္ခဏာများပေါ်အခြေခံပြီးတစ်ဦးကတော့ galaxy ၏လူ့ခွဲခြားကြိုတင်ခန့်မှန်းနိုင်မယ့်စက်သင်ယူမှုပုံစံကိုတည်ဆောက်ခဲ့သည်။ ဒီမော်ဒယ်မြင့်သောတိကျမှန်ကန်မှုနှင့်အတူလူ့ခွဲခြားမှုမျိုးပွားနိုင်လျှင်, ကနဂါးငွေ့တန်းတစ်ခုမရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့အရေအတွက်ကိုခွဲခြားဖို့က Galaxy တိရစ္ဆာန်ရုံသုတေသီများအသုံးပြုသောနိုငျသညျ။

ကြောင်းတူပထမတစ်ချက်မှာရှင်းရှင်းလင်းလင်းမဖြစ်စေခြင်းငှါ, ပေမယ့်အဆိုပါ Banerji ၏ core နဲ့လုပ်ဖော်ကိုင်ဘက်များ '' ချဉ်းကပ်မှု, အမှန်တကယ်လေ့လူမှုရေးသုတေသနများတွင်အသုံးပြုနည်းစနစ်ဖို့တော်တော်လေးဆင်တူသည်။ ပထမဦးစွာ Banerji နှင့်လုပ်ဖော်ကိုင်ဘက်များက၎င်း၏ဂုဏ်သတ္တိများအကျဉ်းချုပ်ကြောင်းကိန်းဂဏန်း features တွေအစုတခုသို့ချင်းစီပုံရိပ်ကိုပြောင်းလဲ။ ပုံသဏ္ဍာန်နှင့်အညီအပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် Non-အဖြူ pixels ကို၏အချိုးအစား: ဥပမာအားဖြင့်, နဂါးငွေ့တန်း၏ပုံရိပ်များအဘို့, သုံး features တွေရှိပေလိမ့်မည်။ မှန်ကန်သော features တွေ၏ရွေးချယ်ရေးပြဿနာရဲ့အရေးပါတဲ့အစိတ်အပိုင်းတစ်ခုဖြစ်တယ်, ဒါကြောင့်ယေဘုယျအားဖြင့်ဘာသာရပ်-ဧရိယာကျွမ်းကျင်မှုလိုအပ်သည်။ အများအားအင်္ဂါရပ်အင်ဂျင်နီယာ, ပုံရိပ်နှုန်းတဦးတည်းအတန်းနဲ့ဒေတာ matrix ကိုအတွက်ရလဒ်တွေကိုနှင့်ပုံရိပ်ကိုဖော်ပြပြီးတော့သုံးကော်လံကိုခေါ်ဒါကပထမဦးဆုံးခြေလှမ်း။ ဒေတာ matrix နှင့်တပ်မက်လိုချင်သောအထွက် (ဥပမာ image ကိုတစ်ဦးဘဲဥပုံနဂါးငွေ့တန်းအဖြစ်လူသားတစ်ဦးခြင်းဖြင့်ခွဲခြားခဲ့ပါသည်ရှိမရှိ) ပေးထားသောအဆိုပါသုတေသနပညာရှင်တစ်ဦးစာရင်းအင်းသို့မဟုတ်စက်သင်ယူမှုပုံစံ-ဥပမာ, ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်-သော features တွေပေါ်အခြေခံပြီးလူ့ခွဲခြားဟောကိန်းထုတ်ဖန်တီး ပုံရဲ့။ နောက်ဆုံးတွင်သုတေသီအသစ်ကနဂါးငွေ့တန်း (ပုံ 5.4) ၏ခန့်မှန်းခြေခွဲခြားမှုထုတ်လုပ်ရန်ဒီစာရင်းအင်းမော်ဒယ်အတွက် parameters များကိုအသုံးပြုသည်။ စက်သင်ယူမှုအတွက်, ဒီချဉ်းကပ်မှု-သုံးပြီးထို့နောက်အချက်အလက်အသစ်ကို-ဖြစ်ပါတယ်ကြီးကြပ်သင်ယူမှုကိုခေါ်တံဆိပ်ကပ်နိုငျသောပုံစံကိုဖန်တီးရန်ဥပမာတံဆိပ်ကပ်။

ပုံ 5.4: ဘယ်လို Banerji et al ၏ရိုးရှင်းဖော်ပြချက်။ (2010) ကတော့ galaxy ခွဲခြားလုပ်ဖို့စက်သင်ယူမှုပုံစံကိုလေ့ကျင့်ပေးဖို့က Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုခဲ့သည်။ နဂါးငွေ့တန်း၏ပုံများ features တွေတစ် matrix ကိုအတွက်ပြောင်းလဲခဲ့ကြသည်။ ဒီရိုးရှင်းတဲ့ဥပမာမှာသုံး features တွေပါ (ပုံတွင်အပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် nonwhite pixels ကို၏အချိုးအစား) ရှိပါတယ်။ ထို့နောက်ပုံရိပ်တွေ၏အပိုင်းတစ်ပိုင်းကိုသာလျှင်အဘို့, က Galaxy တိရစ္ဆာန်ရုံတံဆိပ်များတစ်စက်သင်ယူမှုပုံစံကိုလေ့ကျင့်ပေးဖို့အသုံးပြုကြသည်။ နောက်ဆုံးအနေနဲ့စက်သင်ယူမှုကျန်ရှိနေသေးသောနဂါးငွေ့တန်းများအတွက်ခွဲခြားမှုကိုခန့်မှန်းရန်အသုံးပြုသည်။ မဟုတ်ဘဲလူသားမြားသညျပြဿနာတစ်ခုဖြေရှင်းရှိခြင်းထက်, ကလူသားမြားသညျထိုပြဿနာကိုဖြေရှင်းနိုင်မယ့်ကွန်ပျူတာလေ့ကျင့်ရန်အသုံးပြုနိုင်မယ့် Datasets တည်ဆောက်ရှိပါတယ်, ဘာဖြစ်လို့လဲဆိုတော့ကျွန်မကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာစီမံကိန်းကိုဒီကိုခေါ်ပါ။ ဒီကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာစနစ်၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကို အသုံးပြု. အချက်အလက်များ၏မရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွဖြစ်ပါတယ်။ Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်းထံမှခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်ပေးနဂါးငွေ့တန်း၏ပုံများ။

ပုံ 5.4: ဘယ်လိုရိုးရှင်းဖော်ပြချက် Banerji et al. (2010) ကတော့ galaxy ခွဲခြားလုပ်ဖို့စက်သင်ယူမှုပုံစံကိုလေ့ကျင့်ပေးဖို့က Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုခဲ့သည်။ နဂါးငွေ့တန်း၏ပုံများ features တွေတစ် matrix ကိုအတွက်ပြောင်းလဲခဲ့ကြသည်။ ဒီရိုးရှင်းတဲ့ဥပမာမှာသုံး features တွေပါ (ပုံတွင်အပြာ၏ပမာဏ, အ pixels ကို၏အရောင်အဝါအတွက်ကှဲလှဲနှင့် nonwhite pixels ကို၏အချိုးအစား) ရှိပါတယ်။ ထို့နောက်ပုံရိပ်တွေ၏အပိုင်းတစ်ပိုင်းကိုသာလျှင်အဘို့, က Galaxy တိရစ္ဆာန်ရုံတံဆိပ်များတစ်စက်သင်ယူမှုပုံစံကိုလေ့ကျင့်ပေးဖို့အသုံးပြုကြသည်။ နောက်ဆုံးအနေနဲ့စက်သင်ယူမှုကျန်ရှိနေသေးသောနဂါးငွေ့တန်းများအတွက်ခွဲခြားမှုကိုခန့်မှန်းရန်အသုံးပြုသည်။ မဟုတ်ဘဲလူသားမြားသညျပြဿနာတစ်ခုဖြေရှင်းရှိခြင်းထက်, ကလူသားမြားသညျထိုပြဿနာကိုဖြေရှင်းနိုင်မယ့်ကွန်ပျူတာလေ့ကျင့်ရန်အသုံးပြုနိုင်မယ့် Datasets တည်ဆောက်ရှိပါတယ်, ဘာဖြစ်လို့လဲဆိုတော့ကျွန်မကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာစီမံကိန်းကိုဒီကိုခေါ်ပါ။ ဒီကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာစနစ်၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကို အသုံးပြု. အချက်အလက်များ၏မရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွဖြစ်ပါတယ်။ ကနေခွင့်ပြုချက်အားဖြင့်ပြန်ထုတ်ပေးနဂါးငွေ့တန်း၏ပုံများ Sloan ဒစ်ဂျစ်တယ်က Sky စစ်တမ်း

Banerji နှင့်လုပ်ဖော်ကိုင်ဖက်များက '' စက်သင်ယူမှုပုံစံအတွက် features တွေငါ့အကစားစရာဥပမာ-ဘို့ဥပမာထဲမှာများထက်ပိုမိုရှုပ်ထွေးခဲ့ကြသည်သူမက "ဟု de Vaucouleurs axial အချိုး fit" ကဲ့သို့ features တွေကိုအသုံးပြုသူမ၏မော်ဒယ်လ်ကတညျးကအတုအာရုံကြောကွန်ယက်ကိုခဲ့ပါတယ်, ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မဟုတ်ခဲ့ပေ။ သူမ၏အင်္ဂါရပ်များ, သူမ၏မော်ဒယ်နှင့်သဘောတူညီမှုသည် Galaxy တိရစ္ဆာန်ရုံခွဲခြားမှုကိုအသုံးပြုပြီးသူမအသီးအသီးအင်္ဂါရပ်အပေါ်အလေးဖန်တီး, ပြီးတော့နဂါးငွေ့တန်းများ၏ခွဲခြားအကြောင်းကိုဟောကိန်းများစေဤအလေးသုံးစွဲဖို့နိုင်ခဲ့သည်။ ဥပမာအားဖြင့်, သူမ၏ခွဲခြမ်းစိတ်ဖြာနိမ့်နှင့်အတူပုံရိပ်တွေ "ဟု de Vaucouleurs axial အချိုး fit" လိမ်နဂါးငွေ့တန်းဖြစ်ဖို့ပိုဖွယ်ရှိကြောင်းတွေ့ရှိခဲ့ရသည်။ ဤအလေးပေးထားသူမကကျိုးကြောင်းဆီလျော်မှန်ကန်မှုနဲ့နဂါးငွေ့တန်းများ၏လူ့ခွဲခြားကြိုတင်ခန့်မှန်းနိုင်ခဲ့တယ်။

Banerji နှင့်လုပ်ဖော်ကိုင်ဖက်များ၏လုပျငနျးကျွန်မကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာ system ကိုခေါ်ပါလိမ့်မယ်အဘယျသို့သို့က Galaxy တိရစ္ဆာန်ရုံလှည့်။ ထိုအမျိုးစပ်စနစ်များကိုစဉ်းစားရန်အကောင်းဆုံးနည်းလမ်းအစားလူသားတှေဟာပြဿနာကိုဖြေရှင်းဖို့ရှိခြင်းထက်ကြောင်းဖြစ်တယ်, သူတို့သညျလူသားတို့ပြဿနာကိုဖြေရှင်းနိုင်မယ့်ကွန်ပျူတာလေ့ကျင့်ပေးဖို့သုံးနိုငျတဲ့ Datasets တည်ဆောက်ရှိသည်။ တစ်ခါတစ်ရံထိုပြဿနာကိုဖြေရှင်းနိုင်မယ့်ကွန်ပျူတာသင်တန်းပေးဥပမာအများကြီးလိုအပ်နှင့်ဥပမာတစ်ခုလုံလောက်သောအရေအတွက်ကထုတ်လုပ်နိုင်ရန်တစ်ခုတည်းသောနည်းလမ်းဟာအစုလိုက်အပြုံလိုက်ပူးပေါင်းဖြစ်ပါတယ်နိုင်ပါတယ်။ ဒီကွန်ပျူတာ-ကူညီချဉ်းကပ်၏အားသာချက်ကလူ့ကြိုးစားအားထုတ်မှုသာကနျ့ငွေပမာဏကို အသုံးပြု. အချက်အလက်များ၏မရှိမဖြစ်လိုအပ်တဲ့အဆုံးမဲ့ပမာဏကိုင်တွယ်ရန်သင့်အားဖွဖြစ်ပါတယ်။ ဥပမာအားဖြင့်, တစ်ဦးသန်းလူ့ခွဲခြားနဂါးငွေ့တန်းနှင့်အတူတစ်သုတေသီထို့နောက်တစ်ဘီလီယံသို့မဟုတ်ပင်တစ်ထရီလီယံနဂါးငွေ့တန်းခွဲခြားဖို့အသုံးပြုနိုင်မယ့်ကြိုတင်ခန့်မှန်းချက်မော်ဒယ်တည်ဆောက်နိုင်ပါတယ်။ နဂါးငွေ့တန်း၏ကြီးမားနံပါတ်များရှိပါတယ်လျှင်, လူ့-ကွန်ပျူတာဟိုက်ဘရစ်ဒီလိုမျိုးတကယ်သာဖြစ်နိုင်ပါဖြေရှင်းချက်ဖြစ်ပါသည်။ ဤသည်အဆုံးမဲ့အပေါ်တွင်ကျွမ်းကျင်ပိုင်နိုင်မှုသို့သော်အခမဲ့မဟုတ်ပါဘူး။ မှန်ကန်စွာလူ့ခွဲခြားမှုမျိုးပွားနိုင်သောတည်ဆောက်ခြင်းတစ်စက်သင်ယူမှုမော်ဒယ်လ်တစ်ဦးခက်ပြဿနာသူ့ဟာသူဖြစ်တယ်, ဒါပေမဲ့ကံကောင်းထောက်မစွာဤခေါင်းစဉ်မှဆက်ကပ်အပ်နှံအလွန်အစွမ်းထက်တဲ့စာအုပ်တွေပြီးသားရှိပါတယ် (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013)

က Galaxy တိရစ္ဆာန်ရုံလူ့တွက်ချက်မှုစီမံကိန်းများကိုတဖြည်းဖြည်းတိုးတက်ပြောင်းလဲမည်မျှကောင်းတစ်ခုပုံဥပမာဖြစ်ပါတယ်။ ပထမဦးစွာတစ်သုတေသီသူ့ကိုယ်သူသို့မဟုတ်သုတေသနလက်ထောက် (ဥပမာ Schawinski ရဲ့ကနဦးခွဲခြားအားထုတ်မှု) ၏သေးငယ်တဲ့အသင်းနှင့်အတူစီမံကိန်းကြိုးစားနေ။ ဒီချဉ်းကပ်နည်းကိုကောင်းစွာစကေးမပါဘူးဆိုရင်, ထိုသုတေသနပညာရှင်အများအပြားပါဝင်သူများနှင့်အတူလူသားတစ်ဦးကွန်ပျူတာစီမံကိန်းကိုပြောင်းရွှေ့နိုင်ပါတယ်။ ဒါပေမယ့်အချက်အလက်များ၏တစ်ဦးအခြို့သောအသံအတိုးအကျယ်အဘို့, စင်ကြယ်သောလူ့ကြိုးစားအားထုတ်မှုလုံလောက်အောင်ဖြစ်လိမ့်မည်မဟုတ်ပေ။ ထိုအခြိနျတှငျ, သုတေသီများလူ့ခွဲခြားမှုထို့နောက်အချက်အလက်များ၏နီးပါးန့်အသတ်ပမာဏအသုံးချနိုင်မယ့်စက်သင်ယူမှုပုံစံကိုလေ့ကျင့်ရန်အသုံးပြုသည့်အတွက်ကွန်ပျူတာ-ကူညီလူ့ကွန်ပျူတာ system ကိုတည်ဆောက်ရန်လိုအပ်သည်။