5.3.1 Netflix နဲ့ဆု

အဆိုပါ Netflix နဲ့ Prize ကိုလူတွေကြိုက်နှစ်သက်လိမ့်မည်သည့်ရုပ်ရှင်ကြိုတင်ခန့်မှန်းဖို့ပွင့်လင်းခေါ်ဆိုခကိုအသုံးပြုပါတယ်။

အများဆုံးလူသိများတဲ့ပွင့်လင်းခေါ်ဆိုခစီမံကိန်းသည် Netflix နဲ့ဆုဖြစ်ပါတယ်။ Netflix နဲ့အွန်လိုင်းမှရုပ်ရှင်ငှားရမ်းသည့်ကုမ္ပဏီဖြစ်ပြီး, 2000 ခုနှစ်က Cinematch, ဖောက်သည်ရုပ်ရှင်တွေအထူးအကြံပြုလိုတယ်တဲ့ဝန်ဆောင်မှုစတင်ဆောင်ရွက်ခဲ့သည်။ ဥပမာအားဖြင့်, Cinematch သင်သည်သို့ပြန်သွားရန် Star Wars နဲ့အင်ပါယာသတိပေးချက်များကြိုက်တယ်ကြောင်းသတိထားမိပြီးတော့သင် Jedi ၏သို့ပြန်သွားသည်ကိုစောင့်ကြည့်ဖို့အကြံပြုလိုပါတယ်ပေလိမ့်မည်။ အစပိုင်းမှာ Cinematch ညံ့ဖျင်းအလုပ်လုပ်ခဲ့ပါတယ်။ သို့သော်နှစ်ပေါင်းများစွာ၏သင်တန်းကျော်, Cinematch ဖောက်သည်မွေ့လျော်မယ်လို့အဘယျသို့ရုပ်ရှင်တွေကြိုတင်ခန့်မှန်းရန်၎င်း၏စွမ်းရည်တိုးတက်လာဖို့ကဆက်လက်ပြောကြားသည်။ 2006 အသုံးပြုပုံသို့သော် Cinematch အပေါ်တိုးတက်မှု plateaued ။ Netflix ဟာမှာသုတေသီတွေကသူတို့စဉ်းစားနိုင်တာအရာအားလုံးကြိုးစားခဲ့ခဲ့ပေမယ့်တစ်ချိန်တည်းမှာသူတို့ကသူတို့ရဲ့ system ကိုတိုးတက်ကောင်းမွန်အောင်ကူညီစေခြင်းငှါအခြားအတွေးအခေါ်များရှိသံသယရှိသူ။ တစ်ပွင့်လင်းခေါ်ဆိုခ: ထို့ကြောင့်သူတို့က, အချိန်, ဘာအတူအစွန်းရောက်ဖြေရှင်းချက်ထလာ၏။

အ Netflix နဲ့ဆု၏နောက်ဆုံးအောင်မြင်မှုကိုမှဝေဖန်ဖွင့်ခေါ်သံဒီဇိုင်းရေးဆွဲခဲ့ပုံကြီးနှင့်ဤပုံစံဒီဇိုင်းလူမှုရေးသုတေသနအတွက်သုံးနိုင်တယ်ဘယ်လောက်ပွင့်လင်းခေါ်ဆိုမှုများအတွက်အရေးကြီးသောသင်ခန်းစာတွေရှိတယ်။ Netflix နဲ့ပဲသူတို့ပထမဦးဆုံးအနေနဲ့ပွင့်လင်းခေါ်ဆိုခဆင်ခြင်သောအခါများစွာသောလူမြင်ယောင်အဘယ်သို့သောအရာ, စိတ်ကူးများတစ်ခုပျက်ပြင်ဆင်ထားသညတောင်းဆိုချက်ထုတ်မထားခဲ့ပါဘူး။ အဲဒီအစား, Netflix နဲ့ရိုးရှင်းတဲ့အကဲဖြတ်စံနှုန်းများနှင့်အတူရှင်းလင်းပြတ်သားတဲ့ပြဿနာ စုပေါင်း. : သူတို့ 3 သန်းကျင်းပထွက် ratings (အသုံးပြုသူများကိုဖန်ဆင်းတော်မူ၏ပေမယ် Netflix ဟာမလွှတ်ဘဲခဲ့ကွောငျး ratings) ကြိုတင်ခန့်မှန်းဖို့က 100 သန်းရုပ်ရှင် ratings တစ် set ကိုအသုံးပြုလူတွေကိုစိန်ခေါ်လိုက်တယ်။ Cinematch 1 သန်းဒေါ်လာအနိုင်ရမယ်လို့ထက် 10% ပိုမို 3 သန်းကျင်းပထွက် ratings ကြိုတင်ခန့်မှန်းနိုင်ကြောင်းထားတဲ့ algorithm ကိုဖန်တီးနိုင်သူမည်သူမဆို။ ဒီရှင်းရှင်းလင်းလင်းနဲ့ကျင်းပထွက် ratings-ရည်ရွယ်ထို Netflix နဲ့ Prize ကိုဖြေရှင်းချက် generate ထက်စစျဆေးဖို့ပိုမိုလွယ်ကူဖြစ်ကြောင်းထိုကဲ့သို့သောလမ်းအတွက်ရှုမြင်သုံးသပ်ကြခဲ့ကွောငျးမှအကဲဖြတ်စံ-နှိုင်းယှဉ်ဟောကိန်းထုတ် ratings လျှောက်ထားရန်လွယ်ကူသော; ဒါဟာပွင့်လင်းခေါ်ဆိုမှုအတွက်သင့်လျော်သောပြဿနာတစ်ခုသို့ Cinematch တိုးတက်လာ၏စိန်ခေါ်မှုလှည့်။

2006 ခုနှစ်၏အောက်တိုဘာလအတွက်, Netflix ဟာ (ကျွန်တော်တို့အခန်း 6 မှာဒီဒေတာကိုလွှတ်ပေးရန်၏ privacy ကိုသက်ရောက်မှုတွေကိုစဉ်းစားမည်) အကြောင်းနှင့် ပတ်သက်. 500,000 ဖောက်သည်ထံမှသန​​်း 100 ရုပ်ရှင် ratings င်တစ်ဦး Datasets ထုတ်ပြန်ခဲ့သည်။ အဆိုပါ Netflix နဲ့ဒေတာ 20000 ရုပ်ရှင်အားဖြင့်ခန့်မှန်းခြေအားဖြင့် 500,000 ဖောက်သည်သောကြီးမားသော matrix ကိုအဖြစ် conceptualized နိုင်ပါသည်။ ဒီ matrix ကိုအတွင်းမှာပဲ, 1 ကနေ 5 ကြယ်များ (စားပွဲတင် 5.2) အားတစ်စကေးအပေါ်အကြောင်းကိုသန်း 100 ratings ရှိကြ၏။ အဆိုပါစိန်ခေါ်မှု 3 သန်းကျင်းပထွက် ratings ကြိုတင်ခန့်မှန်းဖို့ matrix ကိုအတွက်လေ့လာဒေတာကိုသုံးပါဖို့ပဲ။

စားပွဲတင် 5.2: အ Netflix နဲ့ Prize ကိုမှအချက်အလက်များ၏သိထား။ Netflix ဟာ 20,000 ရုပ်ရှင်အပေါ် 500,000 ဖောက်သည်များကထောက်ပံ့ပေးအကြောင်းကိုသန်း 100 ratings (5 ကြယ်များ 1 မှကြယ်ပွင့်) လွတ်လာ။ အ Netflix နဲ့ဆု၏ရည်မှန်းချက်အဖြစ်ပြသ 3 သန်းရုပ်ရှင်၏ကျင်းပခဲ့ထွက် ratings ကြိုတင်ခန့်မှန်းဖို့ကဤ ratings သုံးစွဲဖို့ပါပဲ "?" ။ အ Netflix နဲ့ဆုအတွက်သင်တန်းသားများအားဖြင့်တင်သွင်းခန့်မှန်း ratings အကျင်းပခဲ့ထွက် ratings နှင့်နှိုင်းယှဉ်ခဲ့ကြသည်။ ငါအခန်း 6 မှာဒီဒေတာကိုလွှတ်ပေးရန်ပတျဝနျးကငျြအကျင့်ဝတ်ဆိုင်ရာကိစ္စရပ်များကိုဆွေးနွေးကြမည်။
Movie, 1 Movie, 2 Movie, 3 ။ ။ ။ Movie, 20000
ဖုန်းဆက်သူ 1 2 5 ?
ဖုန်းဆက်သူ 2 2 ? 3
ဖောက်သည် 3 ? 2
။ ။ ။
ဖောက်သည် 500,000 ? 2 1

ကမ္ဘာတဝှမ်းသုတေသီများနှင့်ဟက်ကာများစိန်ခေါ်မှုမှရေးဆွဲခဲ့ကြ, နှင့် 2008 ခုနှစ်များကထက်ပိုမို 30,000 လူများကအလုပ်လုပ်ခဲ့ကြ (Thompson 2008) ။ ပြိုင်ပွဲ၏သင်တန်းကျော်, Netflix ဟာ 5000 ကျော်သင်းကနေထက်ပိုမို 40,000 အဆိုပြုဖြေရှင်းချက်လက်ခံရရှိ (Netflix 2009) ။ သိသာထင်ရှားတဲ့ Netflix နဲ့သမျှသောဤအဆိုပြုထားသောဖြေရှင်းနည်းများဖတ်ခြင်းနှင့်နားမလည်နိုင်။ ထိုဖြေရှင်းချက်စစျဆေးဖို့လွယ်ကူသောကြောင့်တပြင်လုံးကိုအရာ, သို့သော်, ချောချောမွေ့မွေ့ပြေးလေ၏။ Netflix နဲ့့ကွန်ပျူတာ (သူတို့အသုံးပြုတဲ့အထူးသဖြင့်မက်ထရစ်ယုတ်နှစ်ထပ်အမှား၏တစ်စတုရန်းအမြစ်ခဲ့) တဲ့ Pre-သတ်မှတ်ထားသောမက်ထရစ်အားဖြင့်ကျင်းပထွက် ratings ဖို့ခန့်မှန်း ratings နှိုင်းယှဉ်တယ်။ ဒါဟာလျင်မြန်စွာကောင်းသောစိတ်ကူးများအချို့သောအံ့သြစရာသောအရပ်တို့ကိုမမှလာသောကြောင့်, အရေးကြီးသောဖြစ်ထွက်လှည့်သောလူတိုင်းကနေဖြေရှင်းချက်ကိုလက်မခံဖို့ Netflix နဲ့ enabled ကြောင်းဖြေရှင်းချက်အကဲဖြတ်ဖို့ဒီစွမ်းရည်ခဲ့သည်။ တကယ်တော့အနိုင်ရတဲ့ဖြေရှင်းချက်မျှကြိုတင်အတှေ့အကွုံအဆောက်အဦရုပ်ရှင်ထောက်ခံချက်စနစ်များခဲ့သုံးသုတေသီများအားဖြင့်စတင်ခဲ့အဖွဲ့တစ်ဖွဲ့ကတင်ပြခဲ့သည် (Bell, Koren, and Volinsky 2010)

အ Netflix နဲ့ဆုတစ်ခုမှာလှပသောရှုထောင့်ကသူတို့ဖြေရှင်းချက်မျှမျှတတအကဲဖြတ်ရှိသည်ဖို့လောကရှိလူတိုင်း enabled ဖြစ်ပါတယ်။ လူတို့သည်မိမိတို့ခန့်မှန်း ratings အပ်လုဒ်လုပ်ထားတဲ့အခါသူတို့သူတို့ကိုယ်သူတို့ ပတ်သက်. ၎င်းတို့၏ပညာသင်နှစ်အထောက်အထားများ, သူတို့ရဲ့အသက်, လူမျိုး, ကျား, မ, လိင်, ဒါမှမဟုတ်ဘာမှ upload ရန်မလိုအပ်ခဲ့ပါဘူး။ ထို့ကြောင့်စတန်းဖို့ဒ်နေတဲ့နာမည်ကျော်ပါမောက္ခ၏ခန့်မှန်း ratings သူမ၏အိပ်ခန်းထဲမှာဆယ်ကျော်သက်ထံမှထိုအဖြစ်အတိအကျတူညီကုသခဲ့ကြသည်။ ကံမကောင်းစွာပဲ, ဒီအများဆုံးလူမှုရေးသုတေသနတွင်စစ်မှန်တဲ့မဟုတ်ပါဘူး။ ဒါကအများဆုံးလူမှုရေးသုတေသနများအဘို့, အကဲဖြတ်အလွန်အချိန်စားသုံးခြင်းနှင့်တစ်စိတ်တစ်ပိုင်းပုဂ္ဂလဒိဋ္ဖြစ်ပါသည်, ဖြစ်ပါတယ်။ ဒီတော့အများစုသုတေသနလုပ်ငန်းစိတ်ကူးများအလေးအနက်အကဲဖြတ်ဘယ်တော့မှကြသည်နှင့်အတွေးအခေါ်များအကဲဖြတ်ကြသောအခါထိုသို့စိတ်ကူးများ၏ဖန်ဆင်းရှင်ထံမှထိုအကဲဖြတ် detach ဖို့ခဲယဉ်းသည်။ ဖြေရှင်းချက်စစျဆေးဖို့လွယ်ကူသောကြောင့်, ပွင့်လင်းဖုန်းခေါ်ဆိုမှုသုတေသီများသူတို့သာကျော်ကြားပါမောက္ခကနေဖြေရှင်းချက်ထည့်သွင်းစဉ်းစားပါကအက်ကြောင်းကတဆင့်လဲကြလိမ့်မယ်လို့အပေါငျးတို့သအလားအလာအံ့သြဖွယ်ဖြေရှင်းချက်ဝင်ရောက်ဖို့ခွင့်ပြုပါ။

ဥပမာတစျခုမှာ screen ကိုနာမတျောကိုကိုရှိမုနျ Funk အတူ Netflix နဲ့ Prize ကိုတစ်စုံတစ်ဦးကနေစဉ်အတွင်း, သူ့ဘလော့ဂ်ပေါ်မှာအခြားသင်တန်းသားများအားဖြင့်ယခင်ကအသုံးပြုခဲ့ဘူးသော linear algebra တစ်ဦးထံမှချဉ်းကပ်မှုတစ်ခုအနည်းကိန်းရဲ့တန်ဖိုးကိုပြိုကွဲအပေါ်အခြေခံပြီးတစ်ဦးအဆိုပြုဖြေရှင်းချက်တင်ခဲ့သည်။ funk ရဲ့ blog post တစ်ပြိုင်တည်းနည်းပညာနှင့် weirdly အလွတ်သဘောခဲ့သည်။ ကောင်းတစ်ဦးဖြေရှင်းချက်ဖော်ပြဤ blog post ကိုဖြစ်ခဲ့သည်သို့မဟုတ်ပါကအချိန်အတိုင်းအတာတစ်ခုစွန့်ပစ်ခဲ့သလဲ တစ်ပွင့်လင်းခေါ်ဆိုခစီမံကိနျး၏အပြင်ဘက်တွင်ဖြေရှင်းချက်အလေးအနက်အကဲဖြတ်ခံရကြပြီဘယ်တော့မှအကြောင်းတည်း။ အားလုံးရှိမုနျကို Funk ပြီးနောက် Cal Tech မှသို့မဟုတ် MIT ကပါမောက္ခတစ်ဦးမဟုတ်ခဲ့, သူသည်အချိန်, နယူးဇီလန်ပတ်ပတ်လည် backpacking ခဲ့သူတစ်ဦးဆော့ဖ်ဝဲခဲ့ (Piatetsky 2007) ။ သူ Netflix ဟာမှာအင်ဂျင်နီယာတစ်ဦးမှဒီစိတ်ကူးမေးလ်ပို့ပေးခဲ့လျှင်၎င်းသည်နီးပါးဆက်ဆက်အလေးအနက်ထားခဲ့ကြလိမ့်မည်မဟုတ်ပေ။

ဆန်းစစ်သုံးသပ်ခြင်းစံလျှောက်ထားရန်ရှင်းရှင်းလင်းလင်းနဲ့လွယ်ကူသောကြောင့်ကံကောင်းထောက်မစွာ, မိမိအဟောကိန်းထုတ် ratings အကဲဖြတ်နှင့်သူ၏ချဉ်းကပ်မှုကအလွန်အစွမ်းထက်ကြောင်းကိုချက်ချင်းရှင်းရှင်းလင်းလင်းခဲ့ကြ၏သူသည်ယှဉ်ပြိုင်မှုအတွက်စတုတ္ထအရပ်မှတဟုန်ထိုးတစ်ကြီးမားတဲ့ရလဒ်အခြားအသင်းများပြီးသားဖြစ်ဘူးသောပေးထား ထိုပြဿနာအပေါ်လလောက်အလုပ်လုပ်။ အဆုံး၌, ရှိမုန် Funk ရဲ့ချဉ်းကပ်မှု၏အစိတ်အပိုင်းနီးပါးအားလုံးလေးနက်သောပြိုင်ဘက်များကအသုံးပြုခဲ့ကြသည် (Bell, Koren, and Volinsky 2010)

ရှိမုနျကို Funk မဟုတ်ဘဲလျှို့ဝှက်စောင့်ရှောက်ဖို့ကြိုးစားနေထက်, မိမိချဉ်းကပ်ရှင်းပြဘလော့ဂ်ပို့စ်ရေးဖို့ကို ရွေးချယ်. ဆိုတဲ့အချက်ကိုလည်း Netflix နဲ့ဆုအများအပြားသင်တန်းသားများကိုသီးသန့်ဒေါ်လာသန်းဆုချီးမြှင့်ခြင်းဖြင့်လှုံ့ဆော်ကြသည်မဟုတ်ကြောင်းဖော်ပြထားသည်။ အဲဒီအစား, များစွာသောသင်တန်းသားများကိုလည်းပညာတတ်စိန်ခေါ်မှုနှင့်ပြဿနာန်းကျင်ဖွံ့ဖြိုးသောလူမှုအသိုင်းအဝိုင်းခံစားသလိုပဲ (Thompson 2008) , ငါသည်များစွာသောသုတေသီများနားလညျနိုငျမျှော်လင့်ထားကြောင်းခံစားချက်တွေကို။

အဆိုပါ Netflix နဲ့ Prize ကိုတစ်ပွင့်လင်းခေါ်ဆိုခတစ်ဦးဂန္နမူနာဖြစ်ပါသည်။ Netflix ဟာတိကျတဲ့ပန်းတိုင်တစ်ခု (ရုပ်ရှင် ratings ခန့်မှန်း) နဲ့တစ်ဦးဆိုတဲ့မေးခွန်းကိုမေးခဲ့ကြတယ်နှင့်များစွာသောလူထံမှဖြေရှင်းချက်ကျရကြောင်း။ Netflix ဟာသူတို့ဖန်တီးဖို့ထက်အတည်ပြုရန်ဖို့ပိုပြီးလွယ်ကူ ရှိ. , နောက်ဆုံးမှာ Netflix ဟာအကောင်းဆုံးကိုဖြေရှင်းနည်းကောက်ယူသောကွောငျ့ဤသူအပေါင်းတို့ဖြေရှင်းချက်အကဲဖြတ်ရန်နိုင်ခဲ့သည်။ ထို့နောက်ငါသည်ဤတူညီတဲ့ချဉ်းကပ်မှုဇီဝဗေဒနှင့်ဥပဒေအတွက်အသုံးပြုနိုင်ပါတယ်သင်မည်သို့ပြပါလိမ့်မယ်။