5.3.1 Netflix နဲ့ဆု

အဆိုပါ Netflix နဲ့ Prize ကိုလူတွေကြိုက်နှစ်သက်လိမ့်မည်သည့်ရုပ်ရှင်ကြိုတင်ခန့်မှန်းဖို့ပွင့်လင်းခေါ်ဆိုခကိုအသုံးပြုပါတယ်။

အများဆုံးလူသိများတဲ့ပွင့်လင်းခေါ်ဆိုခစီမံကိန်းသည် Netflix နဲ့ဆုဖြစ်ပါတယ်။ Netflix ဟာအွန်လိုင်းရုပ်ရှင်ငှားရမ်းသည့်ကုမ္ပဏီဖြစ်ပြီး, 2000 ခုနှစ်က Cinematch, ဖောက်သည်များရုပ်ရှင်များအကြံပြုဖို့ဝန်ဆောင်မှုစတင်ဆောင်ရွက်ခဲ့သည်။ ဥပမာအားဖြင့်, Cinematch သင်သည်သို့ပြန်သွားရန် Star Wars နဲ့ The အင်ပါယာသတိပေးချက်များကြိုက်တယ်ကြောင်းသတိထားမိပြီးတော့သင် Jedi ၏ပြန်သွားစောင့်ကြည့်ဖို့အကြံပြုလိုပါတယ်ပေလိမ့်မည်။ အစပိုင်းမှာ Cinematch ညံ့ဖျင်းအလုပ်လုပ်ခဲ့ပါတယ်။ ဒါပေမယ့်နှစ်ပေါင်းများစွာ၏သင်တန်းကျော်ပါကဖောက်သည်ကိုခံစားမယ်လို့အဘယ်အရာကိုရုပ်ရှင်ကြိုတင်ခန့်မှန်းရန်၎င်း၏စွမ်းရည်ကိုတိုးတက်စေရန်ဆက်လက်ပြုလုပ်ခဲ့သည်။ 2006 by သို့သော် Cinematch အပေါ်တိုးတက်မှု plateaued ခဲ့သည်။ Netflix ဟာမှာသုတေသီများသူတို့စဉ်းစားနိုင်တော်တော်များများအရာအားလုံးကြိုးစားခဲ့ဖူးပေမယ့်, တစ်ချိန်တည်းမှာသူတို့ကသူတို့ရဲ့ system ကိုတိုးတက်ကောင်းမွန်အောင်ကူညီစေခြင်းငှါအခြားအစိတ်ကူးများရှိခဲ့ကြောင်းသံသယရှိ။ ပွင့်လင်းခေါ်ဆိုခ: ထို့ကြောင့်သူတို့က, အချိန်, ဘာနဲ့အစွန်းရောက်ဖြေရှင်းချက်ထလာ၏။

အဆိုပါ Netflix နဲ့ဆု၏နောက်ဆုံးအောင်မြင်မှုအရေးပါသည့်ပွင့်လင်းခေါ်ဆိုခဒီဇိုင်းရေးဆွဲခဲ့သည်ကိုမည်သို့ဖြစ်ခဲ့သည်, ဤဒီဇိုင်းလူမှုရေးသုတေသနအတွက်အသုံးပြုရနိုင်ပုံကိုပွင့်လင်းခေါ်ဆိုမှုများအတွက်အရေးကြီးသောသင်ခန်းစာများရှိပါတယ်။ Netflix နဲ့ပဲသူတို့ပထမဦးဆုံးအနေနဲ့ပွင့်လင်းခေါ်ဆိုခဆင်ခြင်သောအခါများစွာသောလူစိတ်ကူးကားအဘယ်သို့သောစိတ်ကူးများတစ်ခုပျက်ပြင်ဆင်ထားသညတောင်းဆိုမှုကိုထုတ်မထားခဲ့ပါဘူး။ အစား, Netflix နဲ့ရိုးရှင်းတဲ့အကဲဖြတ်လုပ်ထုံးလုပ်နည်းနှင့်အတူရှင်းလင်းပြတ်သားတဲ့ပြဿနာ စုပေါင်း. : သူတို့ 3 သန်းကျင်းပထွက် ratings (အသုံးပြုသူများကိုလုပ်ပေမယ့် Netflix နဲ့ဖြန့်ချိမခဲ့ကွောငျး ratings) ကြိုတင်ခန့်မှန်း 100 သန်းရုပ်ရှင် ratings အစုတခုသုံးစွဲဖို့လူတွေကိုစိန်ခေါ်ခဲ့သည်။ Cinematch တစ်ဦးသန်းဒေါ်လာအနိုင်ရမယ်လို့ထက် 10% ပိုကောင်း 3 သန်းကျင်းပထွက် ratings ဟောကိန်းထုတ်ထားတဲ့ algorithm ကိုဖန်တီးရန်ပထမဦးဆုံးပုဂ္ဂိုလ်တစ်ဦး။ ဤသည်ကိုရှင်းရှင်းလင်းလင်းနှင့်ကျင်းပထွက် ratings-ဓိပ်ပာပု Netflix နဲ့ Prize ကိုဖြေရှင်းချက် generate ထက်စစ်ဆေးဖို့ပိုပြီးလွယ်ကူခဲ့ထိုကဲ့သို့သောလမ်းအတွက်ရှုမြင်သုံးသပ်ကြခဲ့ကွောငျးနှင့်အတူအကဲဖြတ်လုပ်ထုံးလုပ်နည်း-နှိုင်းယှဉ်ဟောကိန်းထုတ် ratings လျှောက်ထားရန်လွယ်ကူသော; ဒါဟာပွင့်လင်းခေါ်ဆိုမှုသင့်လျော်သောပြဿနာတစ်ခုသို့ Cinematch တိုးတက်အောင်၏စိန်ခေါ်မှုလှည့်။

2006 ခုနှစ်အောက်တိုဘာလမှာတော့ Netflix ဟာ (ကျွန်တော်တို့အခနျးကွီး 6 ၌ဤဒေတာလွှတ်ရာ privacy ကိုဂယက်ရိုက်ထည့်သွင်းစဉ်းစားမည်) အကြောင်းကိုအကြောင်းကို 500,000 ဖောက်သည်ထံမှသန်း 100 ရုပ်ရှင် ratings င်တစ်ဦး Datasets ထုတ်ပြန်ခဲ့သည်။ အဆိုပါ Netflix နဲ့ဒေတာ 20000 ရုပ်ရှင်အားဖြင့်ခန့်မှန်းခြေအားဖြင့် 500,000 ဖောက်သည်သောကြီးမား matrix အဖြစ် conceptualized နိုင်ပါသည်။ ဒီ matrix ကိုအတွင်းမှာပဲတဦးတည်းမှငါးကြယ်များ (စားပွဲ 5.2) မှတစ်စကေးအပေါ်သန်း 100 လောက် ratings ရှိခဲ့သည်။ အဆိုပါစိန်ခေါ်မှု 3 သန်းကျင်းပထွက် ratings ကြိုတင်ခန့်မှန်းဖို့ matrix ကိုအတွက်စောင့်ကြည့်လေ့လာသည့်ဒေတာကိုသုံးပါဖို့ပဲ။

စားပွဲတင် 5.2: အ Netflix နဲ့ဆုအနေဖြင့်ဒေတာများ၏သိထား
movie, 1 movie, 2 movie, 3 ... movie, 20000
ဖောက်သည် 1 2 5 ... ?
ဖောက်သည် 2 2 ? ... 3
ဖောက်သည် 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
ဖောက်သည် 500,000 ? 2 ... 1

ကမ္ဘာတဝှမ်းသုတေသီများနှင့်ဟက်ကာများစိန်ခေါ်ရန်ရေးဆွဲခဲ့ကြ, နှင့် 2008 ခုနှစ်များကထက်ပိုမို 30000 ကလူပေါ်မှာအလုပ်လုပ်နေခဲ့ကြသည် (Thompson 2008) ။ ပြိုင်ပွဲ၏သင်တန်းကျော်, Netflix ဟာ 5000 ကျော်သင်းကနေထက်ပိုမို 40,000 အဆိုပြုထားဖြေရှင်းနည်းများကိုလက်ခံရရှိ (Netflix 2009) ။ သိသာထင်ရှားတဲ့ Netflix သမျှသောဤအဆိုပြုထားသောဖြေရှင်းချက်ကိုဖတ်ပြီးနှင့်နားမလည်နိုင်ဘူး။ အဆိုပါဖြေရှင်းချက်ကိုစစျဆေးဖို့လွယ်ကူပါတယ်ကြောင့်မြေတပြင်လုံးအရာ, သို့သော်, ချောချောမွေ့မွေ့ပြေးလေ၏။ Netflix ဟာကိုယ့်ကွန်ပျူတာတစ် prespecified မက်ထရစ်ကို အသုံးပြု. ကျင်းပထွက် ratings (သူတို့အသုံးပြုတဲ့အထူးသဖြင့်မက်ထရစ်ယုတ်၏စတုရန်းအမြစ်အမှားနှစ်ထပ်ခဲ့သည်) နှင့်အတူဟောကိန်းထုတ် ratings နှိုင်းယှဉ်တယ်။ ဒါဟာလျင်မြန်စွာကောင်းသောစိတ်ကူးများအချို့သောအံ့သြစရာသောအရပ်တို့ကိုမမှလာသောကြောင့်, အရေးကြီးသောဖြစ်ထွက်လှည့်အရာလူတိုင်းထံမှဖြေရှင်းချက်ကိုလက်မခံဖို့ Netflix နဲ့ enabled ကြောင်းဖြေရှင်းချက်အကဲဖြတ်ဖို့ဒီစွမ်းရည်ကိုဖြစ်ခဲ့သည်။ တကယ်တော့အနိုင်ရဖြေရှင်းချက်မျှကြိုတင်အတွေ့အကြုံကိုအဆောက်အဦရုပ်ရှင်ထောက်ခံချက်စနစ်များကိုသူသုံးသုတေသီများအားဖြင့်စတင်ခဲ့အဖွဲ့တစ်ဖွဲ့ကတင်ပြခဲ့ပါသည် (Bell, Koren, and Volinsky 2010)

အဆိုပါ Netflix နဲ့ဆုတစ်ခုမှာလှပသောရှုထောင့်ကမျှမျှတတအကဲဖြတ်ခံရဖို့အပေါငျးတို့သအဆိုပြုဖြေရှင်းချက် enabled သောကွောငျ့ဖွစျသညျ။ ဆိုလိုသည်မှာလူတို့သည်မိမိတို့ခန့်မှန်း ratings အပ်လုဒ်တင်ပြီးတဲ့အခါမှာသူတို့ကသူတို့ပညာရေးဆိုင်ရာအထောက်အထားများ, ၎င်းတို့၏အသက်, လူမျိုး, ကျား, မ, လိင်, ဒါမှမဟုတ်သူတို့ကိုယ်သူတို့အကြောင်းကိုဘာမှ upload တင်ရန်မလိုအပ်ခဲ့ဘူးသည်။ စတန်းဖို့ဒ်ကနေနာမည်ကြီးပါမောက္ခ၏ခန့်မှန်း ratings သူမ၏အိပ်ခန်းထဲမှာဆယ်ကျော်သက်ထံမှထိုအဖြစ်အတိအကျတူညီကုသခံခဲ့ရသည်။ ကံမကောင်းစွာပဲ, ဒီအများဆုံးလူမှုရေးသုတေသနတှငျစစျမှနျသောမဟုတ်ပါဘူး။ ဒါကအများဆုံးလူမှုရေးသုတေသနအဘို့, အကဲဖြတ်အလွန်အချိန်ကုန်ခြင်းနှင့်တစ်စိတ်တစ်ပိုင်းပုဂ္ဂလဒိဋ္ဖြစ်ပါသည်, ဖြစ်ပါတယ်။ ဒါကြောင့်အများစုသုတေသနစိတ်ကူးများအလေးအနက်ထားအကဲဖြတ်ဘယ်တော့မှနေကြပြီး, အတွေးအခေါ်များကိုအကဲဖြတ်ကြသောအခါကအတွေးအခေါ်များ၏ဖန်ဆင်းရှင်ထံမှထိုအကဲဖြတ် detach ရန်ခဲယဉ်းသည်။ သူတို့မဟုတ်ရင်လွဲချော်မည်ဖြစ်ကြောင်းစိတ်ကူးများရှာဖွေတွေ့ရှိနိုင်အောင်ပွင့်လင်းခေါ်ဆိုခစီမံကိန်းများ, အခြားတစ်ဖက်တွင်, လွယ်ကူပြီးတရားမျှတတဲ့အကဲဖြတ်ရှိသည်။

ဥပမာ, Netflix နဲ့ဆုကာလအတွင်းတဦးတည်းအချက်မှာ, မျက်နှာပြင်အမည်ရှိမုနျကို Funk နှင့်အတူတစ်စုံတစ်ယောက်သည်သူ၏ဘလော့ဂ်ပေါ်ရှိအခြားသင်တန်းသားများအားဖြင့်ယခင်ကအသုံးပြုခဲ့ဘူးသော linear algebra တစ်ဦးထံမှချဉ်းကပ်မှုတစ်ခုအနည်းကိန်းရဲ့တန်ဖိုးကိုပြိုကွဲအပေါ်အခြေခံပြီးတစ်ဦးအဆိုပြုဖြေရှင်းချက်တင်ခဲ့သည်။ funk ရဲ့ blog post: တစ်ပြိုင်နက်တည်းနည်းပညာနှင့် weirdly အလွတ်သဘောဖြစ်ခဲ့သည်။ အကောင်းတစ်ဖြေရှင်းချက်ဖော်ပြဤ blog post ကိုဖြစ်ခဲ့သည်သို့မဟုတ်ပါကအချိန်အတိုင်းအတာတစ်ခုစွန့်ပစ်ခဲ့သလဲ ပွင့်လင်းခေါ်ဆိုခစီမံကိန်း၏ပြင်, ဖြေရှင်းချက်အလေးအနက်အကဲဖြတ်ရရှိထားဘယ်တော့မှလိမ့်မယ်။ ပြီးနောက်အားလုံးရှိမုန် Funk MIT ကပါမောက္ခတစ်ဦးမဟုတ်ခဲ့, သူသည်အချိန်, နယူးဇီလန်န်းကျင် backpacking ခံခဲ့ရသူတစ် software ကို developer ခဲ့ (Piatetsky 2007) ။ သူ Netflix မှာအင်ဂျင်နီယာတစ်ဦးမှဒီစိတ်ကူးမေးလ်ပို့ပေးခဲ့လျှင်၎င်းသည်နီးပါးဆက်ဆက်ကိုဖတ်ရှုခဲ့ကြလိမ့်မည်မဟုတ်ပေ။

အဆိုပါအကဲဖြတ်စံလျှောက်ထားရန်ရှင်းပါတယ်လွယ်ကူသောကြောင့်ကံကောင်းထောက်မစွာ, မိမိအဟောကိန်းထုတ် ratings အကဲဖြတ်နှင့်သူ၏ချဉ်းကပ်နည်းဟာအလွန်အစွမ်းထက်ကြောင်းကိုချက်ချင်းရှင်းရှင်းလင်းလင်းခဲ့ကြ၏သူသည်ယှဉ်ပြိုင်မှုအတွက်စတုတ္ထနေရာအရပ်မှတဟုန်ထိုးတစ်ကြီးမားတဲ့ရလဒ်ကတခြားအသင်းတွေပြီးသားခဲ့ကြောင်းပေးထား ပြဿနာပေါ်လကြာအလုပ်လုပ်။ အဆုံး၌, သူ့ချဉ်းကပ်၏အစိတ်အပိုင်းများကိုလုံးဝနီးပါးအားလုံးလေးနက်ပြိုင်ဘက်များကအသုံးပြုခဲ့ကြသည် (Bell, Koren, and Volinsky 2010)

ရှိမုနျကို Funk မဟုတ်ဘဲလျှို့ဝှက်စောင့်ရှောက်ဖို့ကြိုးစားနေထက်, သူ့ချဉ်းကပ်နည်းကိုရှင်းပြနေတဲ့ဘလော့ဂ်ပို့စ်ရေးဖို့ကို ရွေးချယ်. ဆိုတဲ့အချက်ကိုလည်း Netflix နဲ့ဆုအများအပြားသင်တန်းသားများကိုသီးသန့်ဒေါ်လာသန်းဆုချီးမြှင့်ခြင်းဖြင့်လှုံ့ဆော်ကြသည်မဟုတ်ကြောင်းဖော်ပြသည်။ အဲဒီအစား, များစွာသောသင်တန်းသားများကိုလည်းပညာတတ်စိန်ခေါ်မှုနှင့်ပြဿနာန်းကျင်ဖွံ့ဖြိုးသောလူမှုအသိုင်းအဝိုင်းပျော်မွေ့ပုံ (Thompson 2008) , ငါသည်များစွာသောသုတေသီများနားလညျနိုငျမျှော်လင့်ထားကြောင်းခံစားချက်များကို။

အဆိုပါ Netflix နဲ့ Prize ကိုပွင့်လင်းခေါ်ဆိုခတစ်ဦးဂန္ဥပမာတစ်ခုဖြစ်သည်။ Netflix ဟာတိကျတဲ့ရည်မှန်းချက် (ရုပ်ရှင် ratings ခန့်မှန်း) နဲ့တစ်ဦးဆိုတဲ့မေးခွန်းကိုမေးခဲ့ကြတယ်နှင့်လူများစွာကနေဖြေရှင်းချက်ကျရကြောင်း။ Netflix ဟာသူတို့ဖန်တီးဖို့ထက်စစ်ဆေးဖို့ပိုပြီးလွယ်ကူ ရှိ. , နောက်ဆုံးမှာ Netflix ဟာအကောင်းဆုံးကိုဖြေရှင်းချက်ကောက်ယူသောကွောငျ့ဤအရာအလုံးစုံဖြေရှင်းချက်အကဲဖြတ်ရန်နိုင်ခဲ့သည်။ ထို့နောက်ငါသည်ဤတူညီတဲ့ချဉ်းကပ်ဇီဝဗေဒနှင့်ဥပဒေများတွင်အသုံးပြုနိုင်ပါတယ်သင်မည်သို့ပြပြီးဒေါ်လာသန်းဆုချီးမြှင့်ခြင်းမရှိဘဲပါလိမ့်မယ်။