5.3.1 Netflix Prize

Netflix Prize wuxuu isticmaalaa call u furan tahay in la saadaaliyo oo movies dadka jeclaan doonaa.

Mashruucan furan oo si wacan loo yaqaan waa furaha Netflix. Netflix waa shirkad kumbuyuutar ah oo lagu iibsado filimada, iyo sannadkii 2000 waxay bilaabatay Cinematch, oo ah adeeg loogu talagalay filimka macaamiisha. Tusaale ahaan, Cinematch waxay ogaaneysaa inaad jeceshahay Star Wars iyo Boqortooyada Dhibaatooyinka Dib-u-celinta kadibna kugula talineyso inaad daawato Jeedka . Ugu horreyn, Cinematch ayaa si xun u shaqeeyay. Hase yeeshee, muddada sanooyin badan, waxay sii waday in ay hagaajiso kartidooda si ay u saadaaliso waxa macaamiisha xiiseyn lahaa. Sannadkii 2006, si kastaba ha ahaatee, horumarinta Cinematch waxay dhigteen. Cilmi-baadhayaasha reer Netflix ayaa isku dayay wax walba oo ay ka fekeraan, laakiin, isla markaas waxay ka shakiyeen inay jiraan fikrado kale oo ka caawin kara inay hagaajiyaan nidaamkooda. Sidaa darteed, waxay la yimaadeen wixii dhacay, waqtigaas, xalka xag-jirnimada: wicitaan furan.

Feejignaan ah guusha kama dambaysta ah ee Netflix Prize waa sida wacitaanka furan loo naqshadeeyey, iyo naqshadahani waxay leeyihiin casharo muhiim ah sida loo isticmaalo wicitaanka furan ee loo adeegsan karo cilmi-baarista bulshada. Netflix ma aysan soo saarin codsi aan loo baahnayn oo fikrado ah, taas oo ah dad badan oo malaynaya marka ugu horeysa ee ay tixgeliyaan wicitaan furan. Dhinaca kale, Netflix waxay dhibaato ka muuqatay nidaam qiimeyn oo sahlan: waxay ku adkeeyeen dadka in ay isticmaalaan 100 malyan oo qiimeyn oo filim ah si ay u saameeyaan qiimeynta 3 malyuun oo lagu qabtay (dhibcaha ay isticmaalaan dadka laakiin ayan sii daynin Netflix). Qofka ugu horreeya ee abuura algorithm oo saadaaliyay 3 milyan oo ka mid ah qiimeynta 10% oo ka fiican Cinematch ayaa ku guuleysan lahaa malaayiin doolar. Tani waa mid cad oo sahlan in lagu dabaqo habraaca qiimaynta-marka la barbardhigo qiimeynta la saadaaliyay ee qiimayaasha la bixiyay-macnaheedu waa in Netflix Prize loo qaabeeyey si habsami ah ay u sahlanaato in la hubiyo intii ka dhalatay; waxay u jeestay caqabadda horumarinta cinwaanka cinwaanka dhibaatada ku habboon wicitaan furan.

Bishii Oktoobar ee 2006, Netflix wuxuu sii daayay dataset oo ay ku jirto 100 milyan oo qiimeyn oo filim ah oo ka yimid qiyaastii 500,000 macaamiil (waxaan tixgelin doonaa saameynta asturnaanta ee sirta xogta ee cutubka 6). Macluumaadka Netflix waxaa lagu tilmaami karaa matalaad weyn oo ah qiyaastii 500,000 oo macaamiil ah 20,000 oo filim. Dhexdhexaadkan, waxaa jiray qiyaastii 100 malyan oo qiimeyn ah miisaan ka mid ah hal ilaa shan xiddigood (Jadwalka 5.2). Caqabada waxay ahayd in la isticmaalo xogta la arkay ee ku jirta jaantuska si loo saadaaliyo qiimeynta 3 milyan ee la qabtay.

Jaantuska 5.2: Heerka Macluumaadka laga soo xigtay Netflix Prize
Muuqaal 1 Muuqaalka 2 Muuqaal 3 ... Movie 20,000
Macaamiisha 1 2 5 ... ?
Macaamil 2 2 ? ... 3
Macaamil 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Macaamiisha 500,000 ? 2 ... 1

Cilmi-baadhayaasha iyo shabakadaha khatarta ah ee adduunka oo dhan ayaa lagu soo rogay caqabadda, iyadoo 2008-dii in ka badan 30,000 qof ay ka shaqaynayeen (Thompson 2008) . Intii ay socotay tartanka, Netflix wuxuu helay in ka badan 40,000 oo xalal soo jeedin ah oo ka badan 5,000 oo kooxood (Netflix 2009) . Sida iska cad, Netflix ma akhrin karin oo fahmi karin dhammaan xalalka la soo jeediyey. Dhamaan waxkasta ayaa si haboon u shaqeeyey, hase yeeshe, maxaa yeelay xalabtu way sahlanaatay. Netflix wuxuu kumbuyuutarku ku barbardhigi karaa cabirrada la saadaaliyay ee leh shaashooyinka la qabtey iyada oo la adeegsanayo mitir loo qoondeeyey (metrik gaar ah oo ay adeegsadeen ayaa ahaa asalka jajabka ee khaladka isku dhafka ah). Waxay awood u lahayd inay si dhaqso ah u qiimeyso xalalka u saamaxaya Netflix in ay aqbalaan xalalka ka yimaada qof walba, taas oo u muuqata mid muhiim ah maxaa yeelay fikradaha wanaagsan ayaa ka yimid meelo yaab leh. Xaqiiqdii, xalinta guuleysiga waxaa soo gudbiyay koox ay bilaabeen seddex cilmi baarayaal oo aan lahayn khibrado hore u sameynta filimka filimka (Bell, Koren, and Volinsky 2010) .

Mid ka mid ah qaabka quruxda badan ee Netflix Prize waa in ay u saamaxday dhammaan xalalka la soo jeediyey in lagu qiimeeyo si caddaalad ah. Taasi waa, marka dadku ku qanciyeen darajooyinka la saadaaliyay, uma baahna inay u gudbiyaan aqoonsigooda waxbarasho, da ', da', jinsi, jinsi, jinsi, ama wax ku saabsan naftooda. Qiyaasaha la saadaaliyay ee professor caan ka ah Stanford ayaa la mid ah kuwa la mid ah kuwa ka yimi daaradeeda qolkeeda. Nasiib darro, tani run maaha cilmi-baaris bulsheed. Taasi waa, badi cilmi bulsheed, qiimeyntu waa waqti aad u wakhti badan oo qayb ahaan shakhsi ahaaneed. Sidaa awgeed, fikradaha cilmi-baarista intooda badani weligood lama qiimeeyo, iyo marka fikradaha la qiimeeyo, way adagtahay in la tirtiro qiimeyntan ka timid abuuraha fikradaha. Mashruucyada furan ee furan, dhinaca kale, waxay leeyihiin qiimeyn sahlan oo caddaalad ah si ay u ogaadaan fikradaha laga yaabo in la seegayo.

Tusaale ahaan, hal dhibic inta lagu jiro Netflix Prize, qof haysta shaashadda Simon Funk ayaa ku soo qoray blogkiisa xal la soo jeediyey oo ku salaysan qiyaaso qiimo leh, hab ka socota aljebra toosan oo aan hore loo isticmaalin ka qaybgalayaasha kale. Funk's blog post wuxuu ahaa mid isku mid ah oo farsamo ah oo aan rasmi ahayn. Miyey this blog post ku tilmaamay xal fiican ama ma ahaa waqti qashin ah? Meel ka baxsan mashruuca wicitaanka ee furan, xalku marna ma helin qiimeyn halis ah. Ka dib, Simon Funk maaha professor at MIT; Waxa uu ahaa horumariye software kaas oo, waqtigaa, wuxuu ku soo laabtay New Zealand (Piatetsky 2007) . Haddii uu farriintan u direy injineerka Netflix, dhab ahaantii lama aqrin.

Nasiib wanaag, sababtoo ah shuruudaha qiimeyntu waxay ahaayeen kuwo cad oo sahlan oo lagu dalbado, qiimihiisii ​​la saadaaliyay ayaa la qiimeeyay, isla markiiba wuxuu caddeeyey in qaabkiisa uu ahaa mid aad u awood badan: wuxuu ku dhajiyay kaalinta afaraad tartanka, natiijada cajiibka ah ee kooxo kale oo hore ka shaqeynta bilaha dhibaatada. Dhamaadkii, qaybo ka mid ah qaabkiisa ayaa loo adeegsaday dhamaan tartamayaasha halista ah (Bell, Koren, and Volinsky 2010) .

Xaqiiqada ah in Simon Funk uu doortay inuu qoro barta blog-ka ah ee sharraxaya qaabkiisa, halkii uu isku dayi lahaa inuu sii wado qarsoodi, waxa kale oo uu muujinayaa in kaqeybgalayaasha badan ee Netflix Prize aysan aheyn mid u jimicsiga abaalmarinta malaayiin doolar ah. Taa baddalkeed, kaqeybgalayaasha badani waxay u muuqdeen inay ku raaxaystaan ​​caqabadda caqliga iyo bulshada oo horumarisay dhibaatada (Thompson 2008) , dareenka aan filayo in cilmi badani fahmi karaan.

Abaalmarinta Netflix waa tusaale cad oo ah wicitaan furan. Netflix wuxuu su'aasha ujeediyey gaar ahaan himilooyin gaar ah (saadaalinta filimka qiyamka) iyo xalalka loo qoondeeyey ee dad badan. Netflix wuxuu awooday in uu qiimeeyo dhammaan xalalkaas maxaa yeelay way fududayd in la hubiyo intii la abuuray, ugu dambeyntiina Netflix wuxuu xushay xalka ugu fiican. Marka xigta, waxaan ku tusi doonaa sida habkan loo mid ah loo isticmaali karo biolojiga iyo sharciga, iyo iyada oo aan ka badnayn hal milyan oo doolar.