5.3.1 Premiu Netflix

Lu Premiu Netflix usa d aperta à predict chì i filmi genti ti piaci.

U prugettu d 'aria cchiù canusciutu è la Premiu Netflix. Netflix hè una cumpagnia Location vintage online, è in u 2000 hè lanciata Cinematch, un serviziu à assicurà chì i filmi à u clienti. Per esempiu, Cinematch putissi nutari ca vi piacia Star Wars è colpi di Imperu Back e poi preferimu noi chì vi fighjulà u campanile di lu Cunzigghiu Jedi. Nizziarmenti, Cinematch travagliatu accolta. Ma, duranti lu cursu di tanti anni, Cinematch cuntinuatu à migliurà a so capacità à predict ciò chì i filmi i clienti ùn piantate. Par u 2006, pirò, lu prugressu in u Cinematch plateaued. Li arricercatura à Netflix avia pruvatu limita tuttu ciò ch'elli circate, ma a lu stissu tempu, si era suspittatu chì ci eranu altre idee chì aiuta a li ccasioni di u so sistema. Cusì, ch'elli ghjùnsenu cù ciò chì fù, à u mumentu, una suluzione radicali: una d 'apartu.

Scritte a lu eventual successu di u Premiu Netflix era comu la chiamata aperta hè statu creatu, è stu generu hà lizioni mpurtanti di comu chiama aperta pò ièssiri usatu di ricerca suciali. Netflix nun sulu e trata fori una richiesta unstructured per idei, ca è chiddu ca assai genti creda chì, quand'elli lagnà prima un d 'apartu. Invece, Netflix civile hè un prublema cumuna cù un cuntu criteri di valutazione: si misi 'populu pi usari nu nsemi di 100 miliuna di valutazioni, vintage à predict 3 miliuna di valutazioni tenerà-out (valutazioni chì utilizatori avia fattu, ma chì Netflix ùn hà lintà). Quant'ella pò creà una algutitimu chì pudia predict i 3 milioni di valutazioni tenerà-out 10% megliu cà Cinematch si tace 1 miliuna di euru. Stu chjaru è facile di dumandà a valutazione di criterii-comparing valutazioni prividiri a tenu-out valutazioni-vulia dì chì u Premiu Netflix fu custruzzione di a na tali manera ca li suluzzioni sunnu cchiù facili a scupriri ca pruduce; si vutau a sfida di migliurà a Cinematch in un prublema prupizia di un d 'apartu.

Nta l 'uttùviru di 2006, Netflix publicatu un dataset chì cuntene 100 miliuna di valutazioni, vintage da circa circa 500,000 clienti (no ti lagnà u cunseguenze a privacy di sta rilassu dati ntâ scienza Chapter 6). I dati Netflix pò esse conceptualized comu un tempurale matrici ca è circa 500.000 i clienti di 20.000 filmi. Dentru à stu matrice, ci erani circa 100 miliuna di valutazioni nantu à una scala da 1 à 5 étoiles (Table 5,2). A sfida era a usari li dati osservatu a la matrici a predict i 3 milioni di valutazioni tenerà-out.

Table 5,2: Schema di dati da u Premiu Netflix. Netflix liberatu, circa 100 miliuni di valutazioni (1 étoile à 5 étoiles) fornitu da 500.000 clienti nantu à 20.000 filmi. U scopu di u Premiu Netflix era à aduprà sti évaluation à predict u valutazioni tenerà-out of 3 miliuna di i filmi, indicatu comu "?". évaluation, Volume pruposti da i participanti à u Premiu Netflix foru paragunatu à u valutazioni tenerà-out. I vi discurriri nzèmmula di li tematiche etici ca circonna sta rilassu dati à Chapter 6.
Movie 1 Movie 2 Movie 3 . . . Movie 20.000
Customer 1 2 5 . ?
Customer 2 2 ? . 3
Customer 3 ? 2 .
. . . . . . . .
Customer 500.000 ? 2 . 1

Circadori è hackers giru di lu munnu foru pigghiati di la scummissa, e da u 2008 chiossai di 30.000 pirsuni foru travagghiannu supra lu (Thompson 2008) . Duranti lu cursu di 'stu paliu feroci, Netflix ricevutu più di 40.000 suluzione pruposta da più di 5000 squadre (Netflix 2009) . Currispundenu, Netflix ùn hà pussutu leghje è capisce tutte ste suluzioni pruposti. U friscalette, cosa corse lisu, parò, picchì li suluzzioni ca eranu facile à verificà. Netflix pudia basta un urdinatore cunfruntari lu valutazioni prividiri à u valutazioni tenerà-out par un metrichi (i particulari metrichi usàvanu nnî era la lingua latina quatratu di l 'errore intantu-arancia), pre-pricisatu. Era sta capacità à evaluate prestu suluzioni chì hà permessu Netflix a accittari suluzioni da tutti, chi riniscìu a èssiri mpurtanti picchì boni idei ghjunse da certi lochi stupente. In fatti, a sola suluzione vincitori hè statu cunvalidatu da una squadra di abbiata trè circadori ca nunn'appi sistemi avvisu, vintage sperienza custruzzioni avanzu (Bell, Koren, and Volinsky 2010) .

Unu bellu aspettu di u Premiu Netflix hè chì hè permessu tutti in u mondu à avè a so suluzione rivalutatu abbastanza. Quandu populu activity so valutazioni missile, ma ùn hanu bisognu di la torna indettendu à u so diplumata accademicu, a so età, a punti, voce, urintamentu sessuale, o capisciu iddi stissi. Cusì, u valutazioni prividiri di un famosu prufessore da Stanford eranu cotti esattamente a stessa cum'è quelli da un zitellone in u so stanze. Per disgrazia, stu ùn hè vera in più di ricerca suciali. Pirtantu, di cchiù di ricerca suciali, di valutazione è assai tempu cunsumanu e in parti particulari. Cusì, a più idee di ricerca sò mai seriamenti rivalutatu, e quannu idee sò rivalutatu, hè difficiuli à fà detach quelli laus da lu criaturi di l 'idei umani. A causa di suluzioni sò facili à verificà, chiama aperta permettenu di circadori à accede à tutti i suluzioni Prepaid maravigliosa chì cadiri à traversu u cracks s'ellu si cunzidiratu sola suluzione da li prufissura famosu.

Per esempiu, a unu puntu duranti lu Premiu Netflix calchissia cù u nomu di screnu Simon Corso signalatu nant'à u so bloggu una suluzione pruposta basatu annantu à una decomposition valori singulari, un accostu da l 'àlgibbra liniari, ca nun avìa statu usatu esiste da altri participanti. bloggu articulu d'Corso era simultaneously tecnicu è weirdly informal. Fu st'articulu bloggu addiscriviennu una bona suluzione, o chì era un ghjetti di tempu? Fora di un prughjettu d aperta, a sola suluzione pè mai ani ricivutu una seria di valutazione. Dopu tuttu Simon E Spingule Francese ùn era un prufissuri Cal Tech o MIT; iddu era un documentaliste prugrammu chì, à u mumentu, fu backpacking campiglia intornu à New Zealand (Piatetsky 2007) . S'è avia trasmissu par stu scopu di un ingenieru di Netflix, hè quasi sicuru putìssiru nun hannu statu pigliatu in seriu.

Par furtuna, perchè i criteri di valutazione eranu chjaru è facile di dumandà, a so valutazioni missile eranu rivalutatu, è era necessità è chjaru chì u so accostu era assai putente: iddu rocketed a quarta locu in u cuncorsu, un densita risultatu datu chì altre squadre avia digià statu travagliendu per mesi nantu à u prublemu. In fini, parti di appruccià si versu l'Simon Corso èranu usatu da guasi tutti i cuncurrenti poesia (Bell, Koren, and Volinsky 2010) .

Lu fattu ca Simon Corso scigghieru di scriviri un articulu bloggu spieghendu u so avvicinamentu, chiu tostu di piazzà à tena lu sicretu, è ancu chì parechji i participanti à u Premiu Netflix ùn eranu mutivatu à parta da u primu premiu miliuna di danaru. Incuntrariu, assai participanti paria ancu à tastà a sfida ntillittuali, e la cumunità chì si ngrannìu attornu a lu prubbrema (Thompson 2008) , sentimenti chì mi m'aspettu parechji circadori ponu capì.

Lu Premiu Netflix hè un isempiu classicu di una d 'apartu. Netflix criò una quistioni cu nu scopu pricisu (chì pridisci valutazioni, vintage) è solicited suluzioni da parechje persone. Netflix, rinisciu a evaluate tutti sti suluzzioni picchì eranu più fàciule à verificà di a criari, è infine Netflix chjappi li suluzzioni megliu. Next, I Mulateri Di L'mustrà quantu stu stissu avvicinamentu pò ièssiri usatu 'nta bioluggìa e lege.