5.3.1 Premiu Netflix

Lu Premiu Netflix usa d aperta à predict chì i filmi genti ti piaci.

U prughjettu di chjamà à u più bellu cunniscenu cum'è u Premiu Netflix. Netflix hè una cummerciale di filmi online, è in u 2000 poeta à cinematograficu Cinematch, un serviziu per recitarà films à i clienti. Per esempiu, Cinematch puderia avè avvistu chì site piaciutu Star Wars è L'Imperu Strikes Back, è raghjunghjani vede chì vede turnà di u Jedi . In prima, Cinematch hà travagliatu pocu. Ma, à u cursu di parechji anni, cuntinuava à migliurà a so capacità per predica chì clienti di i films accessuva. In 2006, però, u prugressu nantu à Cinematch anu chjappu. I ricchieri in Netflix anu pruvatu bramu di tuttu ciò ch'elli puderanu pensà, ma, à u stessu tempu, suspetìanu chì ci era parechje idee chì puderanu aiutà à migliurà u so sistema. Cusì, vènsenu cun quellu chì era, in questu tempu, una soluzione radicale: una calla aperta.

A critica di u successu eventuali di u Premiu Netflix era cumu a chjamata aperta hè statu creatu, è questu disegnu teni lezii impurtanti per quandu i chjave apertu pò esse usatu per a ricerca sociale. Netflix ùn hà micca esse chjapputu di una dumanda senza strutturata per l'idee, chì ghjè chì parechji pirsuni imaginate quandu u primu cunzidirevule una calla aperta. Invece, Netflix hà avutu un problema chjaru cù un prughjettu simplicii d'evaluazione: sfidau persone à utilizà un set di 100 million movie ratings per predice 3 milioni di qualchi sughjetti (qualificazioni chì l'utenti anu fattu, ma chì Netflix micca spargiu). A prima persona di creà un algoritmu chì avvirtutu i 3 millioni di qualchi sughjetti 10% megliu ca Cinematch averia un milione di dolar. Questu prucessu clarificatu è faciule d'appiecazione di valutazione-cumparendu i qualifiche di previsti cù qualificazioni dispunibuli, hà significatu chì u Premiu Netflix hè stata fatta di manera chì e solu solu for cheche di generale; hà rivolgiutu u prublema di migliurà Cinematch in un prublema adattatu per una invidera chjamata.

In uttobre di u 2006, Netflix allibiu un dicumuzzu chì cuntene 100 millioni di qualificazioni di film di circa about 500 000 clienti (cunsiderà a cunclusioni di privacy di sta data liberata in u capitu 6). A data di Netflix pò esse cuncettualizata cum'è una matrice enorma chì hè di circa 500.000 clienti per 20 000 cinema. In questa matriu, ci era circa 100 millioni di qualificazioni in una scala da unu à cinque stelle (tavola 5.2). A sfida hè di utilizà a data ancheta in a matrice per prevene i 3 millioni di qualchi sughjetti.

Table 5.2: Schematic of Data di u Netflix Prize
Movie 1 Movie 2 Movie 3 ... Movie 20,000
Client 1 2 5 ... ?
Client 2 2 ? ... 3
Client 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Clienti 500.000 ? 2 ... 1

L'investigatore è i pirate di u mondu eranu tracciati à u sfide, è in u 2008 anu travagliatu più di trenta mila persone (Thompson 2008) . À u cursu di u cuncorsu, Netflix hà ricivutu più di 40 000 solu suluzzioni propositi di più di 5 000 squadra (Netflix 2009) . Ovivu, Netflix ùn pudia micca leghjite è cumprende tutti questi suluzione proponii. Tuttu a cosa hè stata sulla, però, perchè e suluzione sò stati faciuli di verificà. Netflix puderia esse ghjustu una computer compare the ratings predicted with the up-out ratings using a metric prespecified (a metrica particular chì anu utilizatu era l'arcu quadru di l'errore squared). Hè stata capacità per a valora rapidamente e solu solu chì facenu Netflix per accettà solu suluzioni di tutti, chì anu da esse impurtante perchè e boni idee vinìanu da parechji posti surprisanti. In fatti, a suluzione risulente hè statu sottumessa da un squadra iniziatu da trè investigatore chì ùn avianu micca spirimintassi di avè i sperimentali di i sistemi di ricerca di cinema (Bell, Koren, and Volinsky 2010) .

Un aspectu bella di u Premiu Netflix hè chì hà permessu di tutte e solu suluzzioni propii per esse evaluatu bè. Hè per quessa, quandu e persone uploaded a so classificazioni previsti, ùn anu micca bisognu di carica di e credenzii akkademichi, a so età, a razza, u sessu, l'orientazione sessuale, o qualcosa di elli. I predichi qualifiche di un famosu prufissore da Stanford anu trattatu questu solu chì anu da un adulescente in a so alcuna. Sfortunatamente, questu hè micca veru in a maiò parte di a ricerca suciale. Perchè, per a maiò parte di a ricerca suciale, a valutazione hè assai persone è sia parutività. Cusì, a maiò parte di e idee di ricerca ùn sò mai valutati seriamente, è quandu l'idee sò stati evaluati, hè difficiulmente dispunibule u valutazione da u creadoru di l'idee. I prughjetti di u chjamate chjamati, invece, anu una valutazione fàciule è bella per scopra l'idee chì avete esse misstu altrimenti.

Per esempiu, in un puntu durante u Premiu Netflix, qualchissia cù u nomu di scatula Simon Funk pubblicò à u so blog una solu pruposta solu per una descompunazione di valori singularu, un avvicinamentu da l'àlgaria lineale chì ùn era micca utilizatu da parte di l'altre participanti. U blog postu Funk fu simultaneamente tècnicu è pocu informale. Hà sta blog descrizanu una bona suluzione o hè stata perdi u tempu? Fora di un prughjettu di cunferenza chjamata, a solu suluzione ùn pò mai avè ricivutu studiu seria. Dopu tuttu, Simon Funk ùn era micca un prufissuri à u MIT; era un sustegnu di u software chì, in u mumentu, era impannillendi à Nova Zealand (Piatetsky 2007) . S'ellu avia mailed this idea à un ingegientu in Netflix, ùn hà micca legatu.

Fortunatamente, perchè i critichi d'evaluazioni eranu scritti è faciuli d'appiegazione, i so predichosti évaluations, è hè stata rimorsu chì u so avvicinamentu era assai putente: si spiegava à u quartu locu in a cuncurrenza, un tremendu risultatu datu chì l'altri equipi eranu digià statu travaglia per mesi nantu à u prublema. A fine, parte di u so avvicinamentu eranu usati da quasi tutti i competiti seriati (Bell, Koren, and Volinsky 2010) .

U fattu chì Simon Funk hà sceltu à scrive un blog post chì spiega u so approcciu, invece di pruvà à mantene a secreta, ancu mostra chì parechji participanti in u Prix Netflix ùn eranu micca motivati ​​solu per u prublema di milione di dolar. Puderete assai participanti anu ancu parmettini di sfruttà u sfide intellettuale è di a cumunità chì si sviluppau à u prublema (Thompson 2008) , sentimenti chì aghju belli investigatori pò capiscenu.

U Premiu Netflix hè un esempiu classicu di una calla aperta. Netflix planteò una quistione cù una mira specifica (predice i qualificazioni di film) è suluzione dumandatu da parechje persone. Netflix hà capaci di evaluà tutte issi suluzione perchè eranu più fàciule di verificà chì di creà, è nant'à Netflix hà sappiutu a megliu solu. Dopu, vi vi vi cunfermà cumu questa stessa strada puderia esse aduprata in a biologia è a lege, è senza premiu di un million dolore.