5.3.1 Netflix-prys

Die Netflix-prys gebruik oop oproep om te voorspel watter flieks mense sal wil hê.

Die mees bekende oop oproep projek is die Netflix-prys. Netflix is ​​'n aanlyn film huur maatskappy, en in 2000 is dit van stapel gestuur Cinematch, 'n diens aan films beveel aan kliënte. Byvoorbeeld, kan Cinematch agterkom dat jy graag Star Wars en Empire Strikes Back en dan aanbeveel dat jy kyk na Return of the Jedi. Aanvanklik Cinematch gewerk swak. Maar, in die loop van baie jare, Cinematch voortgegaan om sy vermoë om te voorspel wat films kliënte sal geniet verbeter. Teen 2006 het egter vordering op Cinematch plateaued. Die navorsers aan Netflix het probeer pretty much alles wat hulle kon dink, maar op dieselfde tyd, hulle vermoed dat daar ander idees wat jou kan help om hulle te verbeter. So, kom hulle saam met wat, op die oomblik, 'n radikale oplossing: 'n oop gesprek.

Van kritieke belang om die uiteindelike sukses van die Netflix prys is hoe die oop gesprek is ontwerp en die ontwerp het belangrike lesse vir hoe oop oproepe kan gebruik word vir sosiale navorsing. Netflix nie net sit uit 'n ongestruktureerde versoek om idees, en dit is wat baie mense dink wanneer hulle die eerste keer 'n ope oproep oorweeg. Inteendeel, Netflix sorg vir 'n duidelike probleem met 'n eenvoudige evalueringskriteria: hulle uitgedaag mense om 'n stel van 100 miljoen fliek graderings gebruik om 3000000 gehou-out graderings voorspel (graderings wat gebruikers gemaak het, maar dat Netflix nie vry). Enigiemand wat 'n algoritme wat die 3000000 gehou-out graderings 10% beter as Cinematch 1000000 dollars sou wen kon voorspel kon skep. Dit duidelik en maklik om aansoek te doen evalueringskriteria-vergelyking voorspel graderings te hou-out graderings-beteken dat die Netflix-prys is geraam in so 'n manier dat oplossings is makliker om te kyk as genereer; dit blyk die uitdaging van die verbetering van Cinematch in 'n probleem wat geskik is vir 'n oop gesprek.

In Oktober van 2006, Netflix vrygestel van 'n datastel bevat as 100 miljoen fliek graderings van oor ongeveer 500,000 kliënte (sal ons die privaatheid implikasies van hierdie data vrylating in Hoofstuk 6 oorweeg). Die Netflix data kan gekonseptualiseer as 'n reuse-oorsig wat ongeveer 500,000 kliënte deur 20.000 films. Binne hierdie matriks, was daar ongeveer 100 miljoen graderings op 'n skaal van 1 tot 5 sterre (Tabel 5.2). Die uitdaging was om die waargenome data te gebruik in die matriks om die 3000000 gehou-out graderings voorspel.

Tabel 5.2: Skematiese van data uit die Netflix-prys. Netflix vrygestel oor 100000000 graderings (1 ster tot 5 sterre) wat deur 500,000 kliënte op 20.000 films. Die doel van die Netflix prys is om hierdie graderings gebruik om die gehou-out graderings van 3 miljoen movies, getoon as "?" Voorspel. deur deelnemers aan die Netflix prys voorgelê voorspel graderings is in vergelyking met die gehou-out graderings. Ek sal die etiese kwessies rondom hierdie uitgawe data in Hoofstuk 6 bespreek.
Movie 1 Movie 2 movie 3 . . . Fliek 20000
Customer 1 2 5 . ?
Customer 2 2 ? . 3
Customer 3 ? 2 .
. . . . . . . .
kliënt 500,000 ? 2 . 1

Navorsers en hackers regoor die wêreld is gevestig op die uitdaging, en teen 2008 meer as 30,000 mense is besig met dit (Thompson 2008) . In die loop van die wedstryd, Netflix het meer as 40,000 voorgestelde oplossings van meer as 5000 spanne (Netflix 2009) . Dit is duidelik dat, Netflix kan nie lees en al hierdie voorgestelde oplossings te verstaan. Die hele ding het glad verloop, maar omdat die oplossings was maklik om na te gaan. Netflix kon net 'n rekenaar die voorspelde graderings om die gehou-out graderings te vergelyk met 'n pre-gespesifiseerde metrieke (die besonder metrieke wat hulle gebruik is die vierkantswortel van die gemiddelde-kwadraat fout). Dit was hierdie vermoë om vinnig oplossings wat Netflix in staat gestel om oplossings van almal, wat blyk belangrik te wees nie, want 'n goeie idees vandaan kom 'n paar verrassende plekke aanvaar evalueer. In werklikheid was die wen-oplossing voorgelê deur 'n span wat begin is deur drie navorsers wat geen ondervinding gebou fliek aanbeveling stelsels voor het (Bell, Koren, and Volinsky 2010) .

Een mooi aspek van die Netflix-prys is dat dit in staat gestel almal in die wêreld om hul oplossing redelik geëvalueer. Wanneer mense hul voorspel graderings gelaai, het hulle nie nodig het om hul akademiese kwalifikasies, hul ouderdom, ras, geslag, seksuele oriëntasie, of enigiets oor hulself te laai. So, was die voorspel gradering van 'n bekende professor van Stanford presies behandel dieselfde as dié van 'n tiener in haar slaapkamer. Ongelukkig is dit nie die geval in die meeste sosiale navorsing. Dit is, vir die meeste sosiale navorsing, evaluering is baie tydrowend en gedeeltelik subjektiewe. So, is die meeste navorsing idees nooit ernstig beoordeel, en wanneer idees word geëvalueer, is dit moeilik om die evaluerings losmaak van die skepper van die idees. Omdat oplossings is maklik om te kyk, oop oproepe toelaat navorsers toegang tot al die potensieel wonderlike oplossings wat deur die krake val as hulle net beskou oplossings van bekende professore.

Byvoorbeeld, op 'n punt tydens die Netflix prys iemand met die skuilnaam Simon Funk gepos op sy blog 'n voorgestelde oplossing gebaseer op 'n besondere waarde ontbinding, 'n benadering van lineêre algebra wat nie voorheen gebruik deur ander deelnemers. Funk se blog post was gelyktydig tegniese en uitgesoekte informeel. Was hierdie blog post beskryf 'n goeie oplossing of was dit 'n vermorsing van tyd? Buite 'n oop gesprek projek, die oplossing dalk nooit ernstige evaluering ontvang. Na alles Simon Funk was nie 'n professor by Cal Tech of MIT; Hy was 'n sagteware ontwikkelaar wat op die oomblik, is Toer om Nieu-Seeland (Piatetsky 2007) . As hy hierdie idee het per e-pos aan 'n ingenieur by Netflix, is dit byna seker sou nie gewees het ernstig opgeneem.

Gelukkig, want die evalueringskriteria duidelik en maklik om aansoek te doen was, het sy voorspel graderings geëvalueer, en dit was onmiddellik duidelik dat sy benadering was baie sterk, hy ingeskiet tot die vierde plek in die kompetisie, 'n geweldige gevolg gegee dat ander spanne reeds was werk vir maande op die probleem. Op die ou end, dele van benadering Simon Funk se gebruik deur feitlik alle ernstige mededingers (Bell, Koren, and Volinsky 2010) .

Die feit dat Simon Funk het gekies om 'n blog boodskap skryf verduidelik sy benadering, eerder as om te probeer om dit geheim te hou, illustreer ook dat baie deelnemers aan die Netflix prys nie uitsluitlik is gemotiveer deur die miljoen dollar-prys. Inteendeel, baie deelnemers ook gelyk te geniet die intellektuele uitdaging en die gemeenskap wat ontwikkel rondom die probleem (Thompson 2008) , gevoelens wat ek verwag baie navorsers kan verstaan.

Die Netflix-prys is 'n klassieke voorbeeld van 'n oop gesprek. Netflix sorg vir 'n vraag met 'n spesifieke doel (voorspel fliek graderings) en gevra oplossings van baie mense. Netflix was in staat om al hierdie oplossings te evalueer omdat hulle makliker om te verifieer as te skep was, en uiteindelik Netflix opgetel die beste oplossing. Volgende, sal ek jou wys hoe dit dieselfde benadering gebruik kan word in biologie en die wet.