5.3.1 Netflix Prize

Ang Netflix Prize naggamit bukas tawag sa pagtagna nga mga pelikula ang mga tawo sama sa.

Ang labing inila nga open call project mao ang Netflix Prize. Ang Netflix usa ka kompaniya sa pag-arkila sa pelikula sa online, ug sa tuig 2000 naglunsad kini og Cinematch, serbisyo nga nagsugyot og mga salida sa mga kustomer. Pananglitan, ang Cinematch mahimong makamatikod nga gusto nimo ang Star Wars ug Ang Imperyal nga Mihimo og Balik ug dayon rekomend nga imong bantayan ang Return of the Jedi . Sa sinugdanan, ang Cinematch nagtrabaho nga dili maayo. Apan, sulod sa daghang katuigan, nagpadayon kini sa pagpalambo sa abilidad niini sa pagtag-an kon unsa nga mga pelikula nga gipahimuslan sa mga kostumer. Hinuon, sa 2006, ang pag-uswag sa Cinematch nahimutang. Ang mga tigdukiduki sa Netflix naningkamot og maayo sa tanan nga ilang gihunahuna, apan, sa samang higayon, sila nagduda nga dunay ubang mga ideya nga makatabang kanila sa pagpalambo sa ilang sistema. Sa ingon, sila miabut uban sa unsay kaniadto, usa ka radical solution: usa ka open call.

Ang kritikal nga kalampusan sa Netflix Prize mao ang paagi sa pagdisenyo sa open call, ug kini nga disenyo adunay importante nga mga pagtulun-an kung giunsa nga ang mga open call mahimong magamit alang sa social research. Ang Netflix wala lamang nagpagawas sa wala'y natun-an nga hangyo alang sa mga ideya, nga mao ang gihunahuna sa daghang mga tawo sa una nilang paghunahuna sa usa ka bukas nga tawag. Hinuon, ang Netflix naghatag og usa ka tin-aw nga problema sa usa ka yano nga pamaagi sa pagtimbang-timbang: gihagit nila ang mga tawo sa paggamit sa usa ka set nga 100 ka milyon nga mga rating sa pelikula aron pagtag-an ang 3 ka milyon nga gipangputol nga mga rating (ratings nga gihimo sa mga tiggamit apan wala gibuhian sa Netflix). Ang unang tawo nga nagmugna sa usa ka algorithm nga nagtagna sa 3 ka milyon nga gipagawas nga rating nga 10% mas maayo kaysa Cinematch makadaog og usa ka milyon nga dolyar. Kini tin-aw ug sayon ​​nga magamit ang pamaagi sa pag-evaluate-pagtandi sa gitagna nga mga rating uban sa mga gipangputol nga rating-nagpasabot nga ang Netflix Prize gibutang sa paagi nga ang mga solusyon mas sayon ​​nga masusi kay sa makamugna; kini nahimong hagit sa pagpalambo sa Cinematch ngadto sa usa ka problema nga angay alang sa usa ka open nga tawag.

Niadtong Oktubre sa 2006, ang Netflix nagpagawas sa usa ka dataset nga adunay 100 ka milyon nga mga rating sa pelikula gikan sa mga 500,000 nga mga kustomer (atong hisgotan ang mga implikasyon sa privacy niining pagpagawas sa datos sa kapitulo 6). Ang datos sa Netflix mahimong konseptualisado nga usa ka dako nga matrix nga gibana-bana nga 500,000 nga mga kustomer sa 20,000 nga mga pelikula. Sulod niini nga matrix, dihay mga 100 ka milyon nga mga grado sa usa ka sukdanan gikan sa usa ngadto sa lima ka mga bituon (sa lamesa 5.2). Ang hagit mao ang paggamit sa naobserbahan nga datos sa matrix aron pagtag-an ang 3 milyon nga gipanghatag nga rating.

Table 5.2: Schematic of Data gikan sa Netflix Prize
Movie 1 Movie 2 Movie 3 ... Movie 20,000
Customer 1 2 5 ... ?
Customer 2 2 ? ... 3
Customer 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Customer 500,000 ? 2 ... 1

Ang mga tigdukiduki ug mga hacker sa tibuok kalibutan nadani sa hagit, ug sa tuig 2008 kapin sa 30,000 ka mga tawo ang nagtrabaho niini (Thompson 2008) . Sa dagan sa kompetisyon, ang Netflix nakadawat og sobra sa 40,000 nga gisugyot nga mga solusyon gikan sa kapin 5,000 ka mga team (Netflix 2009) . Siyempre, ang Netflix dili makabasa ug makasabut sa tanan niining gisugyot nga mga solusyon. Hinuon, ang tanan nga hapsay nagdagan, tungod kay ang mga solusyon sayon ​​nga susihon. Ang Netflix mahimo nga adunay usa ka kompyuter nga itandi ang gitagna nga mga grado sa mga gipagawas nga mga grado gamit ang usa ka prespecified metric (ang partikular nga metriko nga ilang gigamit mao ang kwadro nga gamut sa minubo nga minatarong nga kuwadrado). Kini nga katakos sa dali nga pagtimbangtimbang sa mga solusyon nga nakapahimo sa Netflix nga modawat sa mga solusyon gikan sa tanan, nga nahimo nga importante tungod kay ang maayong mga ideya naggikan sa pipila ka makapahingangha nga mga dapit. Sa pagkatinuod, ang nakadaog nga solusyon gisumitir sa usa ka team nga gisugdan sa tulo ka mga tigdukiduki nga walay naunang kasinatian nga pagtukod sa mga sistema sa rekomendasyon sa pelikula (Bell, Koren, and Volinsky 2010) .

Usa ka maanyag nga aspeto sa Netflix Prize mao nga kini nakapahimo sa tanan nga gisugyot nga mga kasulbanan aron mahatagan sa pagtan-aw nga patas. Sa ato pa, sa dihang gi-upload sa mga tawo ang ilang gitagna nga mga grado, wala sila kinahanglan nga i-upload ang ilang mga kredensyal sa akademik, edad, lahi, gender, orientasyon sa sekswalidad, o bisan unsa bahin sa ilang kaugalingon. Ang gitagna nga mga pagtan-aw sa usa ka inila nga propesor gikan sa Stanford gitratar gayud sama sa mga gikan sa usa ka tin-edyer sa iyang kwarto. Ikasubo, kini dili tinuod sa kadaghanan sa sosyal nga pagsiksik. Kana, alang sa kadaghanan sa sosyal nga panukiduki, ang pagtan-aw usa ka pag-usik sa panahon ug usa ka piho nga suhetibo. Busa, ang kadaghanan sa mga ideya sa panukiduki wala gayud seryoso nga gibana-bana, ug sa dihang ang mga ideya gibana-bana, lisud ang paglumpag sa mga pagsusi gikan sa tiglalang sa mga ideya. Ang mga bukas nga mga proyekto sa tawag, sa laing bahin, adunay sayon ​​ug patas nga pag-usisa aron makadiskobre sila sa mga ideya nga dili makalimtan.

Pananglitan, sa usa ka punto sa panahon sa Netflix Prize, ang usa ka tawo nga may screen nga ngalan nga Simon Funk nagpakita sa iyang blog usa ka gisugyot nga solusyon nga gibase sa singular value decomposition, usa ka paagi gikan sa linear algebra nga wala pa gigamit kaniadto sa ubang mga partisipante. Ang post sa Funk sa blog post dungan nga teknikal ug weirdly informal. Kini ba nga post sa blog nga naghulagway sa usa ka maayo nga solusyon o kini usa ka pag-usik sa panahon? Sa gawas sa usa ka proyekto sa open call, ang solusyon dili unta makadawat og seryoso nga pagtimbangtimbang. Human sa tanan, si Simon Funk dili usa ka propesor sa MIT; siya usa ka software developer kinsa, nianang higayona, nag backpacking sa New Zealand (Piatetsky 2007) . Kon iyang gipadad-an kini nga ideya ngadto sa usa ka enhinyero sa Netflix, hapit dili gayud kini mabasa.

Maayo na lang, tungod kay ang klasipikasyon sa pag-evaluate klaro ug sayon ​​nga magamit, ang iyang gitagna nga mga rating gibana-bana, ug kini klaro kaayo nga ang iyang paagi kusog kaayo: siya rocketed ngadto sa ikaupat nga dapit sa kompetisyon, usa ka dakong resulta nga gihatag nga ang ubang mga teams na nagtrabaho sulod sa mga bulan sa problema. Sa katapusan, ang mga bahin sa iyang pamaagi gigamit sa halos tanan nga seryoso nga mga kakompetensya (Bell, Koren, and Volinsky 2010) .

Ang kamatuoran nga si Simon Funk mipili sa pagsulat sa usa ka post sa blog nga nagpatin-aw sa iyang pamaagi, kay sa pagsulay sa pagtago niini, naghulagway usab nga daghang mga partisipante sa Netflix Prize dili lamang gipalihok sa milyon nga dolyar nga ganti. Hinunoa, daghan nga mga partisipante usab daw nakatagamtam sa intelektwal nga hagit ug sa komunidad nga naglambo sa problema (Thompson 2008) , mga pagbati nga akong gilauman nga masabtan sa daghang mga tigdukiduki.

Ang Netflix Prize usa ka pananglitan nga pananglitan sa usa ka bukas nga tawag. Naghatag ang Netflix og usa ka pangutana uban sa usa ka piho nga tumong (pagtagna sa mga rating sa pelikula) ug pagpangayo og solusyon gikan sa daghang mga tawo. Ang Netflix nakahimo sa pagtimbang-timbang sa tanan niini nga mga solusyon tungod kay kini mas sayon ​​sa pagsusi kay sa paghimo, ug sa katapusan ang Netflix mipili sa labing maayo nga solusyon. Sunod, ipakita ko kanimo kon sa unsang paagi kining sama nga pamaagi magamit sa biology ug balaod, ug walay usa ka milyon nga dolyar nga ganti.