5.3.1 Netflix Prize

Ang Netflix Prize naggamit bukas tawag sa pagtagna nga mga pelikula ang mga tawo sama sa.

Ang labing maayo ang nailhan nga proyekto bukas tawag mao ang Netflix Prize. Netflix mao ang usa ka online movie abang nga kompanya, ug sa tuig 2000 kini gilusad Cinematch, usa ka pag-alagad sa rekomend mga pelikula sa mga kustomer. Pananglitan, tingali makamatikod Cinematch nga imong ganahan Star mga Gubat ug Imperyo welga Balik ug unya rekomend nga motan-aw Pagbalik sa Jedi. Sa sinugdan, Cinematch nagtrabaho mangil-ad. Apan, sa ibabaw sa ginsakpan sa daghan nga mga tuig, Cinematch nagpadayon sa pagpalambo sa iyang abilidad sa pagtagna unsa ang mga salida sa sine kustomer nga makatagamtam. Pinaagi sa 2006, bisan pa niana, pag-uswag sa Cinematch plateaued. Ang mga tigdukiduki sa Netflix misulay pretty daghan ang tanan nga ilang hunahuna sa, apan sa samang panahon, sila gidudahang nga may ubang mga ideya nga makatabang kanila sa pagpalambo sa ilang sistema. Busa, sila miabut sa uban sa kon unsa ang mao, sa panahon, sa usa ka radikal nga solusyon: ang usa ka bukas nga tawag.

Kritikal nga sa ngadto-ngadto kalamposan sa Netflix Prize mao kon sa unsang paagi nga ang abli nga tawag gidisenyo, ug kini nga disenyo adunay importante nga mga leksyon alang sa kon sa unsang paagi nga bukas sa mga tawag nga magamit alang sa social research. Netflix wala lang gikan sa usa ka walay porma nga hangyo alang sa mga ideya, nga mao ang daghan nga mga tawo mahunahuna sa dihang sila unang hisgotan ang usa ka bukas nga tawag. Hinunoa, Netflix posing sa usa ka tin-aw nga problema sa usa ka yano nga criteria evaluation: sila gihagit sa mga tawo sa paggamit sa usa ka hugpong sa mga 100 ka milyon nga ratings movie sa pagtagna sa 3 ka milyon nga gipahigayon-gikan sa ratings (ratings nga tiggamit gihimo apan nga Netflix wala buhian). Bisan kinsa nga makahimo sa paghimo sa usa ka algorithm nga pagtagna sa 3 ka milyon nga gipahigayon-gikan sa ratings 10% nga mas maayo pa kay sa Cinematch nga modaog sa 1 milyon nga dolyares. Kini nga tin-aw ug sayon ​​nga paggamit sa evaluation nga criteria-pagtandi gitagna ratings sa gihimo-gikan sa ratings-nagpasabot nga ang Netflix Prize si framed sa ingon nga paagi nga ang mga solusyon mas sayon ​​sa pagsusi kay sa pagmugna; kini mibalik sa hagit sa pagpalambo sa Cinematch ngadto sa usa ka problema nga angay alang sa usa ka bukas nga tawag.

Sa Oktubre sa 2006, Netflix gipagawas sa usa ka panid nga adunay sulod nga 100 ka milyon nga ratings movie gikan sa mga bahin sa 500,000 kustomer (atong hisgotan ang mga implikasyon privacy sa niini nga pagpagawas sa data sa Kapitulo 6). Ang Netflix nga datos mahimong konsepto nga ingon sa usa ka dako nga matrix nga gibana-bana nga 500,000 ka mga kustomer pinaagi sa 20,000 mga pelikula. Sulod taguangkan niini, may mga 100 ka milyon nga ratings sa usa ka scale gikan sa 1 ngadto sa 5 mga bitoon (Talaan 5.2). hagit mao ang paggamit sa mga obserbahan nga datos sa sa taguangkan sa pagtagna sa mga 3 milyones nga gipahigayon-gikan sa ratings.

Table 5.2: kombensiyonal nga sa mga data gikan sa Netflix Prize. Netflix gipagawas mga 100 ka milyon nga ratings (1 nga bitoon sa 5 bitoon) nga gihatag sa 500,000 kustomer sa 20,000 mga salida. Ang tumong sa Netflix Prize mao ang sa paggamit sa niini nga mga ratings sa pagtagna sa gipahigayon-gikan ratings sa 3 ka milyon nga mga salida sa sine, gipakita nga "?". Gitagna ratings gisumite sa mga partisipante sa Netflix Prize nga itandi sa gihimo-gikan sa ratings. ko sa paghisgot sa pamatasan nga mga isyu nga naglibot niini nga data sa pagpagawas sa Kapitulo 6.
movie 1 movie 2 movie 3 . . . movie 20,000
Customer 1 2 5 . ?
Customer 2 2 ? . 3
Customer 3 ? 2 .
. . . . . . . .
Customer 500,000 ? 2 . 1

Tigdukiduki ug mga hackers sa tibuok kalibutan nadani sa hagit, ug sa 2008 labaw pa kay sa 30,000 ka mga tawo ang nagtrabaho sa ibabaw niini (Thompson 2008) . Sa ibabaw sa ginsakpan sa contest, Netflix nakadawat labaw pa kay sa 40,000 gisugyot solusyon gikan sa labaw pa kay sa 5,000 ka mga teams (Netflix 2009) . Tin-aw nga, Netflix dili makabasa ug makasabut niining tanang mga gisugyot nga mga solusyon. Ang tibuok nga butang hapsay, bisan pa niana, tungod kay ang mga solusyon sa mga sayon ​​sa pagsusi. Netflix mahimong lang sa usa ka computer itandi sa gitagna ratings ngadto sa gipahigayon-gikan sa ratings sa usa ka pre-bungat metriko (ang partikular nga metriko ilang gigamit mao ang square sa gamut sa mga ubos nga-kuwadradong sayop). Kini mao ang kini nga abilidad sa madali sa pagtimbang-timbang sa mga solusyon nga nakahimo Netflix sa pagdawat solusyon gikan sa tanan, nga nahimo gikan nga mahimong importante tungod kay ang maayo nga mga ideya gikan sa pipila ka mga ikatingala nga mga dapit. Sa pagkatinuod, ang winning solusyon gisumiter sa usa ka team nga gisugdan sa tulo ka mga tigdukiduki nga walay sa wala pa kasinatian sa building movie rekomendasyon sistema sa (Bell, Koren, and Volinsky 2010) .

Usa ka matahum nga bahin sa Netflix Prize mao nga kini nakahimo sa tanan sa kalibutan sa ilang solusyon evaluate minatarong, sa maayohon. Kon ang mga tawo upload sa ilang gitagna ratings, wala sila kinahanglan nga upload sa ilang academic credentials, ilang edad, rasa, gender, sekswal nga orientasyon, o sa bisan unsa mahitungod sa ilang kaugalingon. Busa, ang gitagna ratings sa usa ka bantog nga propesor gikan sa Stanford ang pagtratar gayud sa sama nga ingon sa mga gikan sa usa ka tin-edyer sa iyang lawak nga higdaanan. Ikasubo, kini dili mao ang tinuod nga diha sa kadaghanan sa sosyal nga research. Nga mao, alang sa kadaghanan sa sosyal nga research, evaluation mao ang kaayo nga nagaut-ut sa panahon ug sa partially suhetibong. Busa, ang kadaghanan sa research nga mga ideya dili gayod seryoso evaluate, ug sa diha nga mga ideya evaluate, kini mao ang lisud nga sa tangtangon nga mga ebalwasyon gikan sa Magbubuhat sa mga ideya. Tungod kay ang mga solusyon sa mga sayon ​​sa pagsusi, bukas sa mga tawag motugot tigdukiduki sa pag-access sa tanan nga mga kalagmitan maanindot nga mga solusyon nga mahulog pinaagi sa mga liki kon sila lamang giisip nga solusyon gikan sa inila nga propesor.

Kay sa panig-ingnan, sa usa ka punto sa panahon sa Netflix Prize sa usa ka tawo sa ngalan screen Simon Funk posted sa iyang blog sa usa ka gisugyot nga solusyon base sa usa ka singular bili kadugta, usa ka pamaagi sa linear algebra nga wala gigamit kaniadto sa ubang mga partisipante. blog post ni Funk si dungan teknikal ug weirdly impormal nga. Ang kini nga blog post nga naghulagway sa usa ka maayo nga solusyon o kini nga usa ka awa-aw sa panahon? Sa gawas sa usa ka bukas nga proyekto tawag, ang solusyon aron dili gayud nakadawat seryoso nga evaluation. Human sa tanan si Simon Funk dili usa ka propesor sa Cal Tech o MIT; siya usa ka software developer nga, sa panahon, camping sa palibot sa New Zealand (Piatetsky 2007) . Kon siya email kini nga ideya sa usa ka engineer sa Netflix, kini hapit sa pagkatinuod dili unta gikuha seryoso.

Maayo na lang, tungod kay ang mga criteria sa evaluation sa mga tin-aw ug sayon ​​sa paggamit, ang iyang gitagna ratings mga evaluate, ug kini dayon tin-aw nga ang iyang pamaagi mao ang gamhanan kaayo: siya rocketed sa ikaupat nga dapit sa kompetisyon, usa ka dakong resulta nga gihatag nga sa uban nga mga teams na nagtrabaho alang sa mga bulan sa problema. Sa katapusan, mga bahin sa Simon Funk sa pamaagi nga gigamit sa halos sa tanan nga seryoso nga kompetensya (Bell, Koren, and Volinsky 2010) .

Ang kamatuoran nga si Simon Funk gipili sa pagsulat sa usa ka blog post nga nagpatin-aw sa iyang pamaagi, inay naningkamot sa paghupot niini nga tinago nga mga, naghulagway usab nga daghang mga partisipante sa Netflix Prize wala lamang nadasig sa milyon nga dolyar nga ganti. Hinunoa, daghang mga partisipante usab daw sa pagtagamtam sa intellectual hagit ug sa komunidad nga naugmad sa palibot sa problema (Thompson 2008) , mga pagbati nga ako nga sa daghan nga mga tigdukiduki masabtan.

Ang Netflix Prize mao ang usa ka classic nga ehemplo sa usa ka bukas nga tawag. Netflix gipangutana sa usa ka pangutana uban sa usa ka piho nga tumong (pagtagna ratings movie) ug nangayo solusyon gikan sa daghang mga tawo. Netflix nakahimo sa pagtimbang-timbang sa tanan niini nga mga solusyon tungod kay sila mas sayon ​​sa pagsusi kay sa paghimo, ug sa katapusan Netflix gikuha ang labing maayo nga solusyon. Sunod, ipakita ko kaninyo kon sa unsang paagi nga kini sama nga nga paagi mahimong gamiton sa Biology ug sa balaod.