5.3.1 Premju Netflix

Il-Premju Netflix użi sejħa miftuħa li wieħed ibassar liema films nies ser simili.

Il-proġett iktar magħrufa sejħa miftuħa huwa l-Premju Netflix. Netflix hija online kumpannija movie kiri, u fl-2000 nediet Cinematch, servizz li jirrakkomanda films lill-klijenti. Per eżempju, Cinematch tista 'tinnota li inti gustado Star Wars u Strikes Imperu Lura u mbagħad jirrakkomanda li inti tara Ritorn tal-jedi. Inizjalment, Cinematch maħduma b'mod fqir. Iżda, matul il-kors ta 'bosta snin, Cinematch kompliet ittejjeb il-kapaċità tagħha li wieħed ibassar liema films klijenti se jgawdu. Sa l-2006, madankollu, il-progress fuq Cinematch plateaued. Ir-riċerkaturi fi Netflix kienu ippruvaw kollox pretty ħafna huma jista 'jaħseb, iżda fl-istess ħin, huma suspett li kien hemm ideat oħra li tista' tgħin lilhom ittejjeb is-sistema tagħhom. Għalhekk, dawn ħarāet bil dak li kien, fiż-żmien, soluzzjoni radikali: sejħa miftuħa.

Kritiku għas-suċċess eventwali tal-Premju Netflix kienet kif is-sejħa miftuħa kienet iddisinjata, u dan id-disinn għandu lezzjonijiet importanti dwar kif sejħiet miftuħa jistgħu jintużaw għal riċerka soċjali. Netflix ma biss tqiegħed talba mhux strutturata għall-ideat, li huwa dak li ħafna nies jimmaġina meta l-ewwel jikkunsidraw sejħa miftuħa. Pjuttost, Netflix ħoloq problema ċara ma 'kriterji ta' evalwazzjoni sempliċi: huma kkontestaw in-nies li jużaw sett ta '100 miljun klassifikazzjonijiet movie li wieħed ibassar 3 miljun klassifikazzjonijiet miżmuma barra (klassifikazzjonijiet li l-utenti kienu għamlu iżda li Netflix ma rilaxx). Kull min jista 'joħloq algoritmu li jistgħu jbassru t-3 miljun klassifikazzjonijiet miżmuma barra 10% aħjar minn Cinematch se jirbħu 1 miljun dollaru. Din il ċar u faċli biex japplikaw evalwazzjoni kriterji tat-tqabbil klassifikazzjonijiet mbassra li saru barra klassifikazzjonijiet-fisser li l-Premju Netflix kien inkwadrati b'tali mod li s-soluzzjonijiet huma aktar faċli biex jiċċekkjaw milli jiġġeneraw; li rriżulta l-isfida tat-titjib Cinematch fi problema adattat għal sejħa miftuħa.

F'Ottubru tal-2006, Netflix rilaxxati CCD fihom 100 miljun klassifikazzjonijiet movie minn madwar madwar 500,000 klijenti (aħna ser tikkunsidra l-implikazzjonijiet tal-privatezza ta 'dan ir-rilaxx tad-data fil-Kapitolu 6). Id-data Netflix tista 'tiġi kunċettwalizzat bħala matriċi enormi li hi ta' madwar 500,000 klijenti minn 20,000 films. Fi ħdan dan il-matriċi, kien hemm madwar 100 miljun kwalifiki fuq skala minn 1 sa 5 stilel (Tabella 5.2). L-isfida kienet li jużaw id-dejta osservata fil-matriċi li jbassru t-3 miljun klassifikazzjonijiet miżmuma barra.

Tabella 5.2: Skematika ta 'data mill-Premju Netflix. Netflix rilaxxati madwar 100 miljun klassifikazzjonijiet (1 star sa 5 stilel) provduti minn 500,000 klijenti fuq 20,000 films. L-għan tal-Premju Netflix kien li jużaw dawn il-klassifikazzjonijiet li jbassru l-klassifikazzjonijiet miżmuma barra ta '3 miljun films, murija bħala "?". klassifikazzjonijiet mbassra li jitressqu minn parteċipanti fis-Premju Netflix tqabblu mal-klassifikazzjonijiet miżmuma barra. I se jiddiskutu l-kwistjonijiet etiċi li jdawwar din l-istqarrija tad-data fil-Kapitolu 6.
movie 1 movie 2 movie 3 . . . movie 20000
klijent 1 2 5 . ?
klijent 2 2 ? . 3
klijent 3 ? 2 .
. . . . . . . .
klijent 500000 ? 2 . 1

Riċerkaturi u hackers madwar id-dinja kienu mfassla l-isfida, u sa l-2008 b'aktar minn 30,000 ruħ kienu jaħdmu fuqu (Thompson 2008) . Matul il-kors tal-konkors, Netflix rċeviet aktar minn 40,000 soluzzjonijiet proposti minn aktar minn 5,000 timijiet (Netflix 2009) . Ovvjament, Netflix ma setgħux jaqraw u jifhmu l dawn is-soluzzjonijiet proposti. Il-ħaġa sħiħa dam bla xkiel, madankollu, minħabba s-soluzzjonijiet kienu faċli biex jiċċekkjaw. Netflix jistgħu biss ikollhom kompjuter jqabblu l-klassifikazzjonijiet mbassra għall-klassifikazzjonijiet miżmuma barra minn metrika (il metriku partikolari li użat kien l-għerq kwadrat tal-iżball-medja kwadrat) speċifikat minn qabel. Kien din l-abilità li jevalwa malajr soluzzjonijiet li ppermettiet Netflix li jaċċettaw soluzzjonijiet minn kulħadd, li rriżultaw li huma importanti għaliex l-ideat tajbin kienu ġejjin minn xi postijiet sorprendenti. Fil-fatt, is-soluzzjoni rebbieħa kienet sottomessa minn tim beda minn tliet riċerkaturi li kellhom l-ebda sistema ta 'qabel ta' bini esperjenza rakkomandazzjoni movie (Bell, Koren, and Volinsky 2010) .

Aspett wieħed sabiħa tal-Premju Netflix huwa li ppermettiet lil kulħadd fid-dinja li jkollhom soluzzjoni tagħhom evalwati b'mod ġust. Meta n-nies uploaded klassifikazzjonijiet previsti tagħhom, huma ma kellhomx bżonn biex ittella kredenzjali akkademiċi tagħhom, tagħhom età, razza, sess, orjentazzjoni sesswali, jew xi ħaġa dwarhom infushom. Għalhekk, il-klassifikazzjonijiet mbassra ta 'professur famuż minn Stanford kienu ttrattati eżattament l-istess bħal dawk minn żagħżugħ fil kamra tas-sodda tagħha. Sfortunatament, dan mhux veru f'ħafna riċerka soċjali. Dan huwa, għal ħafna riċerka soċjali, l-evalwazzjoni huwa ħafna ħin u parzjalment suġġettivi. Allura, ideat ta 'riċerka aktar huma qatt evalwati bis-serjetà, u meta l-ideat huma evalwati, huwa diffiċli li jinqata dawn l-evalwazzjonijiet mill-kreatur ta' l-ideat. Minħabba soluzzjonijiet huma faċli biex jiċċekkjaw, sejħiet miftuħa jippermettu lir-riċerkaturi biex ikollha aċċess għall-soluzzjonijiet potenzjalment isbaħ li jaqgħu permezz tal-xquq jekk huma biss ikkunsidrati soluzzjonijiet minn professuri famużi.

Per eżempju, fil-punt wieħed matul il-ħadd Premju Netflix bl-isem iskrin Simon Funk stazzjonati fuq blog soluzzjoni proposta tiegħu bbażat fuq dekompożizzjoni valur singular, approċċ minn alġebra lineari li ma kinux ġew użati qabel mill-parteċipanti l-oħra. blog post Funk kien simultanjament teknika u weirdly informali. Kien dan blog post jiddeskrivi soluzzjoni tajba jew ma kien ħela ta 'ħin? Barra minn proġett sejħa miftuħa, is-soluzzjoni tista qatt rċevew evalwazzjoni serja. Wara kollox Simon Funk ma kien professur fil Cal Tech jew MIT; huwa kien żviluppatur ta 'softwer li, fiż-żmien, kien backpacking madwar New Zealand (Piatetsky 2007) . Kieku emailed din l-idea ma 'inġinier fil Netflix, huwa kważi ċertament ma kinitx tkun jittieħdu bis-serjetà.

Fortunatament, minħabba li l-kriterji ta 'evalwazzjoni kienu ċari u faċli biex japplikaw, klassifikazzjonijiet mbassra tiegħu kienu evalwati, u kien istantanjament ċar li l-approċċ tiegħu kienet b'saħħitha ħafna: huwa b'ħeffa kbira lill raba' post fil-kompetizzjoni, minħabba tremendi minħabba li timijiet oħra kienu diġà ġew jaħdmu għal xahar fuq il-problema. Fl-aħħar, partijiet ta 'approċċ Simon Funk kienu użati minn kważi kulħadd kompetituri serji (Bell, Koren, and Volinsky 2010) .

Il-fatt li Simon Funk għażlet li tikteb blog post li tispjega l-approċċ tiegħu, aktar milli jippruvaw li jżommha sigriet, turi wkoll li ħafna parteċipanti fil-Premju Netflix ma kinux motivati ​​b'mod esklussiv mill-premju miljun dollaru. Pjuttost, ħafna parteċipanti deher ukoll li jgawdu l-isfida intellettwali u l-komunità li żviluppaw madwar l-problema (Thompson 2008) , sentimenti li nistenna ħafna riċerkaturi jistgħu jifhmu.

Il-Premju Netflix huwa eżempju klassiku ta 'sejħa miftuħa. Netflix maħluqa mistoqsija bil-mira speċifika (tbassir klassifikazzjonijiet movie) u miġjuba soluzzjonijiet minn ħafna nies. Netflix kienet f'pożizzjoni li jevalwaw dawn is-soluzzjonijiet kollha għaliex kienu faċli biex jivverifikaw milli joħolqu, u finalment Netflix qabad l-aħjar soluzzjoni. Sussegwentement, jiena ser nuruk kif din l-istess approċċ jista 'jintuża fil-bijoloġija u l-liġi.