5.3.1 Netflix Saria

Netflix Saria deialdi irekia erabiltzen duten filmak jendeak nahi den aurreikustea.

ezagunena deialdi irekia Proiektua Netflix Saria da. Netflix online filma alokatzeko enpresa bat da, eta 2000an Cinematch, zerbitzu bat abian jarri du filmak gomendatzen bezeroei. Adibidez, Cinematch Star Wars eta Empire Strikes gustatu duzula Itzuli eta gero gomendatzen Jedi itzulera ikusten duzula nabarituko dezake. Hasieran, Cinematch aritu gaizki. Baina, urte askotan zehar, Cinematch zer filmak bezeroei gozatzeko litzateke iragartzeko bere gaitasuna hobetzeko jarraitu. 2006an, ordea, aurrerapen Cinematch on plateaued. Netflix ikertzaileek saiatu izan nahiko askoz dena uste izan dute, baina, aldi berean, susmatzen dute ez dagoela beste ideia beren sistema hobetzen lagundu dezakete ziren. Horrela, sortu ziren zer izan zen, garai hartan, erradikala irtenbide bat: deialdi irekia.

Netflix Saria arrakastaren balizko kritikoa zen deialdi irekian nola diseinatu zuten, eta asmo hori nola deialdiak ikerketa sozialak egiteko erabili ahal izango da ikasgai garrantzitsuak ditu. Netflix ez itzali ideia eskaera egituratu gabea, hau da, zer jende askok imajinatu ere, kontuan hartzen dute lehenengo deialdi irekia. Izan ere, Netflix ebaluazio irizpideak sinple bat arazo argi bat planteatzen: pertsona desafioa dute 100 milioi movie ratings multzo bat erabili 3 milioi ospatuko-out balorazioak iragartzeko (balorazioak duten erabiltzaileek egin zituen, baina hori Netflix ez zuen askatu). Edonork algoritmo bat erabiltzen du, 3 milioi ospatuko-out ratings% 10 hobea Cinematch baino 1 milioi dolar irabazi zituen iragartzeko sortu dezake. Honek argi eta erraz ebaluazio irizpide-alderatuz iragarri ospatuko-out to balorazioak aplikatzeko balorazioak-ekarri Netflix Saria modu bat dela konponbide errazago sortuko baino egiaztatu dira, hala nola eratua zegoen; Cinematch hobetzeko arazoren bat deialdi irekia egokia sartu erronkari horrexegatik da.

2006ko urrian, Netflix kaleratu 100 milioi movie ratings dituen bezeroei buruz 500.000 batetik (datu pribatuak oharra honen ondorioak 6. kapituluan aztertuko dugu) multzoaren bat. Netflix datuak matrize handi bat da, gutxi gorabehera, 500.000 bezeroak 20.000 filmak bezala kontzeptualizatu daiteke. matrize horren barruan, 1 eta 5 stars (5.2 taula) eskala bat balorazioak 100 milioi inguru egon ziren. Erronka zen ikusitako datuak erabili matrize 3 milioi ospatuko-out balorazioak iragartzeko.

5.2 taula: Netflix Saria datuen eskematikoa. Netflix kaleratu ratings 100 milioi inguru (1 star 5 stars) 500.000 bezeroek emandako 20.000 filmak. Netflix Saria helburua balorazioak hauek erabili ospatuko-out 3 milioi filmak, "?" Erakusten balorazioak iragartzea zen. Netflix Sarian parte hartzaileek aurkeztutako iragarri balorazioak ziren alderatuta ospatuko-out balorazioak. arazo etiko datuak 6. kapituluan oharra honen inguruko hitz egingo dut.
Movie 1 Movie 2 Movie 3 . . . Movie 20.000
Bezeroaren 1 2 5 . ?
Bezeroaren 2 2 ? . 3
Bezeroaren 3 ? 2 .
. . . . . . . .
Bezeroaren 500.000 ? 2 . 1

Ikertzaileak eta hacker mundu osoko ziren erronka marraztuta, eta 2008 arabera 30.000 pertsona baino gehiago ari da lanean (Thompson 2008) . Lehiaketan zehar, Netflix 40.000 proposatutako konponbideak jaso 5.000 baino gehiago taldeetako (Netflix 2009) . Jakina, Netflix ezin irakurri eta proposatutako irtenbide horiek guztiak ulertzen. Gauza osoa ran dihoa, ordea, irtenbide erraza egiaztatu zirelako. Netflix besterik ezin dute ordenagailu bat alderatu iragarri ospatuko-out balorazioak balorazioak aurrez zehaztutako metrikoa (metrikoa bereziki besteko karratuaren error erro karratua zen erabiltzen dute) batek. Netflix gaituta dagoela guztiontzat, aktibatuta garrantzitsua izan den ideia ona leku harrigarriak batzuk zetorren delako irtenbideak onartzeko konponbideak azkar ebaluatzeko gaitasun hori izan da. Izan ere, irabazlearen irtenbide zen hiru ikertzaile zuela aldez aurretik esperientzia eraikin movie gomendio sistemen hasitako talde batek aurkeztu (Bell, Koren, and Volinsky 2010) .

One Netflix Saria alderdi ederra da munduko pertsona guztiek gaituta dela haien konponbidea ebaluatu nahiko dute. Igotako Jendeak bere iragarri balorazioak, ez zuten beren kredentzialak akademiko, adina, arraza, sexua, sexu-joera, edo bere burua buruz ezer igo behar. Horrela, iragarri Stanford irakasle ospetsu baten balorazioak tratatu ziren zehazki bere logelan nerabe dira berberak. Zoritxarrez, hau ez da ikerketa gizarte gehienetan egia. Hau da, ikerketa sozial gehienak, ebaluazio oso denbora kontsumitzen eta partzialki subjektiboa da. Beraz, ikerketa ideia gehienak ez dira inoiz serio ebaluatu, eta ideiak ebaluatu dira, zaila da ebaluazio horien deskonektatzea ideia sortzailea from. konponbide erraza egiaztatu daudelako, deialdiak ikertzaileek konponbide potentzialki zoragarria duten pitzadurak bidez erori litzateke irakasleek ospetsua irtenbide bakarra dira kontuan hartzen bada sartzeko aukera izan dezaten.

Adibidez, puntu bat pantaila izenarekin Netflix Saria norbait unetan Simon Funk argitaratua bere blog proposatutako irtenbide bat oinarritzen singular balio deskonposizio batean, hori ez zuen erabili dira aldez aurretik beste partehartzaileek algebra lineala ikuspuntua. Funk-ren blog post, aldi berean, tekniko eta weirdly informal zen. Zen blog post hau irtenbide ona bat deskribatzeko edo denbora galtze bat izan zen? dei irekiko proiektu bat kanpo, konponbidea agian inoiz ebaluazio larriak jaso dute. Ondoren Simon Funk guztiak ez zen Cal Tech edo MIT irakasle bat; software developer bat, garai hartan, izan zen Zeelanda Berrian inguruan backpacking zen (Piatetsky 2007) . zuen epostan izan bada ideia hori Netflix ingeniariak, da ia zalantzarik gabe, ez dute serio hartu dira.

Zorionez, ebaluazio irizpideak argi eta erraz aplikatzeko zirelako, bere iragarri balorazioak ebaluatu ziren, eta berehala argi bere planteamendu hori oso indartsua izan zen: Bilintx lehiaketan laugarren postua zuen, emaitza izugarria eman beste taldeek jada arazoa hilabetez lanean. Azkenean, Simon Funk hurbilketa zati ia guztiak lehiakide larria erabili zituzten (Bell, Koren, and Volinsky 2010) .

Izan ere, Simon Funk hori aukeratu zuen bere ikuspegi azaltzeko, baizik eta isilpean gorde nahian baino blog post bat idazteko, halaber ilustratzen duten Netflix Sarian parte-hartzaile askok ez ziren esklusiboki milioi dolarreko saria motibaturik. Izan ere, parte-hartzaile askok ere zirudien erronka intelektual eta komunitatea arazoaren inguruan garatzen gozatzeko (Thompson 2008) , sentimendu hori ikertzaile askok ulertu ahal espero dut.

Netflix Saria deialdi ireki baten adibide klasiko bat da. Netflix galdera bat planteatzen badu helburu zehatz batekin (movie ratings iragartzeko) eta konponbideak eskatu jende askok. Netflix Irtenbide horiek guztiak ebaluatu zen gai izan ziren errazago sortu baino egiaztatzeko delako, eta, azken finean, Netflix konponbide onena bildu. Hurrengoa, erakutsi dut nola planteamendu hau bera biologia eta legeak ere erabili ahal izango da.