5.3.1 Netflix Saria

Netflix Saria deialdi irekia erabiltzen duten filmak jendeak nahi den aurreikustea.

Ezagutzen den deialdi proiektu ezagunena Netflix saria da. Netflix lineako filmeen alokairuko enpresa da, eta 2000. urtean Cinematch-en abiarazi zuen, bezeroei filmak gomendatzeko zerbitzua. Adibidez, Cinematch-k Star Wars eta The Empire Strikes Back gustatu zitzaizkiola eta, ondoren , Jediaren itzulera ikusten duzula gomendatzen dizu. Hasieran, Cinematch gaizki lan egin zuen. Baina, urte askotan zehar, zinemaren bezeroek gozatuko zuten aurreikusteko gaitasuna hobetu zuen. 2006rako, ordea, Cinematch-en aurrerapenak plateauatu zuen. Netflixeko ikertzaileek pentsatu zuten guztia nahiko saiatu zen, baina, aldi berean, sistema hobetzeko lagungarri izan zitezkeen beste ideia batzuk ere susmatu zituzten. Horrela, irtenbide erradikala zen garaian, dei ireki bat zegoen.

Netflix sarirako arrakasta izan zuen kritikoa, dei irekia diseinatu zen, eta diseinu honek ikasgai garrantzitsuak ditu ikerketa sozialetarako deiak irekitzeko. Netflix-ek ideia ez-egituratuak eskatu zituen, jende asko iruditzen baitzaio lehenbailehen deia irekita dagoenean. Izan ere, Netflixek arazoren bat planteatu zuen ebaluazio prozedura sinple batekin: jendeak 100 milioi film kalifikazioren bat erabiltzea zalantzan jarri zuen 3 milioi heldutasun balorazio aurreikusteko (erabiltzaileek egindako balorazioak, baina Netflix-ek ez zuela askatu). Txinatchek milioi bat dolar baino gehiago irabaziko lukeen 3 milioi zaleen balorazioak aurreikusten dituen algoritmo bat sortuko duen lehen pertsona. Ebaluazio prozedura argi eta erraz hau balorazio aurreikusitako ratingsekin alderatuz gero, Netflix saria konponbide errazagoak sortzea baino errazagoa izan zen. Cinematch hobetzeko erronka bihurtu da dei irekietarako egokia den arazo bihurtzeko.

2006ko urrian, Netflix-ek 500.000 bezero inguruko 100 milioi film kalifikazioren datu-multzo bat argitaratu zuen (6 kapituluko datuen inguruko pribatutasun-ondorioak kontuan hartuko ditugu). Netflix datuek kontzeptualizatu ahal izango dute 20.000 film inguru inguruko 500.000 bezero inguruko matrize handi bat bezala. Matrize honen barruan, 100 bat puntu lortu zituzten eskala batetik bestera, bost izarretik (5.2 taula). Erronka matrizean ikusitako datuak erabiltzea aurreikusitako 3 milioi balorazio predikatzeko erabili zen.

5.2 taula: Netflix sariaren datuak eskematikoki
Filma 1 Movie 2 Movie 3 ... 20.000 film
Bezeroa 1 2 5 ... ?
Bezeroa 2 2 ? ... 3
Bezeroa 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Bezeroa 500.000 ? 2 ... 1

Mundu osoko ikertzaile eta hackerrek erronkari ekin zioten eta 2008an 30.000 pertsona baino gehiago lanean ari ziren (Thompson 2008) . Lehiaketaren zehar, Netflix-ek 40.000 soluzio baino gehiago bidali zituen 5.000 taldeetatik (Netflix 2009) . Jakina, Netflix-ek ezin zituen proposatutako soluzio guztiak irakurri eta ulertu. Guztia arazorik gabe joan zen, ordea, irtenbideak errazak izan ziren egiaztatzeko. Netflix-ek ordenagailu bat izan zezakeen aurreikusitako kalifikazioak aurrez zehaztutako kalifikazioak erabiliz zehaztutako metodo bat erabiliz (batez besteko karratuko erroreen erro karratua izan zen metodo partikularra). Netflix-ek soluzioak onar ditzakeen irtenbideak ebaluatu ditu azkarregi, eta horrek garrantzi handia izan du, ideia onak leku harrigarrietatik datozelako. Izan ere, irabazi-asmorik gabeko irtenbidea aurkeztu zuten hiru ikertzaileek egindako lana, aldez aurretik esperientzia eraikitzeko film aholku sistemak (Bell, Koren, and Volinsky 2010) .

Netflix sariaren alderdi ederra da proposatutako irtenbideak ebaluatzea nahiko egokia dela. Hau da, jendeak aurreikusitako balorazioak kargatzen zituenean, ez zuten beren kredentzial akademikoa, adina, arraza, sexua, sexu orientazioa, edo beraien inguruko zerbait kargatu. Stanford-eko irakasle ospetsuaren aurreikuspenen balorazioak bere logelan nerabeenekiko berdinak izan ziren. Zoritxarrez, hau ez da egia ikerketa sozial gehienetan. Hau da, ikerketa sozial gehienetan, ebaluazioa oso denbora asko eta partzialki subjektiboa da. Horrela, ikerketa-ideia gehienak inoiz ez dira ebaluatu serio, eta ideiak ebaluatzen direnean, ideia sortzaileek ebaluazio horiek desegiteko zaildu egiten dute. Deialdi proiektu irekiak, bestetik, ebaluazio erraza eta egokia izatea ahalbidetzen dute.

Esate baterako, Netflix Sariaren puntu batean, Simon Funk izeneko pantailako norbaitek bere blogean proposatutako irtenbidea argitaratu zuen balio bereizgarriaren deskonposizioan oinarritua, beste parte-hartzaile batzuek ez zutena aljebra lineal batetik abiatuta. Funk-en blog-mezua aldi berean teknikoa eta bitxia zen informala zen. Blogeko post hau irtenbide egokia deskribatu al zen edo denbora alferrik galdu zen? Deialdi irekiko proiektu baten kanpoan, ebazpena ez da inoiz ebaluazio larririk jaso. Azken finean, Simon Funk ez zen MITeko irakaslea; Zeure Zeelanda Berrian (Piatetsky 2007) software-garatzaile zen. Ideia hau Netflix-eko ingeniari bati mezu elektronikoa igorri bazaio, ziur asko ez litzateke irakurriko.

Zorionez, ebaluazio-irizpideak argi eta erraz aplikatu zirenez, bere balorazio aurreikuspenak ebaluatu egin ziren eta berehala argi zegoen bere ikuspegia oso indartsua zela: lehiaketa laugarrena izan zen, beste talde batzuek jadanik izan zuten emaitza izugarria. Arazoaren inguruko hilabeteetan lanean. Azkenean, bere ikuspuntuaren zatiak ia lehiakide larri guztiak erabiltzen zituzten (Bell, Koren, and Volinsky 2010) .

Izan ere, Simon Funk-ek blog-post bat idatzi zuen bere ikuspuntua azalduz, sekretua mantentzen saiatzen ari zen bitartean, Netflix Sarirako parte-hartzaile asko ez zirela milioika dolarreko saririk sortu. Aitzitik, parte-hartzaile askok erronka intelektuala eta arazoaren inguruan garatutako komunitatea (Thompson 2008) ere gustatu zitzaiela zirudien, ikertzaile askok ulertzen dituzten sentimenduak ulertu ahal izateko.

Netflix Saria deialdi irekiko adibide klasikoa da. Netflixek helburu zehatz bat planteatu zuen (filmaren balorazioak aurreikustea) eta jende askorentzako soluzioak eskatu zituen. Netflix-ek irtenbide horiek guztiak ebaluatu ditu, sortzea baino errazagoa delako, eta, azken finean, Netflix-ek konponbide egokiena aukeratu zuen. Hurrengoa, erakutsiko dizut nola ikuspegi hori biologia eta zuzenbidean erabil daitekeen, eta milioi bat dolarreko saria gabe.