5.3.1 Netflix Bebungah

Netflix Bebungah migunakake telpon mbukak kanggo mrédhiksi kang movies wong bakal kaya.

Proyek panggilan sing paling kondhang yaiku Netflix Prize. Netflix minangka perusahaan rental film online, lan ing taun 2000, dheweke ngetokake Cinematch, layanan kanggo menehi saran film kanggo para pelanggan. Contone, Cinematch bisa uga sok dong mirsani sing nyenengake Star Wars lan Kakaisaran Strike Mbalik banjur menehi saran supaya sampeyan nonton Return of the Jedi . Kaping pisanan, Cinematch kerja keras. Nanging, sajrone pirang-pirang taun, terus nambah kemampuan kanggo ngramal apa film sing bakal di senengi para pelanggan. Nanging, ing 2006, kemajuan ing Cinematch wis ngrambah. Para peneliti ing Netflix wis nyoba akeh sing bisa dipikirake, nanging, ing wektu sing padha, dheweke ngira yen ana gagasan liya sing bisa mbantu supaya bisa nambah sistem. Mangkono, dheweke teka karo apa sing ana, ing wektu, solusi radikal: panggilan sing mbukak.

Critical kanggo sukses Netflix ing pungkasan yaiku carane telpon mbukak dirancang, lan desain iki duwe piwulangan penting babagan carane mbukak telpon bisa digunakake kanggo riset sosial. Netflix ora mung nyuwun panjalukan kanggo ide, sing akeh wong mbayang-mbayangake nalika nimbang-nimbang panggilan mbukak. Netflix nyatakake masalah sing jelas karo prosedur evaluasi sing prasaja: wong-wong mau nggunakake tantangan kanggo nyetel 100 juta rating film kanggo ngramalake rating 3 yuta sing dianakake (peringkat sing kedhaftar digawe nanging Netflix ora diluncurake). Wong pisanan nggawe algoritma sing mbedakake rating 3 yuta sing dianakake 10% luwih apik tinimbang Cinematch bakal menang jutaan dolar. Iki cetha lan gampang kanggo aplikasi prosedur evaluasi-mbandhingake peringkat sing direkam kanthi ratings sing ditahan-tegese Netflix Prize diringkes kanthi cara sing solusi luwih gampang kanggo mriksa saka generate; dadi tantangan kanggo ngapikake Cinematch dadi masalah sing cocok kanggo telpon sing mbukak.

Ing wulan Oktober 2006, Netflix ngluncuraké dèmbèp sing ngandhut 100 yuta rating film saka kira-kira 500.000 pelanggan (kita bakal nyinaoni implikasi privasi rilis data iki ing bab 6). Data Netflix bisa dikonsep minangka matriks ageng sing kira-kira 500.000 pelanggan kanthi 20.000 film. Ing matriks iki, ana sekitar 100 yuta rating ing skala saka siji nganti limang bintang (Tabel 5.2). Tantangan iki nggunakake data sing diamati ing matriks kanggo ngramal 3 yuta peringkat sing ditahan.

Tabel 5.2: Skematis Data saka Bebungah Netflix
Film 1 Wayang 2 Wayang 3 ... Film 20.000
Pelanggan 1 2 5 ... ?
Customer 2 2 ? ... 3
Customer 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Pelanggan 500.000 ? 2 ... 1

Peneliti lan peretas ing saindenging donya ditarik tantangan, lan ing 2008 luwih saka 30.000 wong nyambut gawe (Thompson 2008) . Sajrone kontes, Netflix nampa luwih saka 40.000 solusi sing diusulake saka luwih saka 5,000 tim (Netflix 2009) . Temenan, Netflix ora bisa maca lan mangerteni kabeh solusi kasebut. Nanging, kabeh masalah mlaku kanthi lancar, amarga solusi gampang dipriksa. Netflix mung duwé komputer mbandhingaké peringkat sing diprediksi kanthi rating sing dianakaké kanthi nggunakake metrik prespecified (metrik tartamtu sing dipigunakaké minangka root kuadrat saka kesalahan kuadrat rata-rata). Iku kemampuan kanggo cepet ngevaluasi solusi sing netepake Netflix kanggo nampa solusi saka kabeh wong, sing dadi penting amarga gagasan apik teka saka sawetara panggonan sing nggegirisi. Ing kasunyatan kasebut, solusi menang dikirimake dening tim sing diwiwiti dening telu peneliti sing ora duwe pengalaman ngembangake sistem rekomendasi film (Bell, Koren, and Volinsky 2010) .

Salah siji aspek apik saka Netflix Prize yaiku supaya kabeh solusi sing diusulake bisa dievaluasi kanthi adil. Dadi, nalika wong-wong diunggahake rating sing dianggep, dheweke ora perlu ngunggah kredensial akademik, umur, ras, gender, orientasi seksual, utawa apa-apa bab awake dhewe. Penafsiran sing diprediksi saka profesor terkenal saka Stanford diobati persis sama karo sing saka remaja ing kamar turu. Sayange, iki ora bener ing paling riset sosial. Sing, kanggo paling riset sosial, evaluasi banget wektu-wektu lan sebagian subyektif. Dadi, akeh gagasan riset sing ora tau dievaluasi sacara serius, lan nalika gagasan diandharake, ora angel nyisakake evaluasi kasebut saka panyipta gagasan. Proyek-proyek buka bukaan, ing tangan liyane, duwe evaluasi sing gampang lan adil supaya bisa nemokake gagasan sing bakal ditolak sebaliknya.

Contone, ing salah sawijining titik sajrone Bebungah Netflix, wong sing nganggo jeneng layar Simon Funk ngirimake solusi ing ngajokaken adhedhasar dekomposisi nilai tunggal, pendekatan saka aljabar linear sing durung digunakake sadurunge dening peserta liyane. Posting blog Funk iku bebarengan karo informal lan ora resmi. Punapa postingan blog punika nggambaraken solusi ingkang sae utawi mbuang-buang waktu? Luwih saka proyek panggilan sing mbukak, solusi kasebut durung tau ditampa kanthi serius. Sawise kabeh, Simon Funk ora dadi profesor ing MIT; piyambakipun dados pangembang piranti lunak ingkang, nalika punika, tas kerja ing (Piatetsky 2007) New Zealand (Piatetsky 2007) . Yen dheweke wis dikirim lewat email menyang insinyur ing Netflix, mesthine ora bakal dibaca.

Untunge, amarga kriteria evaluasi cetha lan gampang diterapake, rating sing diratingake wis dievaluasi, lan kanthi cepet cetha yen pendekatane banget kuat: dheweke roket menyang posisi kaping papat ing kompetisi, asil apik banget yen tim liyane wis digunakake kanggo sasi ing masalah. Ing pungkasan, bagean-bagian pendekatane digunakake dening saingan kabeh pesaing serius (Bell, Koren, and Volinsky 2010) .

Kasunyatan bilih Simon Funk milih nulis postingan blog sing njelasake pendekatan, tinimbang nyoba njaga rahasia, uga nggambarake manawa akeh peserta Netflix ing Priyantun ora mumpuni kanthi hadiah milyaran dolar. Luwih akeh peserta uga nyenengake tantangan intelektual lan komunitas sing dikembangake ing masalah kasebut (Thompson 2008) , perasaan sing aku ngarepake akeh peneliti bisa ngerti.

Bebungah Netflix minangka conto klasik saka telpon sing mbukak. Netflix ngajokake pitakonan karo tujuan tartamtu (ngira rating film) lan solusi solicited saka akeh wong. Netflix bisa ngira-ngira kabeh solusi kasebut amarga luwih gampang kanggo mriksa tinimbang nggawe, lan pungkasane Netflix milih solusi sing paling apik. Sabanjure, aku bakal nuduhake sampeyan carane pendekatan sing padha bisa digunakake ing biologi lan hukum, lan tanpa hadiah jutaan dolar.