5.3.1 Netflix Hadiah

Nu Netflix Hadiah ngagunakeun telepon kabuka pikeun ngaduga nu film urang bakal resep.

proyék panggero kabuka paling ogé dipikawanoh nyaeta Hadiah Netflix. Netflix mangrupa parusahaan rental pilem online, sarta dina 2000 éta dibuka Cinematch, layanan pikeun nyarankeun pilem ka konsumén. Contona, Cinematch bisa aya bewara nu resep Star Wars sarta The Kakaisaran panarajangan Balik lajeng nyarankeun nu lalajo Balik ti Jedi. Dina awalna, Cinematch digawé kirang. Tapi, ngaliwatan kursus sababaraha taun, éta terus ngaronjatkeun kamampuhna pikeun ngaduga pilem naon konsumén bakal ngarasakeun. Ku 2006, kumaha oge, kamajuan dina Cinematch sempet plateaued. Para panalungtik dina Netflix sempet diusahakeun lumayan loba sagalana maranéhna bisa mikir, tapi, dina waktos anu sareng, aranjeunna disangka yen aya pamanggih sejenna nu bisa ngabantu aranjeunna ningkatkeun sistem maranéhanana. Ku kituna, aranjeunna datang nepi ka naon, wanoh, leyuran radikal: hiji panggero muka.

Kritis kana kasuksésan ahirna tina Hadiah Netflix éta kumaha panggero kabuka ieu dirancang, sarta rarancang ieu boga palajaran penting pikeun kumaha nelepon kabuka bisa dipaké pikeun panalungtikan sosial. Netflix henteu ngan nempatkeun kaluar hiji pamundut anu henteu kaduga pikeun gagasan, nu kumaha loba jalma ngabayangkeun lamun aranjeunna mimiti mertimbangkeun hiji panggero muka. Rada, Netflix ngawarah masalah jelas kalawan prosedur evaluasi basajan: aranjeunna ditantang jalma ngagunakeun susunan 100 juta ratings pilem keur prediksi 3 juta dilaksanakeun-kaluar ratings (ratings yén pamaké geus dijieun tapi nu Netflix teu ngaleupaskeun). Baé pangheulana nyieun hiji algoritma anu diprediksi dina 3 juta dilaksanakeun-kaluar ratings 10% leuwih hade tinimbang Cinematch bakal meunang sajuta dollar. Prosedur-ngabandingkeun evaluasi Ieu jelas tur gampang panawaran ratings diprediksi kalawan ngayakeun-kaluar ratings-dimaksudkan yén Hadiah Netflix ieu dipiguraan dina cara sapertos nu solusi éta gampang pariksa ti ngahasilkeun; eta ngahurungkeun tantangan ti ngaronjatkeun Cinematch kana masalah cocog pikeun hiji panggero muka.

Dina Oktober 2006, Netflix ngarilis dataset ngandung 100 juta ratings pilem tina ngeunaan ngeunaan 500.000 konsumén (urang anggap implikasi privasi sahiji siaran data ieu surah 6). Data Netflix bisa conceptualized salaku matrix badag nu mangrupa kira 500.000 konsumén ku 20.000 pilem. Dina matrix ieu, aya kira-kira 100 juta ratings dina skala ti hiji nepi ka lima béntang (tabel 5.2). tantangan ieu ngagunakeun data observasi dina matrix keur prediksi 3 juta dilaksanakeun-kaluar ratings.

Tabél 5.2: Schematic of Data ti Hadiah Netflix
pilem 1 pilem 2 pilem 3 ... pilem 20.000
customer 1 2 5 ... ?
customer 2 2 ? ... 3
customer 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
customer 500.000 ? 2 ... 1

Peneliti sarta hacker sabudeureun dunya anu digambar keur tantangan, sarta ku 2008 leuwih ti 30.000 urang anu dipake dina eta (Thompson 2008) . Ngaliwatan kursus kontes teh, Netflix narima leuwih ti 40.000 solusi usulan ti leuwih ti 5,000 tim (Netflix 2009) . Jelas, Netflix teu bisa maca jeung ngarti kabeh solusi ieu diusulkeun. Sakabeh hal lumpat mulus kitu, sabab solusi éta gampang pikeun pariksa. Netflix ngan bisa boga komputer ngabandingkeun ratings diprediksi jeung dilaksanakeun-kaluar ratings maké métrik prespecified (nu métrik tinangtu maranéhna dipaké éta akar kuadrat mean kuadrat kasalahan). Ieu kabisa ieu gancang evaluate solusi nu diaktipkeun Netflix narima solusi ti dulur, anu tétéla jadi penting lantaran gagasan alus datang ti sababaraha tempat héran. Kanyataanna, leyuran unggul ieu dikintunkeun ku tim dimimitian ku tilu peneliti anu teu boga pangalaman wangunan sistem rekomendasi pilem prior (Bell, Koren, and Volinsky 2010) .

Hiji aspék geulis ti Hadiah Netflix téh nya éta sangkan sagala solusi diusulkeun bisa dievaluasi cukup. Hartina, lamun urang diunggah ratings maranéhna diprediksi, aranjeunna henteu kudu unggah Kapercayaan akademik maranéhanana, maranéhanana umur, lomba, gender, orientasi seksual, atanapi naon bae ngeunaan diri. ratings nu diprediksi tina profesor kawentar ti Stanford dirawat persis sarua jeung pamadegan ti rumaja di pangkeng nya. Hanjakal, ieu téh teu bener dina panalungtikan sosial paling. Hartina, pikeun panalungtikan sosial paling, évaluasi pisan waktu-consuming sarta sawaréh subjektif. Ku kituna, paling pamendak hasil panalungtikan anu pernah dievaluasi serius, sarta lamun gagasan anu dievaluasi, éta hésé coplokkeun Panakawan pamadegan ti panyipta sahiji gagasan. proyék panggero kabuka, di sisi sejen, kudu meunteun panggampangna tur adil ngarah bisa manggihan ide anu bakal jadi lasut disebutkeun.

Contona, dina hiji titik dina mangsa Hadiah Netflix, batur kalawan nami layar Simon Funk dipasang dina blog na leyuran diusulkeun dumasar kana hiji nilai dékomposisi tunggal, hiji pendekatan ti aljabar linier nu geus teu kungsi dipaké saacanna ku pamilon séjén. pos blog Funk urang éta sakaligus teknis na weirdly informal. Ieu pos blog ieu ngajéntrékeun leyuran alus atawa éta hiji runtah waktu? Luar tina hiji proyek panggero kabuka, leyuran bisa pernah nampi evaluasi serius. Barina ogé, Simon Funk teu jadi profesor di MIT; anjeunna pamekar software anu, wanoh, ieu backpacking sabudeureun UNPAD (Piatetsky 2007) . Mun anjeunna ngalaman emailed gagasan ieu insinyur di Netflix, éta ampir pasti bakal moal geus maca.

Untungna, ku sabab kriteria meunteun éta jelas tur gampang panawaran, ratings na diprediksi anu dievaluasi, sarta ieu instan jelas yén pendekatan nya éta anu pohara kuat: anjeunna rocketed ka tempat kaopat dina kompetisi, hasil tremendous nunjukkeun yen tim séjén geus geus geus gawe bulan on masalah. Tungtungna, bagéan pendekatan na anu dipaké ku ampir sakabéh pesaing serius (Bell, Koren, and Volinsky 2010) .

Kanyataan yén Simon Funk milih nulis pos blog dijelaskeun pendekatan na, tinimbang nyobian tetep eta rusiah, ogé illustrates nu loba pamilon dina Hadiah Netflix teu ngamotivasi éksklusif ku hadiah juta-dollar. Rada, loba pamilon ogé seemed ngarasakeun tantangan intelektual jeung komunitas nu dikembangkeun di sabudeureun masalah (Thompson 2008) , parasaan mah nyangka loba peneliti tiasa ngartos.

The Netflix Hadiah mangrupakeun conto klasik ngeunaan hiji panggero muka. Netflix ngawarah sual kalayan tujuan husus (ngaramal ratings pilem) jeung solicited solusi tina loba jalma. Netflix éta bisa evaluate sagala solusi ieu alatan maranéhanana éta gampang pariksa ti pikeun nyieun, sarta pamustunganana Netflix ngangkat solusi pangalusna. Salajengna, kuring gé nunjukkeun maneh kumaha pendekatan sarua ieu bisa dipaké dina biologi jeung hukum, sarta tanpa hadiah juta-dollar.