5.3.1 Netflix Hadiah

Nu Netflix Hadiah ngagunakeun telepon kabuka pikeun ngaduga nu film urang bakal resep.

proyék telepon kabuka Nu pang alusna dipikawanoh nyaéta Hadiah Netflix. Netflix mangrupakeun pausahaan rental film online, jeung dina taun 2000 eta dibuka Cinematch, service ka nyarankeun film ka konsumén. Contona, Cinematch bisa bewara nu liked Star Wars jeung panarajangan Kakaisaran Back terus nyarankeun nu lalajo Return tina Jedi. Mimitina, Cinematch digawé kirang. Tapi, leuwih tangtu loba taun, Cinematch terus ngaronjatkeun pangabisa -na pikeun ngaduga film naon konsumén bakal ngarasakeun. Ku 2006, kumaha oge, kamajuan dina Cinematch plateaued. Para panalungtik di Netflix geus usaha lumayan loba sagalana maranéhanana bisa mikir, tapi di waktu nu sami, maranéhanana disangka nu aya gagasan séjén anu bisa Sangkan maranéhna gampang dina ngaronjatkeun sistim maranéhanana. Ku kituna, maranehna datang nepi ka naon ieu, di waktu, leyuran radikal: telepon kabuka.

Kritis ka kasuksésan ahirna of Hadiah Netflix ieu kumaha telepon kabuka dirarancang, jeung design ieu ngabogaan palajaran penting pikeun kumaha telepon kabuka bisa dipaké pikeun panalungtikan sosial. Netflix teu ngan nunda kaluar hiji paménta unstructured keur gagasan, nu naon loba jelema dibayangkeun basa aranjeunna mimiti mertimbangkeun telepon kabuka. Rada, Netflix ngawarah masalah jelas jeung kritéria meunteun basajan: maranehna ditantang urang ngagunakeun susunan 100 juta ratings film pikeun ngaduga 3 juta dilaksanakeun-kaluar ratings (ratings nu pamaké geus dijieun tapi Netflix teu ngaleupaskeun). Saha bisa nyieun algoritma anu bisa ngaduga 3 juta dilaksanakeun-kaluar ratings 10% leuwih hade tinimbang Cinematch bakal meunang 1 juta dollar. Ieu jelas jeung gampang panawaran evaluasi patokan-ngabandingkeun ratings diprediksi ka dilaksanakeun-kaluar ratings-Hartina, Hadiah Netflix ieu dipiguraan dina cara saperti nu solusi nu leuwih gampang pikeun mariksa ti ngahasilkeun; eta ngahurungkeun tangtangan tina ningkatkeun Cinematch jadi masalah cocog pikeun telepon kabuka.

Dina Oktober 2006, Netflix ngarilis dataset ngandung 100 juta ratings film ti ngeunaan ngeunaan 500.000 konsumén (urang bakal mertimbangkeun implikasi privasi tina release data ieu di Bab 6). Data Netflix bisa conceptualized salaku matrix badag anu kira-kira 500.000 konsumén ku 20.000 film. Dina matrix ieu, aya kira-kira 100 juta ratings dina skala ti 1 nepi ka 5 béntang (Table 5.2). tangtangan ieu make data observasi dina matrix ka ngaduga 3 juta dilaksanakeun-kaluar ratings.

Table 5.2: Schematic data ti Hadiah Netflix. Netflix dileupaskeun kira 100 juta ratings (1 béntang ka 5 béntang) nu disadiakeun ku 500.000 konsumén dina 20.000 film. Tujuan Hadiah Netflix ieu make ratings ieu keur prediksi dilaksanakeun-kaluar ratings 3 juta pilem, dipidangkeun salaku "?". ratings diprediksi nyerah ku pamilon dina Hadiah Netflix anu dibandingkeun jeung ratings dilaksanakeun-kaluar. Kuring bakal ngabahas isu etika sabudeureun ieu release data dina Bab 6.
Movie 1 Movie 2 Movie 3 . . . Movie 20.000
Palanggan 1 2 5 . ?
Palanggan 2 2 ? . 3
Palanggan 3 ? 2 .
. . . . . . . .
Palanggan 500.000 ? 2 . 1

Panalungtik jeung hackers sakuliah dunya anu ditarik ka tangtangan, sarta ku 2008 leuwih ti 30.000 urang gawe dina eta (Thompson 2008) . Leuwih kursus kontes teh, Netflix narima leuwih ti 40.000 leyuran diusulkeun ti leuwih ti 5.000 tim (Netflix 2009) . Jelas, Netflix teu bisa maca jeung ngarti sadaya leyuran ieu diusulkeun. Sakabeh hal lumpat lancar, kumaha oge, sabab leyuran éta gampang pikeun mariksa. Netflix ngan bisa boga komputer ngabandingkeun ratings diprediksi ka ratings dilaksanakeun-kaluar ku métrik (nu métrik tangtu maranehna dipaké ieu akar kuadrat kasalahan mean-kuadrat) pre-husus. Ieu kamampuhan ieu gancang evaluate leyuran nu diaktipkeun Netflix narima solusi ti dulur, anu tétéla jadi penting lantaran gagasan alus datang ti sababaraha tempat héran. Kanyataanna, leyuran unggul ieu nyerah ku tim dimimitian ku tilu panalungtik nu teu boga pangalaman wangunan sistem rekomendasi film prior (Bell, Koren, and Volinsky 2010) .

Hiji aspék geulis Hadiah Netflix téh nya éta diaktipkeun everyone di dunya boga solusi maranéhanana dievaluasi cukup. Lamun urang dimuat ratings maranéhanana diprediksi, maranéhanana teu kudu unggah Kapercayaan akademik maranéhanana, maranéhanana umur, ras, gender, orientasi seksual, atawa nanaon ngeunaan diri. Ku kituna, ratings diprediksi tina profesor kawentar ti Stanford dirawat persis sarua jeung jalma ti rumaja di pangkeng nya. Hanjakalna, ieu téh teu bener dina panalungtikan sosial paling. Hartina, pikeun panalungtikan sosial paling, évaluasi pisan consuming waktu jeung sawaréh subjektif. Jadi, paling gagasan panalungtikan anu kungsi dievaluasi serius, sarta lamun gagasan anu dievaluasi, geus hésé coplokkeun Panakawan maranéhanana ti panyipta tina gagasan. Sabab solusi anu gampang mariksa, telepon kabuka ngidinan panalungtik pikeun ngakses sadaya leyuran nu berpotensi éndah nu bakal tumiba ngaliwatan retakan lamun maranehna ngan dianggap solusi ti profesor kawentar.

Contona, di hiji titik salila Netflix Hadiah batur jeung ngaran layar Simon Funk dipasang dina blog leyuran-Na diusulkeun dumasar kana nilai dékomposisi tunggal, hiji pendekatan ti aljabar linier nu geus teu acan dipaké saméméhna ku pamilon séjén. post blog Funk sacara ieu sakaligus téhnis jeung weirdly informal. Ieu post blog ieu ngajéntrékeun leyuran alus atawa ieu eta hiji runtah waktu? Di luar hiji proyék telepon kabuka, leyuran jadi kungsi geus nampa evaluasi serius. Sanggeus kabéh Simon Funk ieu teu profesor di Cal Tech atawa MIT; manéhna developer software anu, di waktu, ieu backpacking kira-kira Selandia Anyar (Piatetsky 2007) . Lamun manéhna geus emailed pamanggih ieu ka insinyur di Netflix, eta ampir pasti bakal teu geus dicokot sacara serius.

Untungna, sabab kriteria meunteun éta jelas jeung gampang panawaran, ratings-Na diprediksi anu dievaluasi, sarta ieu instan jelas yen pendekatan nya éta pohara kuat: manéhna rocketed ka tempat kaopat di kompetisi, hasil tremendous nunjukkeun yen tim séjén geus geus geus gawe bulan dina masalah. Dina ahir, bagian pendekatan Simon Funk urang anu dipaké ku ampir sakabéh pesaing serius (Bell, Koren, and Volinsky 2010) .

Kanyataan yén Simon Funk milih nulis pos blog dijelaskeun pendekatan-Na, tinimbang nyoba ngajaga eta rusiah, ogé illustrates nu loba pamilon dina Hadiah Netflix teu ngamotivasi sacara éksklusif ku hadiah juta dollar. Rada, loba pamilon ogé seemed ngarasakeun tangtangan intelektual jeung masarakat nu dimekarkeun kira-kira masalah (Thompson 2008) , parasaan mah nyangka loba panalungtik bisa ngarti.

Nu Netflix Hadiah mangrupa conto Palasik hiji sauran muka. Netflix ngawarah Patarosan kalayan tujuan husus (ngaramal ratings film) jeung solicited solusi ti loba jelema. Netflix ieu bisa evaluate sadaya leyuran ieu sabab éta gampang pikeun pariksa ti nyieun, sarta pamustunganana Netflix meunang leyuran pangalusna. Next, Abdi gé mintonkeun Anjeun kumaha pendekatan sarua ieu bisa dipaké dina biologi jeung hukum.