5.3.1 Netflix Bebungah

Netflix Bebungah migunakake telpon mbukak kanggo mrédhiksi kang movies wong bakal kaya.

project telpon mbukak paling uga dikenal minangka hadiah Netflix. Netflix iku sawijining perusahaan rental movie online, lan ing taun 2000 dibukak Cinematch, layanan kanggo menehi saran film kanggo pelanggan. Contone, Cinematch bisa sok dong mirsani sing disenengi Star Wars lan serangan Kekaisaran Back lan banjur menehi rekomendasi sing nonton Bali saka Jedi. Kaping pisanan, Cinematch makarya lingkungan. Nanging, liwat Course saka akeh taun, Cinematch terus kanggo nambah kemampuan kanggo prédhiksi film apa pelanggan seneng. Miturut 2006, Nanging, proses ing Cinematch plateaued. Peneliti ing Netflix wis nyoba cantik akeh kabeh padha bisa mikir, nanging ing wektu sing padha, padha seng di tuduh sing ana gagasan sing bisa ngrewangi nambah sistem sing. Mangkono, padha munggah karo apa iki, ing wektu, solusi radikal: telpon mbukak.

Kritis kanggo sukses akhire Bebungah Netflix ana carane telpon mbukak iki dirancang, lan desain iki wis piwulang penting carane telpon mbukak bisa digunakake kanggo riset sosial. Netflix ora mung sijine metu request unstructured kanggo gagasan, kang apa akeh wong mbayangno nalika padha nimbang lan telpon mbukak. Luwih, Netflix nuduhke masalah langit karo kritéria evaluasi prasaja: padha tantangan wong nggunakake pesawat saka 100 yuta ratings movie kanggo mrédhiksi 3 yuta dianakaké-metu ratings (ratings sing kedhaftar wis digawe nanging sing Netflix ora nerbitaké). Sapa sing bisa nggawe algoritma sing bisa prédhiksi 3 yuta dianakaké-metu ratings 10% luwih saka Cinematch bakal menang 1 yuta dolar. Iki cetha lan gampang kanggo aplikasi evaluasi kritéria-mbandingaken ratings mbadek dianakaké-metu ratings-temenan Bebungah Netflix iki bakal dipigura ing kuwi cara sing solusi sing luwih gampang kanggo mriksa saka generate; diaktifake tantangan Ngapikake Cinematch menyang masalah cocok kanggo telpon mbukak.

Sasi Oktober 2006, Netflix dirilis perlengkapan data ngemot 100 yuta ratings movie saka bab babagan 500.000 pelanggan (kita nimbang mbek privasi release data iki ing Bab 6). The data Netflix bisa conceptualized minangka matriks ageng sing kira-kira 500.000 pelanggan dening 20,000 film. Ing matrik iki, ana bab 100 yuta ratings ing ukuran saka 1 kanggo 5 stars (Tabel 5.2). tantangan iki nggunakake data diamati ing matrik kanggo mrédhiksi 3 yuta dianakaké-metu ratings.

Tabel 5.2: Skematis data saka Bebungah Netflix. Netflix dirilis 100 yuta ratings (1 star kanggo 5 stars) diwenehake dening 500.000 pelanggan ing 20,000 film. Ing goal Bebungah Netflix iki kanggo nggunakake ratings iki kanggo mrédhiksi dianakaké-metu ratings saka 3 yuta film, dituduhake minangka "?". ratings mbadek diajukake dening peserta ing Hadhiah Netflix padha dibandhingake ratings dianakaké-metu. Aku bakal ngrembug masalah sopan lingkungan iki release data ing Bab 6.
movie 1 movie 2 movie 3 . . . movie 20,000
customer 1 2 5 . ?
customer 2 2 ? . 3
customer 3 ? 2 .
. . . . . . . .
customer 500.000 ? 2 . 1

Peneliti lan hacker saindhenging donya padha digambar kanggo tantangan, lan 2008 luwih saka 30,000 wong padha nggarap iku (Thompson 2008) . Liwat dalan saka kontes, Netflix ditampa luwih saka 40,000 solusi ngajokaken saka luwih saka 5,000 tim (Netflix 2009) . Temenan, Netflix ora bisa maca lan ngerti kabeh solusi iki ngajokaken. Ing bab kabèh mlayu lancar, Nanging, amarga solusi padha gampang kanggo mriksa. Netflix bisa mung duwe komputer mbandhingaké ratings mbadek ratings dianakaké-metu dening meter (ing meter tartamtu padha digunakake ana ing ROOT kothak kesalahan tegese adoh) wis kasebut. Iku kemampuan kanggo cepet ngira-ngira solusi sing aktif Netflix kanggo nampa solusi saka everyone, kang nguripake metu dadi penting amarga gagasan apik teka saka sawetara panggonan ngageti. Ing kasunyatan, solusi menang dipun andaraken dening tim diwiwiti dening telung peneliti sing wis ora pengalaman bangunan sistem rujukan movie sadurunge (Bell, Koren, and Volinsky 2010) .

Siji aspek ayu Bebungah Netflix iku aktif everyone ing donya duwe solusi sing mandhiri nyedhaki. Nalika wong diunggahaké ratings mbadek, padha ora perlu kanggo ngunggah Diverifikasi akademisi, sing umur, lomba, Jenis Kelamin, orientasi seksual, utawa apa-apa bab piyambak. Mangkono, ing ratings mbadek saka profesor misuwur saka Stanford padha dianggep persis padha sing saka taruna ing kamaripun. Sayange, iki ora bener ing riset sosial paling. Sing, kanggo riset sosial paling, evaluasi banget wektu lan sebagian subyektif. Dadi, paling gagasan riset sing tau mandhiri akeh, lan nalika gagasan sing mandhiri, iku hard kanggo copot evaluasi sing saka pangripta gagasan. Amarga solusi gampang kanggo mriksa, telpon mbukak ngidini kanggo riset ngakses kabeh solusi ing potensi apik sing bakal tiba liwat retak yen padha mung dianggep solusi saka profesor misuwur.

Contone, ing salah siji titik sak Netflix Bebungah wong kanthi jeneng layar Simon Funk dikirim blog solusi kang ngajokaken adhedhasar Nilai bosok tunggal, pendekatan saka aljabar linear sing wis ora dianggo sadurunge dening peserta liyane. kirim blog Funk kang ana bebarengan technical lan Ananging ora resmi. Iki kirim blog iki njlentrehke solusi sing apik utawa ana iku sampah wektu? Outside saka project telpon mbukak, solusi bisa tau wis nampa evaluasi serius. Sawise kabeh Simon Funk ora profesor ing Cal Tech utawa MIT; kang ana pangembang software sing, ing wektu, iki backpacking watara New Zealand (Piatetsky 2007) . Yen wis dikirim idea iki kanggo insinyur ing Netflix, iku meh mesthi bakal ora wis dijupuk akeh.

Begjanipun, amarga kritéria evaluasi padha cetha lan gampang kanggo aplikasi, ratings kang mbadek padha mandhiri, lan iku enggal cetha sing pendekatan banget kuat: kang rocketed kanggo papat Panggonan ing kompetisi, asil sanget diwenehi sing tim liyane wis wis wis digunakake kanggo sasi ing masalah. Ing pungkasan, bagean saka pendekatan Simon Funk kang padha digunakake dening sakbenere kabeh saingan serius (Bell, Koren, and Volinsky 2010) .

Kasunyatan sing Simon Funk milih kanggo nulis post blog penjelasan pendekatan, tinimbang nyoba kanggo tetep rahasia, uga nggambaraké sing akeh peserta ing Hadhiah Netflix padha ora motivasi istimewa dening hadiah yuta dollar. Luwih, akeh peserta uga ketoke seneng tantangan intelektual lan masyarakat sing dikembangaké watara masalah (Thompson 2008) , raos aku nyana akeh peneliti bisa ngerti.

Netflix Bebungah menika tuladha klasik saka telpon mbukak. Netflix nuduhke pitakonan karo goal tartamtu (ngiro ratings movie) lan solicited solusi saka akeh wong. Netflix bisa kanggo ngira-ngira kabeh solusi iki amarga padha luwih gampang kanggo verifikasi saka kanggo nggawe, lan pungkasanipun kagelar Netflix ngangkat solusi sing paling apik. Sabanjure, aku bakal nuduhake sampeyan carane pendekatan padha bisa digunakake ing biologi lan hukum.