5.3.1 Xelata Netflix

Xelata Netflix zimên banga vekirî mirov pêşbînî bike, ku movies gelê dixwazim wê.

Projeyê de banga vekirî herî baş tê zanîn ku xelata Netflix e. Netflix an şîrketa kirê movie liserxetê e, û di sala 2000 ew Cinematch, xizmeteke destpêkirin ji bo pêşniyar movies bo mişterî. Ji bo nimûne, Cinematch bibe bibînî ku hûn hez Star Wars û Strikes Empire Back û paşê tewsiye dikin ku tu watch Return of the Jedi. Di destpêkê de, Cinematch bi eksê xebitî. Lê belê, li ser Helbet ji gelek salan, Cinematch berdewam ji bo baştirkirina kapasîteya xwe ya ku texmîn bikin ku movies mişteriyên wê dilşad bibin. By 2006, lê belê, pêşketina li ser Cinematch plateaued. Ku lêkolînerên li Netflix hema her tiştê wan nikaribû ji difikirin hewl dabû, lê di eynî demê de, ew bi guman bûn ku ramanên din yên ku alîkariya wan sîstema xwe baştir heye. hevkarîya Open Call: bi vî awayî, ku ew bi çi bû çareseriyeke radîkal hat, di wê demê de,.

Krîtîk ji bo serkeftina sedem ku Xelata Netflix bû çawa banga vekirî hate çêkirin, û ev dîzayn dersên girîng ji bo çawa bangên vekirî dikare ji bo lêkolîna civakî tê bikaranîn. Netflix ew ne tenê derxistin derve an request napoxte ji bo ramanên, ku çi gelek kes difikirin dema ku ew yekemîn an banga vekirî dibînin. Lê belê, Netflix pirsîn a pirsgirêka zelal bi pîvanên nirxandinê simple: ew kesên ku rabûm bi kar set of 100 milyon ratings movie mirov pêşbînî bike, 3 milyon ratings lidarxistin-out (ratings ku bikarhênerên kiribû lê ji bo ku Netflix bernedan ne). Her kesê ku nikaribû an rêbazeke ku ji bo 3 mîlyon ratings lidarxistin-out texmîna 10% çêtir Cinematch dê 1 milyon dolar qezenc biafirîne. Ev zelal û hêsan derbas nirxandina pîvanên-di danberheva ratings Caf lidarxistin-out ratings-wateyê ku Xelata Netflix bi awayekî wisa ku çareserî hêsantir ji bo bipêşxistina ku venêrî pirsyar kirin; ev jî di warê başkirina Cinematch nav a pirsgirêka minasib ji bo banga vekirî zivirî.

Di meha cotmehê de ji 2006, Netflix a dataset dihewînin, mînakên 100 milyon ratings movie ji li ser li ser 500,000 mişteriyên (em dê encamên wê nepeniya vê serbestberdana welat li Chapter 6 bifikirin) serbest berdan. Daneyên Netflix dikarin wek matrix mezin e ku bi qasî 500,000 mişteriyên destê 20,000 movies, tifl-. Di vê matrix, li dora 100 milyon ratings li ser skalayek ji 1 heta 5 stars (Table 5.2) heye. Pirsiyara dawî de bi kar Daneyên dît ku di matrix ku pêşbînî li ser 3 milyon ratings lidarxistin-out.

Table 5.2: Schematic ên data ji Xelata Netflix. Netflix li ser 100 mîlyon ratings (1 star ji bo 5 stars) ji aliyê 500,000 muşterîyên li ser 20,000 movies berdan. Armanca Xelata Netflix bû ji bo bikaranîna van ratings ku pêşbînî li ser ratings lidarxistin-ji 3 milyon movies, li banî wek "?". ratings Caf ji aliyê beşdarên Xelata Netflix şandin ji ratings lidarxistin-derve bihêt kirin. Ez dê pirsgirêkên etîk ku li derdora vê serbestberdana welat li Chapter 6 nîqaş bikin.
Movie 1 Movie 2 Movie 3 . . . Movie 20,000
mişterî 1 2 5 . ?
mişterî 2 2 ? . 3
mişterî 3 ? 2 .
. . . . . . . .
mişterî 500,000 ? 2 . 1

Lêkolînvan û êrîşkirin li seranserî cîhanê, ji tekoşîna hatin kirin, û ji aliyê 2008 zêdetir ji 30,000 kesan li ser kar bûn (Thompson 2008) . Li ser Helbet ji hejêkerên, Netflix zêdetir ji 40,000 pêşniyarên çareseriyê ji pitir ji 5,000 tîmên wergirt (Netflix 2009) . Xuyaye, Netflix ne dikarin bixwînin û fêm bikin ev hemû pêşniyarên çareseriyê. Hemû tişt bi lez bi sebr, lê belê, ji ber ku çareserî bi hêsanî kontrol bûn. Netflix tenê nikaribû xwedî dibe beramberiya ratings Caf ji ratings lidarxistin-ji aliyê metric (ji metric taybetî ew kar root çargoşe error mean-Squared bû) pre-diyarkirin. Ev ev şiyana ku zû dinirxînin çareseriyên ku Netflix enabled to qebûl çareseriyê ji her kesê ku ji bo ku giring be, ji ber ku fikrên baş ji hin deverên ecêb bû. Di rastiyê de, çareseriyê bidestxistina ji aliyê ekîbeke dest bi sê lêkolînerên ku ti ​​ezmûna avakirina sîstemên pêşnîyar movie kiribû, hate dayîn (Bell, Koren, and Volinsky 2010) .

Yek mijareke xweşik ên di Xelata Netflix ew e ku, hemû kes di cîhanê de çalak be ji bo çareseriya wan nirxandin adil. Dema ku gelê ratings pêşbîniyê xwe uploaded, ew jî ne lazim bo barkirina û pêbawerên akademîk xwe, xwe bi temen, nijad, zayend, meyla cinsî, an jî tiştekî li ser xwe. Bi vî awayî, ratings Caf ji profesor navdar ji Stanford tam mîna wan ji teenager di oda xwe de hatin dermankirin. Mixabin, ev e di piraniya lêkolînên civakî de ne rast e. e ku, ji bo piraniya lêkolînên civakî, nirxandina pir sergêjî û bi qismî subjektîf e. Loma, piraniya ramanên lêkolîn bi tu caran bi cidî nirxandin, û dema ku ramanên nirxandin, lê zehmet e ku detach wan nirxandinên ji afirînerê ramanên. Ji ber ku çareserî ne hêsan e jî, bangên vekirî nehêlin ku lêkolîner ji bo xwe bigihînin tevahiya çareyên potansiyel nedîtî yên ku dê bi rêya tifingê bikeve, eger ew tenê çareseriyên ji mamosteyên navdar hesibandin.

Ji bo nimûne, li yek xala di dema yekî Xelata Netflix bi navê screen li Şimûn Funk posted li ser bloga çareseriya pêşniyara xwe li ser decomposition nirxa singular, bi nêrîneke ji cebir ku berê ji aliyê beşdarên din jî bi kar hatiye. blog post Funk ya hevdem teknîkî û weirdly nefermî bû. Bû, ev blog post ji bo danasîna çareseriyeke baş, an jî wê çolê ji dem bû? Li derveyî projeyeke banga vekirî, çareseriya qet bibe nirxandineke cidî stand. Piştî ku bû profesor li Cal Tech an MIT hemû Simon Funk ne; ew Developer ku, di wê demê de, li dora New Zealand Backpacking bû (Piatetsky 2007) . Eger ew vê fikrê to muhendis li Netflix bi rêket kiribû, ew hema hema bi rastî ne bi dijwarî hatin binçavkirin.

Başe, ji ber ku krîterên nirxandinê de zelal û hêsan derbas bûn, ratings pêşbîniyê xwe, nirxandin kirin û ew di cih de eşkere kir ku nêzîkatiya wî pir bi hêz bû: ew rêza çarem Di pêşbirkê de sedê, di encama mezin daye ku tîmên din hatibûn kar ji bo mehan li ser pirsgirêkê. Di dawiyê de, parçeyên nêzîkatiya Simon Funk ji aliyê hema hema hemû hevrikên giran hatin bikaranîn (Bell, Koren, and Volinsky 2010) .

Ev rastiyeke ku, Simon Funk hilbijart ji bo nivîsandina blog post bi mijara nêzîkatiya wî, li şûna ku hewl dide ku ew veşartî biparêze, bi h'ejmara ku gelek beşdaran, di Xelata Netflix bûn tenê ji aliyê xelata milyon dolar de sextekarî ne. Lê belê, gelek beşdaran jî xuya ji huneran li hember rewşenbîr û civaka ku li dora pirsgirêka pêş (Thompson 2008) , hest, ku ez li hêviya gelek lêkolîner dikarin fêm bikin.

Xelata Netflix a nimûne klasîk ên li ser banga vekirî ye. Netflix a question bi armanc daniye (encama ratings movie) û çareseriyên ji gelek kesên îrtîbatê. Netflix bikaribin van rast nenirxînin, çareseriyên bû, ji ber ku ew hêsantir bo piştraskirina ji ava bûn, û di dawiyê de Netflix doşeka baştirîn çareserî. Next, ez ê te çawa ev nêzîkatiya heman dikarin di biyolojî û qanûna bikaranîn nîşan bide.