5.3.1 Prize Netflix

Çmimi Netflix përdor thirrje të hapur të parashikohet se cila filma njerëzit do të donte.

Më të njohur projekti thirrje e hapur është Çmimin Netflix. Netflix është një kompani online film me qira, dhe në vitin 2000 ajo nisi Cinematch, një shërbim për të rekomanduar filma për konsumatorët. Për shembull, Cinematch mund të vëreni se ju ka pëlqyer Star Wars dhe Strikes Back Empire dhe pastaj ju rekomandojmë që të shikojnë Kthimi i Jedi. Fillimisht, Cinematch punuar dobët. Por, gjatë shumë viteve, Cinematch vazhduar për të përmirësuar aftësinë e tij për të parashikuar se çfarë filma konsumatorët do të gëzojnë. Nga 2006, megjithatë, progresi në Cinematch plateaued. Hulumtuesit në Netflix kishte provuar shumë e shumë çdo gjë që mund të mendoni, por në të njëjtën kohë, ata dyshohet se ka pasur ide të tjera që mund të ndihmojnë ata të përmirësojnë sistemin e tyre. Kështu, ata dolën me atë që ishte, në atë kohë, një zgjidhje radikale: një thirrje të hapur.

Kritike për suksesin përfundimtar të Çmimit Netflix ishte se si thirrja e hapur ishte projektuar, dhe ky dizajn ka mësime të rëndësishme për mënyrën se si thirrjet e hapur mund të përdoret për kërkime sociale. Netflix nuk ka vetëm të vënë nga një kërkesë pastrukturuar për ide, e cila është ajo që shumë njerëz imagjinoni kur ata së pari të marrin në konsideratë një thirrje të hapur. Përkundrazi, Netflix përbën një problem të qartë me një kriter të thjeshtë të vlerësimit: ato sfiduar njerëzit që të përdorin një grup prej 100 milion ratings film të parashikohet se 3 milion mbahen-out ratings (vlerësimet që kishte bërë përdoruesit, por që Netflix nuk lirimin). Kushdo që mund të krijojë një algoritmi që mund të parashikojë të 3 milionë mbahen-out ratings 10% më i mirë se Cinematch do të fitojë 1 milion dollarë. Kjo qartë dhe të lehtë për të aplikuar kriteret e vlerësimit, krahasuar ratings parashikuar të mbahen-out ratings-do të thotë se Çmimi Netflix është përshtatur në mënyrë të tillë që zgjidhjet janë më të lehtë për të kontrolluar se sa gjeneruar; ajo doli me sfidën e përmirësimit Cinematch në një problem të përshtatshme për një thirrje të hapur.

Në tetor të vitit 2006, Netflix lëshuar një dataset përmban 100 milion ratings film nga rreth rreth 500.000 konsumatorë (ne do të marrin në konsideratë implikimet fshehtësisë së këtij njoftimi të dhënave në Kapitullin 6). Të dhënat Netflix mund të konceptohet si një matricë të madh që është afërsisht 500.000 klientët nga 20.000 filma. Në kuadër të kësaj matrice, ka qenë rreth 100 milionë ratings në një shkallë nga 1 deri në 5 yje të mundshëm (Tabela 5.2). Sfida është që të përdorin të dhënat e vëzhguara në matricën për të parashikuar të 3 milionë mbahen-out ratings.

Tabela 5.2: skematike e të dhënave nga Çmimit Netflix. Netflix lëshuar rreth 100 milionë ratings (1 yll deri në 5 stars) të siguruara nga 500,000 konsumatorët në 20,000 filma. Qëllimi i Çmimit Netflix ishte për të përdorur këto vlerësime për të parashikuar të mbahen-out ratings e 3 milion filma, treguar si "?". vlerësimet e parashikuara të dorëzuara nga pjesëmarrësit në Çmimin Netflix janë krahasuar me ratings mbahen-out. Unë do të diskutojnë çështjet etike që rrethojnë këtë lirimin e të dhënave në kapitullin 6.
Movie 1 Movie 2 Movie 3 . . . Movie 20,000
Customer 1 2 5 . ?
Customer 2 2 ? . 3
Customer 3 ? 2 .
. . . . . . . .
Customer 500,000 ? 2 . 1

Hulumtuesit dhe hakerat në mbarë botën janë tërhequr në sfidën, dhe deri në vitin 2008 më shumë se 30.000 njerëz janë duke punuar në atë (Thompson 2008) . Gjatë konkursit, Netflix ka marrë më shumë se 40.000 zgjidhjet e propozuara nga më shumë se 5.000 ekipe (Netflix 2009) . Natyrisht, Netflix nuk mund të lexuar dhe kuptuar të gjitha këto zgjidhje të propozuara. Gjithë gjë u zhvillua pa probleme, megjithatë, për shkak se zgjidhjet ishin të lehtë për të kontrolluar. Netflix vetëm mund të ketë një kompjuter të krahasuar ratings parashikuar të ratings të mbajtura nga një metrik (metrikë të veçantë ata kanë përdorur është rrënja katrore e gabimit mesatar-squared) paracaktuar. Ishte kjo aftësi për të shpejt të vlerësuar zgjidhjet që mundësuar Netflix të pranojë zgjidhje nga të gjithë, e cila doli të jetë e rëndësishme, sepse idetë e mira vijnë nga disa vende të habitshme. Në fakt, zgjidhja fituese është paraqitur nga një ekip filluar nga tre studiuesve që nuk kishin ndërtimit përvoja e sistemeve të mëparshme movie rekomanduese (Bell, Koren, and Volinsky 2010) .

Një aspekt i bukur i Çmimit Netflix është se ajo ka mundësuar të gjithë në botë që të ketë zgjidhja e tyre vlerësohet në mënyrë të drejtë. Kur njerëzit ngarkuar shkallën e parashikuar, ata nuk kanë nevojë për të ngarkoni kredencialet e tyre akademike, e moshën, racën, gjininë, orientimin seksual, apo ndonjë gjë për veten e tyre. Kështu, vlerësimet e parashikuara nga një profesor i njohur nga Stanford u trajtuan pikërisht njëjtë si ato të një të riu në dhomë gjumi e saj. Për fat të keq, kjo nuk është e vërtetë në hulumtimet më të madhe sociale. Kjo është, për kërkime më të madhe sociale, vlerësimi është shumë kohë dhe pjesërisht subjektive. Pra, ide shumica e hulumtimit nuk janë vlerësuar seriozisht, dhe kur idetë janë vlerësuar, është e vështirë të shkëputen këto vlerësime nga krijuesit e ideve. Për shkak se zgjidhjet janë të lehtë për të kontrolluar, thirrjet e hapura të lejojë studiuesit për të hyrë në të gjitha zgjidhjet e mundshme të mrekullueshme që do të bien nëpër të çara në qoftë se ata konsiderohen vetëm zgjidhje nga profesorë të njohur.

Për shembull, në një moment gjatë dikush Çmimin Netflix me emrin ekran Simon Funk postuar në blog një zgjidhje e propozuar në bazë të një dekompozim vlerës njëjës, një qasje nga algjebër lineare që nuk ishte përdorur më parë nga pjesëmarrësit e tjerë. blog post Funk ishte njëkohësisht teknike dhe në mënyrë të çuditshme informal. Ishte ky blog post përshkruan një zgjidhje të mirë apo ishte një humbje kohe? Jashtë një projekt thirrje të hapur, zgjidhja nuk mund të ketë marrë vlerësim serioz. Në fund të fundit Simon Funk nuk ishte një profesor në Cal Teknike apo MIT; ai ishte një zhvillues software i cili, në atë kohë, u backpacking rreth Zelanda e Re (Piatetsky 2007) . Nëse ai kishte emailed këtë ide për një inxhinier në Netflix, ajo pothuajse me siguri do të nuk janë marrë seriozisht.

Për fat të mirë, sepse kriteret e vlerësimit ishin të qartë dhe të lehtë për të aplikuar, ratings e tij parashikoi janë vlerësuar, dhe ishte menjëherë e qartë se qasja e tij ishte shumë e fuqishme ai rocketed në vendin e katërt në konkurs, një rezultat i jashtëzakonshëm duke qenë se ekipet e tjera kanë qenë tashmë duke punuar për muaj të problemit. Në fund, pjesë e qasjes Simon Funk u përdorur nga pothuajse të gjithë konkurrentët të rënda (Bell, Koren, and Volinsky 2010) .

Fakti se Simon Funk zgjodhi për të shkruar një blog post duke shpjeguar qasjen e tij, në vend se duke u përpjekur për të mbajtur atë të fshehtë, po ashtu tregon se shumë pjesëmarrës në Çmimin Netflix nuk ishin të motivuara vetëm nga çmimi i milion dollarësh. Përkundrazi, shumë pjesëmarrës të dukej për të shijuar sfidën intelektuale dhe komunitetin që zhvilluar rreth problemit (Thompson 2008) , ndjenja që të presin shumë hulumtues mund të kuptoni.

Çmimi i Netflix është një shembull klasik i një thirrje të hapur. Netflix përbën një pyetje me një qëllim të veçantë (duke parashikuar ratings film) dhe kërkohen zgjidhje nga shumë njerëz. Netflix ishte në gjendje për të vlerësuar të gjitha këto zgjidhje, sepse ata ishin më të lehtë për të verifikuar se sa për të krijuar, dhe në fund të fundit Netflix zgjedhur zgjidhjen më të mirë. Tjetra, unë do të ju tregojnë se si kjo qasje njëjta mund të përdoret në biologji dhe ligjit.