5.3.1 Prize Netflix

Çmimi Netflix përdor thirrje të hapur të parashikohet se cila filma njerëzit do të donte.

Projekti më i njohur i thirrjeve të hapura është Çmimi Netflix. Netflix është një kompani me qira në internet, dhe në vitin 2000 lansoi Kinematch, një shërbim për të rekomanduar filma për klientët. Për shembull, Cinematch mund të vërente se ju pëlqente Star Wars dhe The Empire Strikes Back dhe më pas ju rekomandojmë që të shikoni Kthimin e Jedi . Fillimisht, Cinematch ka punuar keq. Por, gjatë shumë viteve, ajo vazhdoi të përmirësonte aftësinë e saj për të parashikuar se cilat filma do të kënaqeshin nga klientët. Sidoqoftë, deri në vitin 2006, përparimi në Kinematch kishte plasaritur. Studiuesit në Netflix kishin provuar shumë gjëra që mund të mendonin, por, në të njëjtën kohë, dyshonin se kishte ide të tjera që mund t'i ndihmonin ata të përmirësonin sistemin e tyre. Kështu, ata dolën me atë që ishte, në atë kohë, një zgjidhje radikale: një thirrje e hapur.

Kritik për suksesin eventual të Çmimit Netflix ishte mënyra se si u hartua thirrja e hapur dhe ky dizajn ka mësime të rëndësishme për mënyrën se si mund të përdoren thirrjet e hapura për kërkime sociale. Netflix nuk solli thjesht një kërkesë të pastrukturuar për idetë, të cilat janë ato që shumë njerëz imagjinojnë kur së pari e konsiderojnë një thirrje të hapur. Përkundrazi, Netflix paraqiti një problem të qartë me një procedurë të thjeshtë vlerësimi: ata sfiduan njerëzit që të përdorin një sërë 100 milionë ratings filmash për të parashikuar 3 milion vlerësime të grumbulluara (ratings që përdoruesit kishin bërë, por që Netflix nuk u lirua). Personi i parë për të krijuar një algoritëm që parashikoi 3 milionë vlerësime të grumbulluara 10% më mirë se Cinematch do të fitonte një milion dollarë. Kjo procedurë e qartë dhe e lehtë për të aplikuar - duke krahasuar vlerësimet e parashikuara me vlerësimet e mbajtura - do të thoshte se Çmimi Netflix ishte i përshtatur në atë mënyrë që zgjidhjet të ishin më të lehta për t'u kontrolluar se sa gjenerimi; u kthye në sfidën e përmirësimit të Kinematchit në një problem të përshtatshëm për një telefonatë të hapur.

Në tetor të vitit 2006, Netflix lëshoi ​​një skedar të dhënash që përmbante 100 milionë vlerësime filmike nga rreth 500,000 klientë (do të shqyrtojmë implikimet e privatësisë së këtij lirimi të të dhënave në kapitullin 6). Të dhënat Netflix mund të konceptohen si një matricë e madhe që është rreth 500,000 klientë nga 20,000 filma. Brenda kësaj matrice, kishte rreth 100 milionë vlerësime në një shkallë nga një deri në pesë yje (tabela 5.2). Sfida ishte të përdoreshin të dhënat e vëzhguara në matricë për të parashikuar vlerësimet e grumbulluara prej 3 milion.

Tabela 5.2: Skema e të Dhënave nga Çmimi Netflix
Filmi 1 Filmi 2 Filmi 3 ... Filmi 20,000
Klienti 1 2 5 ... ?
Klienti 2 2 ? ... 3
Klienti 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Klienti 500,000 ? 2 ... 1

Hulumtuesit dhe hakerët anembanë botës u tërhoqën në sfidë, dhe nga 2008 më shumë se 30,000 njerëz punonin në të (Thompson 2008) . Gjatë rrjedhës së konkursit, Netflix mori më shumë se 40,000 zgjidhje të propozuara nga më shumë se 5.000 skuadra (Netflix 2009) . Natyrisht, Netflix nuk mund të lexonte dhe të kuptonte të gjitha këto zgjidhje të propozuara. Gjithë gjë vazhdoi mirë, megjithatë, sepse zgjidhjet ishin të lehta për t'u kontrolluar. Netflix mund të ketë vetëm një kompjuter krahasuar vlerësimet e parashikuara me vlerësimet e përdorura duke përdorur një metrik të paracaktuar (metrika e veçantë që ata përdorën ishte rrënja katrore e gabimit mesatar të katrorit). Ishte kjo aftësi për të vlerësuar shpejt zgjidhjet që mundësuan që Netflix të pranonte zgjidhje nga të gjithë, gjë që doli të ishte e rëndësishme sepse idetë e mira vinin nga disa vende të habitshme. Në fakt, zgjidhja fituese u paraqit nga një ekip i nisur nga tre studiues të cilët nuk kishin ndërtim paraprak të sistemeve të rekomandimeve të filmit (Bell, Koren, and Volinsky 2010) .

Një aspekt i bukur i Çmimit Netflix është se ai mundësoi që të gjitha zgjidhjet e propozuara të vlerësohen në mënyrë të drejtë. Kjo është, kur njerëzit ngarkuan vlerësimet e tyre të parashikuara, ata nuk kishin nevojë të ngarkonin kredencialet e tyre akademike, moshën, racën, gjininë, orientimin seksual, ose ndonjë gjë tjetër rreth vetes. Vlerësimet e parashikuara të një profesori të njohur nga Stanford u trajtuan pikërisht si ato të një të riu në dhomën e saj të gjumit. Për fat të keq, kjo nuk është e vërtetë në shumicën e hulumtimeve sociale. Kjo është, për shumicën e hulumtimeve sociale, vlerësimi është shumë kohë dhe pjesërisht subjektiv. Pra, shumica e ideve të hulumtimit kurrë nuk vlerësohen seriozisht dhe kur vlerësohen idetë, është e vështirë të shkëpusim këto vlerësime nga krijuesi i ideve. Projektet e thirrjeve të hapura, nga ana tjetër, kanë vlerësim të lehtë dhe të drejtë, në mënyrë që të mund të zbulojnë ide që do të humbeshin ndryshe.

Për shembull, në një moment gjatë Çmimit Netflix, dikush me emrin e ekranit Simon Funk postoi në blogun e tij një zgjidhje të propozuar bazuar në dekompozimin e vlerës së njëjës, një qasje nga algjebra lineare që nuk ishte përdorur më parë nga pjesëmarrësit e tjerë. Postimi i blogut i Funk ishte në të njëjtën kohë teknik dhe i çuditshëm informal. A ishte ky post në blog që përshkruante një zgjidhje të mirë apo ishte një humbje kohe? Jashtë një projekti të thirrjes së hapur, zgjidhja kurrë nuk mund të ketë marrë vlerësim serioz. Në fund të fundit, Simon Funk nuk ishte një profesor në MIT; ai ishte një zhvillues i softuerëve, i cili, në atë kohë, po (Piatetsky 2007) përreth Zelandës së Re (Piatetsky 2007) . Nëse ai e kishte dërguar këtë ide tek një inxhinier në Netflix, pothuajse me siguri nuk do të ishte lexuar.

Për fat të mirë, për shkak se kriteret e vlerësimit ishin të qarta dhe të lehta për t'u aplikuar, vlerësimet e tij të parashikuara u vlerësuan dhe ishte menjëherë e qartë se qasja e tij ishte shumë e fuqishme: ai u rrëzua në vendin e katërt në konkurrim, një rezultat i jashtëzakonshëm duke pasur parasysh se ekipet e tjera tashmë ishin duke punuar për muaj për problemin. Në fund, pjesë të qasjes së tij ishin përdorur pothuajse nga të gjithë konkurrentët seriozë (Bell, Koren, and Volinsky 2010) .

Fakti që Simon Funk zgjodhi të shkruante një postim në blog duke shpjeguar qasjen e tij, në vend që të përpiqej ta mbante sekret, gjithashtu ilustron që shumë pjesëmarrës në Çmimin Netflix nuk ishin të motivuar ekskluzivisht nga çmimi i milion dollarësh. Përkundrazi, shumë pjesëmarrës duket se gëzonin sfidën intelektuale dhe komunitetin që u zhvillua rreth problemit (Thompson 2008) , ndjenjat që pres që shumë studiues mund ta kuptojnë.

Çmimi Netflix është një shembull klasik i një thirrjeje të hapur. Netflix paraqiti një pyetje me një qëllim të caktuar (duke parashikuar vlerësimet e filmave) dhe kërkoi zgjidhje nga shumë njerëz. Netflix ishte në gjendje të vlerësonte të gjitha këto zgjidhje sepse ato ishin më të lehta për t'u kontrolluar se sa për të krijuar, dhe në fund Netflix zgjodhi zgjidhjen më të mirë. Tjetra, unë do t'ju tregoj se si kjo qasje e njëjtë mund të përdoret në biologji dhe ligj dhe pa një çmim prej milion dollarësh.