5.3.1 Netflix Prize

Þessi þýðing var búin til af tölvu. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.3.1 Netflix Prize

The Netflix Prize notar opinn símtal til að spá sem kvikmyndir fólk verður eins.

The best þekktur opinn kalla verkefnið er Netflix Prize. Netflix er online bíómynd leiga fyrirtæki, og árið 2000 hóf Cinematch, þjónustu til að mæla bíó til viðskiptavina. Til dæmis, Cinematch kannski tekið eftir því að þér líkar Star Wars og Empire Strikes Back og þá með því að þú horfir aftur á Jedi. Upphaflega, Cinematch vann illa. En, á meðan mörg ár, Cinematch áfram að bæta getu sína til að spá fyrir um hvað kvikmyndir viðskiptavinir myndu njóta. By 2006, þó framfarir á Cinematch plateaued. Rannsakendur á Netflix hafði reynt nánast allt sem þeir gátu hugsað, en á sama tíma, grunaði að þeir sem þar voru aðrar hugmyndir sem gætu hjálpað þeim að bæta kerfi þeirra. Þannig komu þeir upp með hvað var, á þeim tíma, róttæka lausn: opið hringja.

Mikilvægt að lokum velgengni Netflix Nóbels var hvernig opið hringt var hannað, og þessi hönnun er mikilvæg lærdóm fyrir hversu opið símtöl er hægt að nota fyrir félagslega rannsókna. Netflix ekki bara að setja út ómótaðan beiðni um hugmyndir, sem er það sem margir ímynda sér þegar þeir fjalla fyrst opnu hringja. Frekar, Netflix stafar skýra vandamál með einfaldri matsviðmið: Þeir áskorun fólk til að nota a setja af 100 milljónir bíómynd gesta að spá 3 milljónir haldin út lánshæfismat (einkunnir sem notendur höfðu gert en að Netflix ekki gefa út). Einhver sem gæti búið til reiknirit sem gæti spá fyrir um 3 milljónir haldið út lánshæfismat 10% betri en Cinematch myndi vinna 1 milljón dollara. Þetta ljóst og auðvelt að beita matsviðmið-bera spáð einkunnir til vörslu út gesta-þýddi að Netflix verðlaunin var í ramma á þann hátt að lausnir eru auðveldara að athuga en búa; það kom áskorun um að bæta Cinematch inn í a vandamál sem henta fyrir opnu símtal.

Í október 2006, Netflix út gagnapakkann inniheldur 100 milljónir bíómynd lánshæfismat frá um um 500.000 viðskiptavina (við munum íhuga næði afleiðingarnar af þessum gögnum útgáfu í kafla 6). Netflix gögn má conceptualized eins mikið fylkið sem er um það bil 500.000 viðskiptavinir með 20.000 kvikmyndir. Innan þessa fylki, voru um 100 milljónir einkunnir á kvarðanum frá 1 til 5 stjörnur (tafla 5.2). Áskorunin var að nota þau gögn sem komu fram í fylkinu til að spá fyrir um 3 milljónir haldið út einkunnir.

Tafla 5.2: Yfirlit um gögn frá Netflix verðlaunin. Netflix út um 100 milljónir lánshæfiseinkunnir (1 stjarna til 5 stjörnur) veitt af 500.000 viðskiptavina á 20.000 kvikmyndir. Markmið Netflix verðlaunin voru að nota þessar einkunnir að spá haldin út lánshæfismat 3 milljónir bíó, eins og sýnt er "?". Spáð einkunnir lögð fram af þátttakendum í Netflix verðlaunin voru samanborið við haldin út einkunnir. Ég mun fjalla um siðferðileg álitamál í kringum þessi gögn út í kafla 6.
	Movie 1	Movie 2	Movie 3	. . .	Movie 20.000
viðskiptavinur 1	2	5		.	?
viðskiptavinur 2		2	?	.	3
viðskiptavinur 3		?	2	.
. . .	.	.	.	.	.
viðskiptavinur 500.000	?		2	.	1

Vísindamenn og tölvusnápur um allan heim voru dregin við áskorun, og árið 2008 rúmlega 30.000 manns voru að vinna á það (Thompson 2008) . Á meðan á keppni, Netflix fengið meira en 40.000 fyrirhugaðar lausnir frá fleiri en 5.000 lið (Netflix 2009) . Vitanlega, Netflix gat ekki lesið og skilið allar þessar fyrirhugaðar lausnir. Í heild hlutur rann vel, þó, vegna þess að lausnir voru auðvelt að athuga. Netflix gæti bara hafa a tölva bera spáð einkunnir til the haldin út gesta með fyrirfram skilgreinda mælikvarða (tilteknu mæligildi sem þeir nota var kvaðratrót meðaltals-kvaðrat villa). Það var þessi hæfni til fljótt meta lausnir sem gerðu Netflix að taka lausn frá öllum, sem reyndist vera mikilvægt vegna þess að góðar hugmyndir komu frá sumum á óvart stöðum. Í raun var aðlaðandi lausn lögð af hópi af þremur vísindamönnum sem höfðu enga fyrri reynslu byggja bíómynd meðmæli kerfi byrjaði (Bell, Koren, and Volinsky 2010) .

Einn fallegur þáttur af Netflix verðlaunin er að það virkt allir í heiminum að hafa lausn þeirra metin nokkuð. Þegar fólk hlaðið spáð einkunnir þeirra, þeir fengu ekki að hlaða fræðilegum persónuskilríki þeirra, þeirra aldur, kynþáttur, kyn, kynhneigð, eða neitt um sjálfa sig. Þannig spáð einkunnir fræga prófessor frá Stanford fengu nákvæmlega það sama og þeir eru frá unglingur í svefnherberginu hennar. Því miður, þetta er ekki satt í flestum félagslegum rannsóknum. Það er, að mestu félagslegu rannsóknir, mat er mjög tímafrekt og að hluta huglægt. Svo, flestir rannsóknir hugmyndir eru aldrei alvarlega metin, og þegar hugmyndir eru metin, það er erfitt að losa þá mat frá skapara hugmyndum. Vegna lausnir er auðvelt að athuga, að leyfa opna símtöl vísindamenn fá aðgang að öllum hugsanlegum frábæra lausnir sem myndi falla í gegnum sprungur ef þeir teljast aðeins lausn frá frægum prófessora.

Til dæmis, á einum tímapunkti á Netflix Norðurlandaráðs einhvern með skjánafninu Simon Funk settar á hans blogg fyrirhugaða lausn byggist á Eintölu Gildi Sundrun, aðferð úr línulegri algebru sem ekki hafði verið notaður áður af öðrum þátttakendum. Funk er blogg var samtímis tæknilega og furðulegur óformlega. Var þetta blogg lýsir góða lausn eða var það tímasóun? Utan opnu hringja verkefni, lausnin gæti aldrei hafa fengið alvarleg mat. Eftir allt saman Simon Funk var ekki prófessor Cal Tech eða MIT; Hann var a hugbúnaður verktaki sem, á þeim tíma, var Útivera um Nýja Sjáland (Piatetsky 2007) . Ef hann hefði send þessa hugmynd að verkfræðingur hjá Netflix, það nánast örugglega hefði ekki verið tekin alvarlega.

Sem betur fer, vegna þess að matsviðmið voru skýr og auðvelt að beita, spáð einkunnir hans voru metin, og það var strax ljóst að nálgun hans var mjög öflugur, hann rocketed í fjórða sæti í keppninni, gefið gríðarleg niðurstaða sem önnur lið höfðu þegar verið vinna fyrir mánuði á vandamálinu. Í the endir, hlutar nálgun Simon Funk voru notuð af nánast öllum alvarlegum keppinauta (Bell, Koren, and Volinsky 2010) .

Sú staðreynd að Simon Funk valdi að skrifa blogg útskýra nálgun hans, frekar en að reyna að halda það leyndarmál, einnig sýnir að margir þátttakendur í Netflix verðlaunin voru ekki eingöngu áhugasamir um milljónir dollara verðlaun. Frekar, margir þátttakendur virtust einnig að njóta vitsmunalega áskorun og samfélag sem skapaðist í kringum vandamálið (Thompson 2008) , tilfinningar sem ég búast margir vísindamenn geta skilið.

The Netflix Prize er klassískt dæmi um opnu kalla. Netflix stafar spurningu með ákveðið markmið (spá bíómynd einkunnir) og leitað lausna frá mörgum. Netflix var fær til að meta allar þessar lausnir vegna þess að þeir voru auðveldara að sannreyna en að búa til, og að lokum Netflix valinn bestu lausn. Næst, ég sýna þér hvernig þetta sama aðferð er hægt að nota í líffræði og lögum.