5.3.1 Netflix Tuzo

Netflix Tuzo anatumia wito wazi kutabiri ambayo sinema watu kama.

Mradi unaojulikana sana wa simu ni Netflix Tuzo. Netflix ni kampuni ya kukodisha sinema ya mtandaoni, na mwaka 2000 ilizindua Cinematch, huduma ili kupendekeza sinema kwa wateja. Kwa mfano, Cinematch inaweza kutambua kwamba ulipenda Star Wars na Dola Zitaanza Nyuma na kisha kupendekeza kwamba urejeje Kurudi kwa Jedi . Awali, Cinematch ilifanya kazi vibaya. Lakini, zaidi ya miaka mingi, iliendelea kuboresha uwezo wake wa kutabiri nini wateja wa sinema watafurahia. By 2006, hata hivyo, maendeleo ya Cinematch yalikuwa yamepanda. Watafiti wa Netflix walijaribu kila kitu ambacho wangeweza kufikiria, lakini, wakati huo huo, walidhani kuwa kuna mawazo mengine ambayo inaweza kuwasaidia kuboresha mfumo wao. Hivyo, walikuja na kile kilichokuwa, kwa wakati huo, suluhisho kubwa: wito wazi.

Muhimu kwa mafanikio ya mwisho ya Tuzo ya Netflix ni jinsi simu iliyo wazi imeundwa, na kubuni hii ina masomo muhimu ya jinsi simu za wazi zinaweza kutumika kwa ajili ya utafiti wa jamii. Netflix haikuwa tu kufuta ombi zisizojengwa kwa mawazo, ambayo ndivyo watu wengi wanavyofikiria wakati wao kwanza wanafikiri wito wazi. Badala yake, Netflix imetoa tatizo wazi na utaratibu rahisi wa tathmini: waliwahimiza watu kutumia seti ya filamu milioni 100 ili kutabiri ratings milioni 3 zilizowekwa uliofanyika (ratings ambayo watumiaji waliifanya lakini Netflix hayakuachiliwa). Mtu wa kwanza kuunda algorithm ambayo ilitabiri kiwango cha milioni 3 kilichofanyika 10% bora kuliko Cinematch ingeweza kushinda dola milioni. Hii wazi na rahisi kutumia utaratibu wa tathmini-kulinganisha ratings uliotabiriwa na kupimwa uliofanyika-ilimaanisha kwamba Tuzo ya Netflix iliandaliwa kwa namna ambazo ufumbuzi ulikuwa rahisi kuangalia kuliko kuzalisha; iligeuka changamoto ya kuboresha Cinematch ndani ya tatizo linalofaa kwa simu ya wazi.

Mnamo Oktoba 2006, Netflix ilitoa dataset iliyo na ratings za movie milioni 100 kutoka karibu na wateja 500,000 (tutazingatia matokeo ya faragha ya kutolewa kwa data hii katika sura ya 6). Takwimu za Netflix zinaweza kufikiriwa kama tumbo kubwa ambayo ni wastani wa wateja 500,000 na sinema 20,000. Ndani ya tumbo hili, kulikuwa na ratings milioni 100 kwa kiwango kutoka nyota hadi tano (meza 5.2). Changamoto ilikuwa kutumia data iliyozingatiwa kwenye tumbo ili kutabiri kiwango cha milioni 3 kilichowekwa.

Jedwali 5.2: Mpangilio wa Takwimu kutoka Tuzo la Netflix
Kisasa 1 Kisasa 2 Kisasa 3 ... Kisasa 20,000
Wateja 1 2 5 ... ?
Mteja 2 2 ? ... 3
Wateja 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
Wateja 500,000 ? 2 ... 1

Watafiti na watunzaji duniani kote walivutiwa na changamoto, na kwa mwaka 2008 watu zaidi ya 30,000 walifanya kazi hiyo (Thompson 2008) . Katika kipindi cha mashindano, Netflix imepokea zaidi ya 40,000 ufumbuzi wa mapendekezo kutoka kwa timu zaidi ya 5,000 (Netflix 2009) . Kwa wazi, Netflix haikuweza kusoma na kuelewa ufumbuzi wote uliopendekezwa. Kitu kote kilikimbilia vizuri, hata hivyo, kwa sababu ufumbuzi ulikuwa rahisi kuangalia. Netflix inaweza tu kuwa na kompyuta kulinganisha ratings alitabiri na ratings uliofanyika kwa kutumia metagecified metric (hasa metali walitumia ilikuwa mraba mizizi ya maana maana squared kosa). Ilikuwa ni uwezo huu wa kupima haraka ufumbuzi uliowezesha Netflix kukubali ufumbuzi kutoka kwa kila mtu, ambayo ilionekana kuwa muhimu kwa sababu mawazo mazuri yalikuja kutoka mahali fulani vya kushangaza. Kwa kweli, suluhisho la kushinda liliwasilishwa na timu iliyoanza na watafiti watatu ambao hawakuwa na mifumo ya mapendekezo ya sinema ya awali ya kujenga uzoefu (Bell, Koren, and Volinsky 2010) .

Kipengele kimoja nzuri cha Tuzo ya Netflix ni kwamba imewezesha ufumbuzi wote uliopendekezwa kutathminiwa kwa haki. Hiyo ni, wakati watu walipakia alama zao zilizotabiriwa, hawakuhitaji kupakia sifa zao za kitaaluma, umri wao, rangi, jinsia, mwelekeo wa ngono, au kitu chochote kuhusu wao wenyewe. Ukadirio uliotabiriwa wa profesa maarufu kutoka Stanford ulifanyiwa usawa sawa na wale kutoka kwa kijana katika chumba chake cha kulala. Kwa bahati mbaya, hii si kweli katika tafiti nyingi za jamii. Hiyo ni kwa ajili ya tafiti nyingi za jamii, tathmini ni ya muda mwingi na sehemu ndogo. Hivyo, mawazo mengi ya utafiti hayatambui kwa uzito, na wakati mawazo yanapimwa, ni vigumu kufuta tathmini hizo kutoka kwa muumbaji wa mawazo. Fungua miradi ya wito, kwa upande mwingine, uwe na tathmini rahisi na ya haki ili waweze kugundua mawazo ambayo yangekosa vinginevyo.

Kwa mfano, wakati mmoja wakati wa Tuzo ya Netflix, mtu aliye na jina la skrini Simon Funk aliweka kwenye blogu yake suluhisho lililopendekezwa kwa kuzingatia upungufu wa thamani ya pekee, mbinu kutoka kwa algebra ya kawaida ambayo haijawahi kutumika awali na washiriki wengine. Chapisho la blogu ya Funk lilikuwa la kiufundi na sio rasmi. Ilikuwa post hii ya blogu inayoelezea suluhisho nzuri au ilikuwa ni kupoteza muda? Nje ya mradi wa simu ya wazi, suluhisho haliwezi kupokea tathmini kubwa. Baada ya yote, Simon Funk hakuwa profesa katika MIT; alikuwa msanidi wa programu ambaye, kwa wakati huo, alikuwa (Piatetsky 2007) nyuma karibu na New Zealand (Piatetsky 2007) . Ikiwa alikuwa amewasilisha barua hii kwa mhandisi wa Netflix, hakika hakika haingeweza kusoma.

Kwa bahati nzuri, kwa sababu vigezo vya tathmini vilikuwa wazi na rahisi kutumia, ratings zake zilizotabiriwa zilizingatiwa, na mara moja wazi kuwa mbinu yake ilikuwa na nguvu sana: alipiga mwamba kwa nafasi ya nne katika ushindani, matokeo makubwa yaliyotolewa kutokana na kwamba timu nyingine zilikuwa tayari kufanya kazi kwa miezi kwa tatizo. Hatimaye, sehemu za njia yake zilizotumiwa na washindani wote wenye nguvu (Bell, Koren, and Volinsky 2010) .

Ukweli kwamba Simon Funk alichagua kuandika chapisho la blogu akielezea mbinu yake, badala ya kujaribu kuiweka siri, pia inaonyesha kuwa washiriki wengi katika Tuzo la Netflix hawakuwa tu waliohamasishwa na tuzo ya dola milioni. Badala yake, washiriki wengi pia walionekana kufurahia changamoto ya kiakili na jamii iliyoendelea kuzunguka tatizo (Thompson 2008) , hisia ambazo natarajia watafiti wengi wanaweza kuelewa.

Tuzo ya Netflix ni mfano wa kawaida wa wito wa wazi. Netflix imetoa swali kwa lengo maalum (kutabiri kiwango cha filamu) na iliomba ufumbuzi kutoka kwa watu wengi. Netflix iliweza kutathmini ufumbuzi wote huu kwa sababu walikuwa rahisi kuangalia kuliko kujenga, na hatimaye Netflix ilichukua suluhisho bora. Ifuatayo, nitakuonyesha jinsi njia hii hiyo inaweza kutumika katika biolojia na sheria, na bila ya tuzo ya dola milioni.