5.3.1 Netflix награда

Наградата Netflix користи отворен повик да се предвиди кои филмови луѓе ќе се допаѓа.

најпознатите проект со отворен повик е награда Netflix. Netflix е онлајн филм изнајмување на компанијата, а во 2000 година го лансира Cinematch, услуга за да се препорача филмови на клиентите. На пример, Cinematch може да забележите дека ви се допадна Star Wars и Империјата го возвраќа ударот, а потоа препорачуваме да се види Враќање на Jedi. Првично, Cinematch работел лошо. Но, во текот на многу години, Cinematch продолжи да се подобри неговата способност да се предвиди она што филмови клиенти ќе уживаат. До 2006 година, меѓутоа, напредокот на Cinematch plateaued. Истражувачите на Netflix обиделе доста сè што може да мислам на, но во исто време, тие се осомничени дека имало и други идеи кои би можеле да им помогне да се подобри нивниот систем. Така, тие дојдоа со она што беше, во тоа време, радикално решение: отворен повик.

Од клучно значење за евентуалниот успех на наградата Netflix беше како беше дизајниран со отворен повик, и овој дизајн има важни лекции за тоа како отворени повици може да се користи за социјални истражувања. Netflix не само што се изгасне неструктурирани барање за идеи, што е она што многу луѓе мислат, кога тие прво да се разгледа на јавен повик. Наместо тоа, Netflix претставуваше јасен проблем со едноставни критериуми за евалуација: Тие се спротивставија на луѓето да ги користат сет од 100 милиони филм рејтингот да се предвиди 3 милиони се чуваат надвор рејтинг (рејтинг што корисниците се направени, но дека Netflix не го ослободи). Секој кој може да создаде алгоритам што може да се предвиди 3 милиони се чуваат надвор рејтингот 10% подобра од Cinematch ќе победи 1 милион долари. Оваа јасна и лесно да се примени критериуми за евалуација, во споредба предвидува рангирање за да се чуваат надвор рејтингот значеше дека наградата Netflix беше врамени во таков начин што решенија се полесно да се провери од генерираат; што се на предизвикот на подобрување Cinematch во проблем погодна за отворен повик.

Во октомври 2006 година, Netflix објави базата содржи 100 милиони филм рејтинг од околу 500.000 клиенти (ние ќе го разгледаме приватноста импликации на оваа порака на податоци во Поглавје 6). Податоците за Netflix може да се претставува како голем матрица која е околу 500.000 клиенти преку 20.000 филмови. Во рамките на оваа матрица, имало околу 100 милиони рејтингот на скала од 1 до 5 ѕвезди (Табела 5.2). Предизвикот е да се користи на набљудуваните податоци во матрица да се предвиди 3 милиони се чуваат надвор рејтингот.

Табела 5.2: Шематски приказ на податоците од награда Netflix. Netflix објави околу 100 милиони рејтингот (1 ѕвезда до 5 ѕвезди) обезбедени од 500.000 корисници на 20.000 филмови. Целта на наградата Netflix беше да се искористат овие рангирања да се предвиди кои се чуваат надвор рејтингот на 3 милиони филмови, прикажани како "?". Предвидена рејтингот поднесени од страна на учесниците во наградната Netflix беа споредувани со кои се чуваат од рејтингот. Јас ќе разговараат за етички прашања околу оваа порака на податоци во Поглавје 6.
филм 1 филм 2 Movie 3 . . . филм 20.000
клиентите 1 2 5 . ?
клиентите 2 2 ? . 3
клиент 3 ? 2 .
. . . . . . . .
клиент 500.000 ? 2 . 1

Истражувачи и хакери од целиот свет се подготвени за предизвикот, и до 2008 година повеќе од 30.000 луѓе работат на тоа (Thompson 2008) . Во текот на натпреварот, Netflix доби повеќе од 40.000 предложените решенија од повеќе од 5.000 тимови (Netflix 2009) . Очигледно, Netflix не може да се прочита и разбере сите овие предложени решенија. Целата работа се како подмачкано, сепак, бидејќи решенија се лесно да се провери. Netflix може само да се има компјутер споредат предвиде рејтингот на кои се чуваат надвор рејтинг од страна на однапред дефиниран метрички систем (особено метрички што се користи е квадратен корен од средната-квадрат грешка). Тоа беше оваа способност брзо да се оцени решенија кои овозможија Netflix да прифати решенија од секого, кој испадна да биде важен бидејќи добри идеи доаѓаат од некои изненадувачки места. Всушност, Победничкото решение беше поднесен од страна на тим започнати од тројца истражувачи кои немаат претходно искуство зграда препорака филм системи (Bell, Koren, and Volinsky 2010) .

Една убава аспект на наградата Netflix е тоа што ќе им се овозможи на сите во светот да имаат решение оценуваат праведно. Кога луѓето се поставени нивните предвиде оценки, тие не треба да испратите нивните академски квалификации, нивната возраст, раса, пол, сексуална ориентација, или нешто за себе. Така, предвидените рејтингот на познатиот професор од Стенфорд се третира токму исто како и оние од тинејџер во нејзината спална соба. За жал, тоа не е точно во повеќето социјални истражувања. Тоа е, за повеќето социјални истражувања, евалуација е многу време и делумно субјективен. Значи, повеќето истражувања идеи никогаш не се сериозно евалуира, и кога идеите се оценуваат, тоа е тешко да се оддели тие проценки од креаторот на идеите. Затоа што решенија се лесно да се провери, отворени повици им овозможи на истражувачите да пристапите до сите потенцијално прекрасни решенија кои ќе падне низ пукнатините доколку сметаат само решенија од познати професори.

На пример, во еден момент за време на некој Netflix награда со името на екран Симон Funk објавена на неговиот блог предложеното решение врз основа на еднина вредност распаѓање, пристап од линеарна алгебра кои не биле претходно се користи од страна на другите учесници. блог пост Фанк беше истовремено технички и чудно неформални. Беше овој блог пост во кој се опишува добро решение или тоа е губење на време? Надвор од проект со отворен повик, решението може да никогаш не добиле сериозни евалуација. Впрочем Симон Funk не бил професор на Cal Tech или МИТ; тој е развивач на софтвер, кој во тоа време, беше backpacking низ Нов Зеланд (Piatetsky 2007) . Ако тој преку е-маил оваа идеја да инженер во Netflix, тоа речиси сигурно немало да се сфати сериозно.

За среќа, бидејќи критериумите за оценување беа јасни и лесно да се примени, неговиот предвиде рејтинзи се оценува, и тоа беше веднаш јасно дека неговиот пристап е многу моќен: тој изби на четвртото место во конкуренција, огромна резултат со оглед дека другите тимови веќе се работат со месеци на проблемот. На крајот, делови пристап Симон Funk е се користи од страна на речиси сите сериозни конкуренти (Bell, Koren, and Volinsky 2010) .

Фактот дека Симон Funk избра да пишува блог пост објаснува неговиот пристап, наместо да се обидува да го чува во тајност, исто така, покажува дека многу учесници во наградната Netflix не беа мотивирани исклучиво од страна на награда од милион долари. Наместо тоа, многу учесници, исто така, се чинеше да уживаат во интелектуален предизвик и заедницата која се разви околу проблемот (Thompson 2008) , чувства, очекувам многу истражувачи може да се разбере.

Наградата Netflix е класичен пример за отворен повик. Netflix беше покренато прашањето и со одредена цел (предвидување на филм рејтингот) и поттикнати решенија од многу луѓе. Netflix беше во можност да се оцени сите овие решенија, бидејќи тие се полесно да се провери отколку да се создаде, и на крајот Netflix го избраа најдобриот решение. Напред, јас ќе ви покажеме како Истиот овој пристап може да се користи во биологијата и со закон.