5.3.1 Netflix մրցանակ

Այս թարգմանությունը ստեղծվել է համակարգչի համար. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.3.1 Netflix մրցանակ

The Netflix մրցանակ օգտագործում բաց մրցույթ է կանխատեսել, ինչը ֆիլմեր մարդիկ սիրում:

Առավել հայտնի է բաց մրցույթ նախագիծը Netflix մրցանակի: Netflix է առցանց ֆիլմ Rental ընկերությունը, իսկ 2000 թ., Այն մեկնարկել Cinematch, մի ծառայություն է առաջարկել ֆիլմեր հաճախորդներին. Օրինակ, Cinematch կարող է նկատել, որ Ձեզ դուր եկավ Star Wars եւ Empire գործադուլները Վերադառնալ եւ այնուհետեւ խորհուրդ են տալիս, որ դուք հետեւել վերադարձը Jedi: Սկզբում, Cinematch աշխատել վատ. Սակայն, ավելի երկար տարիների ընթացքում, Cinematch շարունակում է բարելավել իր կարողությունը կանխատեսել, թե ինչ ֆիլմեր հաճախորդները կլինի վայելել. 2006 թվականին, սակայն, առաջընթաց է Cinematch plateaued: Հետազոտողներին Netflix փորձել էր ամեն ինչ շատ նրանք կարող են մտածել, բայց միեւնույն ժամանակ, նրանք կասկածել են, որ եղել են նաեւ այլ գաղափարներ, որոնք կարող են օգնել նրանց բարելավել իրենց համակարգը: Այսպիսով, նրանք եկան, թե ինչ է եղել, այդ ժամանակ, մի արմատական լուծում: բաց զանգ.

Կրիտիկական է վերջնական հաջողության Netflix մրցանակի էր, թե ինչպես բաց զանգը նախատեսված էր, եւ սա դիզայն ունի կարեւոր դասեր է, թե ինչպես բաց զանգեր, կարող է օգտագործվել սոցիալական հետազոտությունների. Netflix ոչ թե պարզապես դրել դուրս չծրագրված խնդրանքը գաղափարների, ինչն շատ մարդիկ պատկերացնում, երբ նրանք առաջին անգամ է համարում բաց զանգ. Փոխարենը, Netflix դրված է հստակ խնդիր է մի պարզ գնահատման չափանիշների: Նրանք վիճարկում մարդկանց օգտագործել մի շարք 100 մլն ֆիլմից վարկանիշները է կանխատեսել 3 մլն անցկացվում դուրս վարկանիշները (վարկանիշը, որը օգտվողները էր կայացվել, սակայն, որ Netflix չհրապարակեցին): Ամեն ոք, ով կարող է ստեղծել այնպիսի ալգորիթմ, որը կարող է կանխատեսել 3 մլն անցկացված դուրս վարկանիշները 10% -ով ավելի լավ է, քան Cinematch կհաղթի 1 միլիոն դոլար: Այս պարզ եւ հեշտ է կիրառել գնահատման չափանիշները-համեմատելով կանխատեսել վարկանշել է կայացած դուրս վարկանիշների-նշանակում է, որ Netflix մրցանակ էր շրջանակված է այնպես, որ լուծումներ են ավելի հեշտ է ստուգել, քան առաջացնում. պարզվեց մարտահրավերի բարելավման Cinematch մեջ խնդրի համար հարմար բաց զանգի.

2006 թ. Հոկտեմբերին, Netflix, ազատ է արձակվել է dataset պարունակող 100 մլն ֆիլմերի վարկանիշները մոտ 500,000 հաճախորդների (մենք պետք է հաշվի առնել գաղտնիության հետեւանքները, այս տվյալները հաղորդագրության մեջ 6-րդ գլխում): The Netflix տվյալները կարող են գաղափարականացված որպես հսկայական մատրիցով, որը մոտավորապես 500.000 հաճախորդների 20,000 movies. Շրջանակներում այս մատրիցով, կար մոտ 100 մլն վարկանիշները սանդղակով 1-ից 5 աստղերի (աղյուսակ 5.2): The մարտահրավեր էր օգտագործել դիտարկված տվյալների մատրիցով է կանխատեսել 3 մլն անցկացված դուրս վարկանիշները:

Աղյուսակ 5.2. Սխեմատիկ տվյալների ից Netflix մրցանակի: Netflix, ազատ է արձակվել շուրջ 100 մլն ԱՄՆ վարկանիշը (1 աստղի 5 աստղ) կողմից տրամադրված 500,000 հաճախորդներին 20.000 movies. Նպատակն է Netflix մրցանակի էր օգտագործել այդ վարկանիշներ է կանխատեսել զբաղեցրած դուրս վարկանիշները 3 միլիոն ֆիլմերի, նշված է "?": Կանխատեսվող վարկանիշները ներկայացրած մասնակիցների Netflix մրցանակի համադրվել են կայացած դուրս վարկանիշների. Ես կքննարկի էթիկայի հարցեր հարակից այս տվյալները ազատ արձակել 6-րդ գլխում:
	Movie 1	Movie 2	Movie 3	, , ,	Movie 20,000
Հաճախորդների 1	2	5		,	?
Հաճախորդների 2		2	?	,	3
Հաճախորդների 3		?	2	,
, , ,	,	,	,	,	,
Հաճախորդների 500,000	?		2	,	1

Հետազոտողները եւ հակերները ամբողջ աշխարհում կազմվել է մարտահրավեր, եւ 2008 թ., Ավելի քան 30,000 մարդ է աշխատում դրա վրա (Thompson 2008) : Ընթացքում, մրցույթի, Netflix ստացել է ավելի քան 40000 առաջարկվող լուծումներ ավելի քան 5000 թիմերից (Netflix 2009) : Ակնհայտ է, Netflix չի կարող կարդալ եւ հասկանալ, թե այդ բոլոր առաջարկվող լուծումներ: Ամբողջ բանը վազեց սահուն, սակայն, քանի որ լուծումները շատ հեշտ է ստուգել: Netflix կարող պարզապես պետք է մի համակարգչային համեմատել կանխատեսվող վարկանիշները, ինչպես նաեւ անցկացված դուրս վարկանիշների կողմից նախապես նշված մետրային (կոնկրետ մետրային որ դրանք օգտագործվում էր քառակուսի արմատ միջին-Squared սխալ): Հենց այդ կարողությունը արագ գնահատելու լուծումներ, որոնք հնարավորություն Netflix է ընդունել լուծումներ բոլորին, որը, ինչպես պարզվեց լինել կարեւոր է, քանի որ լավ գաղափարներ է եկել որոշ զարմանալի վայրերում. Ի դեպ, հաղթող լուծումը ներկայացվել է թիմի սկսվել է երեք հետազոտողների, որ չեն ունեցել նախնական փորձ շինարարական ֆիլմ երաշխավորագիր համակարգեր (Bell, Koren, and Volinsky 2010) :

Մի գեղեցիկ կողմը Netflix մրցանակի է, որ այն հնարավորություն է տալիս բոլորին, որ աշխարհում իրենց լուծումը գնահատվեն բավականին. Երբ մարդիկ Վերբեռնման իրենց կանխատեսել վարկանիշները, որ նրանք պետք չէ վերբեռնել իրենց ակադեմիական հավատարմագրերը, նրանց տարիքը, ռասայից, սեռից, սեռական կողմնորոշում, կամ ոչինչ իրենց մասին. Այսպիսով, կանխատեսել վարկանիշները հայտնի պրոֆեսոր Stanford էին վերաբերվում, թե նույնն է, քանի որ նրանք մի պատանու իր ննջարանում: Ցավոք սրտի, սա ոչ թե ճիշտ է շատ սոցիալական հետազոտությունների: Այսինքն, մեծ սոցիալական հետազոտությունների, գնահատման շատ ժամանակատար է եւ մասամբ սուբյեկտիվ: Այնպես որ, շատ հետազոտական գաղափարները երբեք չեն լրջորեն գնահատվի, եւ երբ գաղափարները գնահատվում են, որ դա դժվար է բաժանել այդ գնահատականներ է ստեղծողի գաղափարների. Քանի որ լուծումները շատ հեշտ է ստուգել, բաց կոչերը թույլ են տալիս հետազոտողներին մուտք գործել բոլոր պոտենցիալ հրաշալի լուծումներ, որոնք կարող են ընկնում միջոցով cracks, եթե նրանք ոչ միայն համարվում լուծումներ հանրահայտ դասախոսների:

Օրինակ, մի կետում ընթացքում Netflix մրցանակ մեկի հետ էկրանի անունով Սիմոն Funk փակցված է իր բլոգում առաջարկվող լուծման վրա հիմնված եզակի արժեքային քայքայման, մոտեցումը գծային հանրահաշվից որ չի օգտագործվել նախկինում մյուս մասնակիցների կողմից: Funk բլոգը գրառումը էր միաժամանակ տեխնիկական եւ weirdly ֆորմալ: Էր այս օրագրում Հաղորդագրություն նկարագրելով մի լավ լուծում, կամ էր այն վատնում. Դուրս է բաց զանգի նախագծին, որի լուծումը կարող երբեք ստացել լուրջ գնահատական: Ի վերջո, Սիմոն Funk չի եղել պրոֆեսոր Cal tech կամ MIT- ի, նա եղել է ծրագրային ապահովման մշակման, որը, այդ ժամանակ էր, Արշավ շուրջ Նոր Զելանդիայում (Piatetsky 2007) : Եթե նա փոստով այս գաղափարը մի ինժեներ Netflix, որ դա գրեթե անկասկած չէր լուրջ ընդունել:

Բարեբախտաբար, քանի որ գնահատման չափանիշները էին պարզ է եւ հեշտ է կիրառել, նրա կանխատեսել Վարկանիշներ են գնահատվում, եւ դա էր ակնթարթորեն պարզ է, որ իր մոտեցումը եղել է շատ հզոր է: Նա rocketed է չորրորդ տեղը մրցույթի, մի հսկայական արդյունքն հաշվի առնելով, որ մյուս թիմերն էլ արդեն աշխատում ամիսներով խնդրի. Ի վերջո, մասեր Սիմոն FUNK մոտեցման կողմից օգտագործվում էին գրեթե բոլոր լուրջ մրցակիցների (Bell, Koren, and Volinsky 2010) :

Այն փաստը, որ Սիմոն Funk ընտրեց գրել օրագրում Հաղորդագրություն բացատրելով իր մոտեցումը, այլ ոչ թե փորձում է պահել այն գաղտնի, ինչպես նաեւ ցույց է տալիս, որ շատ մասնակիցներ են Netflix մրցանակի չեն բացառապես հիմնավորվում է միլիոն դոլարի մրցանակի: Փոխարենը, շատ մասնակիցներ նաեւ թվում էր, վայելել մտավոր խնդիրներ ու հանրությանը, որ մշակված շուրջ խնդրի (Thompson 2008) , զգացմունքները, որ ես ակնկալում եմ շատ հետազոտողներ կարող է հասկանալ:

The Netflix մրցանակ է դասական օրինակ է բաց զանգի. Netflix հարց է կոնկրետ նպատակ (գուշակում ֆիլմերի ratings) եւ միջնորդեց լուծումներ բազմաթիվ մարդկանց: Netflix կարողանում էր գնահատելու բոլոր այդ լուծումները, քանի որ նրանք ավելի հեշտ է ստուգել, քան ստեղծել, եւ, ի վերջո Netflix վերցրել է լավագույն լուծումը: Հաջորդը, ես ցույց կտամ, թե ինչպես է այս նույն մոտեցումն է, կարող է օգտագործվել կենսաբանության եւ օրենքով: