5.3.1 Netflix პრიზი

ეს თარგმანი შეიქმნა კომპიუტერი. ×

5.3.1 Netflix პრიზი

Netflix პრიზი იყენებს ღია მოწოდება პროგნოზირება, რომელიც ფილმები ხალხს მოეწონება.

ყველაზე ცნობილი ღია ზარის პროექტია Netflix Prize. Netflix არის ონლაინ ფილმის გაქირავების კომპანია, ხოლო 2000 წელს დაიწყო Cinematch, სერვისის რეკომენდაცია ფილმების მომხმარებელს. მაგალითად, Cinematch შეიძლება შეამჩნია, რომ მომეწონა Star Wars და იმპერიის Strikes Back და შემდეგ გირჩევთ, რომ თქვენ უყურებთ დაბრუნების Jedi . თავდაპირველად, Cinematch მუშაობდა ცუდად. მაგრამ მრავალი წლის მანძილზე განაგრძო მისი შესაძლებლობების გაუმჯობესება, თუ რა ფილმებს უთმობდნენ მომხმარებელს. 2006 წლისთვის, სინამდვილეში კინემატოგრაფიის წინსვლა შეეხო. მკვლევარებმა Netflix- ს შეეძლოთ საკმაოდ ბევრი რამ შეეძლოთ მათ შეეძლოთ ფიქრობდნენ, მაგრამ, ამავე დროს, ეჭვობენ, რომ არსებობს სხვა იდეები, რომლებიც ხელს შეუწყობს მათ სისტემის გაუმჯობესებას. ამდენად, ისინი მოვიდნენ რა, იმ დროს, რადიკალური გადაწყვეტა: ღია ზარი.

კრიტიკული წარმატება Netflix Prize იყო თუ როგორ ღია ზარი შეიქმნა, და ამ დიზაინის აქვს მნიშვნელოვანი გაკვეთილი, თუ როგორ ღია ზარები შეიძლება გამოყენებულ იქნას სოციალური კვლევა. Netflix- მა უბრალოდ არ გამოუშვა იდეების განუყოფელი მოთხოვნა, რაც ბევრ ადამიანს წარმოუდგენია, როდესაც ისინი პირველად განიხილავენ ღია ზარს. უფრო მეტიც, Netflix- მა მარტივი შეფასების პროცედურა წარმოადგინა: ისინი გამოწვეულნი იყვნენ 100 მილიონიანი ფილმების რეიტინგების გამოყენება, რომლებიც გამოთვლიან 3 მილიონზე მეტ რეიტინგს (რეიტინგები, რომლითაც მომხმარებლები სარგებლობდნენ, მაგრამ Netflix არ გაათავისუფლეს). პირველმა შექმნა ალგორითმი, რომელიც წინასწარმეტყველებდა 3 მილიონზე მეტ რეიტინგს 10% -ით უკეთესი ვიდრე Cinematch- ს მოიგებს მილიონ დოლარს. ეს მკაფიო და ადვილად გამოსაყენებელი შეფასების პროცედურაა - პროგნოზირებულ რეიტინგებთან შედარებით ჩატარებული რეიტინგების შედარება - იმას ნიშნავდა, რომ Netflix Prize- ი შეიქმნა ისე, რომ გამოსავალი უფრო ადვილად შემოწმდა, ვიდრე გენერირება; აღმოჩნდა, რომ Cinematch- ის გაუმჯობესება გამოწვეული იყო ღია ზარისთვის შესაფერისი პრობლემის მოსაგვარებლად.

2006 წლის ოქტომბერში, Netflix- მა გამოაქვეყნა 100 მილიონიანი ფილმების რეიტინგი, რომელიც დაახლოებით 500,000 აბონენტს მოიცავს (ჩვენ განვიხილავთ ამ მონაცემების კონფიდენციალურობის შედეგებს 6-ე პუნქტში). Netflix- ის მონაცემები კონცეპტუალიზებულია, როგორც უზარმაზარი მატრიცა, რომელიც დაახლოებით 500,000 მომხმარებელს 20,000 ფილმის საშუალებით. ამ მატრიქსის ფარგლებში, დაახლოებით 100 მილიონი რეიტინგი იყო მასშტაბით ერთიდან ხუთ ვარსკვლავს (ცხრილი 5.2). გამოწვევა იყო გამოყენებული დაკვირვება მონაცემები matrix პროგნოზირება 3 მილიონი ჩატარებული რეიტინგები.

ცხრილი 5.2: მონაცემთა ნემაფის პრიზის მონაცემთა სქემა
	ფილმი 1	კინო 2	კინო 3	...	ფილმი 20,000
დამკვეთი 1	2	5		...	?
დამკვეთი 2		2	?	...	3
დამკვეთი 3		?	2	...
\(\vdots\)	\(\vdots\)	\(\vdots\)	\(\vdots\)		\(\vdots\)
კლიენტი 500,000	?		2	...	1

მკვლევარებმა და ჰაკერებმა მთელი მსოფლიოს მასშტაბით გამოწვევა და 2008 წლისთვის 30 ათასზე მეტი ადამიანი მუშაობდნენ (Thompson 2008) . კონკურსის მსვლელობისას, Netflix- მა მიიღო 5000-ზე მეტი გუნდისგან (Netflix 2009) 40,000-ზე მეტი შემოთავაზებული გადაწყვეტილება. ცხადია, Netflix ვერ წაიკითხავს და გაიგებს ყველა ამ შემოთავაზებულ გადაწყვეტილებას. მთელი რამ გაიქცა შეუფერხებლად, თუმცა, რადგან გადაწყვეტილებები იყო მარტივი შემოწმება. Netflix- ს შეუძლია კომპიუტერის შედარება წინასწარმეტყველებული რეიტინგები ჩატარებული რეიტინგის მქონე პრეზენტაციულ მეტრიკთან ერთად (კონკრეტული მეტრიკი გამოიყენებოდა კვადრატული ფერის კვადრატული ფესვი). ეს იყო უნარი, რომ სწრაფად შეაფასოს გადაწყვეტილებები, რომლებიც საშუალებას აძლევდა Netflix მიიღონ გადაწყვეტილებები ყველასგან, რომელიც აღმოჩნდა მნიშვნელოვანი, რადგან კარგი იდეები მოვიდა რაღაც გასაკვირი ადგილებიდან. სინამდვილეში გამარჯვებულმა გადაწყვეტილებამ სამი მკვლევარის მიერ წარდგენილი გუნდი წარადგინა, რომელთაც არ ჰქონდათ წინასწარი გამოცდილების მქონე ფილმის სარეკომენდაციო სისტემები (Bell, Koren, and Volinsky 2010) .

Netflix Prize- ის ერთ-ერთი ლამაზი ასპექტი ის არის, რომ შესაძლებელი იყო ყველა შემოთავაზებული გადაწყვეტილება, რომელიც სამართლიანად შეფასდება. ანუ, როდესაც ადამიანები თავიანთ პროგნოზირებულ რეიტინგებს ავრცელებდნენ, მათ არ უნდა ჰქონოდათ აკადემიური რწმუნებების, ასაკის, რასის, სქესის, სექსუალური ორიენტაციის, ან რაიმე საკუთარი თავის შესახებ ატვირთვა. სტენფორდის ცნობილი პროფესორის პროგნოზირებული რეიტინგები ზუსტად იგივე იყო, როგორიც მოზარდიდან მის საძინებელში. სამწუხაროდ, ეს არ არის ჭეშმარიტი სოციალურ კვლევაში. ანუ, სოციალური კვლევის უმეტესობისთვის, შეფასების დრო ძალიან შრომატევადი და ნაწილობრივ სუბიექტურია. ასე რომ, კვლევების უმეტესობა სერიოზულად არ არის შეფასებული და იდეების შეფასებისას ძნელია ამ იდეების შემქმნელებისგან გაუქმება. ღია ზარის პროექტები, მეორეს მხრივ, აქვს მარტივი და სამართლიანი შეფასება, რათა მათ აღმოაჩინონ იდეები, რომლებიც სხვაგვარად გაუშვებდნენ.

მაგალითად, ერთ მომენტში Netflix Prize- ის დროს, ეკრანის სახელით სიმონ ფუნკი თავის ბლოგზე გამოაქვეყნა შემოთავაზებული გადაწყვეტა სინგულარული ღირებულების დეკომპოზიციის საფუძველზე, ხაზოვანი ალგებრის მიდგომა, რომელიც სხვა მონაწილეების მიერ ადრე არ იყო გამოყენებული. Funk- ის დღიური პოსტი ერთდროულად ტექნიკური და უცნაური არაფორმალური იყო. იყო ამ დღიურში პოსტი აღწერს კარგი გამოსავალი ან იყო ნარჩენები დრო? ღია ზარის პროექტის გარეთ, გამოსავალი შესაძლოა სერიოზული შეფასება არ ჰქონდეს. ყოველივე ამის შემდეგ, სიმონ ფანკი არ იყო MIT- ის პროფესორი; ის იყო პროგრამული უზრუნველყოფის შემქმნელი, რომელიც, იმ დროს, იყო backpacking გარშემო ახალი ზელანდია (Piatetsky 2007) . თუ მან ეს იდეა ინჟინერს Netflix- ზე გაუგზავნა, ის თითქმის არ იქნებოდა წაკითხული.

საბედნიეროდ, იმის გამო, რომ შეფასების კრიტერიუმები ნათლად და ადვილად გამოსაყენებელი იყო, მისი პროგნოზირებული რეიტინგები შეფასდა და ის მყისიერად იყო ნათელი, რომ მისი მიდგომა ძალიან ძლიერი იყო: კონკურენციაში მეოთხე ადგილი დაიძაბა, დიდი შედეგი გამოიღო, რომ სხვა გუნდები უკვე იყვნენ მუშაობის თვეში პრობლემა. საბოლოო ჯამში, მისი მიდგომის ნაწილი პრაქტიკულად ყველა სერიოზულმა კონკურენტმა გამოიყენა (Bell, Koren, and Volinsky 2010) .

ის ფაქტი, რომ სიმონ ფანკმა აირჩია ბლოგის ჩანაწერი დაწერა მისი მიდგომა, ვიდრე საიდუმლოდ შენახვის მცდელობა, ასევე გვიჩვენებს, რომ Netflix Prize- ში ბევრი მონაწილე არა მხოლოდ მილიონი დოლარის პრიზით იყო მოტივირებული. პირიქით, ბევრმა მონაწილემ, როგორც ჩანს, ისარგებლა ინტელექტუალური გამოწვევად და საზოგადოებამ, რომელიც პრობლემის გარშემო განვითარდა (Thompson 2008) , გრძნობები, რომ ბევრი მკვლევარი მესმის.

Netflix Prize არის ღია ზარის კლასიკური მაგალითი. Netflix- მა წარმოადგინა კითხვა კონკრეტული მიზნისთვის (ფილმების რეიტინგების პროგნოზირება) და ბევრ ადამიანსგან მიღებული გადაწყვეტილებების მიღება. Netflix- მა შეძლო შეაფასოს ყველა ეს გადაწყვეტილება, რადგან ისინი უფრო ადვილად შეამოწმე, ვიდრე შექმნა, და საბოლოო ჯამში Netflix- მა საუკეთესო გამოსავალი მიიღო. შემდეგი, მე გაჩვენებ, როგორ შეიძლება ეს იგივე მიდგომა გამოყენებულ იქნას ბიოლოგიასა და სამართალში და მილიონი დოლარის პრიზით.