5.3.1 Netflix პრიზი

Netflix პრიზი იყენებს ღია მოწოდება პროგნოზირება, რომელიც ფილმები ხალხს მოეწონება.

ყველაზე ცნობილი ღია მოწოდება პროექტი Netflix პრიზი. Netflix არის ონლაინ ფილმების გაქირავების კომპანია, ხოლო 2000 წელს იგი დაიწყო Cinematch, მომსახურების რეკომენდაცია ფილმები მომხმარებელს. მაგალითად, Cinematch ალბათ შეამჩნევთ, რომ თქვენ მომეწონა Star Wars და Empire Strikes Back და მერე გირჩევთ, რომ თქვენ უყუროთ დაბრუნება Jedi. თავდაპირველად, Cinematch მუშაობდა ცუდად. მაგრამ, რა თქმა უნდა, მრავალი წლის განმავლობაში, Cinematch გააგრძელა გაუმჯობესების მისი უნარი პროგნოზირება, თუ რა ფილმები მომხმარებელს ისარგებლოს. მიერ, თუმცა, 2006 პროგრესი Cinematch პლატო. მკვლევართა ერთი Netflix სცადა საკმაოდ ბევრი ყველაფერი მათ შეიძლება ვიფიქროთ, მაგრამ ამავე დროს, ისინი ეჭვი, რომ იქ სხვა იდეები, რომელიც შეიძლება დაეხმაროს მათ გაიუმჯობესონ სისტემა. ასე რომ, ისინი გამოვიდა, რაც იყო, იმ დროს, რადიკალური გადაწყვეტა: ღია ზარი.

კრიტიკული საბოლოო წარმატებით Netflix პრიზი იყო, თუ როგორ კონკურსიდან შეიქმნა, და ეს დიზაინი მნიშვნელოვან გაკვეთილებს, თუ რამდენად ღია ზარები შეიძლება გამოყენებულ იქნეს სოციალური კვლევა. Netflix არ მხოლოდ დააყენა out unstructured მოთხოვნა იდეები, რაც ბევრს ჰგონია, როდესაც ისინი პირველად განიხილოს ღია ზარი. პირიქით, Netflix დასმულ ნათელი პრობლემა მარტივი შეფასების კრიტერიუმები: ისინი ეჭვქვეშ ხალხს გამოიყენოს კომპლექტი 100 მილიონი ფილმის რეიტინგები პროგნოზირება 3 მილიონი გაიმართა-out რეიტინგები (რეიტინგები, რომ მომხმარებლებს გააკეთა, მაგრამ, რომ Netflix არ გაათავისუფლებს). ვინც შეუქმნიდა ალგორითმი, რომელიც შეიძლება პროგნოზირება 3 მილიონი გაიმართა-out რეიტინგები 10% უკეთესია, ვიდრე Cinematch მოიგებს 1 მილიონი დოლარი. ეს ნათელი და ადვილად ვრცელდება შეფასების კრიტერიუმები-შედარებით იწინასწარმეტყველა რეიტინგები გაიმართა-out რეიტინგები ნიშნავდა, რომ Netflix პრემია კარკასის მდგომარეობაში ისე, რომ გადაწყვეტილებები უფრო ადვილად ნახოთ ვიდრე გენერირება; აღმოჩნდა გამოწვევა გაუმჯობესების Cinematch პრობლემას განკუთვნილია ღია ზარი.

2006 წლის ოქტომბერში, Netflix გაავრცელა ნაკრებს რომელიც შეიცავს 100 მილიონი ფილმის რეიტინგები დაახლოებით 500,000 მომხმარებელს (ჩვენ განვიხილავთ კონფიდენციალურობის შედეგები მოჰყვეს ამ მონაცემების გათავისუფლების თავი 6). Netflix მონაცემები შეიძლება გაცნობიერებული, როგორც დიდი მატრიცა, რომელიც არის დაახლოებით 500,000 მომხმარებელს 20,000 ფილმები. აღნიშნული matrix, იყო დაახლოებით 100 მილიონი რეიტინგები სკალაზე 1-დან 5 ვარსკვლავი (ცხრილი 5.2). გამოწვევა იყო, რათა გამოიყენოთ დაკვირვების მონაცემები მატრიცა პროგნოზირება 3 მილიონი გაიმართა-out რეიტინგები.

მაგიდის 5.2 სქემატური მონაცემების Netflix პრიზი. Netflix გამოვიდა დაახლოებით 100 მილიონი რეიტინგები (1 ვარსკვლავი 5 ვარსკვლავი) გათვალისწინებული 500,000 მომხმარებელს 20,000 ფილმები. მიზანი Netflix პრიზი იყო გამოიყენოს ეს რეიტინგები პროგნოზირება გაიმართა-out რეიტინგები 3 მილიონი ფილმები, ნაჩვენებია, როგორც "?". წინასწარმეტყველებს რეიტინგის მონაწილეთა Netflix პრიზი იყო შედარებით გამართული-out რეიტინგები. მე განიხილავენ ეთიკური საკითხების გარშემო ამ მონაცემების გათავისუფლების თავი 6.
Movie 1 Movie 2 Movie 3 . . . ფილმის 20,000
მომხმარებელთა 1 2 5 . ?
მომხმარებელთა 2 2 ? . 3
მომხმარებელთა 3 ? 2 .
. . . . . . . .
მომხმარებელთა 500,000 ? 2 . 1

მკვლევარებმა და ჰაკერების მთელს მსოფლიოში იყო შედგენილი გამოწვევა, და 2008 ზე მეტი 30,000 ადამიანი მუშაობს მასზე (Thompson 2008) . მეტი რა თქმა უნდა კონკურსი, Netflix ზე მეტი 40,000 შემოთავაზებული გადაწყვეტილებები ზე მეტი 5,000 გუნდი (Netflix 2009) . ცხადია, Netflix ვერ წავიკითხე და მესმის, რომ ყველა ეს შემოთავაზებული გადაწყვეტილებები. მთელი რამ გაიქცა შეუფერხებლად, თუმცა, იმის გამო, რომ გადაწყვეტილებების გადამოწმება ადვილია. Netflix შეიძლება უბრალოდ კომპიუტერი შედარება იწინასწარმეტყველა რეიტინგები გაიმართა-out რეიტინგები წინასწარ განსაზღვრული მეტრულ (კერძოდ მეტრულ ისინი გამოყენებული იყო კვადრატული ფესვი საშუალო-squared შეცდომა). სწორედ ეს უნარი სწრაფად შეაფასოს გადაწყვეტილებები, რომელიც ჩართულია Netflix მიიღოს გადაწყვეტილებები ყველას, რომელიც აღმოჩნდა მნიშვნელოვანია, რადგან კარგი იდეები მოვიდა რამდენიმე მოულოდნელი ადგილები. ფაქტია, რომ გამარჯვებული გადაწყვეტა მიერ წარმოდგენილი გუნდი დაიწყო სამი მკვლევრები, რომ არ ჰქონდა წინასწარი გამოცდილება შენობა ფილმის რეკომენდაციით სისტემები (Bell, Koren, and Volinsky 2010) .

ერთი ლამაზი ასპექტი Netflix პრიზი არის, რომ მას საშუალება ყველას მსოფლიოში, რომ მათი გადაწყვეტა შეფასებული სამართლიანად. როდესაც ადამიანები ატვირთული იწინასწარმეტყველა რეიტინგები, ისინი არ უნდა ატვირთონ თავიანთი აკადემიური მიდგომებით, მათი ასაკის, რასის, სქესის, სექსუალური ორიენტაციის, ან არაფერი თავს. ამდენად, წინასწარმეტყველებს რეიტინგები ცნობილი პროფესორი სტენფორდის ეპყრობოდნენ ზუსტად ისევე, როგორც იმ მოზარდი თავის საძინებელში. სამწუხაროდ, ეს ასე არ არის, ყველაზე სოციალური კვლევა. რომ არის, ყველაზე სოციალური კვლევის, შეფასების არის ძალიან შრომატევადი და ნაწილობრივ სუბიექტური. ასე რომ, საუკეთესო კვლევითი იდეები არასოდეს სერიოზულად შეფასებული, და როდესაც იდეები შეაფასეს, ძნელია გაშლა შეფასებები შემქმნელი იდეები. იმის გამო, რომ გადაწყვეტილებები ადვილად შეამოწმოთ, ღია ზარები დაუშვებს მკვლევარები წვდომის ყველა პოტენციურად მშვენიერი გადაწყვეტილებები, რომ დაეცემა მეშვეობით ბზარები, თუ ისინი მხოლოდ განიხილება გადაწყვეტილებები ცნობილი პროფესორები.

მაგალითად, ერთ მომენტში დროს Netflix პრიზი ვინმე ეკრანზე სახელი Simon Funk ბლოგზე შემოთავაზებული გადაწყვეტა ეფუძნება სინგულარული ღირებულება რღვევა, მიდგომა, წრფივი ალგებრა, რომ არ იყო გამოყენებული ადრე სხვა მონაწილეებს. Funk ის დღიურში ერთდროულად ტექნიკური და საბედისწეროდ არაფორმალური. იყო ამ დღიურში აღწერს კარგი გამოსავალი ან იყო ეს ნარჩენები დრო? გარეთ ღია კონკურსის პროექტის, გამოსავალი, შესაძლოა, არასდროს სერიოზულად შეფასება. ყოველივე ამის შემდეგ სიმონ Funk არ იყო პროფესორი კალ ტექნიკური და MIT; ის იყო პროგრამისტი, რომელიც, იმ დროს, იყო backpacking მთელს ახალი ზელანდია (Piatetsky 2007) . თუ იგი ელექტრონული ფოსტით ეს იდეა ინჟინრად Netflix, ეს, რა თქმა უნდა არ იქნებოდა სერიოზულად.

საბედნიეროდ, რადგან შეფასების კრიტერიუმები იყო ნათელი და ადვილად ვრცელდება, მისი პროგნოზით, რეიტინგები შეაფასა, და ეს იყო მაშინვე ნათელი, რომ მისი მიდგომა იყო ძალიან ძლიერი: ის rocketed მეოთხე ადგილი კონკურსში, დიდი შედეგი იმის გათვალისწინებით, რომ სხვა გუნდები უკვე სამუშაო თვეების განმავლობაში პრობლემა. და ბოლოს, ნაწილები სიმონ Funk მიდგომა გამოიყენა თითქმის ყველა სერიოზული კონკურენტები (Bell, Koren, and Volinsky 2010) .

ის ფაქტი, რომ სიმონ Funk აირჩია დაწერა დღიურში აეხსნა თავისი მიდგომა, ვიდრე ცდილობს შეინარჩუნოს ის საიდუმლო, ასევე გვიჩვენებს, რომ ბევრი მონაწილეთა Netflix პრიზი არ იყო მხოლოდ მოტივირებული მილიონი დოლარი პრიზი. პირიქით, ბევრი მონაწილეებმა ასევე ჩანდა ისარგებლოს ინტელექტუალური გამოწვევა და საზოგადოებას, რომ ირგვლივ განვითარებულ პრობლემის (Thompson 2008) , გრძნობები, რომ მე ველოდები ბევრი მკვლევარი მესმის.

Netflix პრიზი არის კლასიკური მაგალითი ღია კონკურსის. Netflix დასმულ კითხვაზე კონკრეტული მიზანი (პროგნოზირების ფილმის რეიტინგები) და შუამდგომლობა გადაწყვეტილებების ბევრი ადამიანი. Netflix შეძლო შეაფასოს ყველა ეს გადაწყვეტილებები იმიტომ, რომ ისინი უფრო გადაამოწმონ, ვიდრე შექმნა, და საბოლოო ჯამში Netflix აიყვანეს საუკეთესო გამოსავალი. შემდეგი, მე გაჩვენებთ, თუ როგორ ეს იგივე მიდგომა შეიძლება გამოყენებულ ბიოლოგიის და კანონი.