5.3.1 جائزة نيتفليكس

تم إنشاء هذه الترجمة بواسطة الكمبيوتر. ×

5.3.1 جائزة نيتفليكس

يستخدم جائزة نيتفليكس دعوة مفتوحة للتنبؤ التي الأفلام الناس سوف شابه ذلك.

مشروع الاتصال المفتوح الأكثر شهرة هو جائزة Netflix. Netflix هي شركة تأجير أفلام عبر الإنترنت ، وفي عام 2000 أطلقت شركة Cinematch ، خدمة للتوصية بأفلام للعملاء. على سبيل المثال ، قد تلاحظ Cinematch أنك أعجبت بـ Star Wars و The Empire Strikes Back ومن ثم ننصح بمشاهدة عودة Jedi . في البداية ، عملت سينماتش سيئة. ولكن ، على مدار سنوات عديدة ، استمر في تحسين قدرته على التنبؤ بالأفلام التي يمكن للعملاء الاستمتاع بها. بحلول عام 2006 ، ومع ذلك ، كان التقدم في Cinematch ثابتا. لقد حاول الباحثون في Netflix كل شيء يمكن أن يفكروا به ، ولكنهم في الوقت نفسه كانوا يشكون في وجود أفكار أخرى قد تساعدهم على تحسين نظامهم. وهكذا ، توصلوا إلى ما كان ، في ذلك الوقت ، حل جذري: دعوة مفتوحة.

كان النجاح الحاصل في نهاية المطاف لجائزة Netflix هو كيفية تصميم المكالمة المفتوحة ، وهذا التصميم يحتوي على دروس مهمة لكيفية استخدام المكالمات المفتوحة للبحث الاجتماعي. لم تقدم Netflix طلبًا غير منظم فقط للأفكار ، وهو ما يتخيله الكثيرون عندما ينظرون أولاً إلى مكالمة مفتوحة. بدلاً من ذلك ، طرح Netflix مشكلة واضحة في إجراء التقييم البسيط: فقد طعنوا الناس في استخدام مجموعة من 100 مليون تقييم سينمائي للتنبؤ بـ 3 ملايين من تقييمات التدوين (التقييمات التي قدمها المستخدمون لكن Netflix لم يتم إصدارها). أول شخص يخلق خوارزمية تتنبأ بأن 3 ملايين من التقييمات التي احتفظت بها بنسبة 10٪ أفضل من سينماتش سيفوز بمليون دولار. إن إجراء التقييم الواضح والسهل التطبيق - مقارنة التقييمات المتوقعة مع التقييمات المستقرة - يعني أن جائزة Netflix قد تم تأطيرها بطريقة تجعل من السهل التحقق من الحلول أكثر من توليدها ؛ حولت تحدي تحسين Cinematch إلى مشكلة مناسبة لإجراء مكالمة مفتوحة.

في أكتوبر من عام 2006 ، أصدرت Netflix مجموعة بيانات تحتوي على 100 مليون تقييم فيلم من حوالي حوالي 500،000 عميل (سننظر في آثار الخصوصية لهذا الإصدار من البيانات في الفصل 6). يمكن وضع تصور لبيانات Netflix على أنها مصفوفة ضخمة تضم ما يقرب من 500000 عميل من خلال 20000 فيلم. ضمن هذا المصفوفة ، كان هناك حوالي 100 مليون تصنيف على مقياس من واحد إلى خمس نجوم (الجدول 5.2). كان التحدي هو استخدام البيانات المرصودة في المصفوفة للتنبؤ بالتقييمات الثلاثة التي تم الاحتفاظ بها.

جدول 5.2: رسم تخطيطي للبيانات من جائزة Netflix
	الفيلم 1	الفيلم 2	الفيلم 3	...	الفيلم 20،000
العميل 1	2	5		...	؟
العميل 2		2	؟	...	3
العميل 3		؟	2	...
$\vdots$	$\vdots$	$\vdots$	$\vdots$		$\vdots$
العميل 500000	؟		2	...	1

تم جذب الباحثين والمتسللين في جميع أنحاء العالم إلى التحدي ، وبحلول عام 2008 كان أكثر من 30،000 شخص يعملون عليها (Thompson 2008) . على مدار المسابقة ، تلقت Netflix أكثر من 40000 من الحلول المقترحة من أكثر من 5000 فريق (Netflix 2009) . من الواضح أن Netflix لا تستطيع قراءة وفهم كل هذه الحلول المقترحة. بيد أن الأمر برمته سليما ، لأن الحلول كانت سهلة التحقق. يمكن أن يمتلك Netflix جهاز كمبيوتر يقارن بين التقييمات المتوقّعة والتصنيفات المحجوزة باستخدام مقياس محدد مسبقًا (كان المقياس الخاص الذي استخدموه هو الجذر التربيعي لخطأ الوسط التربيعي). كانت هذه القدرة على إجراء تقييم سريع للحلول التي مكنت Netflix من قبول الحلول من الجميع ، والتي تبين أنها مهمة لأن الأفكار الجيدة أتت من بعض الأماكن المدهشة. في الواقع ، تم تقديم الحل الفائز من قبل فريق بدأه ثلاثة باحثين لم تكن لديهم خبرة سابقة في بناء أنظمة توصية الأفلام (Bell, Koren, and Volinsky 2010) .

أحد الجوانب الجميلة لجائزة Netflix هو أنها مكنت من تقييم جميع الحلول المقترحة بشكل عادل. أي أنه عندما يحمّل الأشخاص تقديراتهم المتوقعة ، لا يحتاجون إلى تحميل بيانات الاعتماد الأكاديمية أو العمر أو العرق أو الجنس أو التوجه الجنسي أو أي شيء عن أنفسهم. تم التعامل مع التقييمات المتوقعة لأستاذ مشهور من ستانفورد تماما مثل تلك من مراهق في غرفة نومها. لسوء الحظ ، هذا ليس صحيحًا في معظم الأبحاث الاجتماعية. وهذا هو ، بالنسبة لمعظم البحوث الاجتماعية ، والتقييم يستهلك وقتا طويلا جدا وذاتي جزئيا. لذا ، فإن معظم الأفكار البحثية لا يتم تقييمها بشكل جدي ، وعندما يتم تقييم الأفكار ، من الصعب فصل هذه التقييمات عن منشئ الأفكار. من ناحية أخرى ، تتمتع مشروعات الاتصال المفتوحة بتقييم سهل وعادل حتى يتمكنوا من اكتشاف الأفكار التي قد يتم تفويتها بطريقة أخرى.

على سبيل المثال ، في مرحلة ما خلال جائزة Netflix ، نشر شخص يحمل اسم الشاشة Simon Funk على مدونته حلاً مقترحًا يستند إلى تحليل القيمة المفردة ، وهو نهج من الجبر الخطي لم يستخدمه المشاركون الآخرون من قبل. كانت مقالة فونك الفنية في وقت واحد فنية وغريبة بشكل غير رسمي. هل كانت هذه التدوينة تصف الحل الجيد أم أنها مضيعة للوقت؟ خارج مشروع الاتصال المفتوح ، قد لا يكون الحل قد حصل على تقييم جاد. بعد كل شيء ، لم يكن سيمون فونك أستاذا في MIT. كان مطور برامج ، في ذلك الوقت ، كان (Piatetsky 2007) حقائب الظهر حول نيوزيلندا (Piatetsky 2007) . إذا أرسل هذه الفكرة عبر البريد الإلكتروني إلى مهندس في Netflix ، فمن المؤكد أنه لم يكن من الممكن قراءتها.

لحسن الحظ ، لأن معايير التقييم كانت واضحة وسهلة التطبيق ، تم تقييم تقديراته المتوقعة ، وكان من الواضح على الفور أن أسلوبه كان قوياً جداً: لقد صعد إلى المركز الرابع في المنافسة ، وهي نتيجة هائلة بالنظر إلى أن الفرق الأخرى كانت بالفعل العمل لعدة أشهر على المشكلة. في النهاية ، تم استخدام أجزاء من أسلوبه من قبل جميع المنافسين (Bell, Koren, and Volinsky 2010) .

إن حقيقة أن سيمون فانك فضل كتابة مقال في مدونة يشرح منهجه ، بدلاً من محاولة إبقائه سراً ، يوضح أيضاً أن العديد من المشاركين في جائزة نيتفليكس لم يكونوا مدفوعين حصرياً بالجائزة المليون دولار. وبدلاً من ذلك ، بدا العديد من المشاركين أيضًا متمتعين بالتحدي الفكري والمجتمعية التي تطورت حول المشكلة (Thompson 2008) ، وهي مشاعر أتوقع أن يستطيع العديد من الباحثين فهمها.

جائزة Netflix هي مثال كلاسيكي على مكالمة مفتوحة. طرح Netflix سؤالًا بهدف محدد (توقع تقييمات الأفلام) والحلول المطلوبة من العديد من الأشخاص. تمكنت Netflix من تقييم كل هذه الحلول لأنها كانت أسهل في التحقق من الإنشاء ، وفي النهاية ، اخترت Netflix أفضل الحلول. بعد ذلك ، سأوضح لك كيف يمكن استخدام هذا المنهج نفسه في علم الأحياء والقانون ، وبدون جائزة تبلغ قيمتها مليون دولار.