5.3.1 جائزة نيتفليكس

يستخدم جائزة نيتفليكس دعوة مفتوحة للتنبؤ التي الأفلام الناس سوف شابه ذلك.

المشروع دعوة مفتوحة أكثر من المعروف جيدا هو جائزة نيتفليكس. نيتفليكس هي شركة تأجير الأفلام عبر الإنترنت، وفي عام 2000 أطلقت Cinematch، خدمة ليوصي أفلام للعملاء. على سبيل المثال، Cinematch قد تلاحظ أن حببت حرب النجوم والإضرابات الإمبراطورية العودة ومن ثم ننصح مشاهدة عودة الجيداي. في البداية، عملت Cinematch سيئة. ولكن، على مدى سنوات عديدة، واصلت Cinematch لتحسين قدرته على التنبؤ بما الأفلام العملاء سيتمتعون. وبحلول عام 2006، ومع ذلك، بركود التقدم على Cinematch. وكان الباحثون في نيتفليكس حاولت الى حد كبير كل ما أفكر فيه، ولكن في الوقت نفسه، انهم يشتبهون في أنه كانت هناك أفكار أخرى يمكن أن تساعد على تحسين النظام الخاص بهم. وهكذا، وأنها جاءت مع ما كان، في ذلك الوقت، حل جذري: دعوة مفتوحة.

أمر حاسم لتحقيق النجاح في نهاية المطاف على جائزة نيتفليكس كيفية تصميم دعوة مفتوحة، وهذا تصميم لديه دروس مهمة لكيفية دعوات مفتوحة يمكن استخدامها للبحث الاجتماعي. نيتفليكس لم وضعت للتو من طلب غير منظم للأفكار، وهو ما يتصور كثير من الناس عندما أولا النظر في دعوة مفتوحة. بدلا من ذلك، طرحت نيتفليكس مشكلة واضحة مع معايير التقييم بسيط: أنها طعن الناس على استخدام مجموعة من 100 مليون تصنيف الفيلم على التنبؤ 3000000-عقد من التقييمات (التصنيفات التي المستخدمين حققت لكن هذا نيتفليكس لم تفرج). أي شخص يمكن أن تخلق خوارزمية التي يمكن التنبؤ 3000000 تصنيفات التي عقدت من 10٪ أفضل من Cinematch سيفوز 1000000 دولار. هذا واضحة وسهلة لتطبيق تقييم معايير المقارنة بين تصنيفات المتوقع أن يسيطر بها على تصنيفات من المفترض أن جائزة نيتفليكس كانت مؤطرة في مثل هذه الطريقة أن الحلول هي أسهل للتحقق من توليد. تبين التحدي المتمثل في تحسين Cinematch إلى مشكلة مناسبة للدعوة مفتوحة.

في أكتوبر من عام 2006، أصدرت نيتفليكس مجموعة بيانات تحتوي على 100 مليون تصنيفات الأفلام من حول حول 500،000 العملاء (ونحن سوف النظر في الآثار المترتبة خصوصية هذا الإصدار البيانات في الفصل 6). ويمكن تصور البيانات نيتفليكس في شكل مصفوفة الضخمة التي ما يقرب من 500،000 العملاء من خلال 20،000 الأفلام. داخل هذه المصفوفة، كان هناك حوالي 100 مليون درجات على مقياس من 1 إلى 5 نجوم (الجدول 5.2). ويتمثل التحدي في استخدام البيانات التي لوحظت في مصفوفة للتنبؤ 3000000 تصنيفات التي يسيطر بها.

الجدول 5.2: رسم تخطيطي للبيانات من جائزة نيتفليكس. صدر نيتفليكس نحو 100 مليون التقييمات (1 نجمة إلى 5 نجوم) المقدمة من 500،000 العملاء على 20000 الأفلام. وكان الهدف من جائزة نيتفليكس لاستخدام هذه التصنيفات للتنبؤ التصنيفات التي عقدت من 3 ملايين الأفلام، كما هو موضح "؟". وتمت مقارنة بتصنيفات توقع المقدمة من المشاركين في جائزة نيتفليكس إلى تصنيفات التي يسيطر بها. سأناقش القضايا الأخلاقية المحيطة بهذه صدور البيانات في الفصل 6.
فيلم 1 فيلم 2 فيلم 3 . . . فيلم 20،000
العملاء 1 2 5 . ؟
العملاء 2 2 ؟ . 3
زبون 3 ؟ 2 .
. . . . . . . .
العملاء 500000 ؟ 2 . 1

ووضعت الباحثين والمتسللين في جميع أنحاء العالم إلى مستوى التحدي، وبحلول عام 2008 أكثر من 30000 شخص كانوا يعملون على ذلك (Thompson 2008) . على مدار المسابقة، تلقى نيتفليكس أكثر من 40،000 الحلول المقترحة من أكثر من 5000 فرق (Netflix 2009) . من الواضح، أن نيتفليكس لا قراءة وفهم جميع هذه الحلول المقترحة. ركض كل شيء بسلاسة، ولكن، لأن الحلول كانت سهلة للتحقق. نيتفليكس يمكن أن يكون مجرد جهاز كمبيوتر مقارنة التصنيفات يتوقع أن التقديرات التي يسيطر بها على المتري (في مقياس معين استخدموا كان الجذر التربيعي للخطأ متوسط ​​تربيع) المحددة مسبقا. وكان هذا القدرة على تقييم بسرعة الحلول التي مكنت نيتفليكس لقبول الحلول من الجميع، والتي تحولت إلى أن تكون مهمة لأن الأفكار الجيدة تأتي من بعض الأماكن مثيرة للدهشة. في الواقع، تم تقديم حل الفوز من قبل فريق التي كتبها ثلاثة باحثين التي ليس لديها أنظمة توصية فيلم السابقة بناء تجربة (Bell, Koren, and Volinsky 2010) .

أحد الجوانب الجميلة على جائزة نيتفليكس هو انه مكن الجميع في العالم أن يكون حلهم تقييم إلى حد ما. عندما تحميلها الناس تصنيفاتها توقع، فإنها لا تحتاج إلى تحميل أوراق اعتمادهم الأكاديمية، سنهم أو العرق أو الجنس أو التوجه الجنسي، أو أي شيء عن أنفسهم. وهكذا، تم علاج الدرجات المتوقعة للأستاذ الشهير من جامعة ستانفورد بالضبط نفس تلك من كان في سن المراهقة في غرفة نومها. للأسف، هذا ليس صحيحا في معظم البحوث الاجتماعية. وهذا يعني، بالنسبة لمعظم البحوث الاجتماعية والتقييم وقتا طويلا جدا وشخصي جزئيا. لذلك، فإن معظم الأفكار البحثية أبدا تقييمها على محمل الجد، وعندما يتم تقييم الأفكار، فمن الصعب فصل تلك التقييمات من الخالق من الأفكار. بسبب حلول سهلة للتحقق، ومكالمات مفتوحة تسمح للباحثين للوصول إلى كافة الحلول المحتملة الرائعة التي تقع من خلال الشقوق إذا كانت تعتبر سوى حلول من أساتذة الشهيرة.

على سبيل المثال، عند نقطة واحدة خلال شخص جائزة نيتفليكس مع اسم الشاشة سيمون فونك نشر على مدونته الحل المقترح على أساس تجزئ القيمة المنفردة، وهو نهج من الجبر الخطي التي لم تستخدم من قبل المشاركين الآخرين. تم النشر بلوق الفانك والتقنية في وقت واحد وغير الرسمية بغرابة. كان هذا بلوق وظيفة تصف حلا جيدا أو كان ذلك مضيعة للوقت؟ خارج مشروع الدعوة مفتوحة، قد تلقى حل أبدا تقييم جدي. بعد كان كل سيمون الرائحة الكريهة لا وهو أستاذ في كال تك أو MIT. كان مطور البرمجيات الذين، في ذلك الوقت، كان على الظهر في جميع أنحاء نيوزيلندا (Piatetsky 2007) . إذا كان قد عبر البريد الالكتروني هذه الفكرة لمهندس في نيتفليكس، فإنه يكاد يكون من المؤكد أن لا يكون قد تؤخذ على محمل الجد.

لحسن الحظ، لأن معايير التقييم واضحة وسهلة التطبيق، وجرى تقييم شعبيته متوقعا، وكان واضحا على الفور أن منهجه كان قويا جدا: انه انطلق إلى المركز الرابع في المسابقة، نتيجة هائلة بالنظر إلى أن الفرق الأخرى قد تم بالفعل العمل لعدة أشهر على هذه المشكلة. في النهاية، استخدمت أجزاء من نهج سيمون الرائحة الكريهة من قبل منافسين جادين فقط تقريبا (Bell, Koren, and Volinsky 2010) .

حقيقة أن سيمون فونك اختار لكتابة بلوق وظيفة شرح نهجه، بدلا من محاولة الحفاظ على سريتها، ويوضح أيضا أن العديد من المشاركين في جائزة نيتفليكس لم تكن بدافع حصريا لجائزة مليون دولار. بدلا من ذلك، يبدو أن العديد من المشاركين أيضا التمتع التحدي الفكري والمجتمع التي وضعت للتغلب على المشكلة (Thompson 2008) ، المشاعر التي أتوقع أن العديد من الباحثين على فهم.

جائزة نيتفليكس هو مثال كلاسيكي للدعوة مفتوحة. طرحت نيتفليكس سؤال مع هدف محدد (توقع تصنيف الأفلام) والتمست حلول من كثير من الناس. كان نيتفليكس قادرة على تقييم جميع هذه الحلول لأنها كانت أسهل للتحقق من خلق، وفي نهاية المطاف نيتفليكس اختار أفضل الحلول. بعد ذلك، سوف تظهر لك كيف أن هذا النهج ذاته يمكن استخدامها في البيولوجيا والقانون.