5.3.1 جایزه Netflix بکشد

جایزه Netflix بکشد با استفاده از پاسخ باز به پیش بینی که فیلم از مردم می خواهم.

این پروژه پاسخ باز شناخته شده ترین جایزه Netflix بکشد است. Netflix بکشد یک شرکت اجاره فیلم آنلاین است، و در سال 2000 آن را Cinematch، یک سرویس راه اندازی، توصیه می شود فیلم به مشتریان. به عنوان مثال، ممکن است متوجه Cinematch که شما دوست Star Wars و اعتصاب امپراتوری برگشت و پس از آن توصیه می کنند که شما را تماشا بازگشت از جدی. در ابتدا، Cinematch ضعیف کار کرده است. اما، در طول دوره از سال های بسیاری، Cinematch به بهبود توانایی خود را به پیش بینی آنچه فیلم مشتریان لذت ببرید. در سال 2006، با این حال، پیشرفت در Cinematch plateaued. محققان در Netflix بکشد همه چیز بسیار زیبا که آنها می توانند از فکر می کنم سعی کرده بود، اما در همان زمان، آنها مظنون است که که ایده های دیگر که ممکن است کمک به آنها سیستم خود را بهبود بخشد. فراخوان: بنابراین، آنها با آنچه بود یک راه حل اساسی آمد، در آن زمان،.

انتقادی به موفقیت نهایی جایزه Netflix بکشد بود که چگونه پاسخ باز طراحی شده است، و این طراحی درس مهم برای چگونه تماس های باز را می توان برای تحقیقات اجتماعی استفاده می شود. Netflix بکشد نه تنها قرار دادن یک درخواست بدون ساختار برای ایده است که آنچه بسیاری از مردم تصور وقتی اولین بار فراخوان در نظر بگیرند. در عوض، Netflix بکشد مطرح مشکل روشن با معیارهای ارزیابی ساده است: با مردم به چالش کشیده به استفاده از مجموعه ای از 100 میلیون رتبه بندی فیلم برای پیش بینی 3 میلیون اعتبارهای برگزار کردن (رتبه بندی که کاربران ساخته شده بود، اما که Netflix بکشد را آزاد نیست). هر کسی که می تواند یک الگوریتم است که می تواند 3 میلیون اعتبارهای برگزار کردن پیش بینی 10٪ بهتر از Cinematch 1 میلیون دلار برنده ایجاد کنید. این روشن و آسان به درخواست معیارهای ارزیابی-مقایسه رتبه های پیش بینی شده برای برگزار کردن رتبه بندی-بدان معنی است که جایزه Netflix بکشد در چنین راهی است که راه حل راحت تر از تولید به بررسی قاب شده بود. آن را به چالش بهبود Cinematch به یک مشکل مناسب برای فراخوان تبدیل شده است.

در اکتبر 2006، Netflix بکشد یک مجموعه داده حاوی 100 میلیون رتبه بندی فیلم از حدود 500،000 مشتریان (ما را به حریم خصوصی این نسخه داده ها در فصل 6 نظر) منتشر شد. داده Netflix بکشد می تواند به عنوان یک ماتریس بزرگ است که حدود 500،000 مشتریان با 20000 فیلم، مفهوم. در این ماتریس، حدود 100 میلیون رأی در یک مقیاس از 1 تا 5 ستاره (جدول 5.2) وجود دارد. چالش این بود که به استفاده از داده های مشاهده شده در ماتریس برای پیش بینی 3 میلیون اعتبارهای برگزار کردن.

جدول 5.2: شماتیک از داده ها را از جایزه Netflix بکشد. Netflix بکشد حدود 100 میلیون اعتبار (1 ستاره تا 5 ستاره) ارائه شده توسط 500.000 مشتریان در 20،000 فیلم منتشر شده است. هدف از این جایزه Netflix بکشد استفاده از این رتبه بندی برای پیش بینی رتبه های برگزار کردن از 3 میلیون فیلم، نشان داده شده است به عنوان "؟". رتبه های پیش بینی شده توسط شرکت کنندگان در جایزه Netflix بکشد ارسال به رتبه بندی برگزار کردن مقایسه شد. من به مسائل اخلاقی اطراف این نسخه داده ها در فصل 6 مورد بحث است.
فیلم 1 فیلم 2 فیلم 3 . . . فیلم 20،000
مشتری 1 2 5 . ؟
مشتری 2 2 ؟ . 3
مشتری 3 ؟ 2 .
. . . . . . . .
ضوابط 500،000 ؟ 2 . 1

محققان و هکرها در سراسر جهان به چالش کشیده می شدند، و در سال 2008 بیش از 30،000 نفر در آن مشغول به کار بودند (Thompson 2008) . در طول این دوره از مسابقه، Netflix بکشد بیش از 40،000 راه حل های پیشنهادی از بیش از 5000 تیم دریافت (Netflix 2009) . بدیهی است، Netflix بکشد قادر به خواندن و درک تمام این راه حل پیشنهاد شده است. تمام چیزی که فرار هموار، با این حال، به دلیل راه حل آسان برای بررسی بود. Netflix بکشد فقط می تواند یک کامپیوتر مقایسه رتبه بندی پیش بینی شده برای رتبه بندی برگزار کردن یک متریک (متریک خاص آنها استفاده می شود ریشه دوم میانگین مربع خطا بود) از پیش تعیین شده. این توانایی به سرعت ارزیابی راه حل های که Netflix بکشد را قادر به قبول راه حل از همه، که تبدیل به مهم بود چرا که ایده های خوب از بعضی از نقاط تعجب آور بود. در واقع، راه حل برنده توسط یک تیم آغاز شده توسط سه محقق که هیچ تجربه ساختمان سیستم های توصیه فیلم قبل بود ارائه شد (Bell, Koren, and Volinsky 2010) .

یکی از جنبه های زیبا از جایزه Netflix بکشد این است که آن هر کس در جهان را فعال کنید به راه حل خود را مورد ارزیابی قرار نسبتا. هنگامی که مردم در رتبه بندی پیش بینی شده خود را آپلود، آنها لازم نیست برای آپلود اعتبار علمی خود، به سن، نژاد، جنسیت، گرایش جنسی، و یا هر چیزی در مورد خود. به این ترتیب، رتبه های پیش بینی شده از استاد معروف از دانشگاه استنفورد دقیقا همان کسانی که از یک نوجوان در اتاق خواب خود تحت درمان قرار گرفتند. متاسفانه، این است که در اکثر پژوهش های اجتماعی درست نیست. این است که، برای بسیاری از تحقیقات اجتماعی، ارزیابی بسیار وقت گیر و تا حدی ذهنی است. بنابراین، بسیاری از ایده های پژوهشی در حال هرگز به طور جدی مورد بررسی قرار، و هنگامی که ایده ارزیابی می شوند، آن سخت است برای جدا آن ارزیابیها از خالق ایده. چرا که راه حل بسیار آسان است به بررسی کنید، تماس های باز محققان اجازه می دهد برای دسترسی به تمام راه حل بالقوه فوق العاده است که از طریق ترک سقوط اگر آنها تنها راه حل از استادان معروف در نظر گرفته.

به عنوان مثال، در یک نقطه در طول کسی جایزه Netflix با نام صفحه را سیمون فانک ارسال شده در وبلاگ یک راه حل پیشنهادی خود را بر اساس یک تجزیه مقدار منفرد، یک رویکرد از جبر خطی را که قبلا با دیگر شرکت کنندگان استفاده نشده است. پست وبلاگ فانک به طور همزمان فنی و بطور غیررسمی بود. شد این پست وبلاگ توصیف یک راه حل خوب و یا آن را به یک اتلاف وقت بود؟ خارج از طرح فراخوان، راه حل ممکن است هرگز ارزیابی جدی دریافت کرده اند. پس از یک استاد در کال فن آوری و یا MIT همه سیمون فانک نیست. او یک توسعه دهنده نرم افزار که، در آن زمان، در اطراف نیوزیلند پیاده شد (Piatetsky 2007) . اگر او این ایده را به یک مهندس در Netflix بکشد ایمیل فرستاده بود، آن را تقریبا به طور قطع نمی توانست به طور جدی گرفته شده است.

خوشبختانه، به خاطر معیارهای ارزیابی روشن و آسان به درخواست شد، رتبه بندی پیش بینی شده خود را، مورد بررسی قرار گرفت و فورا آن را روشن است که رویکرد خود را بسیار قدرتمند بود: او به جایگاه چهارم در رقابت به فلک کشیده، در نتیجه فوق العاده ای داده می شود که تیم های دیگر در حال حاضر شده بود کار برای ماه ها در مشکل. در پایان، بخش هایی از رویکرد سیمون فانک با تقریبا تمام رقبای جدی مورد استفاده قرار گرفت (Bell, Koren, and Volinsky 2010) .

واقعیت این است که سیمون فانک تصمیم به نوشتن یک پست وبلاگ توضیح رویکرد خود را، به جای تلاش برای آن را مخفی نگه دارید، همچنین نشان می دهد که بسیاری از شرکت کنندگان در جایزه Netflix بکشد شد به طور انحصاری توسط میلیون دلار جایزه انگیزه نیست. در عوض، بسیاری از شرکت کنندگان نیز به نظر می رسید برای لذت بردن از چالش فکری و جامعه که در اطراف مشکل توسعه (Thompson 2008) ، احساسات است که من انتظار بسیاری از محققان می توانید درک کنید.

جایزه Netflix بکشد یک مثال کلاسیک از یک تماس باز است. Netflix بکشد یک سوال با یک هدف خاص مطرح (پیش بینی رتبه بندی فیلم) و راه حل از بسیاری از مردم درخواست. Netflix بکشد قادر به ارزیابی تمام این راه حل بود چرا که آنها آسان تر از ایجاد شد، و در نهایت Netflix بکشد برداشت بهترین راه حل. بعد، من شما را چگونه این رویکرد همان را می توان در زیست شناسی و قانون استفاده می شود نشان می دهد.