5.3.1 Netflix पुरस्कार

लोक आवडेल जे चित्रपट अंदाज Netflix पुरस्कार उघडा कॉल वापरते.

सर्वात सुप्रसिद्ध खुल्या कॉल प्रकल्प Netflix पुरस्कार आहे. Netflix ऑनलाइन चित्रपट भाड्याने देणे कंपनी आहे, आणि 2000 मध्ये तो ग्राहकांना चित्रपट शिफारस करणे Cinematch, एक सेवा सुरू केली आहे. उदाहरणार्थ, Cinematch तुम्ही स्टार युद्धे आणि साम्राज्य स्ट्राइक आवडले की मागे आणि नंतर आपण मनातल्या परत पाहू, असे शिफारसीय आहे लक्षात येऊ शकते. सुरुवातीला Cinematch असमाधानकारकपणे काम केले. पण, अनेक वर्षे नक्कीच प्रती, Cinematch ग्राहकांना काय चित्रपट आनंद होईल अंदाज त्याच्या क्षमता सुधारण्यासाठी राहिले. 2006, तथापि, Cinematch प्रगती plateaued. Netflix येथे संशोधक विचार करू खूपच जास्त सर्वकाही प्रयत्न केला होता, पण त्याच वेळी, त्यांच्या प्रणाली सुधारण्यासाठी मदत करू शकतील इतर कल्पना होते की संशय. अशा प्रकारे, होते काय, वेळी आला, एक मूलगामी उपाय: खुले कॉल.

Netflix पुरस्कार अंतिम यश गंभीर उघडा कॉल तयार केले होते कसे होते, आणि या रचना सामाजिक संशोधन करण्यासाठी वापरले जाऊ शकते कसे कॉल महत्वाचे धडे आहे. फक्त Netflix कल्पना एक भागात तुम्ही लिहिलेला विनंती, अनेक लोक ते प्रथम खुले कॉल विचार करताना कल्पना काय आहे बाहेर ठेवले नाही. उलट, Netflix एक साधी मूल्यमापन निकष स्पष्ट समस्या विचारलेल्या ते अंदाज 3 दशलक्ष आयोजित आऊट रेटिंग 100 दशलक्ष चित्रपट रेटिंग एका संचाचा वापर आव्हान लोकांना (वापरकर्ते केला होता रेटिंग पण Netflix सोडून नाही). कोण 3 दशलक्ष आयोजित आऊट रेटिंग 10% Cinematch 1 दशलक्ष डॉलर्स विजय होईल पेक्षा चांगले भाकित शकते की एक अल्गोरिदम तयार करू शकलो कोणीही. या स्पष्ट आणि सोपे लागू करण्यासाठी मूल्यमापन आयोजित आऊट अंदाज रेटिंग निकष-तुलना रेटिंग-बोलत Netflix पुरस्कार उपाय निर्माण पेक्षा तपासण्यासाठी सोपे आहेत की अशा प्रकारे रचला होते असे नव्हे, ते खुले कॉल योग्य एक समस्या Cinematch सुधारणा आव्हान केले.

2006 च्या ऑक्टोबर मध्ये, Netflix 100 दशलक्ष चित्रपट रेटिंग असलेले (आपण 6 व्या अध्यायात हा डेटा प्रकाशन गोपनीयता परिणाम विचार करेल) बद्दल 500,000 ग्राहकांना एका डेटासेटमधील जाहीर. Netflix डेटा 20,000 चित्रपट अंदाजे आहे की 500,000 ग्राहकांना एक प्रचंड मॅट्रिक्स म्हणून संकल्पना केले जाऊ शकते. हा मॅट्रिक्स आत, 1 ते 5 तारे (तक्ता 5.2) एक प्रमाणात सुमारे 100 दशलक्ष रेटिंग होते. आव्हान 3 दशलक्ष आयोजित आऊट रेटिंग अंदाज मॅट्रिक्स मध्ये साजरा डेटा वापरण्यासाठी होते.

टेबल 5.2 Netflix पुरस्कार डेटा स्वरुपाचा. Netflix सुमारे 100 दशलक्ष रेटिंग (1 स्टार 5 तारे) 20,000 चित्रपट 500,000 ग्राहकांना उपलब्ध करून देण्यात जाहीर. Netflix पुरस्कार ध्येय 3 दशलक्ष चित्रपट, "?" म्हणून दाखवली आयोजित आऊट रेटिंग अंदाज ही रेटिंग वापरण्यासाठी होते. Netflix पुरस्कार सहभागी सादर केलेल्या अंदाज रेटिंग आयोजित आऊट रेटिंग तुलनेत होते. मी Chapter 6 हा डेटा प्रकाशन आसपासच्या नैतिक अडचणींची चर्चा करेल.
चित्रपट 1 चित्रपट 2 चित्रपट 3 . . . चित्रपट 20,000
ग्राहक 1 2 5 . ?
ग्राहक 2 2 ? . 3
ग्राहक 3 ? 2 .
. . . . . . . .
ग्राहक 500,000 ? 2 . 1

संशोधक आणि हॅकर्स जगभरातील आव्हान आले होते, आणि 2008 पेक्षा जास्त 30,000 लोक तो काम करत होते (Thompson 2008) . स्पर्धा नक्कीच प्रती, Netflix 5,000 पेक्षा जास्त संघ 40,000 हून अधिक प्रस्तावित उपाय प्राप्त (Netflix 2009) . अर्थात, Netflix वाचले आणि या सर्व प्रस्तावित उपाय समजू शकले नाही. संपूर्ण गोष्ट सहजतेने उपाय तपासण्यासाठी सोपे होते कारण, तथापि, धावत गेला. फक्त Netflix संगणक पूर्व-निर्दिष्ट मेट्रिक (विशेषतः ते वापरले क्षुद्र-वर्ग त्रुटी चौरस उगम झाला मेट्रिक) आयोजित आऊट रेटिंग अंदाज रेटिंग तुलना शकते. तो पटकन चांगल्या कल्पना काही आश्चर्यकारक ठिकाणी आले कारण महत्त्वाचे असल्याचे बाहेर चालू जे प्रत्येकजण, ते उपाय स्वीकारण्यासाठी Netflix सक्षम उपाय मूल्यमापन करण्यासाठी ही क्षमता होती. खरं तर, विजय उपाय नाही अगोदर अनुभव इमारत चित्रपट शिफारस प्रणाली होते की तीन संशोधक प्रारंभ संघ सादर करण्यात आला होता (Bell, Koren, and Volinsky 2010) .

Netflix पुरस्कार एक सुंदर पैलू तो प्रामाणिकपणाने मूल्यांकन त्यांच्या उपाय आहेत जगातील प्रत्येक सक्षम आहे. लोक त्यांच्या अंदाज रेटिंग अपलोड केला तेव्हा, ते त्यांच्या शैक्षणिक श्रेय, त्यांचे वय, वंश, लिंग, लैंगिक आवड, किंवा स्वत: बद्दल काहीही अपलोड करण्याची आवश्यकता आहे नाही. अशा प्रकारे, स्टॅन्फोर्ड एक प्रसिद्ध प्रोफेसर अंदाज रेटिंग नक्की तिच्या बेडरूममध्ये एक teenager पासून त्या प्रमाणे हाताळले होते. दुर्दैवाने, या सर्वात सामाजिक संशोधन खरे नाही. सर्वात सामाजिक संशोधन, मूल्यमापन फार वेळ घेणारी आणि अंशतः काल्पनिक आहे, आहे. त्यामुळे, सर्वात संशोधन कल्पना गंभीरपणे मूल्यांकन करत नाही, आणि कल्पना मूल्यमापन केले जाते, तेव्हा ते कल्पना निर्मात्याकडून त्या मोजमापन विलग करणे कठीण आहे. उपाय तपासण्यासाठी सोपे कारण, खुल्या कॉल संशोधक फक्त प्रसिद्ध प्राध्यापक पासून उपाय मानले तर cracks माध्यमातून पडणे असे सर्व संभाव्य आश्चर्यकारक उपाय प्रवेश करण्याची परवानगी.

उदाहरणार्थ, स्क्रीन नाव Netflix पुरस्कार कोणीतरी दरम्यान एका क्षणी सायमन फंक त्याच्या ब्लॉग प्रस्तावित उपाय वर पोस्ट एक असामान्य मूल्य नाश आधारित, लिनिअर अल्जेब्रा एक दृष्टिकोन इतर सहभागी करून पूर्वी वापरलेल्या आले नव्हते. भ्याड ब्लॉग पोस्ट एकाच वेळी तांत्रिक आणि weirdly अनौपचारिक होते. या ब्लॉग पोस्ट एक चांगला उपाय वर्णन किंवा वेळ वाया होते? खुले कॉल प्रकल्प बाहेर, उपाय गंभीर मूल्यमापन मिळाले आहे कधीही शकते. सर्व सायमन फंक कॅल टेक किंवा एमआयटी येथे प्राध्यापक नाही होती; तो वेळी, न्यूझीलंड सुमारे Backpacking होता, सॉफ्टवेअर डेव्हलपर होते (Piatetsky 2007) . तो Netflix एक अभियंता ही कल्पना ईमेल असता, तर तो नक्कीच गांभीर्याने घेतले नसता.

सुदैवाने, कारण मूल्यमापन निकष स्पष्ट आणि लागू करणे सोपे होते, त्याच्या अंदाज रेटिंग मूल्यमापन होते, आणि तो त्याच्या दृष्टिकोन खूप शक्तिशाली होता की त्वरित स्पष्ट झाला, कारण तो स्पर्धेत चौथ्या ठिकाणी यादरम्यान, एक प्रचंड परिणाम इतर संघ आधीच केली होती की, दिले समस्या महिने काम. शेवटी, सायमन फंक च्या पध्दत भाग अक्षरशः सर्व गंभीर प्रतिस्पर्धी द्वारे वापरले होते (Bell, Koren, and Volinsky 2010) .

सायमन फंक ऐवजी नजरेतून प्रयत्न पेक्षा, त्याच्या दृष्टिकोन स्पष्ट करणारा एक ब्लॉग पोस्ट लिहिण्यासाठी निवडले की, देखील Netflix पुरस्कार अनेक सहभागी केवळ दशलक्ष डॉलर बक्षीस प्रवृत्त नाही ते स्पष्ट होते. उलट, अनेक सहभागी देखील बौद्धिक आव्हान आणि समस्या सुमारे विकसित समुदाय आनंद होती (Thompson 2008) , मी अनेक संशोधक समजू शकतो अपेक्षा भावना.

Netflix पुरस्कार खुले कॉल एक क्लासिक उदाहरण आहे. Netflix (चित्रपट रेटिंग भाकीत) एक विशिष्ट ध्येय एक प्रश्न विचारलेल्या आणि अनेक लोक उपाय विनंती. ते तयार पेक्षा सत्यापित करण्यासाठी सोपे होते कारण Netflix या सर्व उपाय मूल्यमापन करण्यासाठी सक्षम होते, आणि शेवटी Netflix सर्वोत्तम उपाय उचलले. कसे याच दृष्टिकोन जीवशास्त्र आणि कायदा मध्ये वापरले जाऊ शकते पुढील, मी आपल्याला दर्शवू.