5.3.1 Netflix انعام

هن Netflix انعام گوئي کي جنهن فلمون ماڻهن کي پسند ڪندو کليل سڏ استعمال ڪري ٿو.

جڏهن ته سڀ کان چڱي طرح معلوم کليل سڏ منصوبي جي Netflix انعام آهي. Netflix هڪ آن لائن فلم ڪرائي تي ڏيڻ جي صحبت آهي، ۽ 2000 ع ۾ ان کي Cinematch، گراهڪن کي فلمون جي صلاح کي هڪ سروس شروع ڪئي. مثال طور، Cinematch نوٽيس وٺن ته اوھان کي پسند آيو اسٽار وار ۽ سلطنت ڊرون واپسي ۽ ان کان پوء جي صلاح آهي ته توهان جي Jedi جي واپسي جا منتظر رھ. شروعات ۾، Cinematch غير تسلي بخش ڪم ڪيو. پر، ڪيترن ئي سالن جي ڪورس تي، Cinematch گوئي کي گراهڪن جيڪي فلمون آسودو ڪري ڇڏي ان جي صلاحيت کي بهتر ڪرڻ لاء جاري. 2006 ع جو قسم، تنهن هوندي به، Cinematch تي جاري plateaued. Netflix تي تحقيق تمام گھڻو سڀڪنھن شيء کي (اھي) جي خيال ٿي سگهي ٿو جي ڪوشش ڪئي هئي، پر هڪ ئي وقت ۾، اهي شڪي ٻيو خيال آهي ته انهن کي انهن جي نظام کي بهتر ڪرڻ ۾ مدد ٿئي نه هئا ته. هڪ کليل سڏ: اهڙيء طرح، اهي هڪ بنيادي حل ڇا هو پاڻ سان وٺي آيو، هن وقت،.

جي Netflix انعام جي موٽڻ ڪاميابي نازڪ ڪيئن کليل سڏ ٺهيل هو، ۽ هن جوڙجڪ ڪيئن کليل مطالبن سماجي تحقيق لاء استعمال ڪري سگهجي ٿو لاء اهم سبق آهي. Netflix صرف خيالن جي لاء هڪ unstructured درخواست ڪڍي ڦٽو نه ڪيو آهي، جنهن ۾ آهي ڪيترن ئي ماڻهن کي جيڪي تصور جنھن مھل پهريون ڀيرو پڌرو سڏ ڪجانء. بلڪ، Netflix هڪ سادي اوسر معيار سان هڪ واضح مسئلو ھندستان: اهي ماڻهو چالان 3 لک منعقد آئوٽ درجابندي (درجابندي ته صارفين ڪيو ھو پر جيڪي Netflix ورائي نه ڪيائون) گوئي لاء 100 ملين فلم درجابندي جي هڪ سيٽ لاء استعمال ڪرڻ. جيڪو هڪ الخوارزمي آهي ته 3 لک منعقد آئوٽ درجابندي 10٪ بهتر کان Cinematch 1 ملين ڊالر ماڻي ها گوئي ڪري سگهي ٿي پيدا ڪري سگهي ٿي. هن صاف ۽ کي منعقد آئوٽ درجابندي-مطلب ته Netflix انعام اهڙي انداز ۾ حل پيدا کان چيڪ ڪرڻ آسان آهي ته بگڙيل صورت ويو اوسر معيار-comparing اڳڪٿي درجابندي لاڳو ڪرڻ آسان؛ اها هڪ کليل سڏ لاء مناسب هڪ مسئلو ۾ Cinematch بهتري جي چئلينج موٽيو.

2006 ع جي آڪٽوبر ۾، Netflix هڪ dataset جي باري ۾ اٽڪل 500،000 گراهڪن کان 100 ملين فلم درجابندي ۾ هجن (اسين باب 6 ۾ ڊيٽا ڇڏڻ جي خانگي نوعيت واري امڪانات تي غور ڪندو) ڇڏيا. هن Netflix ڊيٽا کي هڪ وڏي ٿينديون 20،000 فلمون جي آهي ته لڳ ڀڳ 500.000 گراهڪن جي حيثيت conceptualized ڪري سگهجي ٿو. هن ٿينديون اندر، اتي 1 کان 5 تارن (ٽيبل 5.2) لاء هڪ پيماني تي اٽڪل 100 ملين درجابندي هئا. هن چئلينج جي قائم ٿينديون ۾ هتان جي ڊيٽا کي استعمال ڪرڻ جي 3 لک منعقد آئوٽ درجابندي گوئي ڪري ويو.

ٽيبل 5.2: جي Netflix انعام مان ڊيٽا جي Schematic. Netflix 20،000 فلمون تي 500.000 گراهڪن جي روزي جي باري ۾ 100 ملين درجابندي (1 5 تارن کي اسٽار) ڇڏيا. جي Netflix انعام جو مقصد 3 لک فلمون، جيئن سنڌڙيء جي جي منعقد آئوٽ درجابندي گوئي ڪري انهن جي درجابندي کي استعمال ڪرڻ هو "؟". جي Netflix انعام ۾ ڌرين طرفان پيش اڳڪٿي درجابندي کي منعقد آئوٽ درجابندي جي مقابلي ۾ هئا. مون کي باب 6 ۾ هن ڊيٽا ڇڏڻ جي ڀرپاسي جي اخلاقي معاملن تي ڳالهه ٻولهه ڪئي ويندي.
فلم 1 فلم 2 فلم 3 . . . فلم 20،000
ڪسٽمر 1 2 5 . ؟
ڪسٽمر 2 2 ؟ . 3
ڪسٽمر 3 ؟ 2 .
. . . . . . . .
ڪسٽمر 500.000 ؟ 2 . 1

تحقيق ۽ دنيا جي چوڌاري hackers کي چئلينج ڪرڻ لاء ٺاهيا ويا، ۽ 2008 ع جي وڌيڪ 30،000 ماڻهن کي ان تي ڪم ڪري رهيا هئا (Thompson 2008) . جي تڪرارن جي حقيقت جي حوالي سان، Netflix کان وڌيڪ 5.000 ٽيمن کان وڌيڪ 40.000 تجويز ڪيل حل ملي (Netflix 2009) . ڏٺل، Netflix پڙهي نه سگهي ۽ سمجهي انهن سڀني تجويز ڪيل حل. هن سڄي شيء، سچارا ورهين جي هوندي به ڇاڪاڻ ته حل چيڪ ڪرڻ آسان هئا. Netflix صرف هڪ ڪمپيوٽر (جي خاص Metric اھي استعمال جي پي-squared غلطي جي ڪمرن جي روٽ هو) ھڪ قبل از مخصوص Metric جي ڪرڻ جي منعقد آئوٽ درجابندي جي اڳڪٿي درجابندي compare آهي ٿي سگهي ٿو. اهو تڪڙو حل ته Netflix فعال هر، جنهن ٻاهر موٽيو اهم ٿي، ڇاڪاڻ ته سٺو خيال ڪجهه رايو هنڌن کان آيو کان حل قبول ڪرڻ جي ويجهڙائيء ۾ هن جي صلاحيت هئي. حقيقت ۾، سنڌ جي کٽڻ حل هڪ ٽيم ٽي تحقيق آهي ته ڪو به اڳ جو تجربو عمارت فلم سفارش نظام پيو جي شروع جي پيش ڪيو ويو (Bell, Koren, and Volinsky 2010) .

جي Netflix انعام جي هڪ خوبصورت پاسو آهي ته ان کي دنيا ۾ هر هڪ کي فعال انهن جي حل ھيئن ڳولي هٿ ڪيو آهي. ماڻهن کي انهن جي اڳڪٿي درجابندي لوڊ جڏھن (اھي) پاڻ جي باري ۾ سندن تعليمي سندون، سندن عمر، مذهب، جنس، جنسي تعارفي، يا ڪا شيء اپ لوڊ ڪرڻ جي ضرورت نه ڪيو. اهڙيء طرح، Stanford مان هڪ مشهور پروفيسر جي اڳڪٿي درجابندي سندس ڪمري ۾ هڪ نوجوان کان تن جي طور تي انهيء ساڳي علاج ڪيا ويا. افسوس، هن سڀ کان سماجي تحقيق ۾ سچ نه آھي. اھو سڀ سماجي تحقيق لاء، اوسر تمام وقت ڀسم ۽ جزوي داخلي آهي، آهي. پوء، سڀ کان وڌيڪ تحقيق جي خيال سنجيدگي سان ڳولي هٿ ڪڏهن به آهن، ۽ جڏهن خيال ڳولي رهيا آهن، ان جي خيالن جو خالق مان جن evaluations detach کي سخت آهي. ڇو جو حل چيڪ ڪرڻ آسان آهي، کليل مطالبن تي تحقيق سڀني ممڪنه عجيب حل آهي ته cracks ذريعي ڪرندا ھا ته اھي رڳو مشهور پروفيسرز کان حل سمجهيو ويندو رسائي ڪرڻ جي اجازت ڏئي.

مثال طور، هڪ نقطي تي اسڪرين جو نالو شمعون Funk سان Netflix انعام ڪنهن دور ۾ پنهنجي بلاگ تي هڪ سمجھان قدر decomposition جي بنياد تي هڪ تجويز ڪيل حل، سڌر جو ؟: نواب ته ٻين ڌرين جي عربن استعمال نه ڪئي ويئي هئي مان هڪ اچڻ جي ڳالهه. Funk جي بلاگ پوسٽ جهازن کي فني ۽ weirdly رسمي هو. هن بلاگ پوسٽ هڪ سٺو حل بيان ڪيو ويو يا ان کي وقت جو زيان هئي؟ هڪ کليل سڏ منصوبي جي ٻاهران، جو حل ڪڏهن به سنجيده اوسر حاصل ڪيو ٿئي. سڀ شمعون Funk کان پوء Cal هتي يا MIT تي هڪ پروفيسر نه هو. هن چيو ته هڪ سافٽ ويئر ڊولپر جو، جي وقت تي، نئون ايم جي چوڌاري backpacking ويو هو (Piatetsky 2007) . هن چيو ته Netflix تي هڪ انجنيئر کي هن خيال emailed پئي ته، ان جي لڳ ڀڳ ضرور سنجيدگي سان نه ورتو ويو ھا.

خوشقسمتي، ڇو ته سنڌ جي اوسر معيار پڌرو ۽ لاڳو ڪرڻ آسان هئا، سندس اڳڪٿي درجابندي ڳولي هٿ ڪيا ويا، ۽ ان کي فوري طور واضح ڪيو ويو آهي ته سندس اچڻ تمام طاقتور هو: هن جي مقابلي ۾ چوٿون جاء کي rocketed، هڪ زبردست نتيجو ڏنو آهي ته ٻئي ٽيمون اڳ ۾ ئي ٿي وئي هئي هن مسئلي تي مهينن لاء ڪم ڪري. آخر ۾، شمعون Funk جي اچڻ جي حصن ۾ عملي طور سڀ سنجيده مقابل جي استعمال ڪيا ويا (Bell, Koren, and Volinsky 2010) .

جڏهن ته حقيقت اها آهي ته شمعون Funk، هڪ بلاگ پوسٽ سندس اچڻ بيان لکڻ بجاء ان کي ڳجهو رکڻ جي ڪوشش کان ڄاڻي واڻي، پڻ علامت آهي ته Netflix انعام ۾ ڪيترن ئي ڌرين خلاصيون جي ملين ڊالر انعام ما اتساهجي نه هئا. بلڪ، ڪيترن ئي ڌرين پڻ سنڌ جي علمي، چئلينج ۽ ڪميونٽي آهي ته ان مسئلي کي چوڌاري ترقي آسودو ڪري رهيو (Thompson 2008) ، جذبات ته مون کي ڪيترن ئي تحقيق سمجهي سگهي ٿو اميد.

هن Netflix انعام هڪ کليل سڏ جو هڪ شاندار مثال آهي. Netflix هڪ خاص مقصد (فلم درجابندي predicting) سان هڪ سوال ڪري ھندستان ۽ ڪيترن ئي ماڻهن کان حل ورتا. Netflix ڇاڪاڻ ته اهي آسان هئا پيدا ڪرڻ کان تصديق ڪرڻ، ۽ آخرڪار Netflix جي بهترين حل جي اٻوجھ ماڻهن انهن سڀني حل ويجهڙائيء ۾ ڪرڻ جي قابل هو. اڳيون، آء اوھان کي ڏيکاري سين ڪيئن هن ساڳي اچڻ حياتيات ۽ قانون ۾ استعمال ڪري سگهجي ٿو.