5.3.1 Netflix પુરસ્કાર

Netflix પ્રાઇઝ આગાહી જે ફિલ્મો લોકો ગમશે ઓપન કોલ ઉપયોગ કરે છે.

સૌથી જાણીતા ઓપન કોલ પ્રોજેક્ટ એ નેટફ્લિક્સ પ્રાઇઝ છે Netflix એક ઑનલાઇન મૂવી ભાડે આપતી કંપની છે, અને 2000 માં તે સિનેમેચ લોન્ચ કરી, જે ગ્રાહકોને ફિલ્મોની ભલામણ કરે છે. ઉદાહરણ તરીકે, સિનેમેચ કદાચ નોંધ્યું હશે કે તમને સ્ટાર વોર્સ અને ધ એમ્પાયર સ્ટ્રાઇક્સ બેક ગમ્યું છે અને પછી ભલામણ કરો કે તમે જેઈડીઆઈ રીટર્ન જુઓ છો. શરૂઆતમાં, સિનેમેચે નબળી કામગીરી કરી હતી. પરંતુ, ઘણા વર્ષો દરમિયાન, ગ્રાહકોએ જે મૂવીઝનો આનંદ માણવાની આગાહી કરવાની તેમની ક્ષમતામાં વધારો કરવાનું ચાલુ રાખ્યું હતું. 2006 સુધીમાં, સિનેમેચમાં પ્રગતિમાં વધારો થયો હતો. Netflix અંતે સંશોધકો ખૂબ વિચારણા કરી શકે છે ખૂબ બધું પ્રયાસ કર્યો હતો, પરંતુ, તે જ સમયે, તેઓ તેમના સિસ્ટમ સુધારવા માટે મદદ કરી શકે છે કે જે અન્ય વિચારો હતા કે શંકા. આમ, તેઓ તે સમયે આવ્યા હતા, તે સમયે, એક આમૂલ ઉકેલ: એક ખુલ્લું કૉલ.

નેટફ્લિક્સ પ્રાઇઝની અંતિમ સફળતા માટે જટિલ હતું કે કેવી રીતે ઓપન કોલની રચના કરવામાં આવી હતી, અને આ ડિઝાઇનમાં મહત્વપૂર્ણ રીતો છે કે કેવી રીતે ઓપન કૉલ્સ સામાજિક સંશોધન માટે ઉપયોગમાં લઈ શકાય છે. Netflix માત્ર વિચારો માટે એક અનૌપચારિક વિનંતી બહાર મૂકવામાં ન હતી, જે ઘણા લોકો જ્યારે તેઓ પ્રથમ એક ખુલ્લા કૉલ ધ્યાનમાં કલ્પના છે. તેના બદલે, નેટફ્ક્સે એક સરળ મૂલ્યાંકન પ્રક્રિયા સાથે સ્પષ્ટ સમસ્યા ઉભી કરી હતી: તેઓએ લોકોને 3 મિલિયન યોજાયેલી રેટિંગ્સની આગાહી કરવા માટે 100 મિલિયન મૂવી રેટિંગ્સના સેટનો ઉપયોગ કરવા પડકાર આપ્યો છે (રેટિંગ્સ જે વપરાશકર્તાઓએ બનાવેલા હતા પરંતુ Netflix રિલીઝ થયો નથી). એક એવો અલ્ગોરિધમનો બનાવનાર પ્રથમ વ્યક્તિ જે સિનેમેચ કરતા 10 લાખથી વધુ સારી છે તે 3 મિલિયન યોજાયેલી રેટિંગ્સની આગાહી કરે છે, તે એક મિલિયન ડોલર જીતશે. આ સ્પષ્ટ અને મૂલ્યાંકન કાર્યવાહીને અમલમાં મુકવાની કાર્યવાહી - અનુમાનિત રેટિંગ્સ સાથે પૂર્વનિર્ધારિત રેટિંગ્સની તુલના - તેનો અર્થ એવો થયો કે નેટફ્લિક્સ ઇનામ એ એવી રીતે ગોઠવવામાં આવ્યો હતો કે ઉકેલો જનરેટ કરતાં ચકાસવામાં સરળ હતા; તે એક ખુલ્લા કૉલ માટે યોગ્ય સમસ્યામાં સિનેમેચને સુધારવાના પડકારને સમર્થન આપે છે.

2006 ના ઓકટોબરમાં, નેટફ્લિક્સે આશરે 5,00,000 ગ્રાહકો પાસેથી 100 મિલિયન મૂવી રેટિંગ્સ ધરાવતી ડેટાસેટ રિલિઝ કરી (અમે પ્રકરણ 6 માં આ ડેટા રીલીઝની ગોપનીયતા પર વિચારણા કરીશું). Netflix માહિતી એક વિશાળ મેટ્રિક્સ તરીકે કલ્પના કરી શકાય છે જે 20,000 ફિલ્મો દ્વારા અંદાજે 500,000 ગ્રાહકો છે. આ મેટ્રિક્સની અંદર, એક થી પાંચ તારાઓ (ટેબલ 5.2) માંથી સ્કેલ પર લગભગ 100 મિલિયન રેટિંગ્સ હતા. આ ચક્ર 3 મિલિયન યોજાયેલા આઉટ રેટિંગ્સની આગાહી કરવા મેટ્રિક્સમાં જોવા મળેલા ડેટાનો ઉપયોગ કરવો હતો.

કોષ્ટક 5.2: નેટફ્લક્સ ઇનામમાંથી ડેટાના યોજનાકીય
મૂવી 1 મૂવી 2 મૂવી 3 ... 20,000 નું મૂવી
ગ્રાહક 1 2 5 ... ?
ગ્રાહક 2 2 ? ... 3
ગ્રાહક 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
ગ્રાહક 500,000 ? 2 ... 1

વિશ્વભરના સંશોધકો અને હેકરો પડકાર માટે દોરવામાં આવ્યા હતા, અને 2008 સુધીમાં 30,000 થી વધુ લોકો તેના પર કામ કરતા હતા (Thompson 2008) . હરીફાઈ દરમિયાન, નેટફ્લિક્સને 5,000 થી વધુ ટીમો (Netflix 2009) ના 40,000 થી વધુ પ્રસ્તાવિત સોલ્યુશન્સ મળ્યા હતા. દેખીતી રીતે, Netflix આ બધા સૂચિત ઉકેલો વાંચી અને સમજી શક્યા નથી. આ સમગ્ર વસ્તુ સહેલાઇથી ચાલી હતી, તેમ છતાં, કારણ કે ઉકેલો ચેક કરવા સરળ હતા. નેટફ્લિક્સ પાસે એક અનુમાનિત મેટ્રિક (ચોક્કસ મેટ્રિક કે જેનો તેઓ ઉપયોગ કરાયો હતો તે સરેરાશ સ્ક્વેર્ડ ભૂલનો વર્ગમૂળ હતો) નો ઉપયોગ કરીને રાખેલા આઉટ રેટિંગ્સ સાથેના અનુમાનિત રેટિંગ્સની તુલના કરતા કમ્પ્યુટરની તુલના કરી શકે છે. તે સોલ્યુશન્સને ઝડપથી મૂલ્યાંકન કરવાની સક્ષમતા હતી જે Netflix ને દરેક તરફથી ઉકેલો સ્વીકારવા સક્ષમ બનાવી હતી, જે અગત્યની બાબત બની હતી કારણ કે કેટલાક આશ્ચર્યજનક સ્થાનોથી સારા વિચારો આવ્યા હતા. વાસ્તવમાં, વિજેતા ઉકેલ ત્રણ સંશોધકો દ્વારા શરૂ કરવામાં આવેલી ટીમ દ્વારા રજૂ કરવામાં આવ્યો હતો, જેમની પાસે પહેલાંની કોઈ બિલ્ડિંગ મૂવી ભલામણ પદ્ધતિ (Bell, Koren, and Volinsky 2010) .

Netflix ઇનામ એક સુંદર પાસું એ છે કે તે બધા સૂચિત ઉકેલો એકદમ મૂલ્યાંકન કરવા સક્ષમ. એટલે કે, જ્યારે લોકોએ તેમની આગાહી કરેલ રેટિંગ્સ અપલોડ કર્યા છે, ત્યારે તેમને તેમના શૈક્ષણિક પ્રમાણપત્રો, તેમની ઉંમર, જાતિ, લિંગ, લૈંગિક અભિમુખતા અથવા પોતાના વિશેની કોઈ પણ વસ્તુ અપલોડ કરવાની જરૂર નથી. સ્ટેનફોર્ડના એક પ્રસિદ્ધ પ્રોફેસરની આગાહી કરાયેલા રેટિંગ્સ બરાબર તે જ રીતે તેના બેડરૂમના એક કિશોર વયના લોકો સાથે કરવામાં આવ્યાં હતાં. કમનસીબે, આ મોટાભાગના સામાજિક સંશોધનમાં સાચું નથી એટલે કે, મોટાભાગના સામાજિક સંશોધન માટે, મૂલ્યાંકન ખૂબ જ સમય માંગી રહ્યું છે અને આંશિક રૂપે વ્યક્તિલક્ષી છે. તેથી, મોટાભાગનાં સંશોધન વિચારોનું ગંભીરતાથી મૂલ્યાંકન થતું નથી, અને જ્યારે વિચારોનું મૂલ્યાંકન કરવામાં આવે છે, વિચારોના નિર્માતા પાસેથી તે મૂલ્યાંકનને અલગ કરવું મુશ્કેલ છે. ઓપન કોલ પ્રોજેક્ટ્સ, બીજી તરફ, પાસે સરળ અને વાજબી મૂલ્યાંકન છે જેથી તેઓ એવા વિચારો શોધી શકે જે અન્યથા ચૂકી જશે.

દાખલા તરીકે, નેટફ્લિક્સ પ્રાઇઝ દરમિયાન એક સમયે, સ્ક્રીન નામવાળા સિમોન ફંકના કોઈએ તેના બ્લોગ પર એક અસામાન્ય મૂલ્ય વિઘટન પર આધારિત પ્રસ્તાવિત ઉકેલ, રેખીય બીજગણિતનો અભિગમ, જે અગાઉ અન્ય સહભાગીઓ દ્વારા ઉપયોગમાં લેવાતો ન હતો. ફંકના બ્લોગ પોસ્ટ વારાફરતી તકનીકી અને અનિવાર્યપણે અનૌપચારિક હતા. શું આ બ્લોગ પોસ્ટ એ સારો ઉકેલ વર્ણવ્યો હતો કે તે સમયની કચરો છે? એક ખુલ્લા કૉલ પ્રોજેક્ટની બહાર, ઉકેલને ક્યારેય ગંભીર મૂલ્યાંકન મળ્યું ન હતું. બધા પછી, સિમોન ફંક એમઆઇટીના પ્રોફેસર ન હતા; તે એક સોફ્ટવેર ડેવલપર હતા, તે સમયે, ન્યુઝીલેન્ડ (Piatetsky 2007) આસપાસ (Piatetsky 2007) . જો તેણે આ વિચારને ઈજનેટરને Netflix પર ઇમેઇલ કર્યો હોય, તો તે લગભગ ચોક્કસપણે વાંચવામાં ન હોત.

સદનસીબે, કારણ કે મૂલ્યાંકનના માપદંડ સ્પષ્ટ અને લાગુ કરવા માટે સરળ હતા, તેના અનુમાનિત રેટિંગ્સનું મૂલ્યાંકન કરવામાં આવ્યું હતું, અને તે તરત જ સ્પષ્ટ હતું કે તેમનો અભિગમ ખૂબ જ શક્તિશાળી હતો: તે સ્પર્ધામાં ચોથા સ્થાને પહોંચી ગયો હતો, પરિણામે એક મોટી પરિણામ અન્ય ટીમો પહેલાથી જ આવી હતી સમસ્યા પર મહિના માટે કામ. અંતે, તેમના અભિગમના ભાગોનો ઉપયોગ લગભગ તમામ ગંભીર સ્પર્ધકો (Bell, Koren, and Volinsky 2010) .

હકીકત એ છે કે સિમોન ફન્કએ બ્લોગ પોસ્ટ લખવાનું પસંદ કર્યું હતું, જે તેના રહસ્યને જાળવવાનો પ્રયાસ કરતા, તેના અભિગમને સમજાવે છે, તે પણ દર્શાવે છે કે Netflix Prize માંના ઘણા સહભાગીઓ માત્ર મિલિયન ડોલરના ઇનામ દ્વારા પ્રેરિત ન હતા. ઊલટાનું, ઘણા સહભાગીઓ બૌદ્ધિક પડકાર અને સમુદાયની સમસ્યા (Thompson 2008) આસપાસ વિકસિત કરવા (Thompson 2008) , એવી લાગણીઓ જે મને આશા છે કે ઘણા સંશોધકો સમજી શકે છે.

Netflix પુરસ્કાર ખુલ્લા કૉલનું એક ઉત્તમ ઉદાહરણ છે. Netflix ચોક્કસ ધ્યેય સાથે એક પ્રશ્ન ઉભા (ફિલ્મ રેટિંગ્સ આગાહી) અને ઘણા લોકો ઉકેલો ઉકેલો Netflix આ તમામ ઉકેલો મૂલ્યાંકન કરવાનો હતો કારણ કે તેઓ બનાવવા માટે કરતાં સરળ હતા, અને છેલ્લે Netflix શ્રેષ્ઠ ઉકેલ લેવામાં આગળ, હું તમને બતાવીશ કે આ જ અભિગમ બાયોલોજી અને કાયદામાં કેવી રીતે ઉપયોગ કરી શકાય છે, અને મિલિયન ડોલરની ઇનામ વગર.