5.3.1 నెట్ఫ్లిక్స్ ప్రైజ్

నెట్ఫ్లిక్స్ ప్రైజ్ ప్రజలు ఇష్టపడతారని సినిమాలు అంచనా ఓపెన్ కాల్ ఉపయోగిస్తుంది.

బాగా తెలిసిన బహిరంగ కాల్ ప్రాజెక్ట్ నెట్ఫ్లిక్స్ బహుమతి. నెట్ఫ్లిక్స్ ఒక ఆన్ లైన్ మూవీ అద్దె సంస్థ, మరియు 2000 లో ఇది వినియోగదారులకు సినిమాలను సిఫారసు చేయటానికి Cinematch, సేవను ప్రారంభించింది. ఉదాహరణకు, మీరు స్టార్ వార్స్ మరియు ఎంపైర్ స్ట్రైక్స్ బ్యాక్లను ఇష్టపడినట్లు మరియు సినిమా రిడీ ఆఫ్ ది జెడిని చూడాలని సిన్హాచ్ గమనించవచ్చు. ప్రారంభంలో, సినిమాస్చ్డ్ పని తక్కువగా ఉంది. కానీ, అనేక సంవత్సరాల వ్యవధిలో, వినియోగదారులకు ఎలాంటి సినిమాలు ఆనందిస్తాయనే దాని అంచనాను మెరుగుపరిచాయి. 2006 నాటికి, సినిమాస్చ్చ్లో పురోగతి చోటుచేసుకుంది. నెట్ఫ్లిక్స్లో పరిశోధకులు వారు ఆలోచించగలిగిన అందంగా చాలా ప్రయత్నించారు, కానీ, అదే సమయంలో, వారు వారి వ్యవస్థను మెరుగుపర్చడానికి సహాయపడే ఇతర ఆలోచనలు ఉన్నాయి అని అనుమానించారు. ఆ విధంగా, వారు ఆ సమయములో, రాడికల్ పరిష్కారముతో ముందుకు వచ్చారు: బహిరంగ పిలుపు.

నెట్ఫ్లిక్స్ ప్రైజ్ యొక్క విజయవంతమైన విజయానికి క్లిష్టమైనది ఏమిటంటే బహిరంగ కాల్ రూపకల్పన ఎలా రూపొందించబడింది మరియు సామాజిక పరిశోధన కోసం ఓపెన్ కాల్స్ను ఎలా ఉపయోగించాలో ఈ నమూనాకు ముఖ్యమైన పాఠాలు ఉన్నాయి. నెట్ఫ్లిక్స్ కేవలం ఆలోచనలు కోసం ఒక నిర్మాణాత్మక అభ్యర్థనను ఉంచలేదు, ఇది మొదటి వారు బహిరంగ కాల్ పరిగణలోకి ఉన్నప్పుడు అనేక మంది ఊహించే ఏమిటి. బదులుగా, నెట్ఫ్లిక్స్ సరళమైన మూల్యాంకన విధానంతో ఒక స్పష్టమైన సమస్యను ఎదుర్కుంది: 3 మిలియన్ల మంది రేటింగ్స్ (వినియోగదారులు చేసిన రేటింగ్స్ కానీ నెట్ఫ్లిక్స్ విడుదల కాలేదు) అంచనా వేయడానికి వారు 100 మిలియన్ల చిత్ర రేటింగ్స్ని ఉపయోగించేందుకు సవాలు చేశారు. ఒక అల్గోరిథంను సృష్టించిన మొదటి వ్యక్తి 3 మిలియన్ డాలర్ల రేటింగ్స్ రేటింగ్స్ కంటే 10% ఉత్తమమైనదిగా అంచనా వేశారు. అంచనా వేయబడిన రేటింగ్స్తో పోల్చిన రేటింగ్స్ను పోల్చడానికి ఈ స్పష్టమైన మరియు తేలికైనది - ఇది నెట్ఫ్లిక్స్ బహుమతిని రూపొందించడం కంటే పరిష్కారాలు సులభంగా చేయగల విధంగా తయారు చేయబడ్డాయి; ఇది ఓపెన్ కాల్కు తగిన సమస్యగా సినిమా మ్యాచ్ని మెరుగుపరచడానికి సవాలుగా మారిపోయింది.

2006 అక్టోబరులో, నెట్ఫ్లిక్స్ 500 మిలియన్ల వినియోగదారుల నుండి సుమారు 100 మిలియన్ చిత్ర రేటింగ్లను కలిగి ఉన్న డేటాసెట్ను విడుదల చేసింది (ఈ అధ్యాయంలో 6 వ అధ్యాయం యొక్క గోప్యతాపరమైన చిక్కులను మేము పరిశీలిస్తాము). నెట్ఫ్లిక్స్ డేటా 20,000 చలనచిత్రాల ద్వారా దాదాపు 500,000 కస్టమర్లను కలిగి ఉన్న భారీ మాత్రికగా భావించబడుతుంది. ఈ మాత్రికలో, ఒక నుండి ఐదు నుండి ఐదు నక్షత్రాలు (పట్టిక 5.2) వరకు సుమారు 100 మిలియన్ రేటింగ్లు ఉన్నాయి. 3 మిలియన్ల మంది నిర్వహించిన రేటింగ్స్ అంచనా వేసేందుకు మాత్రికలో పరిశీలించిన డేటాను ఉపయోగించడం ఈ సవాలు.

పట్టిక 5.2: నెట్ఫ్లిక్స్ బహుమతి నుండి డేటా యొక్క స్కీమాటిక్
మూవీ 1 సినిమా 2 మూవీ 3 ... సినిమా 20,000
కస్టమర్ 1 2 5 ... ?
కస్టమర్ 2 2 ? ... 3
కస్టమర్ 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
కస్టమర్ 500,000 ? 2 ... 1

ప్రపంచవ్యాప్తంగా పరిశోధకులు మరియు హ్యాకర్లు సవాలుకు ఆకర్షించబడ్డారు, మరియు 2008 నాటికి 30,000 మందికి పైగా పని చేస్తున్నారు (Thompson 2008) . పోటీ సమయంలో, నెట్ఫ్లిక్స్ 5,000 కంటే ఎక్కువ జట్లు (Netflix 2009) నుండి 40,000 ప్రతిపాదిత పరిష్కారాలను పొందింది. సహజంగానే, నెట్ఫ్లిక్స్ ఈ ప్రతిపాదిత పరిష్కారాలను చదివి అర్థం చేసుకోలేదు. పరిష్కారాలు తనిఖీ సులభంగా ఎందుకంటే మొత్తం విషయం, అయితే, సజావుగా నడిచింది. నెట్ఫ్లిక్స్ ఒక కంప్యూటర్ను ఊహించిన మెట్రిక్ ఉపయోగించి నిర్వహించిన-అవుట్ రేటింగ్స్తో అంచనా వేసిన రేటింగ్లను సరిపోల్చవచ్చు (వారు ఉపయోగించిన నిర్దిష్ట మెట్రిక్ సగటు స్క్వేర్డ్ లోపం యొక్క వర్గమూలం). ప్రతి ఒక్కరి నుండి పరిష్కారాలను ఆమోదించడానికి నెట్ఫ్లిక్స్ను త్వరితగతిన పరిష్కారాలను త్వరగా విశ్లేషించే ఈ సామర్ధ్యం, ఇది చాలా ఆశ్చర్యకరమైన ప్రదేశాల నుండి మంచి ఆలోచనలు వచ్చినందున ఇది ముఖ్యమైనది. వాస్తవానికి, విజేత పరిష్కారం ముందస్తు అనుభవం ఉన్న నిర్మాణాత్మక చిత్రం సిఫారసు వ్యవస్థలు (Bell, Koren, and Volinsky 2010) కలిగి ఉన్న ముగ్గురు పరిశోధకులు ప్రారంభించారు.

నెట్ఫ్లిక్స్ ప్రైజ్ యొక్క ఒక అందమైన అంశం ఏమిటంటే అన్ని ప్రతిపాదిత పరిష్కారాలను చాలా సరళంగా అంచనా వేయడానికి ఇది ఉపయోగపడుతుంది. అనగా, ప్రజలు తమ అంచనా వేసిన రేటింగ్స్ను అప్లోడ్ చేసినప్పుడు, వారి విద్యాసంబంధ ప్రమాణాలు, వారి వయస్సు, జాతి, లింగం, లైంగిక ధోరణి లేదా తమను తాము దేనినీ అప్లోడ్ చేయవలసిన అవసరం లేదు. స్టాన్ఫోర్డ్ నుండి ఒక ప్రసిద్ధ ప్రొఫెసర్ అంచనా రేట్లు ఆమె బెడ్ రూమ్ లో ఒక యువకుడు నుండి సరిగ్గా అదే చికిత్స చేశారు. దురదృష్టవశాత్తు, ఇది చాలా సామాజిక పరిశోధనలో నిజం కాదు. అంటే, చాలా సామాజిక పరిశోధన కోసం, మూల్యాంకనం చాలా సమయం తీసుకుంటుంది మరియు పాక్షికంగా ఆత్మాశ్రయమవుతుంది. కాబట్టి, చాలా పరిశోధన ఆలోచనలు తీవ్రంగా విశ్లేషించబడవు, మరియు ఆలోచనలు పరిశీలించినప్పుడు, ఆలోచనలు సృష్టికర్త నుండి ఆ అంచనాలను వేరు చేయడం కష్టం. ఓపెన్ కాల్ ప్రాజెక్టులు, మరోవైపు, సులభమైన మరియు సరసమైన మూల్యాంకనం కలిగి ఉంటాయి, కాబట్టి అవి తప్పిపోయే ఆలోచనలను కనుగొనవచ్చు.

ఉదాహరణకు, నెట్ఫ్లిక్స్ ప్రైజ్ సమయంలో ఒక సందర్భంలో, సిమోన్ ఫంక్ అనే స్క్రీన్ పేరుతో ఉన్న ఒకరు తన బ్లాగ్లో ఒక ఏకీకృత విలువ కుళ్ళిన ఆధారంగా ప్రతిపాదిత పరిష్కారంను పోస్ట్ చేశారు, ఇది ఇతర పాల్గొనేవారు ఉపయోగించని సరళ బీజగణితం నుండి ఒక విధానం. ఫంక్ బ్లాగ్ పోస్ట్ ఏకకాలంలో సాంకేతికంగా మరియు వింతగా అనధికారికంగా ఉంది. ఈ బ్లాగ్ పోస్ట్ మంచి పరిష్కారం వివరిస్తుందా లేదా అది సమయం వేస్ట్ కాదా? బహిరంగ కాల్ ప్రాజెక్ట్ వెలుపల, పరిష్కారం ఎన్నడూ తీవ్రమైన అంచనాను పొందలేదు. అన్ని తరువాత, సైమన్ ఫంక్ MIT వద్ద ఒక ప్రొఫెసర్ కాదు; అతను సాఫ్ట్వేర్ డెవలపర్, ఆ సమయంలో, న్యూజిలాండ్ (Piatetsky 2007) చుట్టూ బ్యాక్ ప్యాకింగ్ చేశారు. అతను ఈ ఆలోచనను నెట్ఫ్లిక్స్ వద్ద ఒక ఇంజినీర్కు ఇమెయిల్ చేస్తే, అది ఖచ్చితంగా చదివేది కాదు.

అదృష్టవశాత్తూ, మూల్యాంకన ప్రమాణాలు స్పష్టంగా మరియు సులువుగా దరఖాస్తు చేసుకున్నందున, అతని అంచనా రేటింగ్లు విశ్లేషించబడ్డాయి మరియు అతని విధానం చాలా శక్తివంతమైనదని స్పష్టమైంది: పోటీలో నాలుగవ స్థానానికి చేరుకున్నాడు, ఇతర బృందాలను ఇప్పటికే అందించిన విపరీతమైన ఫలితం సమస్య మీద నెలల పని. చివరికి, అతని విధానం యొక్క భాగాలను దాదాపుగా అన్ని తీవ్రమైన పోటీదారులు (Bell, Koren, and Volinsky 2010) .

సిమోన్ ఫంక్ రహస్యంగా ఉంచడానికి ప్రయత్నించి కాకుండా తన విధానం గురించి వివరిస్తూ బ్లాగ్ పోస్ట్ రాయడానికి ఎంచుకున్నాడు, నెట్ఫ్లిక్స్ బహుమతిలో చాలామంది పాల్గొన్నవారు ప్రత్యేకంగా మిలియన్ డాలర్ల బహుమతి ద్వారా ప్రేరణ పొందలేదని వివరిస్తుంది. బదులుగా, చాలామంది పాల్గొనేవారు మేధోసంబంధమైన సవాలు మరియు సమస్య చుట్టూ అభివృద్ధి చేసిన సమాజం (Thompson 2008) ను ఆస్వాదించాడని అనిపించింది, నేను అనేకమంది పరిశోధకులను అర్థం చేసుకోగలమని భావించే భావాలు.

నెట్ఫ్లిక్స్ బహుమతి ఒక బహిరంగ కాల్కి ఒక గొప్ప ఉదాహరణ. నెట్ఫ్లిక్స్ ఒక నిర్దిష్ట లక్ష్యం (చిత్రం రేటింగ్స్ అంచనా) మరియు అనేక మంది నుండి solicited పరిష్కారాలతో ఒక ప్రశ్న వేసింది. నెట్ఫ్లిక్స్ ఈ పరిష్కారాలను విశ్లేషించగలిగింది, ఎందుకంటే వారు సృష్టించడానికి కంటే సులభంగా పరీక్షించగలిగారు, చివరకు నెట్ఫ్లిక్స్ ఉత్తమ పరిష్కారాన్ని ఎంపిక చేసింది. తరువాత, నేను ఇదే విధానాన్ని జీవశాస్త్రం మరియు చట్టం, మరియు ఒక మిలియన్-డాలర్ల బహుమతిని ఎలా ఉపయోగించవచ్చో మీకు చూపుతాను.