5.3.1 నెట్ఫ్లిక్స్ ప్రైజ్

నెట్ఫ్లిక్స్ ప్రైజ్ ప్రజలు ఇష్టపడతారని సినిమాలు అంచనా ఓపెన్ కాల్ ఉపయోగిస్తుంది.

బాగా తెలిసిన ఓపెన్ కాల్ ప్రాజెక్ట్ నెట్ఫ్లిక్స్ బహుమతిని చెప్పవచ్చు. నెట్ఫ్లిక్స్ ఒక ఆన్లైన్ చిత్రం అద్దె సంస్థ, మరియు 2000 లో దానిని వినియోగదారులకు సినిమాలు సిఫార్సు Cinematch, ఒక సర్వీసును ప్రారంభించింది. ఉదాహరణకు, Cinematch మీరు స్టార్ వార్స్ మరియు సామ్రాజ్యం సమ్మెలు నచ్చిన తిరిగి ఆపై మీరు జేడీ ది రిటర్న్ చూడటానికి సిఫార్సు గమనిస్తారు. మొదట్లో, Cinematch పేలవంగా పని. కానీ, అనేక సంవత్సరాల కాలంలో, Cinematch వినియోగదారులు ఆనందించగలిగిన సినిమాలు అంచనా దాని సామర్థ్యాన్ని మెరుగుపర్చడానికి కొనసాగింది. 2006 నాటికి, Cinematch పురోగతి అస్థిరంగా మారిపోయింది. నెట్ఫ్లిక్స్ వద్ద పరిశోధకులు వారు భావిస్తారు కాలేదు అందంగా చాలా ప్రతిదీ ప్రయత్నించాడు, కానీ అదే సమయంలో, వారు వాటిని తమ వ్యవస్థ మెరుగు సహాయపడవచ్చు ఇతర ఆలోచనలు ఉన్నాయి అని అనుమానం. బహిరంగ కాల్: ఈ విధంగా, వారు ఏమి, సమయం వద్ద, ఒక తీవ్రమైన పరిష్కారం వచ్చింది.

నెట్ఫ్లిక్స్ ప్రైజ్ చివరకు విజయం కీలకంగా ఓపెన్ కాల్ రూపొందించబడింది ఎలా, మరియు ఈ నమూనా ఓపెన్ కాల్స్ ఎలా సామాజిక పరిశోధన కోసం ఉపయోగించవచ్చు కోసం ముఖ్యమైన పాఠాలు ఉన్నాయి. నెట్ఫ్లిక్స్ కేవలం వారు మొదటి దృష్టిలో ఉంచుకుంటే బహిరంగ కాల్ అనేక మంది ఊహించే ఏమి ఉంది ఆలోచనలు ఒక అవ్యవస్థీకృత అభ్యర్థన, తప్పిపోవుట లేదు. అయితే, నెట్ఫ్లిక్స్ ఒక సాధారణ అంచనా నిబంధనలు స్పష్టమైన సమస్య పొంచి: అవి ప్రజల 3 మిలియన్ మందిని అవుట్ రేటింగ్స్ అంచనా 100 మిలియన్ల చిత్రం రేటింగ్స్ సమితి ఉపయోగించడానికి సవాలు (వినియోగదారులు చేసిన రేటింగ్స్ కానీ నెట్ఫ్లిక్స్ విడుదల లేదని). ఎవరు Cinematch 1 మిలియన్ డాలర్లు గెలుచుకున్నాడు కంటే 10% మంచి 3 మిలియన్ మందిని అవుట్ రేటింగ్స్ అంచనా అని ఒక అల్గోరిథం సృష్టించగలము ఎవరైనా. ఈ స్పష్టమైన మరియు సులభమైన జరిగిన అవుట్ అంచనా రేటింగ్స్ అంచనా నిబంధనలు-పోల్చడం దరఖాస్తు రేటింగ్స్-అర్థం నెట్ఫ్లిక్స్ ప్రైజ్ పరిష్కారాలను ఉత్పత్తి కన్నా తనిఖీ సులభంగా ఉండే విధంగా ఇరికించారని ఆ; అది ఒక ఓపెన్ కాల్ అనువైన సమస్య Cinematch అభివృద్ధి చేయటాన్ని ఒక సవాలుగా మారింది.

2006 అక్టోబర్ లో, నెట్ఫ్లిక్స్ (6 వ అధ్యాయంలో మనం ఈ డేటాను విడుదల గోప్యతా విధానాలు పరిశీలిస్తారు) గురించి 500,000 గురించి వినియోగదారుల నుండి 100 మిలియన్ల చిత్రం రేటింగ్స్ కలిగిన ఒక డేటాసెట్ విడుదల చేసింది. నెట్ఫ్లిక్స్ డేటా 20,000 సినిమాలు ద్వారా సుమారు 500,000 వినియోగదారులు చేసే భారీ మాతృకను భావనలను చేయవచ్చు. ఈ మాతృక లోపల, 1 నుండి 5 నక్షత్రాలు (టేబుల్ 5.2) నుండి ఒక స్థాయిలో 100 మిలియన్ రేటింగ్స్ ఉన్నాయి. సవాలు 3 మిలియన్ మందిని అవుట్ రేటింగ్స్ అంచనా మాతృకలో గమనించిన దత్తాంశం ఉపయోగించాలని.

టేబుల్ 5.2: నెట్ఫ్లిక్స్ ప్రైజ్ నుండి డేటా యొక్క స్కీమాటిక్. నెట్ఫ్లిక్స్ 100 మిలియన్ రేటింగ్స్ (1 స్టార్ 5 నక్షత్రాలు) 20,000 సినిమాలు 500,000 వినియోగదారులు అందించిన విడుదల చేసింది. నెట్ఫ్లిక్స్ ప్రైజ్ లక్ష్యం 3 మిలియన్ సినిమాలు, "?" అని చూపించిన నిర్వహించారు అవుట్ రేటింగ్స్ అంచనా ఈ రేటింగ్స్ ఉపయోగించాలని. నెట్ఫ్లిక్స్ ప్రైజ్ పాల్గొన్నవారు సమర్పించిన అంచనా రేటింగ్స్ జరిగిన అవుట్ రేటింగ్లు పోలిస్తే. నేను చాప్టర్ 6 లో ఈ డేటాను విడుదల పరిసర నైతిక సమస్యలను చర్చించడానికి చేస్తుంది.
చిత్రం 1 సినిమా 2 మూవీ 3 . . . సినిమా 20,000
కస్టమర్ 1 2 5 . ?
కస్టమర్ 2 2 ? . 3
కస్టమర్ 3 ? 2 .
. . . . . . . .
కస్టమర్ 500,000 ? 2 . 1

ప్రపంచవ్యాప్తంగా పరిశోధకులు మరియు హ్యాకర్లు సవాలుగా తరలివచ్చారు, మరియు 2008 నాటికి 30,000 మంది జనం పని చేశారు (Thompson 2008) . పోటీ కాలగమనంలో నెట్ఫ్లిక్స్ 5,000 జట్లు నుండి కంటే ఎక్కువ 40,000 ప్రతిపాదించిన పరిష్కారాలలో పొందింది (Netflix 2009) . సహజంగానే, నెట్ఫ్లిక్స్ చదివి ఈ ప్రతిపాదిత పరిష్కారాలను అర్థం కాలేదు. మొత్తం విషయం సజావుగా పరిష్కారాలను తనిఖీ సులభమైన ఎందుకంటే, అయితే, నడిచింది. నెట్ఫ్లిక్స్ కేవలం ఒక కంప్యూటర్ జరిగిన అవుట్ రేటింగ్లు అంచనా రేటింగ్ ముందు పేర్కొన్న మెట్రిక్ (ముఖ్యంగా వారు ఉపయోగించిన సగటు-స్క్వేర్డ్ లోపం యొక్క వర్గమూలం ఉంది మెట్రిక్) ద్వారా సరిపోల్చండి కాలేదు. ఇది త్వరగా మంచి ఆలోచనలు కొన్ని ఆశ్చర్యకరమైన ప్రాంతాల నుండి వచ్చింది ఎందుకంటే ముఖ్యమైన గా మారినది ఇది ప్రతి ఒక్కరి నుండి పరిష్కారాలకు ఆమోదించాల్సిన నెట్ఫ్లిక్స్ ఎనేబుల్ పరిష్కారాలు విశ్లేషించడానికి ఈ సామర్థ్యం ఉంది. నిజానికి, గెలిచిన పరిష్కారం అనుభవం భవనం చిత్రం సిఫార్సు వ్యవస్థలు ఉందని మూడు పరిశోధకులు ప్రారంభించారు బృందం సమర్పించారు (Bell, Koren, and Volinsky 2010) .

నెట్ఫ్లిక్స్ ప్రైజ్ ఒక అందమైన కోణం ఇది వారి పరిష్కారం చాలా పరిశీలించిన కలిగి ప్రపంచంలో ప్రతి ఒక్కరూ ఎనేబుల్ ఉంది. ప్రజలు వారి అంచనా రేటింగ్స్ అప్లోడ్ చేసినప్పుడు, వారు వారి విద్యా పత్రాలను, వారి వయసు, జాతి, లింగం, వయస్సు, ముసలితనం లేదా తమ గురించి ఏదైనా అప్లోడ్ అవసరం లేదు. అందువలన, స్టాన్ఫోర్డ్ నుంచి ప్రముఖ ప్రొఫెసర్ అంచనా రేటింగ్స్ ఖచ్చితంగా ఆమె బెడ్ రూమ్ లో ఒక యువకుడు నుండి తరహావే చేర్పించారు. దురదృష్టవశాత్తు, ఈ అనేక సామాజిక పరిశోధనలో నిజం. ఆ అనేక సామాజిక పరిశోధన, మూల్యాంకనం చాలా సమయం తీసుకుంటుంది మరియు పాక్షికంగా ఆత్మాశ్రయ, ఉంది. కాబట్టి, అత్యధిక పరిశోధనా ఆలోచనలు తీవ్రంగా విశ్లేషించబడుతుంది ఎప్పుడూ, మరియు ఆలోచనలు విశ్లేషించబడుతుంది, అది ఆలోచనలు సృష్టికర్త నుండి ఆ అంచనాలు వేరుచేసే కష్టం. పరిష్కారాలను తనిఖీ సులువుగా ఎందుకంటే, ఓపెన్ కాల్స్ పరిశోధకులు వారు మాత్రమే ప్రసిద్ధ ప్రొఫెసర్లు నుండి పరిష్కారాలను భావిస్తారు ఉంటే పగుళ్లు ద్వారా పడే అన్ని సమర్థవంతంగా అద్భుతమైన పరిష్కారాలను యాక్సెస్ అనుమతిస్తుంది.

ఉదాహరణకు, నెట్ఫ్లిక్స్ ప్రైజ్ స్క్రీన్ పేరుతో ఎవరైనా సమయంలో ఒక పాయింట్ వద్ద సైమన్ ఫంక్ ఏక విలువ కుళ్ళిన ఆధారంగా తన బ్లాగ్ ప్రతిపాదిత పరిష్కారం పోస్ట్, ఇతర పాల్గొనేవారు గతంలో ఉపయోగించిన లేదని సరళ బీజగణితం నుండి ఒక విధానం. ఫంక్ యొక్క బ్లాగ్ పోస్ట్ ఏకకాలంలో సాంకేతిక మరియు weirdly అనధికారిక ఉంది. ఈ బ్లాగ్ పోస్ట్ ఒక మంచి పరిష్కారం వివరిస్తూ లేదా సమయం వేస్ట్ జరిగినది? బహిరంగ కాల్ ప్రాజెక్ట్ వెలుపల, పరిష్కారం ఎప్పుడూ తీవ్రమైన పరిశోధనలో అందుకుంటున్నారు. అన్ని సైమన్ ఫంక్ కాల్ టెక్ లేదా MIT ఒక ప్రొఫెసర్ కాదు కొనుచున్నావు ఆ సమయంలో ఆయన, న్యూజిలాండ్ కార్టింగ్ ఇతను ఒక సాఫ్ట్వేర్ డెవలపర్ ఉంది (Piatetsky 2007) . అతను నెట్ఫ్లిక్స్ ఒక ఇంజినీర్ ఈ ఆలోచన ఇమెయిల్ చేసింది, అది దాదాపు పెద్దగా పట్టించుకోవడం లేదని కాదు.

అదృష్టవశాత్తూ, అంచనా నిబంధనలు స్పష్టమైన మరియు దరఖాస్తు సులభం ఎందుకంటే, తన అంచనా రేటింగ్స్ ముందడుగు, మరియు అది తన విధానం చాలా శక్తివంతమైన అని తక్షణమే స్పష్టం: అతను పోటీలో నాల్గవ స్థానానికి అంటాయి, ఒక అద్భుతమైన ఫలితంగా ఇతర జట్లు ఇప్పటికే ఉందని ఇచ్చిన సమస్య నెలల పని. చివరికి, సైమన్ ఫంక్ విధానం యొక్క భాగాలు దాదాపు అన్ని తీవ్రమైన పోటీదారులు ఉపయోగించారు (Bell, Koren, and Volinsky 2010) .

సైమన్ ఫంక్ అంతేకానీ రహస్య ఉంచడానికి ప్రయత్నించేందుకు బదులుగా అతని తీరును వివరిస్తూ ఒక బ్లాగ్ పోస్ట్ రాయడానికి ఎంచుకున్నాడు వాస్తవం, కూడా నెట్ఫ్లిక్స్ ప్రైజ్ అనేక పాల్గొనే ప్రత్యేకంగా మిలియన్ డాలర్ల బహుమతి ద్వారా ప్రేరణ లేని విధంగా వివరిస్తుంది. అయితే, అనేక పాల్గొన్న బౌద్ధిక సవాలు మరియు సమస్యతో అభివృద్ధి కమ్యూనిటీ ఆనందించండి కనిపించింది (Thompson 2008) , నేను అనేక పరిశోధకులు అర్థం ఆశించిన భావాలు.

నెట్ఫ్లిక్స్ ప్రైజ్ బహిరంగ కాల్ ఒక మచ్చుతునక. నెట్ఫ్లిక్స్ (చిత్రం రేటింగ్స్ అంచనా) ఒక నిర్దిష్ట లక్ష్యంతో ఒక ప్రశ్నకు కారణమైంది మరియు అనేక మంది నుండి పరిష్కారాలను అభ్యర్థించాయి. వారు సృష్టించడానికి కంటే ధృవీకరించడానికి సులభంగా ఎందుకంటే నెట్ఫ్లిక్స్ అన్ని ఈ పరిష్కారాలను విశ్లేషించడానికి చేయగలిగింది, చివరకు నెట్ఫ్లిక్స్ ఉత్తమ పరిష్కారం చేసుకుంది. ఇదే విధానం జీవశాస్త్రం మరియు చట్టం లో ఉపయోగించవచ్చు ఎలా తరువాత, నేను మీకు చూపిస్తాను.