5.3.1 פרס נטפליקס

נטפליקס פרס משתמשת שיחה פתוחה לחזות אילו סרטים שאנשים יאהבו.

פרויקט הקריאה הפתוח הידוע ביותר הוא פרס נטפליקס. נטפליקס היא חברת השכרת סרטים באינטרנט, ובשנת 2000 היא השיקה את Cinematch, שירות להמליץ ​​על סרטים ללקוחות. לדוגמה, Cinematch עשוי להבחין כי אתה אוהב מלחמת הכוכבים ואת האימפריה מכה שוב ולאחר מכן ממליצים לך לצפות החזרת הג 'די . בתחילה, Cinematch עבד גרוע. אבל, במשך שנים רבות, היא המשיכה לשפר את יכולתה לחזות אילו סרטים לקוחות ייהנו. עם זאת, בשנת 2006, ההתקדמות על Cinematch היה plaued. החוקרים בנטפליקס ניסו פחות או יותר כל מה שהם יכלו להעלות על דעתם, אבל יחד עם זאת, הם חשדו שישנם רעיונות אחרים שעשויים לעזור להם לשפר את המערכת שלהם. כך הם הגיעו עם מה שהיה אז פתרון רדיקאלי: שיחה פתוחה.

קריטי להצלחתו העתידית של פרס נטפליקס הוא כיצד תוכננה השיחה הפתוחה, ולעיצוב זה יש לקחים חשובים כיצד ניתן להשתמש בשיחות פתוחות למחקר חברתי. נטפליקס לא רק שלחה בקשה לא מובנית לרעיונות, וזה מה שאנשים רבים חושבים כשהם רואים לראשונה שיחה פתוחה. במקום זאת, נטפליקס הציבה בעיה ברורה בהליך הערכה פשוט: הם קראו לאנשים להשתמש במערך של 100 מיליון דירוגים של סרטים כדי לחזות 3 מיליון דירוגים מוחזקים (דירוגים שהמשתמשים עשו אבל נטפליקס לא שוחררה). האדם הראשון ליצור אלגוריתם זה ניבא את 3 מיליון המוחזקים דירוגים 10% יותר מאשר Cinematch ינצח מיליון דולר. הליך הערכה ברור וקל להחלה - השוואה בין דירוגים חזויים לבין דירוגים מוחזקים - פירושו שפרס נטפליקס היה ממוסגר בצורה כזו שהפתרונות היו קלים יותר לבדיקה מאשר ליצור; זה הפך את האתגר של שיפור Cinematch לבעיה המתאימה לשיחה פתוחה.

באוקטובר 2006, הוציאה נטפליקס מערך נתונים המכיל 100 מיליון דירוגי סרטים מתוך כ -500,000 לקוחות (נדון בהשלכות הפרטיות של פרסום נתונים זה בפרק 6). נתוני Netflix ניתנים להמשגה כמטריצה ​​ענקית, המונה כ -500,000 לקוחות ב -20,000 סרטים. בתוך מטריצה ​​זו, היו כ 100 מיליון דירוגים בסולם מ 1-5 כוכבים (טבלה 5.2). האתגר היה להשתמש בנתונים שנצפו במטריצה ​​כדי לחזות את 3 מיליון הדירוגים המוחזקים.

טבלה 5.2: סכמטי לנתונים מפרס נטפליקס
סרט 1 סרט 2 סרט 3 ... הסרט 20,000
לקוח 1 2 5 ... ?
לקוח 2 2 ? ... 3
לקוח 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
500,000 לקוחות ? 2 ... 1

חוקרים ואקרים ברחבי העולם נמשכו לאתגר, וב -2008 יותר מ -30 אלף איש עבדו עליו (Thompson 2008) . במהלך התחרות, נטפליקס קיבלה יותר מ -40,000 פתרונות מוצעים מיותר מ -5,000 צוותים (Netflix 2009) . ברור, נטפליקס לא הצליחה לקרוא ולהבין את כל הפתרונות המוצעים. כל העניין התנהל בצורה חלקה, מפני שהפתרונות היו קלים לבדיקה. Netflix יכול פשוט להשוות את הדירוגים החזויים עם דירוגים מוחזקים באמצעות מדד prespecified (מדד מסוים הם השתמשו היה השורש הריבועי של השגיאה בריבוע הממוצע). זה היה היכולת להעריך במהירות פתרונות שאיפשרו Netflix לקבל פתרונות של כולם, אשר התברר כי חשוב כי רעיונות טובים הגיעו ממקומות מפתיעים מסוימים. למעשה, הפתרון הזוכה הוגש על ידי צוות שהתחיל שלושה חוקרים שלא היו להם ניסיון קודם בבניית מערכות המלצה לסרטים (Bell, Koren, and Volinsky 2010) .

היבט אחד יפה של פרס נטפליקס הוא שהוא איפשר את כל הפתרונות המוצעים כדי להיות מוערך למדי. כלומר, כאשר אנשים העלו את הדירוגים החזויים שלהם, הם לא היו צריכים להעלות את האישורים האקדמיים שלהם, הגיל שלהם, גזע, מין, נטייה מינית, או כל דבר אחר על עצמם. הדירוגים החזויים של פרופסור מפורסם מסטנפורד טופלו בדיוק כמו אלה של נער בחדר השינה שלה. למרבה הצער, זה לא נכון במרבית המחקר החברתי. כלומר, עבור רוב המחקר החברתי, ההערכה היא מאוד זמן רב סובייקטיבית חלקית. לכן, רוב הרעיונות המחקריים לעולם אינם מוערכים ברצינות, וכאשר רעיונות מוערכים, קשה לנתק את ההערכות הללו מיוצר הרעיונות. פרויקטי שיחות פתוחות, לעומת זאת, יש הערכה קלה והוגנת, כך שהם יכולים לגלות רעיונות כי יהיה לפספס אחרת.

לדוגמה, בשלב מסוים במהלך פרס נטפליקס, מישהו עם שם המסך סיימון פאנק פרסם בבלוג שלו פתרון מוצע המבוסס על פירוק ערך יחיד, גישה מאלגברה ליניארית שלא נוצלה בעבר על ידי משתתפים אחרים. פוסט של הבלוג של פאנק היה בו זמנית טכני ובלתי-פורמלי בצורה מוזרה. האם זה לכתוב בלוג המתאר פתרון טוב או שזה היה בזבוז זמן? מחוץ לפרויקט פתוח, הפתרון אולי מעולם לא קיבל הערכה רצינית. אחרי הכל, סיימון פאנק לא היה פרופסור ב- MIT; הוא היה מפתח תוכנה אשר, באותה עת, היה תרמילאים ברחבי ניו זילנד (Piatetsky 2007) . אם הוא שלח את הרעיון הזה למהנדס בחברת נטפליקס, קרוב לוודאי שלא היה קורא אותו.

למרבה המזל, מכיוון שקריטריוני ההערכה היו ברורים וקלים ליישום, הוערכו הדירוגים החזויים שלו, ומיד התברר כי גישתו הייתה חזקה מאוד: הוא טילט למקום רביעי בתחרות, תוצאה עצומה בהתחשב בכך שהצוותים האחרים כבר היו עובד במשך חודשים על הבעיה. בסופו של דבר, חלקים של הגישה שלו היו בשימוש על ידי כל המתחרים רציני (Bell, Koren, and Volinsky 2010) .

העובדה שסיימון פאנק בחר לכתוב פוסט בבלוג המסביר את גישתו, במקום לנסות לשמור את זה בסוד, ממחישה גם כי משתתפים רבים בפרס נטפליקס לא היו מונעים אך ורק על ידי פרס מיליון דולר. נראה כי משתתפים רבים נהנו גם מהאתגר האינטלקטואלי ומהקהילה שהתפתחה סביב הבעיה (Thompson 2008) , רגשות שאני מצפה שחוקרים רבים יוכלו להבין.

פרס נטפליקס הוא דוגמה קלאסית לשיחה פתוחה. נטפליקס הציגה שאלה עם מטרה ספציפית (ניבוי דירוגים לסרט) ושילבה פתרונות מאנשים רבים. נטפליקס הצליחה להעריך את כל הפתרונות הללו משום שקל היה לבדוק אותם מאשר ליצור, ובסופו של דבר נטפליקס בחרה את הפתרון הטוב ביותר. אני אראה לכם כיצד ניתן להשתמש באותה גישה בביולוגיה ובמשפטים, ובלי פרס של מיליון דולר.