5.3.1 פרס נטפליקס

התרגום הזו נוצר על ידי מחשב. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.3.1 פרס נטפליקס

נטפליקס פרס משתמשת שיחה פתוחה לחזות אילו סרטים שאנשים יאהבו.

פרויקט הקריאה פתוחה הידוע ביותר הוא פרס נטפליקס. נטפליקס היא חברת השכרת הסרטים באינטרנט, ובשנת 2000 היא השיקה Cinematch, שירות להמליץ סרטים ללקוחות. לדוגמה, Cinematch ייתכן שתבחין כי אתה אוהב את מלחמת הכוכבים שביתות האימפריה חזרה ולאחר מכן ממליצים לצפות שובו של הג'די. בתחילה, Cinematch עבד גרוע. אבל, במשך שנים רבות, Cinematch המשיך לשפר את היכולת לנבא איזה סרטי לקוחות ייהנו. עד 2006, לעומת זאת, התקדמות על Cinematch plateaued. חוקרים באוניברסיטת נטפליקס ניסה פחות או יותר כל מה שיכלו לחשוב עליו, אבל באותו זמן, הם חשדו כי היו רעיונות אחרים שעשויים לעזור להם לשפר את המערכת שלהם. לפיכך, הם באו עם מה היה, בזמנו, פתרון קיצוני: שיחה פתוחה.

קריטי להצלחה הסופית של פרס נטפליקס היה כיצד השיחה הפתוחה תוכננה, ועיצוב זה יש לקחים חשובים עבור איך לפתוח שיחות ניתן להשתמש למחקר חברתי. נטפליקס לא רק לכבות בקשת מובנה עבור רעיונות, וזה מה שאנשים רבים לדמיין כשהם לשקול שיחה פתוחה. במקום זאת, נטפליקס הייתה בעיה ברורה עם קריטריונים להערכה פשוטים: הם קראו תגר אנשים להשתמש סט של 100 מיליון דירוגי סרט לחזות 3 מיליון דירוגים מושטים (דירוגים שמשתמשים עשו אבל זה נטפליקס לא לשחרר). מי יכול ליצור אלגוריתם שיכול לחזות את 3 מיליון דירוגים מושטים 10% יותר מאשר Cinematch ינצח 1 מיליון דולרים. זה ברור וקל ליישם הערכת קריטריוני השוואת דירוגים חזו מושטת דירוגים התכוונו כי פרס נטפליקס הופלל בצורה כזאת כי פתרונות קלים כדי לבדוק מ רושמים; זה הפך את האתגר של שיפור Cinematch בבעיה מתאימה לשיחה פתוחה.

בחודש אוקטובר של שנת 2006, נטפליקס פרסמה נתונים המכילים 100 מיליון דירוגי סרט מכ כ -500,000 לקוחות (נשקול את ההשלכות הפרטיות בדיווח זה בפרק 6). נתוני נטפליקס ניתן להמשיג כמטריצה ענקית כי הוא כ 500,000 לקוחות בהיקף של כ -20,000 סרטים. בתוך המטריצה הזו, היו כ -100 מיליון דירוגים בסולם מ -1 עד 5 כוכבים (לוח 5.2). האתגר היה להשתמש בנתונים שנצפו המטריצה לחזות את 3 מיליון דירוגים מושטים.

לוח 5.2: סכמטי של נתונים מן נטפליקס הפרס. נטפליקס פרסמה כ -100 מיליון דירוגים (1 כוכב עד 5 כוכבים) המסופקים על ידי 500,000 לקוחות על 20,000 סרטים. המטרה בפרס נטפליקס הייתה להשתמש דירוגים אלה לחזות את הרייטינג המושט של 3 מיליון סרטים, כפי שמוצגים "?". דירוגים חזויים שהגישו ההשתתף בפרס נטפליקס הושוו הרייטינג המושט. אני מוכן לדון בסוגיות האתיות סביב שחרור נתונים זה בפרק 6.
	סרט 1	סרט 2	סרט 3	. . .	סרט 20,000
לקוחות 1	2	5		.	?
לקוחות 2		2	?	.	3
לקוחות 3		?	2	.
. . .	.	.	.	.	.
לקוחות 500,000	?		2	.	1

חוקרי האקרים ברחבי העולם נמשכו האתגר, ובשנת 2008 יותר מ -30,000 בני אדם עובדים על זה (Thompson 2008) . במהלך התחרות, נטפליקס קיבלה יותר מ -40,000 הפתרונות המוצעים מ -5,000 צוותי (Netflix 2009) . ברור, נטפליקס לא יכול לקרוא ולהבין את כל הפתרונות המוצעים. כל העניין רץ בצורה חלקה, עם זאת, כי הפתרונים היו קלים לבדוק. נטפליקס יכול בבקשה לקבל מחשב להשוות את הרייטינג צפוי הרייטינג המוחזק על ידי מדד שהוגדרו מראש (מדד מסוים הם השתמשו היה השורש הריבועי של השגיאה בריבוע ממוצע). זה היה זה היכולת להעריך פתרונות במהירות שאפשרו נטפליקס לקבל פתרונות מכולם, אשר התברר להיות חשוב כי רעיונות טובים הגיעו מאיזה במקומות מפתיעים. למעשה, הפתרון הזוכה הוגש על ידי צוות אשר נכתב על ידי שלושה חוקרים שאין מערכות המלצת סרט בניין ניסיון קודמות (Bell, Koren, and Volinsky 2010) .

היבט יפה אחד בפרס נטפליקס הוא בכך שהיא איפשרה לכל אדם בעולם יש להעריך את פתרונם למדי. כשאנשים נטענים דירוגים ניבאו שלהם, הם לא צריכים להעלות אישורים האקדמיים שלהם, גילם, גזע, מין, נטייה מינית, או משהו על עצמם. לפיכך, הרייטינג החזוי של פרופסור מפורסם מסטנפורד טופל בדיוק כמו אלה של נער בחדר השינה שלה. למרבה הצער, זה לא נכון ברוב המחקר החברתי. כלומר, עבור רוב המחקר החברתי, ההערכה היא מאוד זמן רב וסובייקטיביים חלקית. לכן, רוב הרעיונות והמחקר לא העריכו ברצינות, ומתי רעיונות מוערכים, קשה לנתק הערכות אלה מבית היוצר של רעיונות. מאחר שפתרונות שקל לבדוק, שיחות פתוחות מאפשרות לחוקרי גישה לכל הפתרונים הנפלאים הפוטנציאלי כי ייפלו בין הכיסאות אם הם נחשבים רק פתרונות מפרופסורים מפורסמים.

לדוגמא, בשלב מסוים במהלך מישהו פרס נטפליקס עם שם מסך סיימון פאנק פורסם על שלו לבלוג פתרון מוצע מבוסס על פירוק ערך יחיד, פנייתו של אלגברת ליניארית שלא נוצלה בעבר על ידי משתתפים אחרים. פוסט בבלוג של פאנק היה טכני בו זמנית מוזרה פורמלי. האם לכתוב את הבלוג הזה המתאר פתרון טוב או שזה היה בזבוז זמן? מחוץ פרויקט קריאה פתוח, הפתרון עשוי לא קבל הערכה רצינית. אחרי הכל סיימון פאנק לא היה פרופסור בטכניון של קליפורניה או MIT; הוא היה מפתח תוכנה אשר, בזמנו, היה תרמילאים ברחבי ניו זילנד (Piatetsky 2007) . אם הוא היה בדוא"ל הרעיון הזה מהנדס נטפליקס, כמעט בוודאי לא ננקטו ברצינות.

למרבה המזל, בגלל הקריטריונים להערכה היו ברורים וקלים ליישום, הדירוגים הניבאים שלו הוערכו, והיה ברור מייד כי גישתו הייתה מאוד חזקה: הוא זנק למקום הרביעי בתחרות, בעקבות עצום בהתחשב בכך קבוצות אחרות כבר היו עובד במשך חודשים על הבעיה. בסופו של דבר, חלקים של הגישה של סיימון פאנק שימשו כמעט כל מתחרים רציניים (Bell, Koren, and Volinsky 2010) .

העובדה ששמעון פאנק בחרה לכתוב פוסט בבלוג להסביר את גישתו, ולא מנסה לשמור את זה בסוד, גם ממחיש כי משתתפים רבים בפרס נטפליקס לא הונעו באופן בלעדי על ידי פרס של מיליון דולר. במקום זאת, משתתפים רבים גם נראים נהנו מהאתגר האינטלקטואלי ואת הקהילה שהתפתחה סביב הבעיה (Thompson 2008) , רגשות שאני מצפה חוקרים רבים יכולים להבין.

נטפליקס פרס הוא דוגמה קלאסית של שיחה פתוחה. נטפליקס נשקף שאלה עם מטרה ספציפית (לניבוי דירוגי סרט) שדל פתרונות מאנשים רבים. נטפליקס היה מסוגל להעריך את כל הפתרונות הללו משום שהם היו יותר קל לאמת מאשר ליצור, ובסופו של דבר נטפליקס הרים את הפתרון הטוב ביותר. בשלב הבא, אני אראה לך איך אותה גישה זו ניתן להשתמש בביולוגיה החוק.