פרשנות נוספת

התרגום הזו נוצר על ידי מחשב. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

פרשנות נוספת

סעיף זה נועד לשמש כהפניה, ולא להיקרא כסיפור.

מבוא (סעיף 5.1)

שיתוף פעולה המוני תערובות רעיונות ממדעי אזרח, crowdsourcing, ואינטליגנציה קולקטיבית. מדע אזרח בדרך כלל אומר מעורב "אזרחים" (כלומר, שאינם מדענים) בתהליך המדעי (Crain, Cooper, and Dickinson 2014) . Crowdsourcing בדרך כלל פירושו לקחת בעיה בדרך כלל לפתור בתוך ארגון ובמקום מיקור חוץ זה בפני קהל (Howe 2009) . אינטליגנציה קולקטיבית בדרך כלל אמצעי קבוצות של אנשים מתנהגים באופן קולקטיבי בדרכים שנראות אינטיליגנטי (Malone and Bernstein 2015) . Nielsen (2012) הוא מבוא אורך-ספר נפלא לתוך הכח של שיתוף פעולה המוני למחקר מדעי.

ישנם סוגים רבים של שיתוף פעולה המוני שאינו מתאים בצורה מסודרת לשלוש הקטגוריות הצעתי, ואני חושב שלושה ראויים לתשומת לב מיוחדת משום שהם עלולים להיות שימושיים במחקר חברתי בשלב כלשהו. דוגמה אחת היא שווקי חיזוי, שבו המשתתפים לקנות וחוזי סחר שאינן ניתנות לפדיון המבוסס על תוצאות המתרחשות בעולם (Wolfers and Zitzewitz 2004; Arrow et al. 2008) . שווקי חיזוי משמשים לעתים קרובות על ידי חברות וממשלות לחיזוי, ושווקים מנבאים גם כבר בשימוש על ידי חוקרים חברתיים לחזות את השכפול של מחקרים שפורסמו בפסיכולוגיה (Dreber et al. 2015) .

דוגמה שנייה שאינו מתאים גם לתוך ערכת קטגוריזציה שלי הוא פרויקט אשכולות, שבו חוקרים פעולה באמצעות בלוגים ואתרי Wiki להוכיח משפטים מתמטיקה חדשה (Gowers and Nielsen 2009; Cranshaw and Kittur 2011; Nielsen 2012; Kloumann et al. 2016) . פרויקט אשכול הוא במובנים מסוימים דומים בפרס נטפליקס, אבל המשתתף אשכולות הפרויקט באופן פעיל יותר בנוי על הפתרונים החלקיים של אחרים.

דוגמא שלישית שאינו מתאימה גם לתוך ערכת קטגוריזציה שלי היא גיוס תלוי זמן כגון הסוכנות לפרויקטי המחקר המתקדמת הביטחון (DARPA) רשת אתגר (כלומר, אתגר הבלון האדום). למידע נוסף על הזמן אלה גיוס רגיש לראות Pickard et al. (2011) , Tang et al. (2011) , ו Rutherford et al. (2013) .

חישוב אדם (סעיף 5.2)

המונח "חישוב אדם" יוצא של עבודה שנעשתה על ידי מדעני מחשב, והבנת ההקשר מאחורי מחקר זה ישפר את יכולתך לברור בעיות שעלולות להיות מקובל זה. עבור משימות מסוימות, מחשבים חזקים מאוד עם יכולות בהרבה בני אדם מומחה אפילו. לדוגמא, בשחמט, מחשבים יכולים לנצח אפילו גראנד מאסטרס הטוב ביותר. אבל, וכאן מדובר פחות טוב מוערך על ידי חברתי מדענים-למשימות אחרות, מחשבים הם למעשה הרבה יותר גרועים מאשר אנשים. במילים אחרות, עכשיו אתה יותר טוב אפילו מאשר המחשב המתוחכם ביותר על משימות מסוימות מעורבים בעיבוד תמונות, וידאו, אודיו וטקסט. כך-כפי שהומחש על ידי xkcd נפלא קריקטורה-ישנם משימות קלות למחשבים קשים לאנשים, אבל יש גם משימות שקשה למחשבים קלים לאנשים (איור 5.13). מדעני מחשב עובדים על קשה תמורת מחשבים-קלים-for-אדם משימות אלה, ולכן, הבין שהם יכולים לכלול בני אדם בתהליך חישובית שלהם. הנה איך לואיס פון Ahn (2005) תיאר חישוב האדם כשהוא נטבע לראשונה המונח לו מסה: ". פרדיגמה עבור ניצול כוח העיבוד האנושי לפתור בעיות שמחשבים לא יכולים עדיין לפתור"

איור 5.13: במשימות מסוימות מחשבים הם מדהימים, העולה על היכולת של מומחים אנושיים. אבל, עבור משימות אחרות, בני אדם רגילים יכולים להכות ואפילו מערכות מחשבים מתוחכמות. בעיות בקנה מידה גדולות הכוללות משימות שקשה למחשבים קלים עבור בני אדם הם מתאימים היטב חישוב אדם. משומש בהתאם לתנאים המתוארים כאן: http://xkcd.com/license.html

לפי הגדרה זו FoldIt-שתארתי בפרק פתוח שיחות-יכול להיחשב פרויקט חישוב אדם. עם זאת, אני בוחר לסווג FoldIt כמו שיחה פתוחה מכיוון שהיא דורשת כישורים מיוחדים וזה לוקח את הפתרון הטוב ביותר תרם ולא משתמש באסטרטגיה מפוצלת להחיל-לשלב.

לקבלת טיפול אורך ספר מצוין חישוב אדם, במובן הרחב ביותר של המושג, לראות Law and Ahn (2011) . פרק 3 של Law and Ahn (2011) יש דיון מעניין של צעדים לשלב מורכבים יותר מאלו בפרק זה.

המונח "דו-חל-לשלב" שמש Wickham (2011) לתאר אסטרטגיה מחשוב סטטיסטי, אבל זה לוכד באופן מושלם את תהליך פרויקטי חישוב אנושיים רבים. הפיצול-apply-לשלב האסטרטגיה דומה במסגרת MapReduce שפותח בגוגל (Dean and Ghemawat 2004; Dean and Ghemawat 2008) .

שני פרויקטים חישוב אדם חכם כי לא היה לי מקום לדון הם משחק ESP (Ahn and Dabbish 2004) ו reCAPTCHA (Ahn et al. 2008) . שני הפרויקטים הללו מצאו דרכים יצירתיות כדי להניע המשתתפים לספק תוויות בתמונות. עם זאת, שני הפרויקטים הללו העלו גם שאלות אתיות משום שבניגוד החיות גלקסי, המשתתפים במשחק ESP ו reCAPTCHA לא יודע איך הנתונים שלהם היה בשימוש (Lung 2012; Zittrain 2008) .

בהשראת משחק ESP, חוקרים רבים ניסו לפתח אחרים "משחקים עם מטרה" (Ahn and Dabbish 2008) (כלומר, "משחקי חישוב אדם מבוסס" (Pe-Than, Goh, and Lee 2015) ) כי יכול להיות להשתמש כדי לפתור מגוון של בעיות אחרות. מה "משחקים עם מטרה" האלה יש מכנה משותף הוא כי הם מנסים להפוך את המשימות מעורבות אדם חישוב מהנה. וכך, בעוד משחק ESP חולק באותו שבריר-apply-לשלב מבנה עם חיות גלקסי, היא שונה באופן שבו משתתפים מונעים-כיף לעומת רצון לסייע למדע.

התיאור שלי של חיות גלקסי נשען על Nielsen (2012) , Adams (2012) , Clery (2011) , ו Hand (2010) , ואת המצגת שלי ממטרות המחקר של גן חי גלקסי הייתה פשוט. למידע נוסף על ההיסטוריה של הסיווג הגלקסיה באסטרונומיה וכיצד החיות גלקסי ממשיכה במסורת זו, ראה Masters (2012) ו Marshall, Lintott, and Fletcher (2015) . בונים על גן החיות גלקסי, החוקרים השלימו Galaxy Zoo 2 אשר נאספו יותר מ -60 מיליון יותר סיווגים מורפולוגיים מורכבת ממתנדבים (Masters et al. 2011) . יתר על כן, הם הסתעפו בבעיות מחוץ מורפולוגיה גלקסיה כולל לחקור את פני השטח של הירח, מחפש כוכבי לכת, ותמלול מסמכים ישנים. נכון לעכשיו, כל הפרויקטים שלהם נגבים www.zooniverse.org (Cox et al. 2015) . אחד הפרויקטים-Snapshot סרנגטי-מספק ראיות לכך פרויקטים סיווג תמונה מסוג החיות גלקסי יכול להיעשות גם למחקר סביבתי (Swanson et al. 2016) .

לחוקרים מתכנן להשתמש בשוק העבודה מיקרו-משימה (למשל, טורק מכני אמזון) עבור פרויקט חישוב האדם, Chandler, Paolacci, and Mueller (2013) ו Wang, Ipeirotis, and Provost (2015) להציע עצה טובה על עיצוב המשימה נושאים קשורים אחרים.

חוקרים מעוניינים ליצור מה זמנתי מערכות חישוב אדם דור השני (למשל, מערכות המשתמשות תוויות אדם לאמן מודל למידת מכונה) שאולי יעניינו Shamir et al. (2014) (לדוגמא באמצעות שמע) ו Cheng and Bernstein (2015) . כמו כן, פרויקטים אלה ניתן לעשות עם שיחות פתוחות, לפיה חוקר להתחרות ליצור מודלים ללמידה חישובית מהתפקוד החזוי הגדול. לדוגמה, צוות גן החיות גלקסי ניהל שיחה פתוחה מצא גישה חדשה כי ביצועים טובים יותר אחד שפותח Banerji et al. (2010) ; לראות Dieleman, Willett, and Dambre (2015) לפרטים נוספים.

שיחות פתוחות (סעיף 5.3)

שיחות פתוחות אינן חדשות. למעשה, אחת השיחות הפתוחות הידועות ביותר שתחילתה 1714 כאשר הפרלמנט של בריטניה יצר את הפרס אורך לכל מי שיכול לפתח דרך לקבוע את הקו האורך של ספינה בלב הים. הבעיה מבולבלת רבה של המדענים הגדולים ביותר של הימים, כולל אייזק ניוטון, והפתרון המנצח בסופו של דבר הוגש על ידי שען מן העיירות והכפרים שהתקרבו הבעיה שונה מדענים אשר התמקדו פתרון שאיכשהו יהיה כרוך אסטרונומיה (Sobel 1996) . כפי שמראה דוגמא זו, אחת סיבות לכך שיחות פתוחות נחשבות לעבוד כל כך טוב הן שהם מספקים גישה לאנשים עם מבט שונה ומיומנויות (Boudreau and Lakhani 2013) . ראה Hong and Page (2004) ו Page (2008) לקבלת מידע נוסף על הערך של גיוון בפתרון בעיות.

בכל אחד מהמקרים הקריאים הפתוחים בפרק דורש קצת הסבר נוסף מדוע הוא שייך בקטגוריה זו. ראשית, אחת הדרכים שבהן אני מבחין בין חישוב אדם ופרויקטים שיחה פתוחה היא האם הפלט הוא ממוצע של כל הפתרונות (חישוב האדם) או את הפתרון הטוב ביותר (קריאה פתוחה). נטפליקס פרס הוא מסובך במקצת בעניין זה כי הפתרון הטוב ביותר התברר ממוצע משוכלל של פתרונות יחידים, התקרב כינת פתרון אנסמבל (Bell, Koren, and Volinsky 2010; Feuerverger, He, and Khatri 2012) . מנקודת המבט של נטפליקס, לעומת זאת, כל מה שהם צריכים לעשות זה לבחור את הפתרון הטוב ביותר.

שנית, על ידי כמה הגדרות חישוב אדם (למשל, Von Ahn (2005) ), FoldIt צריך להיחשב פרויקט חישוב אדם. עם זאת, אני בוחר לסווג FoldIt כמו שיחה פתוחה מכיוון שהיא דורשת כישורים מיוחדים וזה לוקח את הפתרון הטוב ביותר תרם, ולא משתמש באסטרטגיה מפוצלת להחיל-לשלב.

לבסוף, אפשר לטעון כי Peer-to-הפטנטים היא דוגמא אוסף נתונים מבוזרים. אני בוחר לכלול אותו לשיחה פתוחה, כי יש לו מבנה דמוי תחרות ורק התרומות הכי משמשות (ואילו עם אוסף נתונים מבוזרים, הרעיון של תרומות טובות ורעות פחות ברור).

למידע נוסף על פרס נטפליקס, ראה Bennett and Lanning (2007) , Thompson (2008) , Bell, Koren, and Volinsky (2010) , ו Feuerverger, He, and Khatri (2012) . למידע נוסף על FoldIt לראות, Cooper et al. (2010) , Andersen et al. (2012) , ו Khatib et al. (2011) ; התיאור שלי של FoldIt נשען על תיאורי Nielsen (2012) , Bohannon (2009) , ו Hand (2010) . למידע נוסף על Peer-to-פטנטים, לראות Noveck (2006) , Bestor and Hamp (2010) , Ledford (2007) , ו Noveck (2009) .

בדומה לתוצאות Glaeser et al. (2016) , Mayer-Schönberger and Cukier (2013) , רווחים גדולים דוחים 10 הפרק ב הפרודוקטיביות של מפקחי בנייה בעיר ניו יורק כאשר בדיקות הם מודרכים על ידי מודלים חזויים. בניו יורק, המודלים המנבאים הללו נבנו על ידי עובדי עירייה, אך במקרים אחרים, אפשר לדמיין שהם יכולים להיוצר או משופר עם שיחות פתוחות (למשל, Glaeser et al. (2016) ). עם זאת, חשש עיקרי אחד עם בשימוש מודלים המנבאים להקצות משאבים הוא שהמודלים יש הפוטנציאל לחזק הטיות קיימות. חוקרים רבים כבר יודעים "זבל פנימה, החוצה אשפה", ועם מודלים חזויים זה יכול להיות "הטיה, הטיה החוצה." ראו Barocas and Selbst (2016) ואת O'Neil (2016) לקבלת מידע נוספת על הסכנות של מודלים מנבאים הבנויות עם נתוני אימון מוטים.

אחת בעיות שעלולות למנוע ממשלות משימוש תחרויות פתוחות היא שהיא דורשת לשחרר נתונים, אשר עלול להוביל הפרות פרטיות. לקבלת מידע נוסף אודות שחרור פרטי ונתוני שיחות פתוחות לראות Narayanan, Huey, and Felten (2016) והדיון בפרק 6.

איסוף נתונים מבוזר (סעיף 5.4)

התיאור שלי של eBird נשען על תיאורי Bhattacharjee (2005) ו Robbins (2013) . למידע נוסף על איך להשתמש חוקרים מודלים סטטיסטיים לנתח נתונים eBird לראות Hurlbert and Liang (2012) ואת Fink et al. (2010) . למידע נוסף על ההיסטוריה של מדע אזרח ornothology ראה Greenwood (2007) .

למידע נוסף על הפרויקט עת מלאווי, לראות Watkins and Swidler (2009) ו Kaler, Watkins, and Angotti (2015) . ובשביל יותר על פרויקט קשור בדרום אפריקה, לראות Angotti and Sennott (2015) . לדוגמאות נוספות של נתונים באמצעות מחקר מפרוייקט עת מלאווי לראות Kaler (2004) ו Angotti et al. (2014) .

עיצוב משלך (סעיף 5.5)

גישתי מציע ייעוץ בעיצוב הייתה אינדוקטיביים, מבוססת על הדוגמות מוצלחות וכושלת פרויקטים בשיתוף המוניים כי שמעתי על. יש גם זרם של מחקר מנסה ליישם תאוריות פסיכולוגיות חברתיות כלליות יותר לעיצוב קהילות מקוונות שרלוונטי לעיצוב פרויקטים בשיתוף המוני, ראה, למשל, Kraut et al. (2012) .

לגבי המשתתפים המניע, זה בעצם די מסובך להבין בדיוק למה אנשים להשתתף בפרויקטים בשיתוף מסה (Nov, Arazy, and Anderson 2011; Cooper et al. 2010, Raddick et al. (2013) ; Tuite et al. 2011; Preist, Massung, and Coyle 2014) . אם אתם מתכננים להניע המשתתפים עם תשלום על שוק עבודה מיקרו-משימה (למשל, אמזון מכונות טורק) Kittur et al. (2013) מציע כמה עצות.

באשר המאפשר הפתעה, לדוגמאות נוספות של תגליות בלתי צפויות יוצא פרויקטים Zoouniverse ראה Marshall, Lintott, and Fletcher (2015) .

באשר להיות מוסרי, כמה היכרויות כלליות טובות הבעיות הכרוכות בעניין Gilbert (2015) , Salehi et al. (2015) , Schmidt (2013) , Williamson (2016) , Resnik, Elliott, and Miller (2015) , ו Zittrain (2008) . על בעיות הקשורות ספציפי על נושאים משפטיים עם עובדי קהל, לראות Felstiner (2011) . O'Connor (2013) מתמודד עם שאלות על פיקוח מוסרי של חקר כאשר התפקידים של חוקרים ומשתתפים לטשטש. לדווח על בעיות הקשורות נתוני שיתוף תוך הגנה נרשמת בפרויקטי מדע אזרח, לראות Bowser et al. (2014) . שניהם Purdam (2014) ו Windt and Humphreys (2016) יש דיון על סוגיות אתיות באוסף נתונים מבוזרים. לבסוף, מרבית הפרויקטים להכיר תרומות אבל לא נותנים ייחוס למשתתפים. ב Foldit, שחקני Foldit לעתים קרובות מופיעים כאן בתור סופר (Cooper et al. 2010; Khatib et al. 2011) . בפרויקטים קריאה פתוחה אחרים, התורם הזוכה לעתים קרובות יכול לכתוב מאמר המסביר את פתרונותיהם (למשל, Bell, Koren, and Volinsky (2010) ו Dieleman, Willett, and Dambre (2015) ). במשפחה של פרויקטים החיות גלקסי, התורמים פעיל וחשוב מאוד לפעמים מוזמנים להיות על ניירות צמד המחברים. לדוגמא, איוון Terentev וטים Matorny, שני משתתפי חיות גלקסי רדיו מרוסיה, היו מחברים על אחד העיתונים כי נבעו פרויקט (Banfield et al. 2016; Galaxy Zoo 2016) .