5.2.2 קידוד-קהל של מניפסטים פוליטיים

Coding מניפסטים פוליטיים, משהו בדרך כלל נעשה על ידי מומחים, יכול להתבצע על ידי פרויקט חישוב אדם וכתוצאה מכך שחזור וגמישות רבים יותר.

בדומה לגן החיות של Galaxy, ישנם מצבים רבים שבהם חוקרים חברתיים רוצים לקודד, לסווג או לתייג תמונה או קטע טקסט. דוגמה לסוג זה של מחקר היא קידוד המניפסטים הפוליטיים. במהלך הבחירות, מפלגות פוליטיות מייצגות מתנגדים המתארים את עמדות המדיניות שלהם ואת הפילוסופיות המנחה. לדוגמה, הנה חלק מניפסט של מפלגת הלייבור בבריטניה משנת 2010:

"מיליוני אנשים עובדים בשירותים הציבוריים שלנו מגלמים את הערכים הטובים ביותר של בריטניה, עוזרים להעצים אנשים כדי להפיק את המרב של חייהם תוך הגנה עליהם מפני הסיכונים הם לא היו צריכים לשאת בעצמם. כשם שאנחנו צריכים להיות נועזים יותר על תפקידה של הממשלה בהפיכת שווקים פועלים למדי, אנחנו גם צריכים להיות רפורמים נועזים של הממשלה. "

המניפסטים האלה מכילים נתונים חשובים למדענים פוליטיים, במיוחד אלה שלומדים את הבחירות ואת הדינמיקה של הדיונים על המדיניות. על מנת לחלץ מידע מתוך המניפסטים הללו, החוקרים יצרו את פרויקט המניפסט, שאסף 4,000 מניפסטים מ -1,000 מפלגות ב -50 מדינות, ולאחר מכן ארגן מדענים פוליטיים כדי לקודד אותם באופן שיטתי. כל משפט בכל מניפסט היה מקודד על ידי מומחה באמצעות 56-סכימה. התוצאה של המאמץ המשותף הזה היא מערך נתונים מסיבי המסכם את המידע המוטבע במניפסטים אלה, ומערך נתונים זה שימש ביותר מ -200 מאמרים מדעיים.

קנת בנואה ועמיתיו (2016) החליטו לקחת את המניפסט קידוד המשימה כי בעבר בוצעו על ידי מומחים ולהפוך אותו לפרויקט חישוב אנושי. כתוצאה מכך, הם יצרו תהליך קידוד כי הוא לשעתקו יותר גמישה יותר, שלא לדבר על זול יותר ומהיר.

עבודה עם 18 המניפסטים שנוצרו במהלך שש בחירות האחרונות בבריטניה, Benoit ועמיתים השתמשו באסטרטגיה פיצול להחיל שילוב עם עובדים בשוק העבודה microtask (אמזון מכני טורק ו CrowdFlower הם דוגמאות של שוק העבודה microtask, עבור יותר בשווקים כאלה , ראה פרק 4). החוקרים לקחו כל מניפסט ופיצלו אותו למשפטים. לאחר מכן, אדם להחיל את ערכת קידוד לכל משפט. בפרט, התבקשו הקוראים לסווג כל משפט כמתייחס למדיניות כלכלית (משמאל או לימין), למדיניות חברתית (ליברלית או שמרנית) או לאף (איור 5.5). כל משפט היה מקודד על ידי כחמישה אנשים שונים. לבסוף, דירוגים אלה שולבו תוך שימוש במודל סטטיסטי, אשר היווה השפעות אינדיווידואליות ואפקט הקושי של המשפט. בסך הכל, בנוית ועמיתיו אספו 200,000 דירוגים מכ -1,500 איש.

איור 5.5: ערכת קידוד מבנואה ואח '. (2016). הקוראים התבקשו לסווג כל משפט כמתייחס למדיניות כלכלית (שמאל או ימין), למדיניות חברתית (ליברלית או שמרנית), או לא. הסתגלות Benoit et al. (2016), איור 1.

איור 5.5: ערכת קידוד Benoit et al. (2016) . הקוראים התבקשו לסווג כל משפט כמתייחס למדיניות כלכלית (שמאל או ימין), למדיניות חברתית (ליברלית או שמרנית), או לא. הסתגלות Benoit et al. (2016) , איור 1.

על מנת להעריך את איכות קידוד הקהל, היו בנואה ועמיתיו גם כ -10 פרופסורים מומחים וסטודנטים לתארים מתקדמים במדע המדינה, אותם המניפסטים בהליך דומה. למרות דירוגים של חברי הקהל היו יותר משתנים מאשר דירוגים מן המומחים, דירוג הקהל היה הסכמה יוצאת דופן עם דירוג המומחה קונצנזוס (איור 5.6). השוואה זו מראה כי, כמו בגן החיות של גלקסי, פרויקטי חישוב אנושיים יכולים לייצר תוצאות באיכות גבוהה.

איור 5.6: אומדני מומחים (ציר x) ואומדני קהל (ציר y) היו בהסכמה יוצאת דופן כאשר קידוד 18 המניפסטים של המפלגה מבריטניה (Benoit et al 2016). המניפסטים היו מקודדים משלוש מפלגות פוליטיות (קונסרבטיבים, עבודה וליברלים דמוקרטיים) ושישה בחירות (1987, 1992, 1997, 2001, 2005 ו -2010). הסתגלות Benoit et al. (2016), איור 3.

איור 5.6: אומדני מומחים ( \(x\) -axis) ואומדני קהל ( \(y\) -axis) היו בהסכמה יוצאת דופן כאשר קידוד 18 המניפסטים של המפלגה מבריטניה (Benoit et al. 2016) . המניפסטים היו מקודדים משלוש מפלגות פוליטיות (קונסרבטיבים, עבודה וליברלים דמוקרטיים) ושישה בחירות (1987, 1992, 1997, 2001, 2005 ו -2010). הסתגלות Benoit et al. (2016) , איור 3.

בהתבסס על תוצאה זו, בנואה ועמיתים השתמשו במערכת קידוד ההמונים שלהם כדי לבצע מחקר שלא היה אפשרי עם מערכת קידוד מנוהלת המנוהלת על ידי פרוייקט המניפסט. לדוגמה, פרויקט המניפסט לא קידד את המניפסטים בנושא ההגירה, כי זה לא היה נושא בולט כאשר פותחה שיטת קידוד באמצע שנות השמונים. ובנקודה זו, זה בלתי אפשרי מבחינה לוגיסטית עבור פרויקט המניפסט לחזור ולשקוד את המניפסטים שלהם כדי ללכוד את המידע הזה. לכן, נראה כי חוקרים המעוניינים ללמוד את הפוליטיקה של ההגירה הם מזל. עם זאת, בנואה ועמיתיו היו מסוגלים להשתמש במערכת החישוב האנושית שלהם כדי לבצע קידוד - מותאם אישית לשאלת המחקר שלהם - במהירות ובקלות.

כדי ללמוד מדיניות הגירה, הם קידדו את המניפסטים של שמונה מפלגות בבחירות הכלליות 2010 בבריטניה. כל משפט במניפסט היה מקודד לגבי השאלה אם הוא קשור לעלייה, ואם כן, האם הוא תומך בהגירה, ניטרלי או אנטי-גירה. בתוך 5 שעות משחרורו של הפרויקט, התוצאות היו. הם אספו יותר מ 22,000 תגובות בעלות כוללת של 360 $. יתר על כן, הערכות מן הקהל הראה הסכם יוצא דופן עם סקר מוקדם יותר של מומחים. לאחר מכן, כמבחן סופי, חודשיים לאחר מכן, החוקרים לשחזר את קידוד הקהל שלהם. בתוך שעות ספורות, הם יצרו מערך נתונים חדש בקוד הצופים, שתואם מקרוב לקבוצת הנתונים המקורית שלהם. במילים אחרות, המחשוב האנושי איפשר להם ליצור קידוד של טקסטים פוליטיים שהסכימו עם הערכות מומחים והיה ניתן לשחזור. יתר על כן, מכיוון שהחישוב האנושי היה מהיר וזול, היה קל להם להתאים אישית את איסוף הנתונים שלהם לשאלת המחקר הספציפית שלהם בנוגע להגירה.