5.2.2 קידוד-קהל של מניפסטים פוליטיים

Coding מניפסטים פוליטיים, משהו בדרך כלל נעשה על ידי מומחים, יכול להתבצע על ידי פרויקט חישוב אדם וכתוצאה מכך שחזור וגמישות רבים יותר.

בדומה החיות גלקסי, ישנם מצבים רבים בהם חוקרים חברתיים רוצה קוד, לסווג, או לתייג תמונה או קטע טקסט. דוגמה לסוג זה של מחקר הוא קידוד של מניפסטים פוליטיים. במהלך בחירות, המפלגות לייצר מנשרים מתארים השקפתם המדינית ואת מנחת פילוסופיות. לדוגמא, הנה פיסת המניפסט של מפלגת העבודה בבריטניה משנת 2010:

"מיליוני אנשים עובדים בשירותים הציבוריים שלנו מגלמים את הערכים הטובים ביותר של בריטניה, עוזרים להעצים אנשים כדי להפיק את המרב של חייהם תוך הגנה עליהם מפני הסיכונים הם לא היו צריכים לשאת בעצמם. כשם שאנחנו צריכים להיות נועזים יותר על תפקידה של הממשלה בהפיכת שווקים פועלים למדי, אנחנו גם צריכים להיות רפורמים נועזים של הממשלה. "

מנשרים אלה מכילים נתונים יקרי ערך עבור אנשי מדע המדינה, בבחירות לומד אלה בפרט ואת הדינמיקה של שוויכוחים פוליטיים. על מנת לחלץ מידע שיטתי מנשרים אלה, החוקרים יצרו פרויקט המניפסט , שארגן מדע המדינה לקודד 4,000 מנשרים מכמעט 1,000 הצדדים ב -50 מדינות. כל משפט בכל מניפסט כבר מקודד על ידי מומחה באמצעות ערכת 56-קטגוריה. התוצאה של מאמץ משותף זה היא בסיס נתונים מסיביים המסכמים את המידע מוטבע מנשרים אלה, ואת נתונים זה כבר בשימוש בלמעלה מ -200 מאמרים מדעיים.

קנת בנואה ועמיתיו (2015) החליטו לקחת את משימת הקידוד במנשר נעשתה בעבר על ידי מומחים ולהפכו פרויקט חישוב אדם. כתוצאה מכך, הם יצרו תהליך קידוד כי הוא יותר לשחזור וגמיש יותר, שלא לדבר על זול יותר ומהיר יותר.

עבודה עם 18 מניפסטים שנוצר במהלך שש מערכות בחירות האחרונות בבריטניה, בנואה ועמיתיו השתמשו הפיצול-apply-לשלב אסטרטגיה עם עובדי שוק עבודה מיקרו-משימה (Amazon Mechanical Turk ו- CrowdFlower הם דוגמאות של שוקי העבודה מיקרו-משימה; במשך יותר על שוקי העבודה מיקרו-משימה, ראה פרק 4). החוקרים לקחו כל מניפסט ולפצל אותו לתוך משפטים. לאחר מכן, דירוג אדם היה מוחל על כל משפט. בפרט, אם המשפט מעורב הצהרת מדיניות, זה קודד בשני מישורים: כלכלי (מ מאוד משמאל לימין מאוד) וחברתי (מ ליברלי שמרני) (איור 5.5). כל משפט קודד בכ -5 אנשים שונים. לבסוף, דירוגים אלה אוחדו באמצעות מודל סטטיסטי היווה היא תופעות rater פרט קושי תופעות משפט. בסך הכל, Benoit ועמיתיו אספו 200,000 דירוגים מכ -1,500 עובדים.

איור 5.5: Coding בסכימה בנואה et al. (2015) (איור 1).

איור 5.5: Coding בסכימה Benoit et al. (2015) (איור 1).

על מנת להעריך את איכות קידוד הקהל, בנואה ועמיתיו גם היו כ -10 מומחים-מרצים וסטודנטים לתארים מתקדמים במדעי מדינה ממדרגה אותה המנשרים באמצעות הליך דומה. למרות הרייטינג מחברי הקהל היה יותר משתנה מ הרייטינג מהמומחים, דירוג קהל הקונצנזוס היה הסכם יוצא דופן עם דירוג מומחה קונסנסוס (איור 5.6). השוואה זו מראה כי, כמו עם חיות גלקסי, פרויקטי חישוב אדם יכולים להפיק תוצאות באיכות גבוהות.

איור 5.6: הערכות מומחים (ציר x) וערכות קהל (ציר y) היו בהסכמה יוצאת דופן כאשר קידוד 18 מניפסטי צד מן בריטניה (בנואה ואחות 2015.). המניפסטים המקודדים היו משלושה מפלגות (קונסרבטיבית, לייבור, ליברל-דמוקרטים) ושש בחירות (1987, 1992, 1997, 2001, 2005, 2010).

איור 5.6: הערכות מומחים (ציר x) וערכות קהל (ציר y) היו בהסכמה יוצאת דופן כאשר קידוד 18 מניפסטי צד מן בריטניה (Benoit et al. 2015) . המניפסטים המקודדים היו משלושה מפלגות (קונסרבטיבית, לייבור, ליברל-דמוקרטים) ושש בחירות (1987, 1992, 1997, 2001, 2005, 2010).

בונים על תוצאה זו, בנואה ועמיתיו השתמשו במערכת קהל קידוד שלהם לצורך מחקר זה היה בלתי אפשרי עם פרויקט המניפסט. לדוגמה, פרויקט המניפסט לא לקודד מנשרים בנושא ההגירה כי לא היה נושא בולט כאשר ערכת קידוד פותחה באמצע 1980. וגם, בשלב זה, הוא מעשי מבחינה לוגיסטית עבור פרויקט המניפסט לחזור מחדש קוד המניפסטים שלהם כדי ללכוד את המידע הזה. לכן, נראה כי חוקרים מעוניינים ללמוד את הפוליטיקה של הגירה נמצאים מחוץ מזל. עם זאת, בנואה חוקרים הצליחו להשתמש במערכת חישוב האדם שלהם לעשות קידוד-אישית זו מחקרם שאלה-במהירות ובקלות.

על מנת ללמוד את מדיניות הגירה, הם מקודדים מניפסטים במשך שמונה צדדים בבחירות 2010 בבריטניה. כל משפט בכל מניפסט קודד באשר לשאלה האם זה קשור להגירה, ואם כן, האם זה היה חוקי הגירה פרו, ניטראלי, או-הגירה אנטי. בתוך 5 שעות של השקת הפרויקט שלהם, התוצאות היו. הם אספו יותר מ -22,000 תגובות בעלות כוללת של 360 $. יתר על כן, ההערכות מהקהל הראו הסכם יוצא דופן עם סקר מוקדם של מומחים. לאחר מכן, כמבחן סופי, חודשים מאוחר יותר, החוקרים לשכפל קהל הקידוד שלהם. תוך כמה שעות, הם יצרו בסיס נתוני קהל בקידוד חדש מקרוב ותואם נתוני הקהל בקידוד המקורי שלהם. במילים אחרות, חישוב אדם אפשרה להם ליצור קידוד של טקסטים פוליטיים כי הסכים עם הערכות מומחה והיה לשחזור. יתרה מזאת, מאחר חישוב האדם היה מהיר וזול, זה היה קל להם אישית איסוף הנתונים שלהם שאלו המחקר הספציפי שלהם על הגירה.