2.4.1 דברי ספירה

ספירה פשוט יכולה להיות מעניינת אם משלב שאלה טובה עם נתונים טובים.

אף על פי שמדובר בשפה מתוחכמת, הרבה מחקרים חברתיים הם פשוט סופרים דברים. בעידן של נתונים גדולים, החוקרים יכולים לספור יותר מתמיד, אבל זה לא אומר שהם צריכים פשוט להתחיל לספור באקראי. במקום זאת, החוקרים צריכים לשאול: מה הדברים שווים לספור? זה אולי נראה כמו עניין סובייקטיבי לחלוטין, אבל יש כמה דפוסים כלליים.

לעתים קרובות התלמידים מניעים לספור את המחקר שלהם באומרו: אני הולך לספור משהו שאף אחד מעולם לא נחשב לפני כן. לדוגמה, סטודנט יכול לומר כי אנשים רבים למדו מהגרים ואנשים רבים למדו תאומים, אבל אף אחד לא למד תאומים מהגרים. מניסיוני, אסטרטגיה זו, שאני מכנה מוטיבציה בהיעדר , אינה מובילה בדרך כלל למחקר טוב. מוטיבציה על ידי היעדרות היא כמו להגיד שיש חור שם, ואני הולך לעבוד קשה מאוד כדי למלא את זה. אבל לא כל חור צריך להיות מלא.

במקום להניע בהיעדר, אני חושב שאסטרטגיה טובה יותר היא לחפש שאלות מחקר שחשובות או מעניינות (או באופן אידיאלי). שני המונחים האלה קצת קשה להגדיר, אבל אחת הדרכים לחשוב על מחקר חשוב היא שיש לו השפעה או הזנה מדידה להחלטה חשובה של קובעי המדיניות. לדוגמה, מדידת שיעור האבטלה חשובה משום שהיא מהווה אינדיקטור למשק המניע החלטות מדיניות. באופן כללי, אני חושב שלחוקרים יש תחושה די טובה לגבי מה שחשוב. אז, בשאר סעיף זה, אני הולך לספק שתי דוגמאות שבהן אני חושב לספור מעניין. בכל מקרה, החוקרים לא היו סופרים באופן מקרי; במקום זאת, הם ספרו הגדרות מאוד מיוחדות אשר חשפו תובנות חשובות לרעיונות כלליים יותר על האופן שבו פועלות מערכות חברתיות. במילים אחרות, הרבה מה שעושה את התרגילים הספורטיביים האלה מעניין הוא לא את הנתונים עצמם, זה בא מן הרעיונות האלה יותר כללי.

דוגמה אחת של כוח פשוט של ספירה מגיע מחקר של הנרי פרבר (2015) על התנהגות של נהגי מוניות בניו יורק. למרות שהקבוצה הזאת לא נשמעת מעניינת מטבעם, זהו אתר מחקר אסטרטגי לבדיקת שתי תיאוריות מתחרות בכלכלת העבודה. לצורכי מחקרו של פרבר, קיימות שתי תכונות חשובות לגבי סביבת העבודה של נהגי המוניות:) 1 (השכר לשעה משתנה מתדירות יומית, בהתבסס על גורמים כמו מזג האוויר,) 2 (מספר השעות שהם העבודה יכולה להשתנות בכל יום בהתאם להחלטות שלהם. תכונות אלה להוביל לשאלה מעניינת על הקשר בין שכר לשעה שעות עבד. מודלים ניאו-קלאסיים בכלכלה צופים כי נהגי מוניות יעבדו יותר בימים שבהם יש להם שכר לשעה גבוה יותר. לחלופין, מודלים מכלכלה התנהגותית צופים בדיוק את ההפך. אם הנהגים קובעים יעד הכנסה מסוים - נניח 100 $ ליום - ועובדים עד שהיעד הזה יתקיים, נהגים יסיימו לעבוד פחות שעות בימים שהם מרוויחים יותר. לדוגמה, אם היית מפרנס יעד, אתה עלול בסופו של דבר עובד ארבע שעות ביום טוב (25 $ לשעה) וחמש שעות ביום רע (20 $ לשעה). אז, האם נהגים עובדים יותר שעות על שעות עם שכר גבוה יותר לשעה (כפי שחזו על ידי מודלים neoclassical) או יותר שעות על ימים עם שכר לשעה נמוך יותר (כפי שחזה על ידי מודלים כלכליים התנהגותיים)?

כדי לענות על שאלה זו קיבל פרבר נתונים על כל נסיעה במונית שצולמו על ידי מוניות בניו יורק בשנים 2009 עד 2013, נתונים זמינים כעת לציבור. נתונים אלה - שנאספו על ידי מטרים אלקטרוניים כי העיר דורשת מוניות להשתמש - כוללים מידע על כל נסיעה: זמן להתחיל, להתחיל מיקום, זמן סיום, מיקום סוף, הנסיעה, וטיפ (אם טיפ שולם באמצעות כרטיס אשראי) . בעזרת נתוני מוניות אלו, פרבר מצא שרוב הנהגים עובדים יותר בימים שבהם השכר גבוה יותר, בהתאם לתיאוריה הניאו-קלאסית.

בנוסף לממצא עיקרי זה, פרבר היה מסוגל להשתמש בגודל הנתונים כדי להבין טוב יותר את ההטרוגניות ואת הדינמיקה. הוא מצא שבמשך הזמן, נהגים חדשים יותר לומדים בהדרגה לעבוד שעות רבות יותר בימי השכר הגבוה (למשל, הם לומדים להתנהג בהתאם לדגם הניאו-קלאסי). ונהגים חדשים שמתנהגים יותר כמטפחי יעד נוטים יותר להפסיק לנהג מוניות. שני הממצאים האלה עדינים יותר, אשר מסייעים להסביר את ההתנהגות הנצפית של הנהגים הנוכחי, היו אפשריים רק בגלל הגודל של הנתונים. לא ניתן היה להבחין במחקרים קודמים שהשתמשו בגיליונות של גליונות נייר ממספר מצומצם של נהגי מוניות לאורך זמן קצר (Camerer et al. 1997) .

המחקר של פרבר היה קרוב לתרחיש המקרה הטוב ביותר עבור מחקר באמצעות מקור נתונים גדול, כי הנתונים שנאספו על ידי העיר היו די קרוב לנתונים שפרבר היה אוסף (הבדל אחד הוא כי פרבר היה רוצה נתונים על סך הכל שכר פארס בתוספת עצות, אבל נתוני העיר כלל רק טיפים המשולמים על ידי כרטיס אשראי). עם זאת, הנתונים לבד לא היו מספיק. המפתח למחקרו של פרבר העלה שאלה מעניינת לנתונים, שאלה שיש לה השלכות רחבות יותר מעבר למסגרת ספציפית זו.

דוגמה שנייה לספירת דברים באה ממחקר של גארי קינג, ג'ניפר פאן ומולי רוברטס (2013) על צנזורה מקוונת של ממשלת סין. במקרה זה, עם זאת, החוקרים היו צריכים לאסוף את הנתונים הגדולים שלהם והם היו צריכים להתמודד עם העובדה כי הנתונים שלהם היה שלם.

קינג ועמיתיו היו מונעים על ידי העובדה כי הודעות מדיה חברתית בסין מצונזרים על ידי מנגנון המדינה העצום, כי הוא חשב לכלול עשרות אלפי אנשים. חוקרים ואזרחים, לעומת זאת, יש תחושה מועטה של ​​איך צנזורה אלה להחליט איזה תוכן צריך להימחק. חוקרים של סין למעשה יש ציפיות סותרות על אילו סוגים של הודעות הם הסיכוי הטוב ביותר לקבל נמחק. יש הסבורים כי הצנזורים מתמקדים בפוסטים ביקורתיים כלפי המדינה, בעוד אחרים חושבים שהם מתמקדים בפוסטים המעודדים התנהגות קולקטיבית, כגון מחאות. הבנת אילו ציפיות אלה נכונה יש השלכות על איך חוקרים מבינים סין וממשלות סמכותיות אחרות העוסקות בצנזורה. לכן, קינג ועמיתיו רצו להשוות בין פרסומים שפורסמו ונמחקו לאחר מכן עם פרסומים שפורסמו ומעולם לא נמחקו.

איסוף הודעות אלה מעורבים במבצע ההנדסי המדהים של זחילה יותר מ -1,000 אתרים-כל מדיה החברתית סיניים עם דף אחרים פריסות-מציאת הודעות רלוונטיות, ולאחר מכן בחינה מחדש הודעות אלה כדי לראות אילו מכן נמחקו. בנוסף לבעיות הנדסיות הנורמליות הקשורים-זחילת אינטרנט בקנה מידה גדולה, הפרויקט הזה היה האתגר הוסיף כי זה היה צריך להיות מהר מאוד כי הודעות צנזורה רבות נלקחות למטה בתוך פחות מ -24 שעות. במילים אחרות, הסורק איטי יחמיץ המון הודעות כי צונזרו. יתר על כן, הסורקים נאלצו לעשות את כל אוסף נתונים אלה תוך התחמקות זיהוי פן אתרי מדיה החברתית לחסום את הגישה או אחר לשנות את מדיניותן בתגובת המחקר.

עם השלמת המשימה הנדסה מסיבית זו, קינג ועמיתיו השיגו כ -11 מיליון נושאים ב -85 נושאים שונים, שכל אחד מהם היה בעל רמת רגישות משוערת. לדוגמה, נושא רגישות גבוהה הוא Ai Weiwei, האמן הפורש; נושא של רגישות באמצע הוא הערכה פיחות של המטבע הסיני, ונושא של רגישות נמוכה היא גביע העולם. מתוכם 11 מיליון הודעות, כ -2 מיליון צונזרו. באופן מפתיע למדי, קינג ועמיתיו גילו כי הודעות בנושאים רגישים במיוחד צונזרו רק לעתים מעט יותר מאשר הודעות על נושאים של רגישות בינונית ונמוכה. במילים אחרות, הצנזורה הסינית נוטה לצנזר פוסט שמזכיר את Ai Weiwei כתפקיד שמזכיר את המונדיאל. ממצאים אלה אינם תומכים ברעיון שהממשלה מצנזרת את כל הנושאים בנושאים רגישים.

חישוב פשוט זה של שיעור הצנזורה לפי נושא יכול להיות מטעה, עם זאת. לדוגמה, הממשלה עלולה לצנזר פרסומים התומכים ב- Ai Weiwei, אך יש להשאיר פוסטים ביקורתיים לגביו. על מנת להבדיל בין הודעות יותר בזהירות, החוקרים היו צריכים למדוד את הרגש של כל הודעה. למרבה הצער, למרות עבודה רבה, שיטות אוטומטיות לחלוטין של זיהוי רגש באמצעות מילונים קיימים עדיין אינם טובים מאוד במצבים רבים (לחשוב על הבעיות יצירת ציר הזמן הרגשי של 11 בספטמבר 2001 מתואר בסעיף 2.3.9). לכן, קינג ועמיתיו נזקקו לדרך לתייג את ה -11 מיליון ההודעות החברתיות שלהם, האם הם (1) מבקרים את המדינה, (2) תומכים במדינה, או (3) דיווחים לא רלוונטיים או עובדתיים על האירועים. זה נשמע כמו עבודה מסיבית, אבל הם פתרו את זה באמצעות טריק חזק כי הוא נפוץ במדעי הנתונים, אך נדיר למדי במדעי החברה: למידה בפיקוח ; ראה איור 2.5.

ראשית, בשלב הנקרא בדרך כלל עיבוד מוקדם , החוקרים העבירו את הפוסטים של מדיה חברתית למטריצה ​​של מונח מסמך , שם היתה שורה אחת עבור כל מסמך ועמודה אחת, אשר רשמה אם ההודעה מכילה מילה מסוימת (למשל, מחאה או תנועה) . לאחר מכן, קבוצה של עוזרי מחקר יד שכותרתו את הרגש של מדגם של הודעות. לאחר מכן, הם השתמשו בנתונים אלה שכותרתם היד כדי ליצור מודל למידה של מכונה שיכול להסיק את הרגש של פוסט המבוסס על מאפייניו. לבסוף, הם השתמשו במודל זה כדי להעריך את הרגש של כל 11 מיליון הודעות.

לכן, במקום קריאה ידנית ותיוג של 11 מיליון הודעות - אשר יהיה בלתי אפשרי מבחינה לוגיסטית - קינג ועמיתיו תייגו ידנית מספר קטן של פוסטים ולאחר מכן השתמשו בלמידה מבוקרת כדי להעריך את הרגש של כל ההודעות. לאחר השלמת הניתוח, הם הצליחו להסיק, כי באופן מפתיע למדי, ההסתברות של פוסט שנמחק אינה קשורה לשאלה האם היא ביקורתית על המדינה או תומכת במדינה.

איור מס '2.5: סכימה פשוטה של ​​הפרוצדורה שבה משתמשים המלך, פאן ורוברטס (2013) כדי להעריך את הרגש של 11 מיליון פרסומים בתקשורת החברתית הסינית. ראשית, בשלב של עיבוד מוקדם, החוקרים העבירו את הפוסטים של המדיה החברתית למטריצה ​​של מסמכים (ראה Grimmer and Stewart (2013) לקבלת מידע נוסף). שנית, הם קידדו את רגשותיהם של מדגם קטן של עמדות. שלישית, הם הכשירו מודל למידה מבוקר כדי לסווג את הרגש של עמדות. רביעית, הם השתמשו במודל הלמידה המפוקח כדי להעריך את הרגש של כל המשרות. ראה המלך, פאן, רוברטס (2013), נספח ב 'לתיאור מפורט יותר.

איור מס '2.5: סכימה פשוטה של ​​הפרוצדורה שבה משתמשים King, Pan, and Roberts (2013) כדי להעריך את הרגש של 11 מיליון פרסומים בתקשורת החברתית הסינית. ראשית, בשלב של עיבוד מוקדם , החוקרים העבירו את הפוסטים של המדיה החברתית למטריצה ​​של מסמכים (ראה Grimmer and Stewart (2013) לקבלת מידע נוסף). שנית, הם קידדו את רגשותיהם של מדגם קטן של עמדות. שלישית, הם הכשירו מודל למידה מבוקר כדי לסווג את הרגש של עמדות. רביעית, הם השתמשו במודל הלמידה המפוקח כדי להעריך את הרגש של כל המשרות. ראה King, Pan, and Roberts (2013) , נספח ב 'לתיאור מפורט יותר.

בסופו של דבר גילו קינג ועמיתיו כי רק שלושה סוגים של פוסטים מצונזרים באופן קבוע: פורנוגרפיה, ביקורת על צנזורים ואלה שיש להם פוטנציאל פעולה קולקטיבי (כלומר, האפשרות להוביל להפגנות רחבות היקף). על ידי התבוננות במספר עצום של פוסטים שנמחקו ופוסטים שלא נמחקו, יכלו קינג ועמיתיו ללמוד כיצד הצנזורים עובדים רק על ידי צפייה וספירה. יתר על כן, הבשר על נושא שיתרחש לאורך הספר הזה, גישת הלמידה הממוחשבת שהשתמשו בה - תיוג ידני של כמה תוצאות ולאחר מכן בניית מודל הלמידה של מכונה לתיוג השאר - מתברר כמקובל מאוד במחקר חברתי בעידן הדיגיטלי . תוכלו לראות תמונות דומות מאוד לאיור 2.5 בפרקים 3 (תשובות לשאלות) ו- 5 (יצירת שיתוף פעולה המוני); זהו אחד הרעיונות המעטים המופיעים בפרקים רבים.

דוגמאות אלה - התנהגותם של נהגי מוניות בניו יורק וצורת הצנזורה של המדיה החברתית של הממשלה הסינית - מראים כי ספירה פשוטה יחסית של מקורות נתונים גדולים יכולה, במקרים מסוימים, להוביל למחקר מעניין וחשוב. בשני המקרים, עם זאת, החוקרים היו צריכים להביא שאלות מעניינות למקור הנתונים הגדול; הנתונים עצמם לא הספיקו.