2.3.1.3 ללא תגובתי

מדידה היא הרבה פחות סיכוי לשנות התנהגות במקורות נתונים גדולים.

אחד האתגרים של מחקר חברתי הוא שאנשים יכולים לשנות את התנהגותם כשהם יודעים שהם הנצפה על ידי החוקרים. מדעני חברה בדרך כלל קוראים שינוי התנהגות זו בתגובת תגובתיות מדידה החוקרת (Webb et al. 1966) . היבט אחד של נתונים גדולים כי חוקר רבים מוצאים מבטיח הוא כי משתתפים הם בדרך כלל לא מודעים לכך הנתונים שלהם נמצאים בשבי או שהם הפכו כל כך רגילים איסוף נתונים זה שזה כבר לא משנה את ההתנהגות שלהם. כי הם הלא מגיבים, אם כן, מקורות רבים של נתונים גדולים יכולים לשמש כדי לחקור התנהגות שלא הייתה amendable כדי מדידה מדויקת בעבר. לדוגמא, Stephens-Davidowitz (2014) משתמש שכיח במונחים גזעניים שאילתות במנוע חיפוש כדי למדוד איבה גזענית באזורים שונים של ארצות הברית. המגזר השקלי הלא צמוד הגבי גדול (ראה בסעיף הקודם) אופי נתוני החיפוש מופעלת מדידות כי יהיה קשה בשיטות אחרות, כגון סקרים.

ללא תגובתיות, לעומת זאת, אינה מבטיחה כי נתונים אלה הם איכשהו לשקף ישירה של התנהגות או עמדות של אנשים. לדוגמה, כמשיב אחד לא אמר Newman et al. (2011) , "זה לא כל כך אין לי בעיות, אני פשוט לא לשים אותם בפייסבוק." במילים אחרות, אף על פי כמה מקורות נתונים גדולים הם הלא מגיב, הם לא תמיד ללא משוא פנים רצייה חברתית , הנטייה של אנשים לרצות להציג את עצמם בצורה הטובה ביותר האפשרית. יתר על כן, כפי שאתאר להלן יותר, מקורות נתונים אלה לפעמים מושפעים הממטרות בעלי פלטפורמה, בעיה בשם מבלבל אלגוריתמי (המתואר בהמשך).

למרות תגובתיות הלא הוא יתרון עבור מחקר, מעקב אחר ההתנהגות של אנשים ללא ההסכמה ומודעותם מעלה דאגות אתיות בהמשך ובפירוט בפרק 6. תגובת ציבור נגד מעקב דיגיטלי גדל יכול להוביל מערכות נתונים גדולות להיות תגובתי יותר לאורך זמן, וחזק חשש מעקב דיגיטלי אפילו יכול להוביל כמה אנשים לנסות opt-out של מערכות נתונים גדולים לחלוטין, הגדלת חששות לגבי-representativity הלא (המתואר בהמשך).

תכונות טובות שלוש אלה של נתונים גדולים למחקר חברתי-גדול, תמיד-על, ובלתי-פעיל-כלל להתעורר כי המקורות הנ"ל לא נוצרו על ידי חוקרים למחקר. עכשיו, אני אשחזר את השבעה מאפיינים של מקורות נתונים גדולים כי הם רעים למחקר. תכונות אלה גם נוטות להתעורר כי נתונים אלה לא נוצרו על ידי חוקרים למחקר.