2.3 מאפיינים משותפים של נתונים גדולים

מקורות נתונים גדולים נוטים להיות בעלי עשר תכונות; חלקם טובים למחקר חברתי וחלקם רעים.

אם חוקרים הולכים ללמוד מנתונים גדולים כי הם לא ליצור או לאסוף, אז הם חייבים להבין את המאפיינים הכלליים שלה. במקום לקחת פלטפורמה ידי גישת פלטפורמה (למשל, הנה מה שאתם צריכים לדעת על טוויטר, הנה מה שאתה צריך לדעת בנוגע לנתוני חיפוש Google, וכו '), אני הולך לתאר עשרה מאפיינים כלליים של נתונים גדולים, מאפיינים המתעוררים כיוון שהנתונים לא נברא לצורך המחקר החברתי. על ידי צעידה לאחור מן הפרטים של כל מערכת מסוימת ומביטים מאפיינים הכלליים אלה, חוקרים יכולים לקבל מידע נוסף לגבי מקורות נתונים קיימים ויש לי במבנה איתן של רעיונות לחול על מקורות נתונים עתידיים.

אני מוצא את זה מועיל לקבוצה המאפיינים לשתי קטגוריות:

  • בדרך כלל טוב למחקר: גדול, תמיד-על, הלא מגיב
  • בדרך כלל רע מחקר: שלם, נגיש, לא מייצג, נסחף, מבולבל אלגוריתמי, נגיש, מלוכלך, ורגיש

באופן כללי, רשומות שלטון ומנהל הן פחות ולא מייצגים, פחות מבולבלים אלגוריתמי, ופחות נסחף. מצד השני, רשומים מנהלי עסקים נוטים להיות גדול יותר ויותר תמיד על.