2.3 10 מאפיינים משותפים של נתונים גדולים

מקורות נתונים גדולים נוטים להיות מספר מאפיינים משותפים; חלקם טובים בדרך כלל למחקר חברתי וחלקם בדרך כלל רע.

למרות כל מקור נתונים גדול הוא מובחן, זה מועיל לשים לב כי ישנם מאפיינים מסוימים נוטים להתרחש שוב ושוב. לכן, במקום לנקוט בגישה לפלטפורמת פלטפורמה (לדוגמה, הנה מה שאתה צריך לדעת על טוויטר, הנה מה שאתה צריך לדעת על נתוני חיפוש של Google, וכו '), אני הולך לתאר עשר תכונות כלליות של גדול מקורות מידע. צעד לאחור מן הפרטים של כל מערכת מסוימת, מסתכל על המאפיינים הכלליים האלה מאפשר לחוקרים ללמוד במהירות על מקורות נתונים קיימים יש קבוצה של רעיונות מוצקים ליישם את מקורות הנתונים שייווצרו בעתיד.

אף על פי שהמאפיינים הרצויים של מקור נתונים תלויים במטרה המחקרית, אני מוצא את זה מועיל לקבץ את המאפיינים של עשר קטגוריות לשתי קטגוריות רחבות:

  • בדרך כלל מועיל למחקר: גדול, תמיד על, ולא פעיל
  • בדרך כלל בעייתי למחקר: לא שלם, בלתי נגיש, לא מייצג, נסחף, מבולבל אלגוריתמי, מלוכלך, רגיש

כפי שאני מתאר את המאפיינים האלה תוכל להבחין כי הם נוטים לעתים קרובות כי מקורות נתונים גדולים לא נוצרו לצורך המחקר.