2.3 Үлкен деректердің он жалпы сипаттамасы

Үлкен дерек көздері ортақ бірқатар сипаттамаларға ие болады; кейбіреулер әлеуметтік зерттеулер үшін әдетте жақсы, ал кейбіреулері әдетте жаман.

Әрбір үлкен деректер көзі әртүрлі болса да, қайта-қайта қайталанатын белгілі бір сипаттамалар бар екенін байқаған жөн. Сондықтан платформа-платформа тәсілін емес, (мысалы, Twitter туралы білуіңіз керек нәрсе, Google-дің іздеу деректері туралы не білу керек және т.б.), мен үлкен өлшемдердің он жалпы сипаттамасын сипаттайтын боламын. деректер көздері. Әр нақты жүйенің егжей-тегжейлі мәліметтеріне орай және осы жалпы сипаттамаларға қарап, зерттеушілер қазіргі деректер көздері туралы тез білуге ​​және болашақта жасалатын деректер көздеріне қолданылатын идеялар жиынтығына ие болады.

Деректер көзінің қалаған сипаттамалары зерттеу мақсатына байланысты болса да, он сипаттаманы екі кең топқа қатыстыруға көмектеседі:

  • зерттеуге арналған, әдетте үлкен, үнемі және реактивті емес
  • зерттеу үшін әдетте проблема: толық емес, қол жетімсіз, репрезентативтік емес, ауытқу, алгоритмдік шошытылған, лас және сезімтал

Мен осы сипаттамаларды сипаттайтын болсам, сіз жиі пайда болғанын байқайсыз, себебі үлкен дерек көздері зерттеу мақсатында жасалмаған.