2.3 Katta ma'lumotlarning o'nta umumiy xususiyatlari

Katta ma'lumot manbalari umumiy xususiyatlar qatoriga egadirlar; ba'zilar odatda ijtimoiy tadqiqotlar uchun yaxshi, ba'zilari odatda yomondir.

Har bir katta ma'lumot manbai har xil bo'lsa-da, takror-takror yuz beradigan muayyan xususiyatlar mavjudligini kuzatish foydali bo'ladi. Shuning uchun, platforma-platforma yondashuvidan ko'ra (masalan, Twitter haqida bilishingiz kerak bo'lgan narsa, Google qidiruv ma'lumotlari haqida bilishingiz kerak bo'lgan narsalar va boshqalar), men katta hajmdagi o'nta umumiy xususiyatlarni tasvirlayman. ma'lumotlar manbalari. Har bir muayyan tizimning tafsilotlarini tiklash va ushbu umumiy xususiyatlarga qarash tadqiqotchilarga mavjud ma'lumotlar manbalari haqida tezda ma'lumot olish va kelajakda yaratilishi kerak bo'lgan ma'lumot manbalariga amal qilish uchun aniq g'oyalar to'plash imkonini beradi.

Agar ma'lumot manbai istalgan xususiyatlar tadqiqot maqsadiga bog'liq bo'lsa-da, men o'nta xususiyatni ikkita toifaga ajratish foydali bo'ladi:

  • odatda tadqiqot uchun foydali bo'ladi: katta, doimo va reaktiv bo'lmagan
  • tadqiqot uchun odatda muammoli: tugallanmagan, erişilemez, vakili bo'lmagan, sürüklenen, algoritmik sifatida karıştırılmış, iflos va sezgir

Men bu xususiyatlarni ta'riflayotgan edim, siz tez-tez kelib turishingizni sezasiz, chunki katta ma'lumot manbalari tadqiqot maqsadida yaratilmagan.