2.3 Ciri-ciri umum dari data yang besar

Sumber data yang besar cenderung memiliki sepuluh karakteristik; beberapa yang baik untuk penelitian sosial dan beberapa buruk.

Jika peneliti akan belajar dari data besar bahwa mereka tidak membuat atau mengumpulkan, maka mereka harus memahami karakteristik umum. Daripada mengambil platform dengan pendekatan platform yang (misalnya, inilah yang perlu Anda ketahui tentang Twitter, inilah yang perlu Anda ketahui tentang data pencarian Google, dll), saya akan menggambarkan sepuluh karakteristik umum data besar, karakteristik yang muncul karena data tidak diciptakan untuk tujuan penelitian sosial. Dengan mundur dari rincian setiap sistem tertentu dan melihat sifat-sifat umum, peneliti dapat dengan cepat mempelajari lebih lanjut tentang sumber data yang ada dan memiliki satu set kuat dari ide-ide untuk diterapkan ke sumber data masa depan.

Saya merasa terbantu untuk kelompok karakteristik menjadi dua kategori:

  • umumnya baik untuk penelitian: besar, selalu-on, non-reaktif
  • umumnya buruk untuk penelitian: lengkap, tidak dapat diakses, non-perwakilan, melayang, algoritma bingung, tidak dapat diakses, kotor, dan sensitif

Secara garis besar, catatan administrasi pemerintah kurang non-perwakilan, kurang algoritme bingung, dan kurang drifting. Di sisi lain, catatan administrasi bisnis cenderung lebih besar dan lebih selalu-on.