2.3 Caratteristiche comuni dei Big Data

Fonti di dati Big tendono ad avere dieci caratteristiche; alcuni sono buoni per la ricerca sociale e alcuni sono cattivi.

Se i ricercatori stanno per imparare dai grandi di dati che non hanno creato o raccolgono, allora devono capire le sue caratteristiche generali. Piuttosto che prendere una piattaforma approccio piattaforma (ad esempio, ecco quello che c'è da sapere su Twitter, ecco quello che dovete sapere su dati di ricerca di Google, ecc), ho intenzione di descrivere le dieci caratteristiche generali dei big data, caratteristiche che si presentano poiché i dati non è stato creato a fini di ricerca sociale. Facendo un passo indietro dai dettagli di ogni particolare sistema e guardando queste proprietà generali, i ricercatori possono imparare rapidamente di più su fonti di dati esistenti e hanno una serie di società di idee da applicare alle fonti di dati futuri.

Trovo utile per raggruppare le caratteristiche in due categorie:

  • generalmente buona per la ricerca: grande, always-on, non reattivo
  • generalmente male per la ricerca: incompleta, inaccessibile, non rappresentativo, alla deriva, algoritmicamente confusi, inaccessibile, sporco, e sensibile

In linea di massima, di governo registri amministrativi sono meno non rappresentativo, meno algoritmicamente confusi, e meno alla deriva. D'altro canto, archivi amministrativi aziendali tendono ad essere più grandi e più sempre attiva.