2.3 Δέκα κοινά χαρακτηριστικά των μεγάλων δεδομένων

Οι μεγάλες πηγές δεδομένων τείνουν να έχουν ορισμένα κοινά χαρακτηριστικά. μερικές είναι γενικά καλές για κοινωνική έρευνα και μερικές είναι γενικά κακές.

Παρόλο που κάθε μεγάλη πηγή δεδομένων είναι ξεχωριστή, είναι χρήσιμο να παρατηρήσετε ότι υπάρχουν ορισμένα χαρακτηριστικά που τείνουν να εμφανίζονται ξανά και ξανά. Ως εκ τούτου, αντί να ακολουθήσετε μια προσέγγιση πλατφόρμας με πλατφόρμα (π.χ., εδώ τι πρέπει να ξέρετε για το Twitter, εδώ είναι τι πρέπει να ξέρετε για τα δεδομένα αναζήτησης Google κ.λπ.), πρόκειται να περιγράψω δέκα γενικά χαρακτηριστικά των μεγάλων πηγές δεδομένων. Η απόσπαση από τις λεπτομέρειες κάθε συγκεκριμένου συστήματος και η εξέταση αυτών των γενικών χαρακτηριστικών επιτρέπει στους ερευνητές να ενημερώνονται γρήγορα για τις υπάρχουσες πηγές δεδομένων και να έχουν ένα σταθερό σύνολο ιδεών για να εφαρμοστούν στις πηγές δεδομένων που θα δημιουργηθούν στο μέλλον.

Παρόλο που τα επιθυμητά χαρακτηριστικά μιας πηγής δεδομένων εξαρτώνται από τον ερευνητικό στόχο, θεωρώ χρήσιμο να ομαδοποιήσω ομαλά τα δέκα χαρακτηριστικά σε δύο ευρείες κατηγορίες:

  • είναι γενικά χρήσιμο για την έρευνα: μεγάλη, πάντα, και μη αντιδραστική
  • γενικά προβληματικές για την έρευνα: ελλιπείς, απρόσιτες, μη αντιπροσωπευτικές, παρασυρόμενες, αλγοριθμικά συγκεχυμένες, βρώμικες και ευαίσθητες

Όπως περιγράφω αυτά τα χαρακτηριστικά, θα παρατηρήσετε ότι προκύπτουν συχνά επειδή δεν δημιουργήθηκαν μεγάλες πηγές δεδομένων για σκοπούς έρευνας.