2.3 Gemeinsame Merkmale der großen Daten

Große Datenquellen sind in der Regel zehn Merkmale aufweisen; einige sind gut für Sozialforschung und einige sind schlecht.

Wenn Forscher von großen Daten lernen werden, dass sie nicht schaffen oder zu sammeln, dann müssen sie ihre allgemeinen Eigenschaften zu verstehen. Anstatt eine Plattform Plattform Ansatz (zB hier, was Sie über Twitter wissen müssen, ist hier, was müssen Sie über Google-Suchdaten wissen, etc.), werde ich zehn allgemeine Merkmale der großen Daten zu beschreiben, Eigenschaften, die entstehen, weil die Daten nicht zum Zwecke der Sozialforschung erstellt. Durch ein Schritt zurück von den Details jedes einzelnen Systems und Blick auf diesen allgemeinen Eigenschaften können die Forscher schnell mehr über vorhandene Datenquellen erfahren und haben eine feste Reihe von Ideen für zukünftige Datenquellen anzuwenden.

Ich finde es hilfreich Gruppe die Eigenschaften in zwei Kategorien:

  • im Allgemeinen gut für die Forschung: groß, always-on, nicht reaktiv
  • im Allgemeinen schlecht für die Forschung: unvollständig, nicht zugänglich, nicht repräsentative, treiben, algorithmisch verwechselt, unzugänglich, schmutzig und sensibel

Im Großen und Ganzen sind staatliche Verwaltungsakten weniger nicht-repräsentativen, weniger algorithmisch verwechselt, und weniger Driften. Auf der anderen Seite, Geschäftsverwaltungsunterlagen sind in der Regel größer und immer-on zu sein.