2.3 Zehn gemeinsame Merkmale von Big Data

Große Datenquellen weisen häufig eine Reihe gemeinsamer Merkmale auf. einige sind im Allgemeinen gut für die Sozialforschung und einige sind im Allgemeinen schlecht.

Auch wenn jede große Datenquelle eindeutig ist, ist es hilfreich zu beachten, dass bestimmte Eigenschaften immer wieder auftreten. Anstatt einen Plattform-für-Plattform-Ansatz zu wählen (z. B., was Sie über Twitter wissen sollten, sollten Sie hier über die Google-Suchdaten usw. informiert sein), werde ich zehn allgemeine Merkmale von "Groß" beschreiben Datenquellen. Der Rückgriff auf die Details jedes einzelnen Systems und die Betrachtung dieser allgemeinen Merkmale ermöglichen es den Forschern, sich schnell mit bestehenden Datenquellen vertraut zu machen und eine Reihe von Ideen für die Datenquellen zu entwickeln, die in Zukunft erstellt werden.

Auch wenn die gewünschten Eigenschaften einer Datenquelle vom Forschungsziel abhängen, finde ich es hilfreich, die zehn Merkmale grob in zwei große Kategorien einzuteilen:

  • allgemein hilfreich für die Forschung: groß, ständig aktiv und nicht reaktiv
  • generell problematisch für die Forschung: unvollständig, unzugänglich, nicht repräsentativ, treibend, algorithmisch konfus, dreckig und sensibel

Während ich diese Merkmale beschreibe, werden Sie feststellen, dass sie oft auftreten, weil große Datenquellen nicht für Forschungszwecke erstellt wurden.