2.3 Zéng gemeinsame Charakteristiken vu groussen Daten

Déi grouss Datenquelle tendéieren eng Rei vu Charakteristike zesummen. Verschidde sinn normalerweis gutt fir sozialer Fuerschung an e puer sinn normalerweis schlecht.

Och wann all grouss Datenquelle differéiert sinn, ass et hëllefräich ze bemierken datt et gewësse Charakteristiken sinn déi ëmmer erëm an ëmmer erëm geschéien. Daat eescht wéi eng Plattform-by-Plattform Approche (zB hei ass wat Dir braucht iwwer Twitter ze wëssen, ass wat Dir braucht iwwer Google Recherche Daten, etc.), ech sinn 10 generell Charakteristiken vun groussem Datenquellen. Stepping zréck vun de Detailer vun all eenzelne System a kuckt dës allgemenge Charakteristiken erméiglecht sech d'Forscher séier iwwert existente Datenquellen ze léieren an hunn e festen Argument vun der Idee fir d'Datenquelle anzeféieren, déi an Zukunft geschafe ginn.

Och wann d'Wënschkennzorten vun enger Datenquelle vun dem Fuerschungsziel abhängt, fannen ech et hëllefräich ze grujat d'zéng Charakteristiken an zwou grouss Kategorien ze gruppéieren:

  • Allgemeng nëtzlech fir Fuerschung: grouss, ëmmer-on an onreaktiv
  • normalerweis problematesch fir Fuerschung: onkomplett, net zougänglech, nonpresentativ, dréifend, algorithmesch verwiesselt, dreckeg an empfindlech

Wéi ech dës Charakteristiken beschreift, fannt Dir dat se oft entstoen, well grouss Datenquelle net zum Zweck vun der Fuerschung geschaf ginn sinn.