2.3 Gemeinsam Charakteristiken vun grouss Daten

Big Datequellen éischter ten Eegenschaften ze hunn; e puer sinn gutt fir sozial Fuerschung an e puer sinn schlecht.

Wann Fuerscher aus grouss Daten ze léieren vouse datt se net gemaach schafen oder sammelen, da mussen se hir allgemeng Eegenschaften verstoen. Anstatt eng Plattform vun Plattform Approche huelen (zB, hei ass dat, wat Dir iwwer Twitter ze kennen muss, hei ass wat muss Dir iwwer google Donnéeën wëssen, etc), dann ginn ech ten allgemeng Eegenschaften vun grouss Daten ze beschreiwen, Charakteristiken déi sech well d'Donnéeën war net fir den Zweck vun der sozialer Recherche geschaf. Vun Hand zréck aus der Detailer vun all bestëmmte System a gesäis dës allgemeng Eegeschaften, kann Fuerscher séier méi iwwer bestehend Datequellen léieren an hunn eng Firma Formatioun vun Iddien fir Zukunft Daten Quellen ze gëllen.

Ech fannen et hëllefräich ze Grupp d'Charakteristiken an zwou Kategorien:

  • generell gutt fir Fuerschung: grouss, ëmmer-wollt, Net-reaktiv
  • meeschtens schlecht fir Fuerschung: onkomplett, onzougänglechen, Net-Vertrieder, vergin, algorithmically verwiesselt, onzougänglechen, dreckeg a sensibel

Groussen schwätzen, sinn Regierung administrative records manner Net-Vertrieder, manner algorithmically verwiesselt, a manner vergin. Wéinst dem Betrib administrative records éischter méi grouss a méi ëmmer-iwwert gin.