2.3 Datu big ezaugarri komunak

Big datuak iturri joera hamar ezaugarriak izan ditzan; zenbait ikerketa sozial ona eta batzuk txarra.

Ikertzaileek dira datuak big ikasi zuen ez dutela sortu edo biltzeko bada, orduan bere ezaugarri orokorrak ulertu behar dute. Baizik plataforma bat hartzeko plataforma hurbilketa egitea baino (adibidez, hemen zer Twitter buruz jakin behar duzu, hona hemen zer Google bilaketa-datuak, etab buruz jakin behar duzun), hamar datuak big ezaugarri orokorrak, sortzen diren ezaugarriak deskribatzeko noa delako datuak ez zen gizarte ikerketaren helburuarekin sortu. atzeratuz sistema partikular bakoitzaren xehetasunak eta propietate orokor horiek begira, ikertzaile azkar ikasi, dauden datuak iturri gehiago eta etorkizunean datu-iturri aplikatzeko ideia multzo sendoa.

lagungarria bi kategoriatan ezaugarriak talde aurkitu dut:

  • Oro har, ikerketa ona: big, beti-on, ez-erreaktiboa
  • oro har, txarra ikerketa egiteko: osatu gabe, eskuraezinak, ez adierazgarri, Drifting algoritmoen nahasturik, eskuraezinak, zikin, eta sentikorra

Oro har, gobernu erregistro administratiboak gutxiago ez adierazgarri, gutxiago algorithmically nahasturik, eta mugimendu azkarreko gutxiago dira. Bestalde, enpresa erregistro administratiboak joera handiagoa eta izan beti-orrian.