2.3 Hamar datu handien ezaugarri komunak

Datu-iturri handiak ezaugarri komunak izaten ohi dituzte; Batzuk oso onak dira ikerketa sozialerako eta batzuetan txarrak izaten dituzte.

Datu-iturri handi bakoitza desberdina bada ere, lagungarria da ohartaraztea, behin eta berriro gertatzen diren zenbait ezaugarri direla. Hori dela eta, plataforma-plataforma hurbiltzeaz gain (adibidez, hemen Twitter-en zer den jakin behar duzu, Google-ren bilaketa-datuei buruz jakin behar duzuna, etab.), Hamar ezaugarri nagusiak deskribatuko ditut datu-iturriak. Sistema partikular bakoitzaren xehetasunak atzera eginez eta ezaugarri orokor horiei begiratuz gero, ikertzaileek lehendik dauden datu-iturriak azkar ikasteko aukera ematen dute eta etorkizunean sortutako datu iturriei aplikatzeko ideia multzo sendoa izango dute.

Datu-iturburuaren nahiaren ezaugarriak ikerketa-helburuaren araberakoak badira ere, lagungarria da hamar ezaugarri bi kategoria zabaletan banatzea:

  • Oro har, ikerketarako lagungarria da: handia, beti-onekoa eta ez-erreaktiboa
  • Oro har, ikerketarako arazoak dira: osatu gabeak, eskuraezinak, ez errepresentatiboak, driftingak, algoritmikoki nahastuak, zikinak eta sentikorrak

Ezaugarri hauek deskribatzen dudan bezala, sarritan agertzen direla ikusiko duzu, datu-iturri handiak ez direlako ikerketarako sortu.