2.3 Tien gemeenschappelijke kenmerken van big data

Grote gegevensbronnen hebben meestal een aantal kenmerken gemeen; sommige zijn over het algemeen goed voor sociaal onderzoek en sommige zijn over het algemeen slecht.

Hoewel elke grote gegevensbron verschillend is, is het handig om op te merken dat er bepaalde kenmerken zijn die steeds weer voorkomen. Daarom, in plaats van een platform-per-platform benadering te gebruiken (bijvoorbeeld, hier is wat je moet weten over Twitter, hier is wat je moet weten over Google-zoekgegevens, etc.), ik ga tien algemene kenmerken van grote data bronnen. Door terug te gaan naar de details van elk specifiek systeem en naar deze algemene kenmerken te kijken, kunnen onderzoekers snel informatie inwinnen over bestaande gegevensbronnen en een stevige set ideeën hebben om toe te passen op de gegevensbronnen die in de toekomst zullen worden gemaakt.

Hoewel de gewenste kenmerken van een gegevensbron afhankelijk zijn van het onderzoeksdoel, vind ik het nuttig om de tien kenmerken grofweg te groeperen in twee brede categorieën:

  • over het algemeen nuttig voor onderzoek: groot, altijd actief en niet-reactief
  • over het algemeen problematisch voor onderzoek: onvolledig, ontoegankelijk, niet-representatief, afdrijvend, algoritmisch verward, vies en gevoelig

Terwijl ik deze kenmerken beschrijf, zul je merken dat ze vaak ontstaan ​​omdat big data-bronnen niet voor onderzoek zijn gemaakt.