2.3 Dez características comúns de grandes datos

Grandes fontes de datos tenden a ter un número de características en común; Algúns xeralmente son bos para a investigación social e algúns xeralmente son malos.

Aínda que cada fonte de datos grande é distinta, é útil notar que hai certas características que tenden a ocorrer unha e outra vez. Polo tanto, no canto de adoptar un enfoque de plataforma por plataforma (por exemplo, aquí tes que saber sobre Twitter, aquí tes que saber sobre os datos de busca de Google, etc.), describiré dez características xerais de grandes fontes de datos. Retomando os detalles de cada sistema particular e observando estas características xerais, os investigadores poden aprender rapidamente sobre as fontes de datos existentes e ter un firme conxunto de ideas para aplicar ás fontes de datos que se crearán no futuro.

Aínda que as características desexadas dunha fonte de datos dependen do obxectivo da investigación, considero útil agrupar as dez características de forma sinxela en dúas grandes categorías:

  • xeralmente útil para a investigación: grande, sempre-on e non reactivo
  • xeralmente problemático para a investigación: incompleta, inaccesible, non representativa, á deriva, algoritmicamente confundida, sucia e sensible

Mentres estou describindo estas características, notarás que a miúdo xorden porque non se crearon grandes fontes de datos para a investigación.