2.3 ühisjooned suur andmeid

Big andmeallikate kipuvad olema kümme omadused; mõned on head sotsiaalsed uuringud ja mõned halvad.

Kui teadlased hakkavad õppima suur andmed, et nad ei saa luua või koguda, siis nad peavad mõistma üldisi omadusi. Selle asemel, lennukitüüpide lähenemist (nt siin on, mida sa pead teadma Twitter, siin on, mida sa pead teadma Google otsingu andmed jne), ma lähen, et kirjeldada kümme üldisi omadusi suur andmed, omadused, mis tekivad sest andmed ei ole loodud selleks, et sotsiaalsed uuringud. Astudes tagasi üksikasjad iga konkreetse süsteemi ja vaadates neid üldised omadused, teadlased saavad kiiresti rohkem teada olemasolevate andmeallikate ja on kindel kogum ideid rakendada tulevikus andmeallikaid.

Minu arvates on kasulik grupi omadused kahte kategooriasse:

  • üldiselt hea teadus: suur, alati-, mitte-reaktiivne
  • üldiselt halb teadus: puudulik, ligipääsmatuks, mitte-esindaja, triivib, algoritmide segas, ligipääsmatuks, määrdunud ja tundlik

Laias laastus omavalitsuse andmed on vähem mitteesinduslikuks vähem algoritmide segas ja vähem triivimist. Teiselt poolt, ettevõtte haldus- arvestust kipuvad olema suurem ja alati edasi.