2.3 Dek komunaj trajtoj de grandaj datumoj

Grandaj datumaj fontoj kutime havas multajn trajtojn; iuj ĝenerale estas bonaj por socia esplorado kaj iuj ĝenerale estas malbonaj.

Kvankam ĉiu granda fonto de datumoj estas klara, ĝi estas helpema rimarki, ke ekzistas iuj trajtoj, kiuj kutimas okazi denove kaj denove. Sekve, anstataŭ preni platformon al platformo (ekzemple, jen kion vi bezonas scii pri Twitter, jen kion vi bezonas scii pri Google serĉaj datumoj, ktp.) Mi priskribos dek ĝeneralajn trajtojn de grandaj datumaj fontoj. Reveninte de la detaloj de ĉiu aparta sistemo kaj rigardante ĉi tiujn ĝeneralajn trajtojn ebligas esploristojn rapide lerni pri ekzistantaj datumaj fontoj kaj havi firman aron de ideoj apliki al la datumaj fontoj, kiuj estos kreitaj en la estonteco.

Eĉ kvankam la dezirataj trajtoj de datuma fonto dependas de la esplora celo, mi trovas ĝin helpema kruele kolekti la dek karakterizaĵojn en du larĝajn kategoriojn:

  • ĝenerale helpema por esplorado: granda, ĉiam-kaj ne neactiva
  • ĝenerale problema por esplorado: nekompleta, nealirebla, ne reprezenta, drifanta, algoritme konfuzita, malpura kaj sentema

Kiel mi priskribas ĉi tiujn karakterizaĵojn, vi rimarkos, ke ili ofte ŝprucas ĉar grandaj datumoj ne estis kreitaj por esplorado.