2.3 Ten karatteristiċi cumuni di grande dati

L'altri fonti di dati speriennu à avè parechji caratteristiche in cumuni; certi sò in generale per a ricerca suciali è parechji sò in generale perchè male.

Ancu chì ogni grande fonti di dati hè distinta, hè d'utile per vede chì ci sò parechje caratteristiche chì tendenu per occurrence sempre è sempre. Dunque, invece di piglià un accostu per una piattaforma pattu (per esempiu, quì hè ciò chì deve bisognu di u Twitter, quì hè ciò chì deve sapere di circa data di ricerca di Google, etc.) vi va a descrizanu deci caratteri generali di grande fonti di dati. Trascendendu da i dati di ogni sistema particulare è guardà e cose di e caractere generale permette à i furmulari attualmente amparate infurmazioni di e fonti di dati è anu un'infigurazioni firmata di l'idee per applicà à i fonti di dati chì sò creati in u futuru.

Ancu chì i caractères desitgiati di una basa di dati dependenu di l'ugnunu di ricerca, averi aiutà à aghjunghje intruduce i ten caratteristiche in dui larghe categurie:

  • ghjinirali assistenza per a ricerca: grande, sempre-on e nonreactive
  • in generale problema per a ricerca: incomplete, inaccessibile, nonrepresentative, drifting, algorithmically confused, dirty, and sensitive

Quand'e dissenu i caratteristiche averebbe bisognu chì sò spessu sviluppate perchè e grande fonti di dati ùn sò micca criati per u scopu di a ricerca.