2.3 Common feartan mòr dàta

Big tobraichean dàta buailteach a bhith deich feartan; tha cuid mhath airson rannsachadh sòisealta agus tha cuid dona.

Ma tha luchd-rannsachaidh a tha a 'dol a bhith ag ionnsachadh bho mòr dàta nach robh iad a' cruthachadh no a 'cruinneachadh, an uair sin, feumaidh iad a thuigsinn feartan coitcheann aige. Seach a bhith a 'gabhail an àrd-chabhsair le àrd-chabhsair dòigh-obrach (me, seo dè dh'fheumas tu airson fios mu Twitter, seo dè dh'fheumas tu airson fios mu Ghoogle rannsachadh dàta, msaa), tha mi a' dol a 'toirt cunntas deich coitcheann feartan mòr dàta, feartan a dh'èireas oir an dàta nach robh a chruthachadh airson adhbhar rannsachadh sòisealta. Le bhith a '-àtha air ais bho na mion-fhiosrachadh mu gach siostam sònraichte agus a' coimhead air feartan coitcheann sin, gheibh luchd-rannsachaidh luath tuilleadh ionnsachadh mu mar-thà tobraichean dàta is daingeann aig seata de bheachdan a chur an sàs san àm ri teachd tobraichean dàta.

Mi ga fhaighinn cuideachail buidheann feartan dhà sheòrsa:

  • math san fharsaingeachd airson rannsachadh: mòr, daonnan-air, neo-mheasaichte
  • fharsaingeachd droch airson rannsachadh: neo-choileanta, ruigsinneach, neo-riochdaire, 'falbh le gaoith, algorithmically confounded, ruigsinneach, salach, agus mothachail

San fharsaingeachd, tha an riaghaltas clàran rianachd nas lugha neo-riochdaire, nas lugha algorithmically confounded, agus nas lugha phleitichean. Air an làimh eile, gnothachas clàran rianachd buailteach a bhith nas motha agus nas daonnan air.