2.3 Saintréithe Coiteann na sonraí mór

Foinsí Big sonraí claonadh go bhfuil deich saintréithe; Tá roinnt mhaith do thaighde sóisialta agus tá cuid acu dona.

Má tá taighdeoirí ag dul a fhoghlaim ó shonraí móra nach raibh siad a chruthú nó a bhailiú, ansin ní mór iad a thuiscint a saintréithe ginearálta. In áit a bheith ag cur ardán le cur chuige ardán (m.sh., a anseo cad is gá duit ar an eolas faoi Twitter, a anseo cad is gá duit ar an eolas faoi sonraí cuardaigh Google, srl), tá mé ag dul chun cur síos deich tréithe ginearálta sonraí mór, saintréithe a thagann chun cinn toisc nach raibh na sonraí a cruthaíodh chun críocha taighde sóisialta. Ag stepping ar ais ó na sonraí faoi gach córas ar leith agus féachaint ar na hairíonna ginearálta, is féidir taighdeoirí níos mó faoi na foinsí sonraí atá ann cheana a fhoghlaim go tapa agus tá sraith daingean de smaointe a chur i bhfeidhm le foinsí sonraí todhchaí.

Bhfaighidh mé chuidiú é a ghrúpáil na saintréithe i dhá chatagóir:

  • go ginearálta go maith do thaighde: mór, i gcónaí-ar, neamh-imoibríoch
  • go ginearálta olc do thaighde: neamhiomlán, inaccessible, neamh-ionadaí, drifting, algorithmically confounded, inaccessible, salach, agus íogair

Tríd is tríd, tá taifid riaracháin rialtais chomh neamh-ionadaí, chomh algorithmically confounded, agus níos lú drifting. Ar an láimh eile, claonadh a bhíonn na taifid riaracháin gnó a bheith níos mó agus níos i gcónaí ar.