2.3 Common tabia ya data kubwa

Big data vyanzo huwa na kuwa na sifa kumi; baadhi ni nzuri kwa ajili ya utafiti wa kijamii na baadhi ni mbaya.

Kama watafiti ni kwenda kujifunza kutoka data kubwa kwamba hawakuwa kujenga au kukusanya, basi lazima kuelewa sifa yake kwa ujumla. Badala ya kuchukua jukwaa na jukwaa mbinu (kwa mfano, hapa ni nini unahitaji kujua kuhusu Twitter, hapa ni nini unahitaji kujua kuhusu data search Google, nk), mimi nina kwenda kwa kuelezea sifa kumi ya jumla ya data kubwa, sifa ambayo yanatokea kwa sababu data hakuumbwa kwa lengo la utafiti wa kijamii. By wanazidi nyuma kutoka maelezo ya kila mfumo fulani na kuangalia mali hizi kwa ujumla, watafiti wanaweza haraka kujifunza zaidi kuhusu vyanzo zilizopo data na kuwa imara seti ya mawazo kuomba vyanzo baadaye data.

Mimi sioni ni manufaa kwa kundi sifa katika makundi mawili:

  • nzuri kwa ujumla kwa ajili ya utafiti: kubwa, daima-on, mashirika yasiyo ya tendaji
  • ujumla mbaya kwa ajili ya utafiti: incomplete, inaccessible, mashirika yasiyo ya mwakilishi, drifting, algorithmically kuhangaika, inaccessible, chafu, na nyeti

Kiujumla, serikali kumbukumbu ya utawala ni chini zisizo mwakilishi, chini algorithmically fadhaa, na kidogo drifting. Kwa upande mwingine, biashara kumbukumbu ya utawala huwa na kuwa kubwa na zaidi daima-on.