2.3 Karatteristiċi komuni ta 'data kbar

Sorsi ta 'dejta kbar għandhom tendenza li jkollhom għaxar karatteristiċi; xi wħud huma tajbin għal riċerka soċjali u xi wħud huma ħżiena.

Jekk ir-riċerkaturi ser jitgħallmu minn data kbar li huma ma joħolqu jew jiġbru, allura dawn għandhom jifhmu karatteristiċi ġenerali tiegħu. Pjuttost milli jieħdu pjattaforma minn approċċ pjattaforma (pereżempju, hawn hu dak li għandek bżonn tkun taf dwar Twitter, hawn hu dak li għandek bżonn tkun taf dwar id-data tat-tiftix Google, eċċ), jien ser tiddeskrivi għaxar karatteristiċi ġenerali ta 'data kbar, il-karatteristiċi li jistgħu jinqalgħu għaliex id-data ma kienet maħluqa għall-iskop ta 'riċerka soċjali. Permezz pass lura mill-dettalji ta 'kull sistema partikolari u tħares lejn dawn il-proprjetajiet ġenerali, ir-riċerkaturi jistgħu malajr jitgħallmu aktar dwar is-sorsi ta' dejta eżistenti u jkollhom sett soda ta 'ideat li japplikaw għal sorsi ta' data fil-futur.

Jien jsibuha utli għall-grupp tal-karatteristiċi f'żewġ kategoriji:

  • ġeneralment tajba għar-riċerka: big, dejjem fuq, mhux reattiv
  • ġeneralment ħażin għal riċerka: mhux kompluta, inaċċessibbli, mhux rappreżentattiva, riesqa, algorithmically mħawwda, inaċċessibbli, maħmuġin, u sensittivi

B'mod ġenerali, ir-rekords amministrattivi tal-gvern huma inqas mhux rappreżentattiva, inqas algorithmically mħawwda, u inqas jgħumu. Min-naħa l-oħra, ir-rekords amministrattivi tan-negozji għandhom tendenza li jkunu akbar u aktar dejjem fuq.