2.1 Introduzzjoni

Fl-istess età, il-ġbir tad-dejta dwar l-imġiba - min jagħmel dak, u meta - kien għali, u għalhekk relattivament rari. Issa, fl-era diġitali, l-imgieba ta 'biljuni ta' nies huma rreġistrati, maħżuna u analizzabbli. Per eżempju, kull darba li tikklikkja fuq websajt, tagħmel sejħa fuq il-mowbajl tiegħek, jew tħallas xi ħaġa bil-karta tal-kreditu tiegħek, rekord diġitali tal-imġieba tiegħek hu maħluq u maħżun minn negozju. Minħabba li dawn it-tipi ta 'data huma prodott sekondarju tal-azzjonijiet ta' kuljum tan-nies, ħafna drabi jissejħu traċċi diġitali . Minbarra dawn it-traċċi miżmuma minn negozji, il-gvernijiet għandhom ukoll dejta sinjifikament għonja dwar kemm in-nies kif ukoll in-negozji. Flimkien dawn in-negozju u r-rekords tal-gvern spiss jissejħu dejta kbira .

L-għargħar dejjem jikber ta 'dejta kbira jfisser li mxejna minn dinja fejn id-dejta tal-imġieba kienet skarsa għal dinja fejn id-dejta tal-imġieba hija abbundanti. L-ewwel pass għat-tagħlim minn informazzjoni kbira qed jirrealizza li huwa parti minn kategorija usa 'ta' dejta li ntużat għal riċerka soċjali għal ħafna snin: data ta 'osservazzjoni . Bejn drabi, id-dejta ta 'osservazzjoni hija kwalunkwe dejta li tirriżulta mill-osservazzjoni ta' sistema soċjali mingħajr ma tintervjeni b'xi mod. Mod mhux tajjeb biex wieħed jaħseb dwarha huwa li d-data ta 'osservazzjoni hija dak kollu li ma jinvolvix tkellem ma' nies (per eżempju, stħarriġ, is-suġġett tal-kapitolu 3) jew ibiddlu l-ambjenti tan-nies (eż. Esperimenti, it-tema tal-kapitolu 4). Għalhekk, minbarra r-rekords tan-negozju u tal-gvern, id-dejta ta 'osservazzjoni tinkludi wkoll affarijiet bħat-test ta' artikli ta 'gazzetti u ritratti bis-satellita.

Dan il-kapitolu għandu tliet partijiet. L-ewwelnett, fis-sezzjoni 2.2, niddeskrivi sorsi kbar ta 'dejta f'aktar dettall u tiċċara differenza fundamentali bejniethom u d-dejta li tipikament intużat għar-riċerka soċjali fil-passat. Imbagħad, fis-sezzjoni 2.3, niddeskrivi għaxar karatteristiċi komuni ta 'sorsi ta' data kbar. Il-fehim ta 'dawn il-karatteristiċi jgħinuk tirrikonoxxi malajr is-saħħiet u n-nuqqasijiet tas-sorsi eżistenti u tgħinek tuża s-sorsi l-ġodda li se jkunu disponibbli fil-futur. Finalment, fit-taqsima 2.4, niddeskrivi tliet strateġiji ewlenin ta 'riċerka li tista' tuża biex titgħallem minn data ta 'osservazzjoni: għadd ta' affarijiet, tbassir ta 'affarijiet u approssimazzjoni ta' esperiment.