2.1 Predstavitev

V analogni dobi, ki zbirajo podatke o vedenju, kaj kdo dela, ko je drago, in zato razmeroma redke. Zdaj, v digitalni dobi, je vedenje milijard ljudi zapisa, shranjevanja in analyzable. Na primer, vsakič, ko boste kliknili na spletni strani, da klic na vaš mobilni telefon, ali plačati za nekaj, s kreditno kartico, je digitalni zapis o svojem vedenju ustvari in shrani podjetja. Ker so ti podatki stranski produkt vsakodnevnih dejanj ljudi, ki jih pogosto imenujemo digitalnih sledi. Poleg teh sledeh, ki jih imajo podjetja, vlade imajo tudi zelo bogate podatke o ljudi in podjetij, podatke, ki so pogosto digitalizira in analyzable. Skupaj so ta podjetja in vladne evidence pogosto imenujejo velike podatkov.

Nenehno naraščajoče poplav velikega podatkov pomeni, da smo se preselili iz sveta, v katerem je bil vedenjski podatki malo na svetu, kjer je vedenjski podatki izdatno. Ampak, ker so ti podatki tipi relativno nov, nesrečno število raziskav, ki jih uporabljajo Izgleda znanstveniki slepo lovijo razpoložljive podatke. To poglavje, namesto, ponuja načelen pristop k razumevanju različnih virov podatkov in kako jih je mogoče uporabiti. To bogatejši razumevanje vam lahko pomagajo bolje ujemajo z vašim raziskovalna vprašanja na ustreznih virov podatkov. Ali pa, če manjkajo takšni obstoječi viri, prepričati, zbrati svoje podatke s pomočjo idej v prihodnjih poglavjih.

Prvi korak k učenju iz velikih podatkov je zavedati, da je del širše kategorije podatkov, ki je bil uporabljen za družbena raziskovanja že več let: opazovalne podatke. Približno, opazovalna podatki so vsi podatki, ki izhaja iz opazovanja socialni sistem, ne posegajo na nek način. Surova način, da razmišljajo o tem, da je opazovalna podatki, vse, kar ne gre v pogovoru z ljudmi (npr raziskovanj temo poglavja 3) ali spreminjajočih se okoljih ljudi (npr, poskusov, je tema poglavja 4). Tako je poleg poslovnih in vladne evidence, opazovalna podatkov vključuje tudi stvari, kot besedila časopisnih člankov in satelitskih fotografij.

To poglavje ima tri dele. Prvič, v točki 2.2, bom opisal veliko podatkov podrobneje in pojasni temeljno razliko med njo in podatkov, ki so bili na splošno uporablja za socialne raziskave v preteklosti. Potem, v oddelku 2.3, bom opisal deset skupnih značilnosti velikih podatkovnih virov. Understanding te značilnosti nam omogoča, da hitro ugotovili prednosti in slabosti obstoječih virov, nam bo pomagalo izkoristiti nove vire, ki bodo ustvarjene v prihodnosti. Nazadnje, v točki 2.4, bom opisal tri glavne raziskovalnih strategij, ki jih lahko uporabite, da se učijo od opazovalne podatkov: štetje stvari, napovedovanje stvari, in približevanje eksperiment.