2.1 Uvod

U analognom dobu, prikupljanje podataka o ponašanju-ko šta kad-je skupo, i zbog toga, relativno rijetke. Sada, u digitalnom dobu, ponašanja milijardi ljudi snimaju, čuvaju, i analyzable. Na primjer, svaki put kliknete na web stranici, uputili poziv na vaš mobilni telefon, ili platiti nešto s vaše kreditne kartice, digitalni zapis vaše ponašanje kreira i skladišti posao. Jer ovi podaci su nusproizvod svaki dan akcije ljudi, oni se često nazivaju digitalnim tragova. Pored ovih tragove drži biznisa, vlade imaju neverovatno bogate podatke o kako ljudi i poslovanja, podaci koji je često digitalizirana i analyzable. Zajedno ove poslovne i vladine evidencije se često nazivaju Big Data.

U stalno raste poplava velikih podataka znači da smo prešli iz svijeta gdje je bilo malo u svijetu u kojem je u izobilju u ponašanju podataka u ponašanju. Ali, jer ovi podaci vrste su relativno novi, nesrećni broj istraživanja pomoću njih izgleda kao naučnici slijepo juri dostupnih podataka. U ovom poglavlju, umjesto toga, nudi principijelan pristup za razumijevanje različitih izvora podataka i kako se mogu koristiti. Ovo bogatije razumijevanje treba pomoći da bolje odgovara vašim istraživanje pitanja odgovarajućih izvora podataka. Ili, ako je takva postojećih izvora nedostaju, uvjeriti da prikupe svoju podatke koristeći ideje u budućnosti poglavljima.

A prvi korak u učenju iz velike količine podataka je da se shvati da je to dio šireg kategorije podataka koji se koristi za društvena istraživanja za mnogo godina: posmatranja podataka. Grubo, posmatranja podataka je svaki podatak koji proizlazi iz posmatranja društveni sistem bez intervencije na neki način. A sirove način razmišljanja o tome je da opservacijskih podataka je sve ono što ne uključuje razgovor sa ljudima (npr, ankete, na temu Poglavlje 3) ili promjena okruženja ljudi (npr, eksperimenti, tema poglavlje 4). Tako je, pored poslovne i vladine evidencije, posmatranja podataka uključuje stvari kao što su tekst novinskih članaka i satelitski snimci.

Ovo poglavlje ima tri dijela. Prvo, u poglavlju 2.2, opisujem Big Data detaljnije i pojasni osnovna razlika između njega i podaci koji su uglavnom koriste za društvena istraživanja u prošlosti. Zatim, u poglavlju 2.3, opisujem deset zajedničke karakteristike velikih izvora podataka. Razumijevanje ove karakteristike nam omogućava da brzo prepoznati prednosti i slabosti postojećih izvora i da će nam pomoći da iskoriste nove izvore koji će biti kreiran u budućnosti. Konačno, u točki 2.4, opisujem tri glavne istraživačke strategije koje možete koristiti za naučiti iz posmatranja podataka: brojanje stvari, predviđanje stvari, i približavanju eksperiment.