2.1 Ievads

Analogā vecumā, vācot datus par uzvedību, kas dara to, ko un kad-bija dārgs, un tāpēc salīdzinoši reti. Tagad digitālajā laikmetā tiek ierakstīti, saglabāti un analizējami miljardu cilvēku uzvedības. Piemēram, katru reizi, kad noklikšķināt uz vietnes, veicat zvanu uz savu mobilo tālruni vai maksā par kaut ko ar savu kredītkarti, uzņēmums izveido un uzglabā jūsu uzvedības digitālo ierakstu. Tā kā šie datu veidi ir cilvēku ikdienas darbību blakusprodukts, tos bieži sauc par ciparu pēdas . Papildus šīm uzņēmējdarbības zīmēm, valdībām ir arī neticami bagāti dati gan par cilvēkiem, gan uzņēmumiem. Kopā šos uzņēmumu un valdības ierakstus bieži sauc par lieliem datiem .

Pieaugošo lielo datu plūds nozīmē, ka mēs esam pārcēlušies no pasaules, kurā uzvedības dati ir reti, uz pasauli, kurā ir daudz uzvedības datu. Pirmais solis, lai mācītos no lieliem datiem, ir saprast, ka tā ir daļa no plašākas datu kategorijas, kas jau daudzus gadus tika izmantota sociālajiem pētījumiem: novērojumi . Aptuveni, novērošanas dati ir visi dati, kas iegūti, novērojot sociālo sistēmu, kaut kādā veidā neiejaucoties. Neapstrādāts veids, kā domāt par to, ir tas, ka novērošanas dati ir viss, kas neietver sarunas ar cilvēkiem (piemēram, aptaujas, 3. nodaļas tēma) vai cilvēku vides mainīšana (piemēram, eksperimenti, 4. nodaļas tēma). Tādējādi papildus uzņēmējdarbības un valdības ierakstiem novērojumu dati ietver arī tādas lietas kā laikrakstu rakstu un satelītu fotogrāfijas.

Šajā nodaļā ir trīs daļas. Pirmkārt, 2.2. Sadaļā es detalizētāk raksturoju lielākus datu avotus un noskaidrojot būtisku atšķirību starp tiem un datiem, kas agrāk parasti tika izmantoti sociālajiem pētījumiem. Tad 2.3. Iedaļā es raksturoju desmit kopīgus lielu datu avotu raksturlielumus. Šo pazīmju izpratne ļauj ātri atpazīt esošo avotu stiprās un vājās puses un palīdzēs izmantot jaunos avotus, kas būs pieejami nākotnē. Visbeidzot, 2.4. Sadaļā es raksturoju trīs galvenās pētniecības stratēģijas, kuras var izmantot, lai mācītos no novērošanas datiem: lietu skaitīšana, lietu prognozēšana un eksperimenta tuvināšana.