3.6 Istraživanja povezana s velikim izvorima podataka

Povezivanje anketa s velikim izvorima podataka omogućuje izradu procjena koje su pojedinačno nemoguće s bilo kojim izvorom podataka.

Većina anketa je samostalan, samostalni napor. Oni se međusobno ne grade i ne iskorištavaju sve druge podatke koji postoje u svijetu. To će se promijeniti. Postoji samo previše da se dobije povezivanjem podataka ankete s velikim izvorima podataka koji su razmotreni u poglavlju 2. Kombinirajući ove dvije vrste podataka, često je moguće učiniti nešto što je nemoguće s bilo kojim pojedinačno.

Postoji nekoliko različitih načina na koje se podaci ankete mogu kombinirati s velikim izvorima podataka. U ovom ću odjeljku opisati dva pristupa koji su korisni i različiti, a ja ću ih nazvati obogaćenim pitanjem i pojačanim pitanjem (slika 3.12). Iako ću ilustrirati svaki pristup s detalnim primjerom, trebali biste prepoznati da su to opći recepti koji se mogu koristiti s različitim vrstama podataka ankete i različitim vrstama velikih podataka. Nadalje, trebali biste primijetiti da se svaki od tih primjera može vidjeti na dva različita načina. Razmišljajući o idejama u 1. poglavlju, neki će ljudi pregledavati ove studije kao primjere podataka o "custommade" istraživanju koji povećavaju "spremne" velike podatke, a drugi će ih pogledati kao primjere podataka o "readymade" velikim podacima koji povećavaju podatke "custommade". Trebali biste moći vidjeti oba prikaza. Konačno, trebali biste primijetiti kako ti primjeri pojašnjavaju da su ankete i veliki izvori podataka nadopunjeni, a ne nadomjestakovi.

Slika 3.12: Dva načina kombiniranja velikih izvora podataka i podataka ankete. U obogaćenom pitanju (odjeljak 3.6.1), veliki izvor podataka ima temeljnu mjeru interesa, a podaci ankete grade potrebni kontekst oko nje. U pojačanom pitanju (odjeljak 3.6.2), veliki izvor podataka nema osnovnu mjeru interesa, no koristi se za pojačavanje podataka ankete.

Slika 3.12: Dva načina kombiniranja velikih izvora podataka i podataka ankete. U obogaćenom pitanju (odjeljak 3.6.1), veliki izvor podataka ima temeljnu mjeru interesa, a podaci ankete grade potrebni kontekst oko nje. U pojačanom pitanju (odjeljak 3.6.2), veliki izvor podataka nema osnovnu mjeru interesa, no koristi se za pojačavanje podataka ankete.