3.6 Suurte andmeallikatega seotud uuringud

Uuringute seostamine suurte andmeallikatega võimaldab teil koostada prognoose, mis oleksid võimatu mõne andmeallika eraldi.

Enamik uuringuid on eraldiseisvad, iseseisvad jõupingutused. Nad ei ehitata üksteisele ja nad ei kasuta ära kõiki teisi maailmas olemasolevaid andmeid. See muutub. Uuringute andmete seostamine peatükis 2 käsitletud suurte andmeallikatega on lihtsalt liiga suur. Neid kahte tüüpi andmeid kombineerides on sageli võimalik teha midagi, mis ei olnud üksinda võimatu.

Uuringuandmeid saab kombineerida suurte andmeallikatega paar erinevat moodi. Selles osas kirjeldan ma kahte lähenemisviisi, mis on kasulikud ja eristatavad, ja kutsun neid rikasteks küsides ja võimendades küsimusi (joonis 3.12). Kuigi ma kavatsen illustreerida igat lähenemist üksikasjaliku näitega, peaksite mõistma, et need on üldised retseptid, mida võiks kasutada erinevate uuringuandmete ja eri tüüpi suurte andmetega. Lisaks peaksite tähele panema, et kõiki neid näiteid saab vaadata kahel erineval viisil. Mõeldes 1. peatüki ideedele, vaatavad mõned inimesed neid uuringuid kui "custommade" uuringuandmete näiteid, mis suurendavad "valmistekstina" suuri andmeid, ja teised näevad neid näiteid "valmismaterjali" suurte andmete parandamiseks "custommade" uuringuandmetest. Sa peaksid nägema mõlemat vaadet. Lõpuks peaksite tähele panema, kuidas need näited selgitavad, et uuringud ja suured andmeallikad on täiendused ja mitte asendajad.

Joonis 3.12: kaks võimalust suurte andmeallikate ja uuringuandmete ühendamiseks. Rikastatud küsimisel (punkt 3.6.1) on suur andmeallikas huvipakkuv põhimeede ja uuringuandmed loovad selle ümber vajaliku konteksti. Laiendatud päringus (punkt 3.6.2) ei sisalda suur andmeallikas huvi põhitegurit, vaid seda kasutatakse uuringuandmete täiustamiseks.

Joonis 3.12: kaks võimalust suurte andmeallikate ja uuringuandmete ühendamiseks. Rikastatud küsimisel (punkt 3.6.1) on suur andmeallikas huvipakkuv põhimeede ja uuringuandmed loovad selle ümber vajaliku konteksti. Laiendatud päringus (punkt 3.6.2) ei sisalda suur andmeallikas huvi põhitegurit, vaid seda kasutatakse uuringuandmete täiustamiseks.