3.6 Uchunguzi unaohusishwa na vyanzo vya data kubwa

Kuunganisha tafiti kwa vyanzo vya data kubwa huwezesha kuzalisha makadirio ambayo haiwezekani kwa chanzo cha data moja kwa moja.

Uchunguzi wengi ni kusimama pekee, jitihada za kibinafsi. Hawana jengo juu ya kila mmoja, na hawatumii faida ya data nyingine zote zilizopo duniani. Hii itabadilika. Kuna mengi tu inayoweza kupatikana kwa kuunganisha data za utafiti kwenye vyanzo vya data vyenye kujadiliwa katika sura ya 2. Kwa kuchanganya aina hizi mbili za data, mara nyingi inawezekana kufanya kitu ambacho haikuwezekana kwa mmoja mmoja.

Kuna njia kadhaa tofauti ambazo data za utafiti zinaweza kuunganishwa na vyanzo vya data kubwa. Katika kifungu hiki, nitaelezea njia mbili zinazofaa na zenye tofauti, na nitawaita kuwa utajiri kuuliza na kukuza kuuliza (takwimu 3.12). Ingawa nitakuelezea kila mbinu na mfano wa kina, unapaswa kutambua kwamba haya ni maelekezo ya jumla ambayo yanaweza kutumika kwa aina tofauti za data za uchunguzi na aina tofauti za data kubwa. Zaidi ya hayo, unapaswa kutambua kwamba kila moja ya mifano hii inaweza kutazamwa kwa njia mbili tofauti. Kukifikiria tena mawazo katika sura ya 1, watu wengine wataona masomo haya kama mifano ya utafiti wa "ulinzi" wa kuimarisha data kubwa, na wengine watawaona kama mifano ya "data tayari" ya kupanua data ya "custommade". Unapaswa kuona maoni yote mawili. Hatimaye, unapaswa kutambua jinsi mifano hizi zinafafanua kwamba uchunguzi na vyanzo vya data vingi vinakamilika na sio wasimamizi.

Kielelezo 3.12: Njia mbili za kuchanganya vyanzo vya data kubwa na data za uchunguzi. Katika kuuliza kustawi (sehemu ya 3.6.1), chanzo kikubwa cha data kina kipimo cha msingi na data ya utafiti hujenga mazingira muhimu karibu na hilo. Katika kupanuliwa kwa kuuliza (kifungu cha 3.6.2), chanzo kikubwa cha data haina kiwango cha msingi cha riba, lakini hutumiwa kuimarisha data ya utafiti.

Kielelezo 3.12: Njia mbili za kuchanganya vyanzo vya data kubwa na data za uchunguzi. Katika kuuliza kustawi (sehemu ya 3.6.1), chanzo kikubwa cha data kina kipimo cha msingi na data ya utafiti hujenga mazingira muhimu karibu na hilo. Katika kupanuliwa kwa kuuliza (kifungu cha 3.6.2), chanzo kikubwa cha data haina kiwango cha msingi cha riba, lakini hutumiwa kuimarisha data ya utafiti.