3.6 Průzkumy spojené s velkými zdroji dat

Spojením průzkumů s velkými datovými zdroji můžete vytvářet odhady, které by nebyly možné s individuálním zdrojem dat.

Většina průzkumů je samostatné, samostatné úsilí. Nevystavují se navzájem a nevyužívají všech ostatních dat, které na světě existují. To se změní. Existuje příliš mnoho, co by bylo možné získat spojením údajů z průzkumů s velkými datovými zdroji popsanými v kapitole 2. Spojením těchto dvou typů dat je často možné udělat něco, co bylo nemožné u každého jednotlivého.

Existuje několik různých způsobů, jak lze údaje z průzkumů kombinovat s velkými zdroji dat. V této části budu popisovat dva přístupy, které jsou užitečné a zřetelné, a já jim říkám obohacené otázky a zesílené otázky (obrázek 3.12). Ačkoli se seznámím s každým přístupem s podrobným příkladem, měli byste si uvědomit, že se jedná o obecné recepty, které by mohly být použity s různými typy dat průzkumu a různými typy velkých dat. Dále byste si měli všimnout, že každý z těchto příkladů lze vidět dvěma různými způsoby. Přemýšlejíc zpět o myšlenkách v kapitole 1, někteří lidé budou tyto studie považovat za příklady údajů z "přizpůsobených" průzkumů, které vylepšují "hotové" velké údaje a ostatní je budou považovat za příklady "hotových" velkých údajů zvyšujících "vlastní" průzkumné údaje. Měli byste vidět oba pohledy. Nakonec byste si měli všimnout, jak tyto příklady objasňují, že průzkumy a velké zdroje dat jsou doplňky a nikoli náhradníky.

Obrázek 3.12: Dva způsoby, jak kombinovat velké zdroje dat a údaje z průzkumů. V obohaceném dotazu (oddíl 3.6.1) má velký datový zdroj hlavní měřítko zájmu a údaje z průzkumu vytvářejí kolem něj potřebný kontext. Při zesílené žádosti (oddíl 3.6.2) nemá velký datový zdroj hlavní měřítko zájmu, ale slouží k zesílení údajů z průzkumu.

Obrázek 3.12: Dva způsoby, jak kombinovat velké zdroje dat a údaje z průzkumů. V obohaceném dotazu (oddíl 3.6.1) má velký datový zdroj hlavní měřítko zájmu a údaje z průzkumu vytvářejí kolem něj potřebný kontext. Při zesílené žádosti (oddíl 3.6.2) nemá velký datový zdroj hlavní měřítko zájmu, ale slouží k zesílení údajů z průzkumu.