3.6 Pesquisas vinculadas a fontes de big data

Vincular pesquisas a grandes fontes de dados permite produzir estimativas que seriam impossíveis com qualquer fonte de dados individualmente.

A maioria das pesquisas é autônoma e independente. Eles não constroem uns sobre os outros e não aproveitam todos os outros dados existentes no mundo. Isso vai mudar. Há muito a ganhar juntando os dados da pesquisa às grandes fontes de dados discutidas no capítulo 2. Combinando esses dois tipos de dados, muitas vezes é possível fazer algo que era impossível com qualquer um deles individualmente.

Existem algumas maneiras diferentes em que os dados da pesquisa podem ser combinados com fontes de big data. Nesta seção, descreverei duas abordagens que são úteis e distintas, e vou chamá-las de perguntas detalhadas e perguntas amplificadas (figura 3.12). Embora ilustre cada abordagem com um exemplo detalhado, você deve reconhecer que essas são receitas gerais que podem ser usadas com diferentes tipos de dados de pesquisa e diferentes tipos de big data. Além disso, você deve notar que cada um desses exemplos pode ser visto de duas maneiras diferentes. Lembrando-nos das ideias do capítulo 1, algumas pessoas verão esses estudos como exemplos de dados de pesquisa “custom made”, aprimorando big data “readymade”, e outros os verão como exemplos de dados de pesquisa “custommade” aprimorados por big data. Você deve poder ver as duas visualizações. Finalmente, você deve observar como esses exemplos esclarecem que pesquisas e fontes de big data são complementos e não substitutos.

Figura 3.12: Duas maneiras de combinar fontes de dados grandes e dados de pesquisa. Na pergunta enriquecida (seção 3.6.1), a grande fonte de dados tem uma medida central de interesse e os dados da pesquisa constroem o contexto necessário em torno dela. Na pergunta amplificada (seção 3.6.2), a grande fonte de dados não possui uma medida central de interesse, mas é usada para amplificar os dados da pesquisa.

Figura 3.12: Duas maneiras de combinar fontes de dados grandes e dados de pesquisa. Na pergunta enriquecida (seção 3.6.1), a grande fonte de dados tem uma medida central de interesse e os dados da pesquisa constroem o contexto necessário em torno dela. Na pergunta amplificada (seção 3.6.2), a grande fonte de dados não possui uma medida central de interesse, mas é usada para amplificar os dados da pesquisa.