3.6 Enquêtes liées aux grandes sources de données

Le fait de lier les enquêtes aux grandes sources de données vous permet de produire des estimations qui seraient impossibles avec l'une ou l'autre source de données individuellement.

La plupart des enquêtes sont des efforts indépendants et autonomes. Ils ne s'appuient pas les uns sur les autres et ils ne tirent pas parti de toutes les autres données qui existent dans le monde. Cela va changer. Il y a tout simplement beaucoup à gagner à lier les données d'enquête aux grandes sources de données discutées au chapitre 2. En combinant ces deux types de données, il est souvent possible de faire quelque chose d'impossible avec l'une ou l'autre.

Les données d'enquête peuvent être combinées de différentes manières avec des sources de données volumineuses. Dans cette section, je décrirai deux approches qui sont utiles et distinctes, et je les appellerai « demande enrichie» et « demande amplifiée» (figure 3.12). Bien que je vais illustrer chaque approche par un exemple détaillé, vous devez reconnaître que ce sont des recettes générales qui pourraient être utilisées avec différents types de données d'enquête et différents types de Big Data. De plus, vous devriez remarquer que chacun de ces exemples pourrait être vu de deux manières différentes. En repensant aux idées du chapitre 1, certaines personnes considéreront ces études comme des exemples de données d'enquête "améliorant" les données volumineuses "readymade", et d'autres les verront comme des exemples de données "améliorées". Vous devriez être capable de voir les deux vues. Enfin, vous devriez remarquer comment ces exemples clarifient que les enquêtes et les sources de données volumineuses sont des compléments et non des substituts.

Figure 3.12: Deux façons de combiner les grandes sources de données et les données d'enquête. Dans la demande enrichie (section 3.6.1), la grande source de données a un intérêt central et les données de l'enquête créent le contexte nécessaire autour d'elle. Dans la demande amplifiée (section 3.6.2), la grande source de données n'a pas de mesure centrale d'intérêt, mais elle est utilisée pour amplifier les données de l'enquête.

Figure 3.12: Deux façons de combiner les grandes sources de données et les données d'enquête. Dans la demande enrichie (section 3.6.1), la grande source de données a un intérêt central et les données de l'enquête créent le contexte nécessaire autour d'elle. Dans la demande amplifiée (section 3.6.2), la grande source de données n'a pas de mesure centrale d'intérêt, mais elle est utilisée pour amplifier les données de l'enquête.