3.6 Undersøgelser knyttet til store datakilder

Sammenkædning af undersøgelser til store datakilder giver dig mulighed for at producere estimater, der ville være umulige for hver enkelt datakilde individuelt.

De fleste undersøgelser er stand-alone, selvstændig indsats. De bygger ikke på hinanden, og de udnytter ikke alle de andre data, der findes i verden. Dette vil ændre sig. Der er kun for meget at vinde ved at forbinde undersøgelsesdata til de store datakilder, der er omtalt i kapitel 2. Ved at kombinere disse to typer data er det ofte muligt at gøre noget, der var umuligt for hver enkelt enkeltperson.

Der er et par forskellige måder, hvorpå undersøgelsesdata kan kombineres med store datakilder. I dette afsnit beskriver jeg to tilgange, som er nyttige og særskilte, og jeg kalder dem beriget spørger og forstærket spørger (figur 3.12). Selv om jeg vil illustrere hver tilgang med et detaljeret eksempel, skal du erkende, at disse er generelle opskrifter, som kan bruges sammen med forskellige typer undersøgelsesdata og forskellige typer store data. Desuden skal du bemærke, at hvert af disse eksempler kunne ses på to forskellige måder. Tænker tilbage til ideerne i kapitel 1, vil nogle mennesker se disse undersøgelser som eksempler på "custommade" undersøgelsesdata, der forbedrer "readymade" store data, og andre vil se dem som eksempler på "readymade" store dataforbedrende "custommade" undersøgelsesdata. Du skal kunne se begge visninger. Endelig bør du bemærke, hvordan disse eksempler tydeliggør, at undersøgelser og store datakilder er komplementer og ikke erstatter.

Figur 3.12: To måder at kombinere store datakilder og undersøgelsesdata med. I beriget spørgsmålet (afsnit 3.6.1) har den store datakilde en kerneforanstaltning af interesse, og undersøgelsesdataene bygger den nødvendige sammenhæng omkring den. I forstærket spørgning (afsnit 3.6.2) har den store datakilde ikke en kerneforanstaltning af interesse, men den bruges til at forstærke undersøgelsesdataene.

Figur 3.12: To måder at kombinere store datakilder og undersøgelsesdata med. I beriget spørgsmålet (afsnit 3.6.1) har den store datakilde en kerneforanstaltning af interesse, og undersøgelsesdataene bygger den nødvendige sammenhæng omkring den. I forstærket spørgning (afsnit 3.6.2) har den store datakilde ikke en kerneforanstaltning af interesse, men den bruges til at forstærke undersøgelsesdataene.