3.6 Ankiety powiązane z dużymi źródłami danych

Łączenie ankiet z dużymi źródłami danych umożliwia generowanie szacunków, które byłyby niemożliwe dla każdego źródła danych indywidualnie.

Większość ankiet to samodzielne, samodzielne wysiłki. Nie opierają się na sobie nawzajem i nie wykorzystują wszystkich innych danych, które istnieją w świecie. To się zmieni. Łączenie danych z ankiety z dużymi źródłami danych omówionymi w rozdziale 2 daje zbyt wiele do osiągnięcia. Łącząc te dwa typy danych, często można zrobić coś, co było niemożliwe z każdym z nich osobno.

Istnieje kilka różnych sposobów, w jakie dane z badań można łączyć z dużymi źródłami danych. W tej sekcji opiszę dwa podejścia, które są użyteczne i wyraźne, i będę je nazywał wzbogaconymi pytając i wzmacniając pytania (rysunek 3.12). Chociaż zamierzam zilustrować każde podejście za pomocą szczegółowego przykładu, należy uznać, że są to ogólne przepisy, które można stosować w przypadku różnych typów danych ankietowych i różnych typów dużych zbiorów danych. Ponadto należy zauważyć, że każdy z tych przykładów można wyświetlić na dwa różne sposoby. Wracając do pomysłów przedstawionych w rozdziale 1, niektórzy ludzie będą postrzegać te badania jako przykłady "custommade" do zwiększania danych "gotowych" danych, a inni będą je postrzegać jako przykład "gotowych" danych "ankietowych" zwiększających ilość danych. Powinieneś widzieć oba widoki. Na koniec powinieneś zauważyć, jak te przykłady wyjaśniają, że ankiety i duże źródła danych są uzupełnieniami, a nie substytutami.

Rysunek 3.12: Dwa sposoby łączenia dużych źródeł danych i danych ankietowych. W rozszerzonym pytaniu (sekcja 3.6.1) duże źródło danych ma główną miarę zainteresowania, a dane z ankiety budują niezbędny kontekst wokół niego. W pytaniach amplifikowanych (sekcja 3.6.2) duże źródło danych nie ma głównej miary zainteresowania, ale służy do wzmocnienia danych z ankiety.

Rysunek 3.12: Dwa sposoby łączenia dużych źródeł danych i danych ankietowych. W rozszerzonym pytaniu (sekcja 3.6.1) duże źródło danych ma główną miarę zainteresowania, a dane z ankiety budują niezbędny kontekst wokół niego. W pytaniach amplifikowanych (sekcja 3.6.2) duże źródło danych nie ma głównej miary zainteresowania, ale służy do wzmocnienia danych z ankiety.