3.6 Проучвания, свързани с големи източници на данни

Свързването на проучвания с големи източници на данни ви позволява да изготвяте прогнози, които биха били невъзможни с всеки отделен източник на данни.

Повечето проучвания са самостоятелни, самостоятелни усилия. Те не се основават един на друг и не се възползват от всички други данни, които съществуват в света. Това ще се промени. Достатъчно е да се спечелят, като се свържат данните от изследванията с големите източници на данни, разгледани в глава 2. Чрез комбинирането на тези два вида данни често е възможно да се направи нещо, което е невъзможно за всеки от тях.

Съществуват няколко различни начина, по които данните от изследванията могат да бъдат комбинирани с големи източници на данни. В този раздел ще опиша два подхода, които са полезни и различни и аз ще ги наричам обогатени, питащи и разширяващи се питат (фигура 3.12). Въпреки че аз ще илюстрирам всеки подход с подробен пример, трябва да признаете, че това са общи рецепти, които могат да се използват с различни видове данни от проучвания и различни видове големи данни. Освен това трябва да забележите, че всеки един от тези примери може да се разглежда по два различни начина. Като се замислим за идеите в глава 1, някои хора ще видят тези проучвания като примери за "потребителски" данни от проучвания, които ще увеличат "готовите" големи данни, а други ще ги видят като примери за "готови" големи данни, увеличаващи "потребителски" данни от изследванията. Трябва да можете да виждате и двете гледни точки. И накрая, трябва да забележите как тези примери изясняват, че проучванията и големите източници на данни са допълнения, а не заместители.

Фигура 3.12: Два начина за комбиниране на големи източници на данни и данни от проучвания. В обогатеното запитване (раздел 3.6.1) големият източник на данни има основна мярка за интерес и данните от изследването изграждат необходимия контекст около него. При разширен въпрос (раздел 3.6.2) големият източник на данни няма основна мярка за интерес, но се използва за разширяване на данните от изследването.

Фигура 3.12: Два начина за комбиниране на големи източници на данни и данни от проучвания. В обогатеното запитване (раздел 3.6.1) големият източник на данни има основна мярка за интерес и данните от изследването изграждат необходимия контекст около него. При разширен въпрос (раздел 3.6.2) големият източник на данни няма основна мярка за интерес, но се използва за разширяване на данните от изследването.