3.6 Обстеження, пов'язані з великими джерелами даних

Поєднання опитувань з великими джерелами даних дає змогу створювати оцінки, які неможливо зробити з кожного джерела даних окремо.

Більшість досліджень є автономними, самостійними зусиллями. Вони не будуються один на одного, і вони не користуються перевагами всіх інших даних, які існують у світі. Це зміниться. Існує забагато, що можна отримати, пов'язавши дані опитування з великими джерелами даних, що розглядаються в главі 2. Поєднання цих двох типів даних часто можна робити те, що було неможливим ні з одним індивідуально.

Існує кілька різних способів, за допомогою яких обстеження можна поєднувати з великими джерелами даних. У цьому розділі я опишу два підходи, корисні та чіткі, і я буду називати їх збагаченими запитами та посиленими запитами (рис. 3.12). Хоча я збираюся ілюструвати кожний підхід з докладним прикладом, ви повинні визнати, що це загальні рецепти, які можна використовувати з різними типами даних опитування та різними типами великих даних. Крім того, ви повинні помітити, що кожен з цих прикладів можна переглянути двома різними способами. Подумавшись про ідеї, наведені в главі 1, деякі люди розглядають ці дослідження як приклади даних "орієнтованого" обстеження, що підвищують "готові" великі дані, а інші розглядають їх як приклади "великогабаритних" даних, що покращують дані "звичайних" даних. Ви повинні мати змогу бачити обидва перегляди. Нарешті, слід зазначити, як ці приклади вказують на те, що обстеження та великі джерела даних є доповненнями, а не замінниками.

Малюнок 3.12: два способи об'єднання великих джерел даних та даних опитування. У збагаченому питанні (розділ 3.6.1) велике джерело даних має основний показник інтересу, а дані опитування створюють необхідний контекст навколо нього. У посиленому питанні (розділ 3.6.2) велике джерело даних не має основного показника інтересу, але воно використовується для посилення даних опитування.

Малюнок 3.12: два способи об'єднання великих джерел даних та даних опитування. У збагаченому питанні (розділ 3.6.1) велике джерело даних має основний показник інтересу, а дані опитування створюють необхідний контекст навколо нього. У посиленому питанні (розділ 3.6.2) велике джерело даних не має основного показника інтересу, але воно використовується для посилення даних опитування.