3.6 대형 데이터 소스에 연결된 설문 조사

설문 조사를 큰 데이터 소스에 연결하면 두 데이터 소스 중 하나를 사용하여 개별적으로 불가능한 예상치를 산출 할 수 있습니다.

대부분의 설문 조사는 독립적이고 독립적 인 노력입니다. 그들은 서로를 기반으로하지 않으며 세계에 존재하는 다른 모든 데이터를 이용하지 않습니다. 이것은 바뀔 것이다. 설문 조사 데이터를 2 장에서 논의 된 대용량 데이터 소스에 연결하여 얻는 것이 너무 많습니다.이 두 가지 유형의 데이터를 결합하여 둘 중 하나만 사용하면 불가능했던 일을 종종 수행 할 수 있습니다.

설문 조사 데이터를 큰 데이터 소스와 결합 할 수있는 몇 가지 방법이 있습니다. 이 절에서는 유용하고 뚜렷한 두 가지 접근법을 설명 할 것이며, 나는 그것들을 풍부하게 묻고 증폭 시키라고 부탁 할 것이다 (그림 3.12). 각 접근법을 자세한 예제로 설명 하겠지만 이러한 유형은 다양한 유형의 조사 데이터 및 다양한 유형의 큰 데이터와 함께 사용할 수있는 일반적인 방법이라는 것을 알아야합니다. 또한,이 예제들 각각은 두 가지 다른 방식으로 볼 수 있습니다. 제 1 장의 아이디어로 돌아가서 어떤 사람들은 이러한 연구를 "주문 제작"빅 데이터를 향상시키는 "맞춤형"설문 데이터의 예로 보게 될 것이며, 다른 사람들은 이것을 "미리 준비된"대용량 데이터의 "커스텀 제작"설문 데이터로 간주 할 것입니다. 두보기를 모두 볼 수 있어야합니다. 마지막으로, 설문 조사와 빅 데이터 소스가 대체품이 아닌 보완 물이라는 것을이 예제가 어떻게 명확히하는지 알아야합니다.

그림 3.12 : 큰 데이터 소스와 측량 데이터를 결합하는 두 가지 방법. 풍성한 질문 (3.6.1 절)에서 큰 데이터 소스는 핵심 관심 측정 값을 가지며 설문 데이터는 그 주변에 필요한 컨텍스트를 구축합니다. 증폭 된 질문 (3.6.2 절)에서 큰 데이터 소스에는 핵심 관심 측정 값이 없지만 설문 데이터를 증폭하는 데 사용됩니다.

그림 3.12 : 큰 데이터 소스와 측량 데이터를 결합하는 두 가지 방법. 풍성한 질문 (3.6.1 절)에서 큰 데이터 소스는 핵심 관심 측정 값을 가지며 설문 데이터는 그 주변에 필요한 컨텍스트를 구축합니다. 증폭 된 질문 (3.6.2 절)에서 큰 데이터 소스에는 핵심 관심 측정 값이 없지만 설문 데이터를 증폭하는 데 사용됩니다.