3.6與大數據源相關的調查

將調查鏈接到大數據源使您可以生成單獨使用任一數據源無法進行的估算。

大多數調查都是獨立的,自足的。它們不是相互依賴的,並且它們不利用世界上存在的所有其他數據。這會改變。通過將調查數據與第2章中討論的大數據源相關聯,實在是太多了。通過組合這兩種類型的數據,通常可以單獨使用其中任何一種來完成某些操作。

調查數據可以通過幾種不同的方式與大數據源相結合。在本節中,我將描述兩種有用且不同的方法,我將其稱為豐富的詢問放大的詢問 (圖3.12)。雖然我將通過詳細示例來說明每種方法,但您應該認識到這些是可以與不同類型的調查數據和不同類型的大數據一起使用的一般配方。此外,您應該注意到,可以通過兩種不同的方式查看這些示例中的每一個。回顧第1章中的想法,有些人會將這些研究視為“定制”調查數據增強“現成”大數據的例子,而其他人則將其視為“現成”大數據增強“定制”調查數據的例子。您應該能夠看到兩個視圖。最後,您應該注意到這些示例如何澄清調查和大數據源是補充而非替代。

圖3.12:兩種組合大數據源和調查數據的方法。在豐富的要求(第3.6.1節)中,大數據源具有感興趣的核心度量,並且調查數據圍繞它構建必要的上下文。在放大的詢問(第3.6.2節)中,大數據源沒有感興趣的核心指標,但它用於放大調查數據。

圖3.12:兩種組合大數據源和調查數據的方法。在豐富的要求(第3.6.1節)中,大數據源具有感興趣的核心度量,並且調查數據圍繞它構建必要的上下文。在放大的詢問(第3.6.2節)中,大數據源沒有感興趣的核心指標,但它用於放大調查數據。