3.6 बड़े डेटा स्रोतों से जुड़े सर्वेक्षण

बड़े डेटा स्रोतों पर सर्वेक्षणों को जोड़ने से आप उन अनुमानों का उत्पादन कर सकते हैं जो व्यक्तिगत रूप से डेटा स्रोत के साथ असंभव होंगे।

अधिकांश सर्वेक्षण स्टैंड-अलोन, स्वयं निहित प्रयास हैं। वे एक दूसरे पर निर्माण नहीं करते हैं, और वे दुनिया में मौजूद सभी अन्य डेटा का लाभ नहीं उठाते हैं। यह बदल जाएगा। सर्वेक्षण डेटा को अध्याय 2 में चर्चा किए गए बड़े डेटा स्रोतों से जोड़कर प्राप्त करने के लिए बहुत कुछ है। इन दो प्रकार के डेटा को संयोजित करके, अक्सर ऐसा करना संभव होता है जो किसी एक के साथ असंभव था।

कुछ अलग-अलग तरीके हैं जिनमें सर्वेक्षण डेटा को बड़े डेटा स्रोतों के साथ जोड़ा जा सकता है। इस खंड में, मैं दो दृष्टिकोणों का वर्णन करूंगा जो उपयोगी और विशिष्ट हैं, और मैं उन्हें समृद्ध पूछता हूं और पूछताछ बढ़ाता हूं (आंकड़ा 3.12)। हालांकि मैं एक विस्तृत उदाहरण के साथ प्रत्येक दृष्टिकोण को चित्रित करने जा रहा हूं, आपको यह समझना चाहिए कि ये सामान्य व्यंजन हैं जिनका उपयोग विभिन्न प्रकार के सर्वेक्षण डेटा और विभिन्न प्रकार के बड़े डेटा के साथ किया जा सकता है। इसके अलावा, आपको ध्यान रखना चाहिए कि इनमें से प्रत्येक उदाहरण दो अलग-अलग तरीकों से देखा जा सकता है। अध्याय 1 में विचारों पर विचार करते हुए, कुछ लोग इन अध्ययनों को "रीडीमेड" सर्वेक्षण डेटा के उदाहरण के रूप में "रेडीमेड" बड़े डेटा के उदाहरण के रूप में देखेंगे, और अन्य उन्हें "रेडीमेड" के बड़े डेटा को "कस्टममेड" सर्वेक्षण डेटा बढ़ाने के उदाहरण के रूप में देखेंगे। आप दोनों विचारों को देखने में सक्षम होना चाहिए। अंत में, आपको ध्यान देना चाहिए कि ये उदाहरण कैसे स्पष्ट करते हैं कि सर्वेक्षण और बड़े डेटा स्रोत पूरक हैं और प्रतिस्थापन नहीं हैं।

चित्र 3.12: बड़े डेटा स्रोतों और सर्वेक्षण डेटा को गठबंधन करने के दो तरीके। समृद्ध पूछने (धारा 3.6.1) में, बड़े डेटा स्रोत में ब्याज का मूल उपाय होता है और सर्वेक्षण डेटा इसके आसपास आवश्यक संदर्भ बनाता है। बढ़ी हुई पूछताछ (धारा 3.6.2) में, बड़े डेटा स्रोत में ब्याज का मूल उपाय नहीं होता है, लेकिन इसका उपयोग सर्वेक्षण डेटा को बढ़ाने के लिए किया जाता है।

चित्र 3.12: बड़े डेटा स्रोतों और सर्वेक्षण डेटा को गठबंधन करने के दो तरीके। समृद्ध पूछने (धारा 3.6.1) में, बड़े डेटा स्रोत में ब्याज का मूल उपाय होता है और सर्वेक्षण डेटा इसके आसपास आवश्यक संदर्भ बनाता है। बढ़ी हुई पूछताछ (धारा 3.6.2) में, बड़े डेटा स्रोत में ब्याज का मूल उपाय नहीं होता है, लेकिन इसका उपयोग सर्वेक्षण डेटा को बढ़ाने के लिए किया जाता है।