3.6 मोठ्या डेटा स्रोतांशी निगडित सर्वेक्षण

मोठ्या डेटा स्त्रोतांकडे सर्वेक्षण करणे आपल्याला डेटा स्त्रोताशी वैयक्तिकरित्या अशक्य असणारे अंदाज तयार करण्यास सक्षम करते.

बहुतेक सर्वेक्षण एकटेच, आत्मनिर्धारित प्रयत्न असतात. ते एकमेकांवर बांधकाम करत नाहीत, आणि ते जगातील इतर सर्व डेटाचा लाभ घेत नाहीत. हे बदलेल. धडा 2 मधील चर्चेतील मोठ्या डेटा स्त्रोतांना सर्वेक्षणाचा डेटा जोडून मिळविण्यावर बरेच काही आहे. या दोन प्रकारांच्या डेटाच्या एकत्रित करून, शक्यतो काहीतरी करणे शक्य आहे जे एकतर वैयक्तिकरित्या अशक्य होते.

मोठ्या प्रमाणात डेटा स्त्रोतांसह सर्वेक्षण डेटा एकत्रित करण्यासाठी विविध प्रकारचे विविध प्रकार आहेत. या विभागात, मी दोन उपयुक्त आणि भिन्न आहेत की पध्दती वर्णन करू, आणि मी समृद्ध विचारून त्यांना कॉल आणि विचारत (आकृती 3.12) अभाव करू. मी प्रत्येक दृष्टिकोनास सविस्तर उदाहरणासह स्पष्ट करू इच्छित असलो तरी, आपण असे ओळखले पाहिजे की हे सर्वसाधारण पाककृती आहेत जे विविध प्रकारचे सर्वेक्षण डेटा आणि विविध प्रकारचे मोठ्या डेटासह वापरले जाऊ शकते. पुढे, आपण लक्षात घ्यावे की यातील प्रत्येक उदाहरणे दोन वेगवेगळ्या प्रकारे पाहिली जाऊ शकतात. अध्याय 1 मध्ये दिलेल्या कल्पनांवर विचार करताना, काही लोक या अभ्यासांना "रेडीमेड" मोठे डेटा वाढविणारे "सानुकूल" सर्वेक्षणाचे डेटा आणि "रेडीमेड" मोठ्या डेटाचे "कस्टमाइडेड" सर्वेक्षण डेटा सुधारण्यासाठी उदाहरणे म्हणून पाहतील. आपण दोन्ही दृश्ये पाहू शकणार पाहिजे. सरतेशेवटी, या उदाहरणे स्पष्ट करतात की सर्वेक्षणे आणि मोठे डेटा स्रोत पूरक आहेत आणि त्याऐवजी वापरलेले नाहीत.

आकृती 3.12: मोठे डेटा स्रोत आणि सर्वेक्षण डेटा एकत्रित करण्याचे दोन मार्ग. समृद्ध गोष्टींविषयी (विभाग 3.6.1), मोठ्या डेटा स्रोताकडे मूळ व्याप्ती आहे आणि सर्वेक्षण डेटा त्याच्या जवळपास आवश्यक संदर्भ तयार करतो. विस्तारित विचारणा (विभाग 3.6.2) मध्ये, मोठ्या डेटा स्त्रोतामध्ये स्वारस्याचा एक मुख्य उपाय नाही, परंतु त्याचा सर्वेक्षण डेटा वाढविण्यासाठी वापरला जातो.

आकृती 3.12: मोठे डेटा स्रोत आणि सर्वेक्षण डेटा एकत्रित करण्याचे दोन मार्ग. समृद्ध गोष्टींविषयी (विभाग 3.6.1), मोठ्या डेटा स्रोताकडे मूळ व्याप्ती आहे आणि सर्वेक्षण डेटा त्याच्या जवळपास आवश्यक संदर्भ तयार करतो. विस्तारित विचारणा (विभाग 3.6.2) मध्ये, मोठ्या डेटा स्त्रोतामध्ये स्वारस्याचा एक मुख्य उपाय नाही, परंतु त्याचा सर्वेक्षण डेटा वाढविण्यासाठी वापरला जातो.