3.4.1 संभाव्यता नमूना: डेटा एकत्रीकरण डेटा विश्लेषण

वजन हेतुपुरस्सर नमूना प्रक्रिया झाल्याने माहित पूर्ववत करू शकता.

संभाव्यता नमुने त्या सर्व लोकांना ज्ञात, विना-शून्य समावेश संभाव्यता आहेत, आणि सोपा संभाव्यता नमूना डिझाइन सोपे जेथे प्रत्येक व्यक्ती समावेश समान संभाव्यता आहे यादृच्छिक नमूना आहे. सर्वेक्षणात परिपूर्ण अंमलबजावणी (उदा, å ​​या त्रुटी आणि-नसलेले प्रतिसाद) सोपे यादृच्छिक नमूना द्वारे निवडले जातात तेव्हा, कारण नमुना-येईल लोकसंख्या एक सूक्ष्म आवृत्ती सरासरी-असेल तर मग अंदाज सोपे आहे.

साधे यादृच्छिक नमूना क्वचितच सराव मात्र, वापरली जाते. उलट, संशोधक हेतुपुरस्सर खर्च कमी करण्यासाठी आणि वाढ अचूकता ऑर्डर मध्ये समावेश असमान संभाव्यता लोकांना निवडा. संशोधक हेतुपुरस्सर समावेश विविध संभाव्यतेची लोकांना निवडा, तेव्हा ऍडजस्ट नमूना प्रक्रिया झाल्याने माहित पूर्ववत करण्यासाठी आवश्यक आहेत. दुसऱ्या शब्दांत, आम्ही एक नमुना सामान्य विधान करणे कसे नमुना कसे निवड झाली अवलंबून असते.

उदाहरणार्थ, चालू लोकसंख्या सर्वेक्षण (CPS) बेकारी दर अंदाज अमेरिकन सरकारने वापरले जाते. बद्दल 100,000 लोक मुलाखत आहेत, प्रत्येक महिन्यात, एकतर फेस-टू-फेस, फोन, आणि परिणाम अंदाज बेकारी दर निर्मिती करण्यासाठी वापरले जातात. सरकार प्रत्येक राज्यात बेकारी दर अंदाज करण्याची इच्छा कारण, की लहान लोकसंख्या (उदा, र्होड आयलंड) आणि मोठ्या लोकसंख्या असलेल्या राज्यातील अनेक राज्यांमध्ये खूप काही सर्वेक्षणात उत्पन्न होईल कारण तो प्रौढ एक साधी यादृच्छिक नमुना करू शकत नाही (उदा , कॅलिफोर्निया). त्याऐवजी, विविध दरात विविध राज्यांमध्ये CPS नमुने लोक, एक प्रक्रिया निवड असमान संभाव्यता थराथराने रचलेला नमूना म्हणतात. उदाहरणार्थ, CPS 2,000 सर्वेक्षणात होते राज्य प्रति, नंतर र्होड आयलंड प्रौढ कॅलिफोर्निया मध्ये प्रौढ पेक्षा समावेश जवळपास 30 पट जास्त शक्यता आहे (र्होड आयलंड: कॅलिफोर्निया वि प्रति 800,000 प्रौढ 2,000 सर्वेक्षणात: 2,000 प्रति 30,000,000 प्रौढ सर्वेक्षणात). आपण नंतर पाहणार आहोत, असमान संभाव्यता नमूना या प्रकारची खूप डेटा ऑनलाइन स्रोत घडते, पण CPS विपरीत, नमूना यंत्रणा सहसा ज्ञात किंवा संशोधक नियंत्रित नाही.

त्याच्या नमूना डिझाइन दिले, CPS थेट अमेरिकन प्रतिनिधी नाही; तो र्होड आयलंड पासून बरेच लोक आणि कॅलिफोर्निया पासून खूप काही समाविष्ट आहे. म्हणून, तो नमुना बेरोजगारीचे प्रमाण देशातील बेकारी दर अंदाज करणे मूर्खपणाचे ठरेल. त्याऐवजी नमुना क्षुद्र, तो वेटेड क्षुद्र, वजन खरं खाते जेथे र्होड आयलंड लोक कॅलिफोर्निया पासून लोक जास्त समाविष्ट करणे अधिक शक्यता होते की घेणे अधिक चांगले आहे. उदाहरणार्थ, कॅलिफोर्निया पासून प्रत्येक व्यक्ती असेल ते अंदाज आणि प्रत्येक र्होड आयलंड पासून जाईल व्यक्ती अधिक मोजू लागलो upweighted- downweighted-ते अंदाज कमी मोजू लागलो. थोडक्यात, आपण जाणून घेण्यासाठी शक्यता कमी आहे त्या लोकांना अधिक आवाज दिले आहेत.

या खेळण्यांचे उदाहरण स्पष्ट एक महत्त्वाचे पण सामान्यपणे गैरसमज ठिकाण: एक नमुना चांगला अंदाज निर्मिती करण्यासाठी लोकसंख्या एक सूक्ष्म आवृत्ती असल्याचे गरज नाही. पुरेसा डेटा संकलित कसे याबद्दल ओळखले जाते, तर मग नमुना अंदाज घेताना माहिती वापरले जाऊ शकते. दृष्टिकोन मी फक्त वर्णन आणि आहे शास्त्रीय संभाव्यता नमूना चौकटीत प्रामाणिकपणे मी तांत्रिक गणितीयदृष्ट्या वर्णन परिशिष्ट-येते. आता, मी त्याच कल्पना नसलेल्या संभाव्यता नमुने लागू केले जाऊ शकते कसे दर्शवू.