3.4.1 நிகழ்தகவு மாதிரி: தரவு சேகரிப்பு மற்றும் தரவு பகுப்பாய்வு

எடைகள் வேண்டுமென்றே மாதிரி செயல்முறை ஏற்படும் சிதைவுகள் அகற்றிவிட முடியும்.

நிகழ்தகவு மாதிரிகள் அனைத்து மக்கள் ஒரு அறியப்படுகிறது, அல்லாத பூஜ்ஜியம் சேர்த்து நிகழ்தகவு வேண்டும் எங்கே அந்த உள்ளன, மற்றும் எளிய நிகழ்தகவு மாதிரி வடிவமைப்பு, எளிய ஒவ்வொரு நபர் சேர்த்து சம வாய்ப்பு உள்ளது, அங்கு சீரற்ற மாதிரி இருக்கிறது. பதிலளித்தவர்களில் சரியான மரணதண்டனை (எ.கா., எந்த எல்லை பிழை நிலை இல்லை பதில்) எளிய சீரற்ற மாதிரி வழியாக தேர்வு போது, பின்னர் மதிப்பின்படி மாதிரி வேண்டும் என்பது மக்கள் ஒரு மினியேச்சர் பதிப்பு சராசரி இருக்கும் ஏனெனில் நேர்மையானவன்.

எளிய சீரற்ற மாதிரி அரிதாக இருப்பினும், நடைமுறையில் பயன்படுத்தப்படுகிறது. மாறாக, ஆராய்ச்சியாளர்கள் வேண்டுமென்றே செலவு குறைக்க மற்றும் துல்லியம் அதிகரிக்கும் பொருட்டு சேர்த்து சமமற்ற சாத்தியக்கூறுகள் மக்கள் தேர்ந்தெடுக்கவும். ஆராய்ச்சியாளர்கள் சேர்க்குமாறு உள்நோக்கத்துடன் பல்வேறு சாத்திய மக்கள் தேர்வு செய்யும் போது, பின்னர் மாற்றங்களை மாதிரி செயல்முறை ஏற்படும் சிதைவுகள் மீளமை தேவை. வேறு வார்த்தைகளில் கூறுவதானால், நாம் ஒரு மாதிரி இருந்து பொதுமைப்படுத்த எப்படி மாதிரி எப்படி தேர்வு செய்யப்பட்டார் பொறுத்தது.

உதாரணமாக, தற்போதைய மக்கள்தொகை கணக்கெடுப்பு (CPS) வேலையின்மை விகிதம் மதிப்பிட அமெரிக்க அரசால் பயன்படுத்தப்படுகிறது. சுமார் 100,000 மக்கள் நேர்காணல் ஒவ்வொரு மாதமும், நேருக்கு நேர் அல்லது தொலைபேசியில் ஒன்று, மற்றும் முடிவுகளை மதிப்பிடப்பட்டுள்ளது வேலையின்மை விகிதம் தயாரிப்பதற்கு பயன்படுத்தப்படுகிறது. அரசு ஒவ்வொரு மாநில வேலையின்மை விகிதம் மதிப்பிட விரும்புகிறார் ஏனெனில், அது அந்த சிறிய மக்கள் (எ.கா., ரோட் தீவு) மற்றும் மக்கள் ஏராளமாக மாநிலங்களில் இருந்து பல மாநிலங்களில் உள்ள மிக சில பதிலளித்தவர்களில் விளைவிக்கும் என்பதால், பெரியவர்கள் ஒரு எளிய சீரற்ற மாதிரி செய்ய முடியாது (எ.கா. , கலிபோர்னியா). அதற்கு பதிலாக, வெவ்வேறு விகிதங்களில் பல்வேறு மாநிலங்களில் CPS, மாதிரிகள் மக்கள், ஒரு செயல்முறை தேர்வு சமமற்ற நிகழ்தகவு அடுக்கு மாதிரி என்று. உதாரணமாக, CPS, 2,000 பதிலளித்தவர்களில் விரும்பினார் மாநில ஒன்றுக்கு, பின்னர் ரோட் தீவில் பெரியவர்கள் கலிபோர்னியா பெரியவர்கள் விட சேர்த்து சுமார் 30 மடங்கு அதிக நிகழ்தகவு வேண்டும் (ரோட் தீவு: கலிபோர்னியா எதிராக 800,000 பெரியவர்கள் 2,000 பதிலளித்தவர்களில்: 30,000,000 பெரியவர்கள் 2,000 பதிலளித்தவர்களில்). நாம் பின்னர் பார்க்க வேண்டும் என, சமமற்ற நிகழ்தகவு மாதிரி இந்த வகையான கூட தரவு ஆன்லைன் மூலம் நடக்கிறது, ஆனால் CPS, போலல்லாமல், மாதிரி நுட்பத்தை பொதுவாக அறியப்பட்ட அல்லது ஆராய்ச்சியாளர் கட்டுப்பாட்டில் இல்லை.

அதன் மாதிரி வடிவமைப்பு கொடுக்கப்பட்ட CPS, அமெரிக்க நேரடியாக பிரதிநிதி அல்ல; அது மற்றும் கலிபோர்னியா இருந்து கூட சில Rhode Island இருந்து பல மக்கள் அடங்கும். எனவே, இது மாதிரி வேலையின்மை விகிதம் நாட்டில் வேலையின்மை விகிதம் மதிப்பிட புத்தியில்லாத இருக்கும். மாறாக மாதிரி சராசரி, அது உண்மை எடைகள் கணக்கு எங்கே Rhode Island இருந்து மக்கள் கலிபோர்னியாவில் இருந்து மக்கள் விட சேர்க்கப்படும் அதிகமாக இருந்தது என்று ஒரு சராசரியின், எடுத்து நன்றாக உள்ளது. எடுத்துக்காட்டாக, கலிபோர்னியா இருந்து ஒவ்வொரு நபர் அவர்கள் மதிப்பீடு மற்றும் ஒவ்வொரு Rhode Island இருந்து வேண்டும் நபர் இன்னும் எண்ண வேண்டும் upweighted- இருக்கும் downweighted-அவர்கள் மதிப்பீடு குறைவாக எண்ண வேண்டும். சாராம்சத்தில், நீங்கள் பற்றி அறிய வாய்ப்பு குறைவு என்று மக்கள் இன்னும் குரல் கொடுக்க வேண்டும்.

இந்த பொம்மை உதாரணமாக ஒரு முக்கியமான ஆனால் அளவில் தவறாகப் புரிந்து எடுத்துக்கொள்வோம்: ஒரு மாதிரி நல்ல மதிப்பீடுகள் பொருட்டு மக்கள் தொகையில் ஒரு மினியேச்சர் பதிப்பு இருக்க வேண்டிய அவசியம் இல்லை. போதுமான தரவுகள் சேகரிக்கப்பட்டன எப்படி பற்றி அறியப்படுகிறது என்றால், அந்த தகவல் மாதிரி மதிப்பீடுகள் செய்யும் போது பயன்படுத்த முடியும். அணுகுமுறை நான் விவரித்தார்-மற்றும் நான் தொழில்நுட்ப உள்ள கணித ரீதியாக விவரிக்க என்று பாரம்பரிய நிகழ்தகவு மாதிரி கட்டமைப்பை உள்ள வெளிப்படைத் குடல்வால்-விழுகிறது. இப்போது, நான் அதே கருத்தை அல்லாத நிகழ்தகவு மாதிரிகள் பயன்படுத்த முடியும் என்பதை காட்ட வேண்டும்.