3.4.1 ప్రాబబిలిటీ సాంప్లింగ్: డేటా సేకరణ మరియు డేటా విశ్లేషణ

తూనికలు కావాలని శాంప్లింగ్ ప్రక్రియ ద్వారా కలిగే వక్రీకరణలు రద్దు చెయ్యవచ్చు.

ప్రాబబిలిటీ నమూనాలను అన్ని ప్రజలు ఒక తెలిసిన, కాని సున్నా చేర్చడం సంభావ్యత ఉన్న ఆ, మరియు సరళమైన సంభావ్యత శాంప్లింగ్ రూపకల్పన సులభమైన ప్రతి వ్యక్తి చేర్చడం సమాన సంభావ్యత కలిగి ఉన్న యాదృచ్ఛిక నమూనా ఉంది. ప్రతివాదులు పరిపూర్ణ అమలు (ఉదా, ఏ కవరేజ్ దోషం మరియు ఏ స్పందన) తో సాధారణ యాదృచ్ఛిక నమూనా ద్వారా ఎంపిక చేసినప్పుడు, అప్పుడు అంచనాలో నమూనా సంకల్ప జనాభా యొక్క ఒక చిన్న వెర్షన్ సగటు ఎందుకంటే సూటిగా ఉంటుంది.

సాధారణ యాదృచ్ఛిక నమూనా అరుదుగా అయితే ఆచరణలో ఉపయోగిస్తారు. అయితే, పరిశోధకులు ఉద్దేశ్యపూర్వకంగా ఖర్చు తగ్గించేందుకు మరియు ఖచ్చితత్వం పెంచడానికి చేర్చడం అసమాన సంభావ్యత వ్యక్తులు ఎంచుకోండి. పరిశోధకులు ఉద్దేశ్యపూర్వకంగా చేర్చడం వివిధ సంభావ్యత వ్యక్తులు ఎంచుకోండి, అప్పుడు సర్దుబాట్లు శాంప్లింగ్ ప్రక్రియ ద్వారా కలిగే వక్రీకరణలు దిద్దుబాటు రద్దుచెయ్యి అవసరమవుతాయి. ఇతర మాటలలో, మేము ఒక నమూనా నుండి సాధారణీకరించడం నమూనా ఎంపికయ్యాడు ఎలా ఆధారపడి ఉంటుంది.

ఉదాహరణకు, ప్రస్తుత జనాభా సర్వే (CPS) నిరుద్యోగం రేటు అంచనా వేయడానికి సంయుక్త ప్రభుత్వం ఉపయోగిస్తారు. ప్రతినెలా 100,000 మంది ఇంటర్వ్యూ ఉంటాయి, ముఖం- to- ముఖం లేదా టెలిఫోన్ పైగా గాని, మరియు ఫలితాలు అంచనా నిరుద్యోగం రేటు ఉత్పత్తి ఉపయోగిస్తారు. చిన్న జనాభా (ఉదా, రోడ్ ద్వీపం) మరియు పెద్ద జనాభా తో రాష్ట్రాల నుంచి చాలా రాష్ట్రాలుగా చాలా కొన్ని ప్రతివాదులు ఇచ్చు ఎందుకంటే ప్రభుత్వం ప్రతి రాష్ట్రంలో నిరుద్యోగ రేటును అంచనా శుభాకాంక్షలు ఎందుకంటే, అది పెద్దలలో ఒక సాధారణ యాదృచ్ఛిక నమూనా కాదు (ఉదా , కాలిఫోర్నియా). బదులుగా, వివిధ స్థాయిల్లో వివిధ రాష్ట్రాల్లో CPS నమూనాలను ప్రజలు, ఈ విధానంలో ఎంపిక అసమాన సంభావ్యత తో అంతస్థులుగా నమూనా సేకరణ అని. ఉదాహరణకు, CPS 2,000 ప్రతివాదులు కావలెను రాష్ట్రం శాతం, అప్పుడు Rhode Island లో పెద్దలు కాలిఫోర్నియాలో పెద్దల కంటే చేర్చడానికి 30 రెట్లు ఎక్కువ గురించి సంభావ్యత వుంటుంది (రోడ్ ఐలాండ్: 800,000 పెద్దలు శాతం 2,000 ప్రతివాదులు కాలిఫోర్నియా వర్సెస్: 30,000,000 పెద్దలు శాతం 2,000 ప్రతివాదులు). మేము తరువాత చూస్తారు వంటి, అసమాన సంభావ్యత తో సాంప్లింగ్ ఈ రకమైన చాలా డేటా ఆన్లైన్ వనరుల జరుగుతుంది కాని CPS కాకుండా, నమూనా విధానం సాధారణంగా తెలిసిన లేదా పరిశోధకుడు నియంత్రణలో ఉండదు.

దాని నమూనా రూపకల్పన ఇచ్చిన, CPS సంయుక్త నేరుగా ప్రతినిధి కాదు; ఇది Rhode Island నుండి చాలా మంది కాలిఫోర్నియా నుంచి చాలా కొన్ని ఉన్నాయి. అందువలన, నమూనా నిరుద్యోగ రేటుతో దేశంలో నిరుద్యోగ రేటును అంచనా తెలివితక్కువతనం అవుతుంది. బదులుగా మాదిరి మధ్యమం, అది బరువులు వాస్తవం కోసం ఖాతా పేరు Rhode Island నుండి ప్రజలు California ప్రజల కన్నా చేర్చవలసిన ఎక్కువగా ఉన్నట్లు ఒక అధిక సగటు తీసుకోవాలని ఉత్తమం. ఉదాహరణకు, కాలిఫోర్నియా నుండి ప్రతి వ్యక్తి వారు Rhode Island నుండి అంచనా మరియు ప్రతి వ్యక్తి అవుతుంది మరింత పరిగణించబడతారు upweighted- ఉంటుంది downweighted వారు అంచనా తక్కువ పరిగణించబడతారు. సారాంశంలో, మీరు గురించి తెలుసుకోవడానికి అవకాశం తక్కువని ప్రజలకు మరిన్ని వాయిస్ ఇస్తారు.

ఈ బొమ్మ ఉదాహరణ ఒక ముఖ్యమైన కానీ సాధారణంగా తప్పుగా విషయాన్ని ఉదహరిస్తుంది: ఒక నమూనా మంచి అంచనాలు ఉత్పత్తి చేయడానికి జనాభా యొక్క ఒక చిన్న వెర్షన్ కానవసరం లేదు. తగినంత డేటా సేకరించిన ఎలా గురించి తెలిసినప్పుడు, ఆ సమాచారం నమూనా నుండి అంచనాలు చేసేటప్పుడు ఉపయోగించవచ్చు. విధానం నేను పైన వివరించిన మరియు చేసిన శాస్త్రీయ సంభావ్యత శాంప్లింగ్ చట్రంలో చతురస్రంగా నేను సాంకేతిక లో గణితశాస్త్ర వివరించే అనుబంధంలో-పడతాడు. ఇప్పుడు, నేను అదే ఆలోచన కాని సంభావ్యత నమూనాలను ఎలా అన్వయించవచ్చు తెలియజేస్తాము.