3.4.1 അനുമാനം ഒരുപറ്റം: ഡാറ്റ ശേഖരം ഡാറ്റ വിശകലനം

തൂക്കവും ബോധപൂർവം പരിശോധിക്കുന്നത് പ്രക്രിയ പരത്തിയ വ്യതിയാനങ്ങളെക്കുറിച്ച് പഴയപടിയാക്കാനുമാകും.

അനുമാനം സാമ്പിളുകൾ ജനം എല്ലാം ഉൾപ്പെടുത്തലുമെല്ലാം അറിയപ്പെടുന്ന ഒരു, നോൺ-പൂജ്യം സംഭാവ്യത ഉണ്ടു എളുപ്പമായതുമായ സംഭാവ്യത ഒരുപറ്റം ഡിസൈൻ ഓരോ വ്യക്തി ഉൾപ്പെടുത്തലുമെല്ലാം തുല്യ സംഭാവ്യത ഉണ്ട് എവിടെ ലളിതമായ റാൻഡം ഒരുപറ്റം എവിടെ ഭാഗ്യവാന്മാർ. സർവേയിൽ തികഞ്ഞ വധശിക്ഷ (ഉദാ, യാതൊരു കവറേജ് പിശക് യാതൊരു നോൺ-പ്രതികരണം) ഉപയോഗിച്ച് ലളിതമായ റാൻഡം ഒരുപറ്റം വഴി തിരഞ്ഞെടുത്തു, അപ്പോൾ മതിപ്പു സാമ്പിൾ ചെയ്യും-ന് ജനസംഖ്യയുടെ ഒരു മിനിയേച്ചർ പതിപ്പ് ശരാശരി-കാരണമാവാം എളുപ്പമുള്ളതാകുന്നു.

ലളിത റാൻഡം ഒരുപറ്റം അപൂർവ്വമായി എന്നാൽ പ്രായോഗികമായി ഉപയോഗിക്കുന്നു. പകരം, ഗവേഷകർ മനഃപൂർവ്വം ചെലവ് കുറയ്ക്കുന്നു കൃത്യതയും വർദ്ധിപ്പിക്കുന്നതിനായി ഉൾപ്പെടുത്തലുമെല്ലാം അസമമായ പ്രോബബിലിറ്റികളുടെ ജനത്തെ തിരഞ്ഞെടുക്കുക. ഗവേഷകർ ബോധപൂർവം ഉൾപ്പെടുത്തലുമെല്ലാം വിവിധ സാധ്യതകൾ ജനത്തെ തിരഞ്ഞെടുക്കുമ്പോൾ തുടർന്ന് അഡ്ജസ്റ്റുമെന്റുകൾ ഒരുപറ്റം പ്രക്രിയ പരത്തിയ വ്യതിയാനങ്ങളെക്കുറിച്ച് ഇല്ലാതാക്കാന് ആവശ്യമാണ്. മറ്റു വാക്കുകളിൽ, നമുക്ക് എങ്ങനെ ഒരു സാമ്പിൾ നിന്ന് സാമാന്യവത്കരിക്കുകയെന്നാൽ സാമ്പിൾ എങ്ങനെ തിരഞ്ഞെടുക്കപ്പെട്ടു ആശ്രയിച്ചിരിക്കുന്നു.

ഉദാഹരണത്തിന്, നിലവിൽ ജനസംഖ്യാ സർവേ (തപ്പി) തൊഴിലില്ലായ്മ നിരക്ക് കണക്കാക്കാൻ അമേരിക്കൻ സർക്കാർ ഉപയോഗിക്കുന്നു. ഓരോ മാസവും ഏകദേശം 100,000 ആളുകൾ മുഖം വരെ മുഖാമുഖം ടെലിഫോൺ മേൽ ഒന്നുകിൽ, അഭിമുഖം, ഒപ്പം ഫലങ്ങളും കണക്കാക്കിയ തൊഴിലില്ലായ്മാ നിരക്ക് ഹാജരാക്കണം ഉപയോഗിക്കുന്നു. സർക്കാർ ഓരോ സംസ്ഥാനത്തും തൊഴിലില്ലായ്മ നിരക്ക് കണക്കാക്കാൻ ഉദ്ദേശിക്കുന്നു ആ ചെറിയ ജനസംഖ്യയുടെ (ഉദാ, റോഡ് ഐലന്റ്) ഉപയോഗിച്ച് സംസ്ഥാനങ്ങളിൽ വളരെ കുറച്ച് പ്രതികരിച്ചവരിൽ നല്കിയാലും കാരണം പ്രായപൂർത്തിയായവരിൽ ലളിതമായ റാൻഡം സാമ്പിൾ ചെയ്യാൻ കഴിയില്ല വലിയ ജനസംഖ്യാ സംസ്ഥാനങ്ങളായി നിന്നും വളരെയധികം (ഉദാ , കാലിഫോർണിയ). പകരം, വിവിധ നിരക്കിൽ വിവിധ സംസ്ഥാനങ്ങളിലെ തപ്പി സാമ്പിളുകൾ ആളുകൾ, ഒരു പ്രക്രിയ തട്ടുകളായി ഒരുപറ്റം തിരഞ്ഞെടുപ്പിന്റെ അസമമായ സംഭാവ്യത വിളിച്ചു. ഉദാഹരണത്തിന്, തപ്പി ഓരോ സംസ്ഥാനത്തിനും 2000 ആൾക്കാരുടെ ആഗ്രഹിച്ചു, അപ്പോൾ റോഡ് ഐലൻഡ് മുതിർന്നവർ കാലിഫോർണിയ (കാലിഫോർണിയ തെരയൂ 800,000 മുതിർന്നവർക്കും ശതമാനം 2000 ആൾക്കാരുടെ: 30.000.000 പ്രായപൂർത്തിയായവരിൽ ശതമാനം 2000 ആൾക്കാരുടെ റോഡ് ഐലൻഡ്) മുതിർന്നവർ അധികം ഉൾപ്പെടുത്തലുമെല്ലാം 30 മടങ്ങ് സംഭാവ്യത ലഭിക്കുമായിരുന്നു. ഞങ്ങൾ പിന്നീട് നോക്കാം അസമ സംഭാവ്യത കൂടെ ഒരുപറ്റം ഇത്തരത്തിലുള്ള വളരെ ഓൺലൈൻ ഡാറ്റ ഉറവിടങ്ങളിൽ സംഭവിക്കുന്നു, എന്നാൽ തപ്പി വ്യത്യസ്തമായി ഒരുപറ്റം മെക്കാനിസം സാധാരണയായി ഗവേഷകൻ അറിയപ്പെടുന്നത് അല്ലെങ്കിൽ നിയന്ത്രണത്തിലുള്ള അല്ല.

അതിന്റെ പരിശോധിക്കുന്നത് ഡിസൈൻ കിട്ടിയ തപ്പി യുഎസ് പ്രതിനിധി നേരിട്ട് ഇല്ല; അതു കാലിഫോർണിയ നിന്നും വളരെ കുറച്ച് റോഡ് ഐലൻഡ് നിന്നും വളരെയധികം ആളുകൾ അടങ്ങിയിരിക്കുന്നു. അതുകൊണ്ടു അതു സാമ്പിൾ തൊഴിലില്ലായ്മ നിരക്ക് രാജ്യത്തെ തൊഴിലില്ലായ്മ നിരക്ക് കണക്കാക്കാൻ ബുദ്ധിഹീനതയായിരിക്കും. പകരം സാമ്പിൾ അർഥമാക്കുന്നില്ല, അതു റോഡ് ഐലന്റ് നിന്ന് ആളുകളെ കാലിഫോർണിയ നിന്ന് ആളുകളെ അധികം ഉൾപ്പെടുത്താൻ സാധ്യതയും വസ്തുത വേണ്ടി തൂക്കം അക്കൗണ്ട് എവിടെ വെയ്റ്റ്ഡ് ശരാശരി, എടുത്തു നല്ലതു. ഉദാഹരണത്തിന് കാലിഫോർണിയയിലെ നിന്ന് ഓരോ വ്യക്തി എസ്റ്റിമേറ്റ്-ഉം റോഡ് ഐലൻഡ് നിന്ന് ഓരോ വ്യക്തിയും downweighted-അവർ ലഭിക്കുമെന്ന് എസ്റ്റിമേറ്റ് കുറവ് എണ്ണുകയാണെങ്കിൽ കൂടുതൽ എണ്ണുകയാണെങ്കിൽ upweighted- തന്നെ. തത്വത്തിൽ, നിങ്ങൾ കുറിച്ച് പഠിക്കാൻ സാധ്യത കുറവാണ് ജനം കൂടുതൽ ശബ്ദം കൊടുത്തിരിക്കുന്നു.

ഈ ടോയ് ഉദാഹരണം പ്രധാനപ്പെട്ട എന്നാൽ സാധാരണയായി ദഫ്മുട്ട് പോയിന്റ് വ്യക്തമാക്കുന്നു: ഒരു സാമ്പിൾ നല്ല എസ്റ്റിമേറ്റുകൾ ഹാജരാക്കാൻ ക്രമത്തിൽ ജനസംഖ്യയുടെ മിനിയേച്ചർ പതിപ്പ് ആയിരിക്കും ആവശ്യമില്ല. മതിയായ ഡേറ്റ ശേഖരിച്ച എങ്ങനെ അറിയപ്പെടുന്നത് എങ്കിൽ, ആ വിവരം സാമ്പിൾ നിന്നും കണക്കുകളിൽ ഉപയോഗിക്കാവുന്ന. സമീപനം ഞാൻ മാത്രം നിങ്ങള്-ഉം ഞങ്ങൾ എനിക്ക് ഗണിതശാസ്ത്രത്തിൽ വിവരിക്കുന്ന സാങ്കേതിക ക്ലാസിക്കൽ സംഭാവ്യത ഒരുപറ്റം ചട്ടക്കൂടിനുള്ളിൽ squarely അനുബന്ധം-വീഴുന്നു. ഇപ്പോൾ ഞാൻ അതേ ആശയം ഇതര പ്രോബബിലിറ്റി സാമ്പിളുകൾ പ്രയോഗിക്കാൻ എങ്ങനെ കാണിക്കും.