3.3.1 പ്രാതിനിധ്യം

ജനപ്രാതിനിധ്യ നിങ്ങളുടെ ടാർഗെറ്റ് ജനസംഖ്യ നിങ്ങളുടെ പ്രതികരിച്ചവരിൽ ഊഹങ്ങൾ നടത്തുന്നത് സംബന്ധിച്ച് ആണ്.

സർവേയിൽ നിന്ന് വലിയ ജനസംഖ്യ അപഗ്രഥനം ചെയ്യുമ്പോൾ സംഭവിക്കാവുന്ന പിഴവുകൾ തരത്തിലുള്ള മനസിലാക്കുന്നതിന്, ന്റെ 1936 പ്രസിഡന്റ് തിരഞ്ഞെടുപ്പ് ഫലത്തെ പ്രവചിക്കാൻ ശ്രമിക്കുന്ന സാഹിത്യ ഡൈജസ്റ്റ് വൈക്കോൽ വോട്ടെടുപ്പ് നോക്കാം. 75 വർഷങ്ങൾക്ക് മുമ്പ് ആയിരുന്നെങ്കിലും ഈ തോൽവിക്ക് ഇന്നും ഗവേഷകർ പഠിപ്പിക്കാൻ ഒരു പാഠമാണ് ഉണ്ട്.

സാഹിത്യ ഡൈജസ്റ്റ് പ്രശസ്തമായ ജനറൽ-പലിശ മാഗസിൻ ആയിരുന്നു, 1920 തുടങ്ങുന്ന അവർ പ്രസിഡന്റ് തിരഞ്ഞെടുപ്പിനായുള്ള ഭാവങ്ങളാണെന്ന് പ്രവചിക്കാൻ വൈക്കോൽ തിരഞ്ഞെടുപ്പിൽ പ്രവർത്തിക്കുന്ന തുടങ്ങി. ഈ പ്രവചനങ്ങൾ അവർ ധാരാളം ആളുകൾ ലേക്കുള്ള ബാലറ്റ് അയയ്ക്കാൻ തന്നെ ചിലത്, തുടർന്ന് ലളിതമായി മടങ്ങി ബാധിച്ചവരെ ബാലറ്റ് അപ്പ് കക്ഷിനില; സാഹിത്യ ഡൈജസ്റ്റ് അഭിമാനത്തോടെ അവർ ലഭിച്ച ബാലറ്റുകൾ ചെയ്തു പോവില്ല "., വെയ്റ്റഡ് ക്രമീകരിച്ചു അരുതു വ്യാഖ്യാനിച്ചു" റിപ്പോർട്ടു ഈ പ്രക്രിയ ശരിയായി വിജയി പ്രവചിച്ച 1920, 1924, 1928 നും 1932 തിരഞ്ഞെടുപ്പുകളിൽ 1936 ന്റെ, കളിലെ നടുവിൽ, സാഹിത്യ ഡൈജസ്റ്റ് ഔട്ട് ബാലറ്റ് ആരുടെ പേരുകൾ മുഖ്യമായി ടെലിഫോൺ ഡയറക്ടറികളും വാഹന രജിസ്ട്രേഷൻ രേഖകളിൽ നിന്നും വന്നു 10 ദശലക്ഷം ആളുകൾ അയച്ചു. ഇവിടെ അവർ സമ്പ്രദായത്തിലേക്ക് വിവരിച്ച രീതി:

"ഡൈജസ്റ്റ് ന്റെ മിനുസമാർന്ന-പ്രവർത്തിക്കുന്ന മെഷീൻ ഹാർഡ് വസ്തുതകൾ ഊഹപ്രവർത്തനങ്ങൾ കുറയ്ക്കാൻ മുപ്പതു വർഷത്തെ അനുഭവം തിടുക്കത്തിൽ കൃത്യതയോടെ പ്രേരിപ്പിക്കുന്നു. . . .ഈ ആഴ്ച 500 പേനകൾ ഒരു ദശലക്ഷം വിലാസങ്ങൾ ഒരു ദിവസത്തെ നാലിലൊന്ന് കൂടുതൽ മാന്തികുഴിയുണ്ടാക്കുന്ന. എല്ലാ ദിവസവും, മുകളിൽ മോട്ടോർ-ribboned നാലാം അവന്യൂ ഉയർന്ന ഒരു വലിയ മുറിയിൽ, ന്യൂയോർക്കിലെ 400 തൊഴിലാളികൾ deftly പ്രിന്റുചെയ്തവ-മതി ഒരു ദശലക്ഷം കഷണങ്ങൾ നാല്പതു പട്ടണത്തിൽ ബ്ലോക്കുകൾ-കടന്നു തുറന്നു അഭിസംബോധന സ്ലൈഡുചെയ്ത് ആവരണം [സഖ്യശക്തികൾ]. ഓരോ മണിക്കൂറിലും, ഡൈജസ്റ്റ് സ്വന്തം പോസ്റ്റ് ഓഫീസ് സബ്സ്റ്റേഷൻ മൂന്ന് chattering തപാൽ മീറ്ററിംഗ് യന്ത്രങ്ങൾ മുദ്രയിട്ടും, സ്റ്റാമ്പ് വച്ച വെളുത്ത oblongs; സ്കിൽഡ് പോസ്റ്റൽ ജീവനക്കാർ mailsacks കൂട്ടങ്ങളായിട്ടാണ് അവരെ ഫ്ലിപ്പ്; ഫ്ലീറ്റ് ഡൈജസ്റ്റ് ട്രക്കുകൾ മെയിൽ-വണ്ടികൾ പ്രകടിപ്പിക്കാൻ അവരെ വേഗത്തിലാക്കി. . . അടുത്ത ആഴ്ച, പത്തു ദശലക്ഷം നിന്ന് ആദ്യ ഉത്തരങ്ങൾ ട്രിപ്പിൾ പരിശോധിക്കേണ്ട, പരിശോധിച്ചു, അഞ്ചു തവണ ക്രോസ്-ക്ലാസിഫൈഡ് നേടിയത് അടയാളപ്പെടുത്തിയിരിക്കുന്ന ബാലറ്റുകൾ ഇൻകമിംഗ് വേലിയേറ്റം ആരംഭിക്കും. കഴിഞ്ഞ കണക്കുകൾ totted ചെക്ക് കഴിഞ്ഞാൽ ചെയ്തു, കഴിഞ്ഞ അനുഭവം അസത്യവും എങ്കിൽ രാജ്യത്തിന് 1 ശതമാനം അംശം ഉള്ളിൽ നാല്പതു ദശലക്ഷം [വോട്ടർമാർ] യഥാർത്ഥ വോട്ടെടുപ്പിലൂടെയാണ് അറിയും. "(ആഗസ്റ്റ് 22, 1936)

വലുപ്പമുള്ള ഡൈജസ്റ്റ് ന്റെ fetishization ഇന്ന് ഏതെങ്കിലും "ബിഗ് ഡാറ്റ" ഗവേഷക പെട്ടെന്നു മനസ്സിലാകും. വിതരണം 10 ദശലക്ഷം ബാലറ്റുകൾ, ഒരു അത്ഭുതകരമായ 2.4 ദശലക്ഷം ബാലറ്റ് മടങ്ങി-ദ്വീപിലങ്ങനെ ആധുനിക രാഷ്ട്രീയ തിരഞ്ഞെടുപ്പിൽ അധികം ഏതാണ്ട് 1000 തവണ വലിയ തുടർന്ന്. ഈ 2.4 ദശലക്ഷം സർവേയിൽ നിന്നും വിധി വ്യക്തമായിരുന്നു: സാഹിത്യ ഡൈജസ്റ്റ് ചലഞ്ചർ ശശിയും Landon ബാധ്യതയുണ്ട് ഫ്രാങ്ക്ലിൻ റൂസ്വെൽറ്റ് പരാജയപ്പെടുത്താൻ പോകുന്നതിന്റെ പ്രവചിച്ചിരുന്നു. എന്നാൽ, വാസ്തവത്തിൽ, നേർ വിരുദ്ധമായ സംഭവിച്ചു. റൂസ്വെൽറ്റ് സഹതാപതരംഗം ലെ Landon പരാജയപ്പെടുത്തി. സാഹിത്യ ഡൈജസ്റ്റ് എങ്ങനെ ഇത്രയധികം ഡാറ്റ എന്തോ പോകും? ഒരുപറ്റം ഔവർ ആധുനിക സാഹിത്യ ഡൈജസ്റ്റ് ന്റെ പിശകുകൾ വ്യക്തമായ ദേവനെ ഭാവിയിൽ സമാന പിശകുകൾ ഒഴിവാക്കുന്നതിന് സഹായിക്കുന്നു.

ഒരുപറ്റം കുറിച്ച് വ്യക്തമായി ചിന്തിക്കുന്നത് ജനം (ചിത്രം 3.1) നാല് വ്യത്യസ്ത ഗ്രൂപ്പുകൾ പരിഗണിക്കുക നമ്മെ ആവശ്യമാണ്. ആളുകളുടെ ആദ്യ ഗ്രൂപ്പ് ടാർഗെറ്റ് തലമുറ ഈ ഗവേഷണ പലിശ ജനസംഖ്യ നിർവചിക്കുന്ന ഗ്രൂപ്പ് ആണ്. സാഹിത്യ ഡൈജസ്റ്റ് കാര്യത്തിൽ ജനസംഖ്യ 1936 പ്രസിഡന്റ് തെരഞ്ഞെടുപ്പിലെ വോട്ടർമാർ ആയിരുന്നു. ഒരു ടാർഗറ്റ് പോപ്പുലേഷനും തീരുമാനത്തിനുശേഷം ഒരു ഗവേഷകൻ അടുത്ത ഒരുപറ്റം ഉപയോഗിക്കാൻ കഴിയുന്ന ആളുകളുടെ ലിസ്റ്റ് വികസിപ്പിക്കാൻ ആവശ്യമാണ്. ഈ ലിസ്റ്റിൽ ഒരുപറ്റം ഫ്രെയിം വിളിക്കുകയും ഒരുപറ്റം ഫ്രെയിമിലോ ജനസംഖ്യ ഫ്രെയിം ജനസംഖ്യ വിളിക്കുന്നു. സാഹിത്യ ഡൈജസ്റ്റ് കാര്യത്തിൽ ഫ്രെയിം ജനസംഖ്യ ആരുടെ പേരുകൾ ടെലഫോൺ ഡയറക്ടറികളും വാഹന രജിസ്ട്രേഷൻ രേഖകളിൽ നിന്നും മുഖ്യമായി വന്നു 10 ദശലക്ഷം ആളുകൾ ആയിരുന്നു. എബൌട്ട് ജനസംഖ്യ ഫ്രെയിമും ജനസംഖ്യ കൃത്യമായി ഒരേ ആയിരിക്കും, പക്ഷെ പ്രായോഗികമായി ഈ കേസിൽ പലപ്പോഴും ആണ്. ജനസംഖ്യ ഫ്രെയിമും ജനസംഖ്യ തമ്മിലുള്ള വ്യത്യാസങ്ങൾ കവറേജ് പിശക് വിളിക്കുന്നു. കവറേജ് പിശക് പ്രശ്നങ്ങൾ ഗ്യാരണ്ടി സ്വയം ചെയ്യരുത്. എന്നാൽ, എങ്കിൽ ഫ്രെയിം ജനസംഖ്യയിൽ ആളുകൾ കവറേജ് ബയസ് ഉണ്ടാകും ഫ്രെയിം ജനസംഖ്യയിൽ ജനങ്ങളെ നിന്ന് ആസൂത്രിതമായി വ്യത്യസ്തമാണ്. കവറേജ് പിശക് സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പിലൂടെ പ്രധാന കുറവുകൾ ആദ്യ ആയിരുന്നു. അവർ ശശിയും Landon (തിരിച്ചുവിളിക്കാൻ ഈ സാങ്കേതികവിദ്യകൾ ഇരുവരും പിന്തുണയ്ക്കുന്നതിന് കൂടുതൽ സാധ്യത ഉണ്ടായിരുന്ന സമ്പന്ന അമേരിക്കക്കാർ ആ ഓവർ പ്രതിനിധാനം വോട്ടർമാരെ-അവരുടെ ജനസംഖ്യ-മാത്രമായിരുന്നു അവർ ടെലിഫോൺ ഡയറക്ടറികൾ ഓട്ടോ രജിസ്ട്രികളും നിന്ന് മുഖ്യമായി ഒരു ഒരുപറ്റം ഫ്രെയിം നിർമ്മാണം, ഉറവിടങ്ങൾ കുറിച്ച് പഠിക്കാൻ ആഗ്രഹിച്ചു ഇന്ന് സാധാരണ ആയ സമയത്ത് അമേരിക്കൻ കളിലെ ഇടയിൽ ആയിരുന്നു എന്ന്) താരതമ്യേന പുതിയ ആയിരുന്നു.

ജനപ്രാതിനിധ്യ പിശകുകൾ: 3.1 ചിത്രം.

ജനപ്രാതിനിധ്യ പിശകുകൾ: 3.1 ചിത്രം.

ഫ്രെയിം ജനസംഖ്യ നിർവ്വചിക്കുമ്പോൾ ശേഷം അടുത്ത ഘട്ടത്തിലേക്കു സാമ്പിൾ ജനസംഖ്യ തെരഞ്ഞെടുക്കുന്നതിനായി ഒരു ഗവേഷകൻ ആകുന്നു; ഈ ഗവേഷക അഭിമുഖം ശ്രമിക്കും ആളുകളാണ്. സാമ്പിൾ ഫ്രെയിം ജനസംഖ്യ വിവിധ സ്വഭാവസവിശേഷതകൾ മാത്രം നമുക്ക് ഒരുപറ്റം പിശക് പരിചയപ്പെടുത്താൻ കഴിയും. ഈ പിശക് ഏതുതരം സാധാരണയായി കണക്കുകളെ അകമ്പടിയുണ്ട് ആ പിശക് വലതുമാർജിനിൽ quantified ആണ്. സാഹിത്യ ഡൈജസ്റ്റ് ആന്റ്ടുമാറോ സാഹചര്യത്തിൽ, അവിടെ യഥാർത്ഥത്തിൽ യാതൊരു സാമ്പിൾ ആയിരുന്നു; അവർ ഫ്രെയിം ജനസംഖ്യയിൽ എല്ലാവർക്കും ബന്ധപ്പെടാൻ ശ്രമിച്ചു. യാതൊരു ഒരുപറ്റം പിശക് ഉണ്ടായിരുന്നു പോലും, അവിടെ വ്യക്തമായും തുടർന്നും പിശക് ഉണ്ടായിരുന്നു. ഇത് സാധാരണയായി സർവ്വേകളിലൂടെയും കണക്കാക്കപ്പെട്ടിട്ടുണ്ട് റിപ്പോർട്ടുചെയ്തിരിക്കുന്ന പിശകുകൾ അരികുകളിൽ സാധാരണയായി misleadingly ചെറിയ അദ്ദേഹം വിശദീകരിക്കുന്നു; ദുർമാർഗം എല്ലാ ഉറവിടങ്ങളും ഉൾപ്പെടുന്നില്ല.

ഒടുവിൽ ഒരു ഗവേഷകൻ സാമ്പിൾ ജനസംഖ്യയിൽ എല്ലാവർക്കും അഭിമുഖം ശ്രമിക്കുന്നു. വിജയകരമായി അഭിമുഖം ആ ജനം പ്രതികരിച്ചവരിൽ വിളിക്കുന്നു. എബൌട്ട്, സാമ്പിൾ ജനസംഖ്യയുടെ പ്രതികരിക്കുന്ന കൃത്യമായി ഒരേ ആയിരിക്കും, പക്ഷെ പ്രായോഗികമായി നോൺ-പ്രതികരണം ഇല്ല. സാമ്പിൾ തിരഞ്ഞെടുത്ത ആളുകൾ പങ്കെടുക്കാൻ നിരസിക്കുന്നു എന്നു ആണ്. പ്രതികരിക്കാൻ ജനങ്ങൾക്ക് പ്രതികരിക്കാൻ ചെയ്തവരാരോ നിന്ന് വ്യത്യസ്തമാണ് ചെയ്യുന്നുവെങ്കിൽ, നോൺ-പ്രതികരണ പക്ഷപാതിത്വം കഴിയും. നോൺ-പ്രതികരണ ബയസ് സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പ് രണ്ടാം പ്രധാന പ്രശ്നം. ഒരു ബാലറ്റ് ലഭിച്ച ആളുകളുടെ% മാത്രം 24 പ്രതികരിച്ചു, അതു Landon പിന്തുണയ്ക്കുന്ന ആളുകൾക്ക് പ്രതികരിക്കാൻ കൂടുതൽ സാധ്യത ഉണ്ടായിരുന്ന പെട്ടു.

വെറും പ്രാതിനിധ്യം ആശയങ്ങൾ പരിചയപ്പെടുത്താൻ ഒരു ഉദാഹരണമാണ് ബിയോണ്ട്, സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പ് haphazard ഒരുപറ്റം അപകടങ്ങളെക്കുറിച്ച് ഗവേഷകർ cautioning ഒരു ഏറെ ആവർത്തിച്ചു ഉപമ ആണ്. നിർഭാഗ്യവശാൽ, ഞാൻ അനേകം ആളുകൾ ഈ കഥയിൽ നിന്ന് ആകർഷിക്കും ആ പാഠം അന്യായം എന്ന് തോന്നുന്നു. കഥ ഏറ്റവും സാധാരണമായ ധാർമിക ഗവേഷകർ നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ നിന്ന് ഒന്നും (അതായത് പങ്കെടുക്കുന്നവർ തിരഞ്ഞെടുത്ത് കർശനമായ സംഭാവ്യത അധിഷ്ഠിത നിയമങ്ങൾ ഇല്ലാതെ സാമ്പിളുകൾ) പഠിക്കാൻ പാടില്ല എന്നതാണ്. എന്നാൽ, ഞാൻ പിന്നീട് ഈ അദ്ധ്യായത്തിൽ കാണിക്കും, ആ ടീച്ചറെ ശരിയാണ്. പകരം, ഞാൻ ഈ കഥ രണ്ടു ആർത്തി ശരിക്കും ഉണ്ട് തോന്നുന്നത്; അവർ 1936 ആദ്യം ലെ പോലെ ഇന്നും സത്യം ധാർമികത, ബാഹ്യാകാശത്തിൽ ശേഖരിച്ച ഡാറ്റ ഒരു വലിയ തുക ഒരു നല്ല എസ്റ്റിമേറ്റ് എന്നതു മാത്രമാണ്. രണ്ടാമതായി, ഗവേഷകർ അവർ അതിൽ നിന്ന് കണക്കുകളിൽ ചെയ്യുമ്പോൾ അവരുടെ ഡേറ്റ ശേഖരിച്ച എങ്ങനെ കണക്കു വേണം. മറ്റു വാക്കുകളിൽ, സാഹിത്യ ഡൈജസ്റ്റ് വോട്ടെടുപ്പ് ഡാറ്റാ ശേഖരണം പ്രക്രിയ വ്യവസ്ഥാപിതമായി ചില സർവേയിൽ നേരെ ശോചനീയമാണ് കാരണം ഗവേഷകർ കൂടുതൽ സങ്കീർണ്ണമായ മതിപ്പു ആ തൂക്കവും വിശേഷം ചില സർവേയിൽ കൂടുതൽ പ്രക്രിയ ഉപയോഗിക്കേണ്ടതുണ്ട്. പിന്നീട് ഈ അദ്ധ്യായത്തിൽ ഞാൻ നിങ്ങളോടു ഒരു നോൺ-പ്രോബബലിറ്റി സാമ്പിളുകൾ ഉപയോഗിച്ച് മികച്ച എസ്റ്റിമേറ്റുകൾ ഉണ്ടാക്കുവാൻ എന്നതില് അത്തരം വെയ്റ്റേജിനു നടപടിക്രമം-പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു-ആ കാണിക്കും.