3.4 ചോദിക്കാൻ ആർ

ഈ പരിഭാഷയെ ഒരു കമ്പ്യൂട്ടർ സൃഷ്ടിച്ചത്. ×

3.4 ചോദിക്കാൻ ആർ

പ്രാപ്യതയിൽ ഡിജിറ്റൽ പ്രായം പ്രോബബിലിറ്റി സാംപ്ലിങ് നടത്തുന്നതും നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങിനുള്ള പുതിയ അവസരങ്ങളും സൃഷ്ടിക്കുന്നു.

സാംപ്ളിങ്ങിന്റെ ചരിത്രത്തിൽ, രണ്ട് മത്സരാധിഷ്ഠിതമായ സമീപനങ്ങളുണ്ട്: പ്രോബബിലിറ്റി സാംപ്ലിംഗ് രീതികളും സാദ്ധ്യമല്ലാത്ത സാംപ്ലിംഗ് രീതികളും. സാംപ്ലിങിന്റെ ആദ്യകാലങ്ങളിൽ രണ്ടു സമീപനങ്ങളും ഉപയോഗിച്ചിരുന്നെങ്കിലും, സാന്ദ്രത സാംബാമിംഗ് ആധിപത്യം സ്ഥാപിച്ചു. അനേകം സോഷ്യൽ റിസർച്ചർമാർക്ക് സാന്ദർഭികതയുടെ സാന്ദർഭശക്തിയെ നോക്കാനുള്ള സാദ്ധ്യതയില്ല. എന്നിരുന്നാലും, ഞാൻ താഴെ വിവരിക്കുന്നത് പോലെ, ഡിജിറ്റൽ യുഗത്തിൽ ഉണ്ടാകുന്ന മാറ്റങ്ങൾ ഗവേഷകർക്ക് നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിംഗ് പുനരവലോകനം ചെയ്യുന്നതിനുള്ള സമയമാണ്. പ്രത്യേകിച്ച്, പ്രോബബിലിറ്റി സാംപ്ലിങ് പ്രാക്ടീസ് ചെയ്യാൻ പ്രയാസമാണ്, കൂടാതെ നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങ് കൂടുതൽ വേഗത്തിൽ ലഭിക്കുന്നുണ്ട്, വിലകുറഞ്ഞതും മെച്ചപ്പെട്ടതുമാണ്. വേഗതയും വിലകുറഞ്ഞതുമായ സർവ്വേകൾ സ്വയം അവസാനിപ്പിക്കുന്നത് മാത്രമല്ല, കൂടുതൽ സാധ്യതകൾ സർവ്വേകളും വലിയ സാമ്പിൾ വലിപ്പവും പോലുള്ള പുതിയ അവസരങ്ങൾ അവർ സഹായിക്കുന്നു. ഉദാഹരണമായി, പ്രോബബിലിറ്റി സമ്പ്രദായമുപയോഗിച്ച് മുൻകൂർ പഠനങ്ങളേക്കാൾ പ്രാഥമിക സാധ്യതയുള്ള രീതികൾ ഉപയോഗപ്പെടുത്തി സഹകരണസംഘടന തെരഞ്ഞെടുപ്പ് പഠനം (സിസിഇഎസ്) ഏകദേശം 10 മടങ്ങ് കൂടുതൽ പങ്കെടുക്കുന്നു. ഈ വലിയ സാമ്പിൾ ഉപഗ്രൂപ്പുകളിലൂടെയും സോഷ്യൽ കോൺടെക്സ്റ്റുകളിലൂടെയും മനോഭാവങ്ങളും പെരുമാറ്റങ്ങളും പഠിക്കാൻ രാഷ്ട്രീയ ഗവേഷകർക്ക് അവസരമൊരുക്കുന്നു. കൂടാതെ, ഈ കൂട്ടിച്ചേർത്ത എല്ലാ കണക്കുകളും ഗുണനിലവാരം കുറയുകയും ചെയ്തു (Ansolabehere and Rivers 2013) .

സാമൂഹ്യ ഗവേഷണത്തിനായി സാംപ്ലിങിനുള്ള സാദ്ധ്യതയുള്ള ആധുനിക സമീപന രീതിയാണ് ഇപ്പോൾ സാധ്യമാക്കുന്നത് . സാംക്രമിക സാംക്രമികളില്, ലക്ഷ്യം ജനങ്ങളിലെ എല്ലാ അംഗങ്ങളും അറിയപ്പെടുന്ന ഒരു നിശ്ചിത സംഖ്യയും, സാമ്പിൾ ചെയ്യപ്പെട്ട എല്ലാ ആൾക്കാരും സർവ്വേയിൽ പ്രതികരിക്കുന്നു. ഈ വ്യവസ്ഥകൾ നിറവേറപ്പെടുമ്പോൾ, ലക്ഷ്യം ജനസംഖ്യയെക്കുറിച്ച് അംബേദ്കരിക്കാനുള്ള സാമ്പിൾ ഉപയോഗപ്പെടുത്തുന്ന ഗവേഷകന്റെ കഴിവിനെക്കുറിച്ച് ഗാംഭീര്യമായ ഗണിത ഫലങ്ങൾ നൽകുന്നു.

എന്നിരുന്നാലും, യഥാർത്ഥലോകത്ത് ഈ ഗണിതശാസ്ത്ര ഫലങ്ങളുടെ അടിസ്ഥാനം വളരെ അപൂർവ്വമായി കണ്ടുമുട്ടിയിരിക്കുന്നു. ഉദാഹരണത്തിന്, മിക്കപ്പോഴും കവറേജ് പിശകുകളും നോൺ റസിഷനും. ഈ പ്രശ്നങ്ങളാൽ, ഗവേഷകർ മിക്കപ്പോഴും അവരുടെ മാതൃകയിൽ നിന്നുള്ള അനുമാനത്തെ അവരുടെ ലക്ഷ്യം ജനസംഖ്യയിൽ എത്തിക്കുന്നതിന് പലതരം സ്റ്റാറ്റിസ്റ്റിക്കൽ ക്രമീകരണങ്ങൾ ഉപയോഗിക്കേണ്ടതുണ്ട്. അതിനാൽ, സൈദ്ധാന്തികമായ ഗതിവിഗതികളും, പ്രായോഗിക പ്രോബബിലിറ്റി സാമ്പിളുകളുമൊക്കെയായി വേർതിരിച്ചറിയാൻ , സിദ്ധാന്തത്തിലെ പ്രോബബിലിറ്റി സാംപ്ലിംഗിനെ വേർതിരിച്ചറിയാൻ ഇത് വളരെ പ്രധാനമാണ്. ഇത് അത്തരം ഗ്യാരന്റി നൽകുന്നില്ല, പലതരം സ്റ്റാറ്റിസ്റ്റിക്കൽ അഡ്ജസ്റ്റ്മെന്റുകളെ ആശ്രയിച്ചിരിക്കുന്നു.

കാലക്രമേണ, സിദ്ധാന്തത്തിലെ സംഭാവ്യത സാംക്രമികവും പ്രായോഗികവുമായ സാംക്രമിക പ്രയോഗത്തിന്റെ വ്യത്യാസങ്ങൾ വർധിച്ചുവരികയാണ്. ഉദാഹരണത്തിന് ഉയർന്ന നിലവാരത്തിലുള്ള, ചെലവേറിയ സർവേകൾ (ചിത്രം 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) എന്നിവിടങ്ങളിൽ നോൺ റെസ്പോൺസ് നിരക്കും സ്ഥിരമായി വർദ്ധിച്ചുകൊണ്ടിരിക്കുന്നു. വാണിജ്യ ടെലിഫോൺ സർവേകളിൽ നോൺ റേഷൻ നിരക്കുകൾ വളരെ കൂടുതലാണ്-ചിലപ്പോൾ 90% (Kohut et al. 2012) . നോൺ റേഷനുകളിൽ ഈ വർദ്ധനവ് ഗുണനിലവാരം നിർബാധം ഭീഷണിപ്പെടുത്തുന്നു, കാരണം ഗവേഷകർ പുനരധിവാസത്തിനായി ഉപയോഗിക്കുന്നതിന് ഉപയോഗിക്കുന്ന സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃകകളെ ആശ്രയിച്ചിരിക്കും. ഉയർന്ന റിട്ടേൺ റേറ്റുകൾ നിലനിർത്തുന്നതിന് സർവേ ഗവേഷകരുടെ ചെലവ് വർധിപ്പിക്കുംവിധം ഗുണനിലവാരത്തിലെ ഈ കുറവുകൾ സംഭവിച്ചിട്ടുണ്ട്. ഗുണനിലവാരം കുറയ്ക്കുന്നതിനും ചെലവ് വർധിക്കുന്നതിനും ഈ ഇരട്ട പ്രവണതകൾ സർവേ ഗവേഷണത്തിന്റെ (National Research Council 2013) ഭീഷണിപ്പെടുത്തുന്നതായി ചിലർ ഭയക്കുന്നു.

ചിത്രം 3.5: ഉയർന്ന ഗുണനിലവാരമുള്ള ചെലവ് സർവേകളിൽ പോലും (ദേശീയ ഗവേഷണ കൌൺസിൽ 2013, ബി. ഡി. മേയർ, മോക്ക്, സള്ളിവൻ 2015) എന്നിവയെല്ലാം ക്രമാനുഗതമായി വർധിച്ചുവരികയാണ്. വാണിജ്യ ടെലിഫോൺ സർവേകൾക്കുണ്ടായ അനൌണ്ടേഷൻ നിരക്കുകൾ വളരെ കൂടുതലാണ്, ചിലപ്പോൾ 90% (കോത്ത് ആൻഡ് 2012). ഈ ദീർഘകാല ട്രെൻഡുകൾ നോൺ റെസ്പോസ്സാണ് സൂചിപ്പിക്കുന്നത്, ഡാറ്റ ശേഖരണം കൂടുതൽ ചെലവേറിയതും, കൂടുതൽ വിശ്വാസ്യത കുറഞ്ഞവയുമാണ്. ബി. ഡി. മേയർ, മോക്ക്, സള്ളിവൻ (2015) എന്നിവയിൽ നിന്നും സ്വീകരിച്ചിരിക്കുന്നു.

ചിത്രം 3.5: ഉയർന്ന ഗുണനിലവാരം കുറഞ്ഞ സർവേകളിൽ (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) പോലും, ആശങ്കകൾ വർധിച്ചുവരികയാണ്. വാണിജ്യ ടെലിഫോൺ സർവേകൾക്കുണ്ടായ അനൌണ്ടേഷൻ നിരക്കുകൾ വളരെ കൂടുതലാണ്, ചിലപ്പോൾ 90% (Kohut et al. 2012) . ഈ ദീർഘകാല ട്രെൻഡുകൾ നോൺ റെസ്പോസ്സാണ് സൂചിപ്പിക്കുന്നത്, ഡാറ്റ ശേഖരണം കൂടുതൽ ചെലവേറിയതും, കൂടുതൽ വിശ്വാസ്യത കുറഞ്ഞവയുമാണ്. BD Meyer, Mok, and Sullivan (2015) , എന്നിവ 1 അംഗീകരിച്ചു.

പ്രോബബിലിറ്റി ഒരുപറ്റം രീതികൾ വേണ്ടി പ്രയാസങ്ങളുണ്ട് വളരുന്ന ചെയ്തു അതേ സമയം, അവിടെ ഇതര പ്രോബബലിറ്റി ഒരുപറ്റം രീതികൾ ആവേശകരമായ ചെയ്തു. പല തരത്തിലുള്ള ശൈലികളിലൊന്നു നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങ് സമ്പ്രദായങ്ങൾ ഉണ്ട്. എന്നാൽ, അവയ്ക്ക് പൊതുവായിട്ടുള്ള ഒരു സംഗതി, ആപേക്ഷിക സാംക്രമിക ഗണിത ചട്ടക്കൂടിൽ (Baker et al. 2013) എളുപ്പത്തിൽ ഉൾക്കൊള്ളാനാകില്ല എന്നതാണ്. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, സാന്ദർഭിക സാംക്രമികേതര രീതികളിൽ എല്ലാവർക്കുമുള്ള ഒരു ഉൾപ്പെടാത്ത സംഭാവ്യതയും ഉൾക്കൊള്ളുന്നില്ല. സോഷ്യൽ റിസർച്ചർമാർക്ക് നോൺ പ്രോബബിലിറ്റി സാംപ്ലിംഗ് സമ്പ്രദായങ്ങൾ വളരെ ഗൌരവമുള്ള പ്രശസ്തിയാണ് വഹിക്കുന്നത്. സർവെ ഗവേഷകരുടെ ലിറ്റററി ഡൈജസ്റ്റ് ഫെയ്സ്കോ (മുൻപ് ചർച്ച ചെയ്തത്), "ഡ്യുയി ഡെഫൈസ് ട്രൂമാൻ" 1948 ലെ പ്രസിഡന്റ് തെരഞ്ഞെടുപ്പ് (ചിത്രം 3.6).

ചിത്രം 3.6: പ്രസിഡന്റ് ഹാരി ട്രൂമാൻ തന്റെ തോൽവി തെറ്റായി പ്രഖ്യാപിച്ച ഒരു പത്രത്തിന്റെ തലക്കെട്ട് അടങ്ങിയതാണ്. ഈ തലക്കെട്ട് നോൺ പ്രോബബിലിറ്റി സാമ്പിളുകൾ (മോസ്റ്റല്ലെർ 1949, ബീൻ 1950, ഫ്രീഡ്മാൻ, പിസാനി, ആൻഡ് പർവേസ് 2007) എന്നിവയുടെ അടിസ്ഥാനത്തിലാണ്. ഡ്യൂവിയെ ട്രൂമൻ പരാജയപ്പെടുത്തിയത് 1948 ലാണ്. എങ്കിലും, ചില ഗവേഷകർ നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകളിൽ നിന്നുള്ള അനുമാനങ്ങളിൽ സംശയമുണ്ടെന്നതിന്റെ കാരണം തന്നെയാണ്. ഉറവിടം: ഹാരി എസ് ട്രൂമാൻ ലൈബ്രറി ആൻഡ് മ്യൂസിയം.

ചിത്രം 3.6: പ്രസിഡന്റ് ഹാരി ട്രൂമാൻ തന്റെ തോൽവി തെറ്റായി പ്രഖ്യാപിച്ച ഒരു പത്രത്തിന്റെ തലക്കെട്ട് അടങ്ങിയതാണ്. ഈ തലക്കെട്ട് നോൺ പ്രോബബിലിറ്റി സാമ്പിളുകൾ (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . 1948 ൽ "ഡ്യുയി ഡെഫിറ്റ്സ് ട്രൂമാൻ" സംഭവിച്ചതാണെങ്കിലും ചില ഗവേഷകർ നോൺ പ്രോബബിലിറ്റീസ് സാമ്പിളുകളിൽ നിന്നുള്ള അനുമാനങ്ങളിൽ സംശയമുണ്ടെന്നതിന്റെ കാരണം തന്നെയുണ്ട്. ഉറവിടം: ഹാരി എസ് ട്രൂമാൻ ലൈബ്രറി ആൻഡ് മ്യൂസിയം .

ഡിജിറ്റൽ യുഡിന് അനുയോജ്യമായ ഒരു സാന്ദർഭിക സാംസ്റിംഗ് ഒരു ഓൺലൈൻ പനികളുടെ ഉപയോഗം ആണ്. ഓൺലൈൻ പാനലുകൾ ഉപയോഗിക്കുന്ന ഗവേഷകർ ചില പാനൽ ദാതാവാണ് - സാധാരണയായി ഒരു കമ്പനി, സർക്കാർ, അല്ലെങ്കിൽ യൂണിവേഴ്സിറ്റി - ആശ്രയിക്കുന്നു. ഈ പാനൽ പങ്കെടുക്കുന്നവർ മിക്കപ്പോഴും ഓൺലൈൻ ബാനർ പരസ്യങ്ങൾ പോലെയുള്ള പലതരം അഡ്ഹോക് രീതികൾ ഉപയോഗിച്ചാണ് റിക്രൂട്ട് ചെയ്യപ്പെടുന്നത്. ആവശ്യമുള്ള സ്വഭാവസവിശേഷതകളോട് ഒരു ഉദാഹരണം (ഉദാ: മുതിർന്നവരുടെ ദേശീയ പ്രതിനിധി) പ്രവേശനത്തിനായി ഒരു ഗവേഷകൻ പാനൽ പ്രൊവൈഡർക്ക് പണമടയ്ക്കാനാകും. ഈ ഓൺലൈൻ പാനലുകൾ പ്രോനബിളിറ്റി അല്ലാത്ത രീതികളാണ്, കാരണം എല്ലാവരേയും അറിയാത്ത, കൂട്ടിച്ചേർക്കാനുള്ള സംഭാവ്യതയില്ല. സോഷ്യൽ റിസർച്ചർമാർ (ഉദാ: സിസിഇഎസ്) നോൺ-പ്രോബബിലിറ്റി ഓൺലൈൻ പനലുകൾ ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിലും, അവയിൽ നിന്ന് വരുന്ന മൂല്യനിർണ്ണയത്തെക്കുറിച്ച് ചില തർക്കങ്ങൾ ഇപ്പോഴും നിലവിലുണ്ട് (കാലെഗാരോ, (Callegaro et al. 2014) .

ഈ സംവാദങ്ങൾ ഉണ്ടായിരുന്നിട്ടും, സോഷ്യൽ റിസർച്ചർമാർ നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങ് പുനരവലോകനം ചെയ്യുന്നതിനുള്ള സമയം കൃത്യമാണെന്നതിന് രണ്ട് കാരണങ്ങളുണ്ടെന്ന് ഞാൻ കരുതുന്നു. ആദ്യം, ഡിജിറ്റൽ യുഗത്തിൽ, സാന്ദർഭികമല്ലാത്ത സാമ്പിളുകളുടെ ശേഖരണത്തിലും അപഗ്രഥനത്തിലും നിരവധി പുരോഗതികൾ ഉണ്ടായിട്ടുണ്ട്. ഈ പുതിയ രീതികൾ മുമ്പ് പ്രശ്നങ്ങളുണ്ടാക്കുന്ന രീതികളിൽ നിന്ന് വ്യത്യസ്തമാണ്, അവയെ "നോൺ-പ്രോബബിലിറ്റി സാമ്പിൾ ചെയ്യൽ 2.0" ആയി കണക്കാക്കാൻ അർത്ഥമുണ്ടാക്കുമെന്ന് ഞാൻ കരുതുന്നു. ഗവേഷണകർക്ക് നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങ് വീണ്ടും പുനർവിചിന്തനം ചെയ്യേണ്ടതിന്റെ രണ്ടാമത്തെ കാരണം, പ്രാക്ടീസ് വളരെ ബുദ്ധിമുട്ടുള്ളതായിത്തീർന്നിരിക്കുന്നു. യഥാർത്ഥത്തിലുള്ള സർവ്വേകൾ ഉള്ളതിനാൽ ഇപ്പോൾ ഉയർന്ന പ്രതികരണങ്ങളില്ല- പ്രതികരിക്കുന്നവരെ ഉൾപ്പെടുത്താനുള്ള യഥാർത്ഥ സാധ്യതകൾ അറിയില്ല. അതിനാൽ, പ്രോബബിലിറ്റി സാമ്പിളുകളും നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകളും വ്യത്യസ്ത ഗവേഷകർ വിശ്വസിക്കുന്നില്ല.

ഞാൻ നേരത്തെ പറഞ്ഞതു പോലെ, പ്രോബബിലിറ്റി സാമ്പിളുകൾ വലിയ സാമൂഹ്യ ഗവേഷകരുടെ കാഴ്ചപ്പാടാണ് കാണുന്നത്, സർവേ ഗവേഷണത്തിന്റെ ആദ്യകാലങ്ങളിൽ ഏറ്റവും ശോചനീയമായ പരാജയങ്ങളിൽ അവർ പങ്കു വഹിച്ചതിന്റെ ഫലമായി. 2012 ലെ യുഎസ് തെരഞ്ഞെടുപ്പിന്റെ ഫലം ശരിയായി കണ്ടുകിട്ടാത്ത സാമ്പിളുകൾ ഉപയോഗിച്ച് വെയി വാങ്, ഡേവിഡ് റോത്ത്ഷീൽഡ്, ശരദ് ഗോയൽ, ആൻഡ്രൂ ഗെൽമാൻ (2015) എന്നിവരുടെ ഗവേഷണഫലമാണ് നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകളുമായി എത്രമാത്രം അകന്നിട്ടുണ്ടെന്നതിന്റെ വ്യക്തമായ ഉദാഹരണമാണ്. അമേരിക്കൻ എക്സ്ബോക്സ് ഉപയോക്താക്കൾ - അമേരിക്കൻ ജനതയുടെ നിശ്ചയദാർഢ്യമല്ലാത്ത ഒരു സാമ്പിൾ. XBox ഗെയിമിംഗ് സിസ്റ്റത്തിൽ നിന്നുള്ള ഗവേഷകരെ റിക്രൂട്ട് ചെയ്തു. നിങ്ങൾ പ്രതീക്ഷിച്ചേക്കാവുന്നതുപോലെ, എക്സ്ബോക്സ് സാമ്പിൾ ആൺ വൃത്തിയാക്കിയതും ചെറുപ്പക്കാരെ തിരഞ്ഞതുമാണ്. 18 മുതൽ 29 വയസ്സ് വരെ പ്രായമുള്ളവർ 19 ശതമാനം വോട്ടർമാരോ അല്ലെങ്കിൽ എക്സ്പിക്സ് സാമ്പിളിൽ 65 ശതമാനം പേരും ആണ്. വോട്ടർമാരിൽ 47 ശതമാനവും എക്സ്ബോക്സ് സാമ്പിളിൽ 93 ശതമാനവും (ചിത്രം 3.7) ഉണ്ടാക്കുക. ശക്തമായ ജനസംഖ്യാപരമായ പക്ഷപാതങ്ങൾ മൂലം റോ റോഡിലെ ഡാറ്റ തെരഞ്ഞെടുപ്പ് വരുമാനത്തിന്റെ ഒരു സൂചനയായിരുന്നു. ബാർക് ഒബാമയെ സംബന്ധിച്ച് മിറ്റ് റോംനിക്ക് ശക്തമായ വിജയം പ്രവചിച്ചു. അസംസ്കൃതവും അസന്തുപ്പെടാത്തതുമായ നോൺ പ്രോബബിലിറ്റി സാമ്പിളുകളുടെ അപകടത്തെക്കുറിച്ചുള്ള മറ്റൊരു ഉദാഹരണമാണ് ഇത്. സാഹിത്യ ഡൈജസ്റ്റ് പിരകോടിയുടെ ഓർമ്മപ്പെടുത്തൽ.

ചിത്രം 3.7: ഡബ്ല്യൂ വാങിലെ മറ്റു പ്രതികൾ. (2015). പ്രതികരിക്കാൻ XBox ൽ നിന്ന് തിരഞ്ഞെടുക്കപ്പെട്ടതിനാൽ, അവർ 2012 ലെ തിരഞ്ഞെടുപ്പിൽ വോട്ടർമാരോട് താരതമ്യേന ചെറുപ്പക്കാരായിരിക്കാൻ സാധ്യത കൂടുതലാണ്. ഡബ്ല്യു വാങിൽ നിന്നും സ്വീകരിച്ചത്. (2015), ചിത്രം 1.

ചിത്രം 3.7: W. Wang et al. (2015) പ്രതികൾ W. Wang et al. (2015) . പ്രതികരിക്കാൻ XBox ൽ നിന്ന് തിരഞ്ഞെടുക്കപ്പെട്ടതിനാൽ, അവർ 2012 ലെ തിരഞ്ഞെടുപ്പിൽ വോട്ടർമാരോട് താരതമ്യേന ചെറുപ്പക്കാരായിരിക്കാൻ സാധ്യത കൂടുതലാണ്. W. Wang et al. (2015) നിന്നും സ്വീകരിച്ചത് W. Wang et al. (2015) , ചിത്രം 1.

എന്നിരുന്നാലും വാങും സഹപ്രവർത്തകരും ഈ പ്രശ്നങ്ങളെക്കുറിച്ച് ബോധവാന്മാരായിരുന്നു, അവ അനായാസങ്ങൾ ചെയ്യുന്നതിനിടെ അവരുടെ റാൻഡം സാമ്പിൾ പ്രക്രിയയ്ക്കായി ക്രമീകരിക്കാൻ ശ്രമിച്ചു. പ്രത്യേകിച്ചും, പോസ്റ്റ് സ്ട്രാറ്ററാഫിക്കേഷനുകൾ ഉപയോഗിച്ചാണ്, അവർ കവറേജ് പിശകുകളും പ്രതികരണവുമില്ലാത്ത പ്രോബബിലിറ്റി സാമ്പിളുകൾ ക്രമീകരിക്കുന്നതിന് ഉപയോഗിക്കുന്ന ഒരു സാങ്കേതികതയാണ്.

ഒരു മാതൃകയിൽ നിന്നു വരുന്ന എസ്റ്റിമേറ്റുകൾ മെച്ചപ്പെടുത്താൻ സഹായിക്കുന്നതിന് ടാർഗെറ്റ് ജനസംഖ്യയെക്കുറിച്ചുള്ള സഹായകരമായ വിവരങ്ങൾ ഉപയോഗിക്കുക എന്നതാണ് പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കിന്റെ പ്രധാന ആശയം. അവരുടെ നോൺ-പ്രോബബിലിറ്റി സാമ്പിളിൽ നിന്ന് മൂല്യനിർണ്ണയം നടത്തുന്നതിന് പോസ്റ്റ് സ്ട്രാറ്റിഫിക്കേഷൻ ഉപയോഗിക്കുമ്പോൾ, വാങ്, സഹപ്രവർത്തകൻ എന്നിവരെ ഓരോ ഗ്രൂപ്പിലേയും വെട്ടിമുറിച്ചു, ഓരോ ഗ്രൂപ്പിലും ഒബാമയ്ക്ക് പിന്തുണയുണ്ടെന്ന് കണക്കാക്കി, പിന്നീട് മൊത്തത്തിൽ ശരാശരി മതിപ്പ് കണക്കു കൂട്ടാനായി ഒരു കൂട്ടം ശരാശരി കണക്കെടുത്തു. ഉദാഹരണത്തിന്, അവർ ജനങ്ങളെ രണ്ട് ഗ്രൂപ്പുകളായി പിരിയുകയാണ്, പുരുഷന്മാരും സ്ത്രീകളുമടങ്ങുന്ന ഒബാമയുടെ പിന്തുണയെന്ന് കണക്കാക്കി, ഒബാമയ്ക്ക് മൊത്തത്തിൽ ശരാശരി പിന്തുണ നൽകിയത്, അവർ സ്ത്രീകളെ 53 ശതമാനവും പുരുഷൻമാരിൽ 47 ശതമാനവും. ഗ്രൂപ്പുകളുടെ വലുപ്പത്തെക്കുറിച്ചുള്ള സഹായവിവരങ്ങൾ ലഭ്യമാക്കുന്നതിലൂടെ അസന്തുലിതമായ ഒരു സാമ്പിൾ വേണ്ടി പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ സഹായിക്കുന്നു.

പോസ്റ്റ് സ്ട്രീറ്റിഫിക്കേഷന്റെ താക്കോൽ ശരിയായ ഗ്രൂപ്പുകൾ രൂപപ്പെടുത്തലാണ്. ഓരോ ഗ്രൂപ്പിലേയും എല്ലാവർക്കും പ്രതികരിക്കുന്നതിന് പ്രതികരണ പ്രഭാവം ഉണ്ടായിരിക്കുമെന്നതു പോലെ, നിങ്ങൾക്ക് ജനസംഖ്യാ ഗ്രൂപ്പുകളായി മാറിയാൽ, പാരാമെഡിക്കൽ സ്റ്റാറ്റിഫിക്കേഷൻ നിഷ്പക്ഷ നിലപാടുകൾ ഉളവാക്കും. മറ്റൊരർഥത്തിൽ, എല്ലാ പുരുഷൻമാർക്കും പ്രതികരണത്തിനുള്ള സാദ്ധ്യത ഉണ്ടെങ്കിൽ എല്ലാ സ്ത്രീകളും ഒരേ പ്രതികരണത്തിന് മുൻതൂക്കം നൽകുമെന്നെങ്കിൽ, ലിംഗഭേദം പോസ്റ്റു ചെയ്യുന്നതിലൂടെ പക്ഷപാതമില്ലെന്ന് കണക്കാക്കാം. ഈ അനുമാനം എന്നത് ഏകജാലക-പ്രതികരണ-വിദഗ്ദ്ധർ-ഉള്ളിൽ ഗ്രൂപ്പുകളുടെ അനുമാനം എന്ന് വിളിക്കപ്പെടുന്നു, ഈ അധ്യായത്തിന്റെ ഒടുവിൽ ഗണിതശാസ്ത്ര കുറിപ്പുകളിൽ കുറച്ചുകൂടി ഞാൻ വിവരിക്കുന്നു.

എല്ലാ പുരുഷന്മാർക്കും എല്ലാ സ്ത്രീമാർക്കും പ്രതികരണ പ്രഭാവം ഉണ്ടായിരിക്കും എന്നതിന് സംശയമില്ല. എന്നിരുന്നാലും, ഗ്രൂപ്പുകളുടെ എണ്ണം കൂടുന്നതിനനുസരിച്ച് ഏകതാപരമായ പ്രതികരണ പ്രഭാവം ഗ്രൂപ്പുകളുടെ അനുമാനത്തിന് കൂടുതൽ ഊഹിക്കാവുന്നതായിത്തീരുന്നു. നിങ്ങൾ കൂടുതൽ ഗ്രൂപ്പുകൾ സൃഷ്ടിച്ചാൽ ജനസംഖ്യാ ഗ്രൂപ്പുകളായി അത് മാറിയാൽ കൂടുതൽ എളുപ്പമാകും. ഉദാഹരണത്തിന്, എല്ലാ സ്ത്രീകൾക്കും സമാനമായ പ്രതികരണമാണെന്നത് തികച്ചും അപ്രസക്തമെന്നു തോന്നിയേക്കാം. എന്നാൽ കോളജിൽ നിന്ന് ബിരുദം നേടിയ, 18-29 വയസുള്ള എല്ലാ സ്ത്രീകൾക്കും അതേ പ്രതികരണ പ്രഭാവം ഉണ്ടെന്ന് തോന്നിയേക്കാം. . ഇപ്രകാരം, പോസ്റ്റ് സ്ട്രാറ്റജിയിൽ ഉപയോഗിക്കുന്ന ഗ്രൂപ്പുകളുടെ എണ്ണം കൂടുതലുണ്ട്, ഈ രീതിയെ പിന്തുണയ്ക്കുന്നതിനുള്ള അനുമാനങ്ങൾ കൂടുതൽ ന്യായമായതാക്കുന്നു. ഈ സത്യത്തിൽ, ഗവേഷകർ പലപ്പോഴും പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷനു വേണ്ടി ഒരു വലിയ സംഘങ്ങൾ സൃഷ്ടിക്കാൻ ആഗ്രഹിക്കുന്നു. എന്നിരുന്നാലും, സംഘങ്ങളുടെ എണ്ണം കൂടുന്നതനുസരിച്ച്, ഗവേഷകർ മറ്റൊരു പ്രശ്നത്തിലേക്ക് കടന്നുവരുന്നു: ഡാറ്റാ സ്പാർസിറ്റി. ഓരോ ഗ്രൂപ്പിലും ഒരു ചെറിയ വിഭാഗം ആളുകൾ മാത്രമേ ഉള്ളൂ എങ്കിൽ, മതിപ്പുകാർ കൂടുതൽ കൃത്യതയില്ലാത്തതും പ്രതികരിക്കാത്ത ഒരു ഗ്രൂപ്പുണ്ടെങ്കിൽ അങ്ങേയറ്റം കുഴപ്പത്തിലാകുമെങ്കിലും, പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ പൂർണമായും തകർന്നുപോകും.

ഏകപക്ഷീയ-പ്രതികരണ-പ്രീപ്ലീനിറ്റി-ഇൻ-ഗ്രൂപ്പുകളുടെ അനുമാനവും, ഓരോ ഗ്രൂപ്പിലെ ന്യായയുക്തമായ സാമ്പിൾ വലിപ്പങ്ങളുടെ ആവശ്യവും തമ്മിലുള്ള ഈ അന്തർലീനമായ പിരിമുറുക്കത്തിൽ രണ്ട് വഴികൾ ഉണ്ട്. ഒന്നാമതായി, ഗവേഷകർക്ക് കൂടുതൽ വിപുലമായ ഒരു സാമ്പിൾ ശേഖരിക്കാം, ഇത് ഓരോ ഗ്രൂപ്പിനും ന്യായമായ സാമ്പിൾ വലുപ്പങ്ങൾ ഉറപ്പാക്കാൻ സഹായിക്കുന്നു. രണ്ടാമതായി, അവയ്ക്ക് ഗ്രൂപ്പുകളുടെ മൂല്യനിർണ്ണയം നടത്തുന്നതിനായി കൂടുതൽ സങ്കീർണ്ണമായ സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക ഉപയോഗപ്പെടുത്താം. വാങ്, സഹപ്രവർത്തകർ എന്നിവർ തങ്ങളുടെ എക്സ്ബോക്സിൽ നിന്ന് പ്രതികരിച്ചവരെ തെരഞ്ഞെടുക്കുന്നതിനെ പറ്റി പഠിച്ചതുപോലെ, ചിലപ്പോൾ ചിലപ്പോൾ ഗവേഷകർ പ്രവർത്തിക്കുന്നു.

അവർ കമ്പ്യൂട്ടർ-അഡ്മിനിസ്ട്രേറ്റഡ് ഇൻറർവ്യൂനൊപ്പം നോൺ-പ്രോബബിലിറ്റി സാംപ്ലിങ് രീതി ഉപയോഗിച്ചു (സെക്ഷൻ 3.5 ലെ കമ്പ്യൂട്ടർ-ഇൻറർനെറ്റഡ് ഇൻറർവ്യൂവിനെക്കുറിച്ച് ഞാൻ കൂടുതൽ സംസാരിക്കും) വാങ് കമ്പനികളും സഹപ്രവർത്തകരും വളരെ കുറഞ്ഞ ചെലവിൽ ഡാറ്റ ശേഖരണം നടത്തി. ഇത് വിവരങ്ങൾ ശേഖരിക്കാൻ 345,858 ആൾമാറാട്ടങ്ങൾ തെരഞ്ഞെടുപ്പ് പോളിങ്ങിന്റെ മാനദണ്ഡങ്ങളാൽ വലിയ എണ്ണം. ഈ വലിയ സാമ്പിൾ സൈസ് അവരെ ഒരുപാട് എണ്ണം പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ ഗ്രൂപ്പുകളെ രൂപപ്പെടുത്താൻ സഹായിച്ചു. ജനസംഖ്യ നൂറുകണക്കിന് ഗ്രൂപ്പുകളായി മാറിയാൽ പാരാ സ്ട്രാറ്റാഫിക്കേഷന്റെ ഭാഗമായി, വാങ്, സഹപ്രവർത്തകർ എന്നിവർ ജനസംഖ്യയിൽ 176,256 ഗ്രൂപ്പുകളായി വിഭാഗിച്ചു. 2 വിഭാഗങ്ങൾ, റേസ് (4 വിഭാഗങ്ങൾ), 4 വയസ്സ്, വിദ്യാഭ്യാസം 4 വിഭാഗങ്ങൾ (3 വിഭാഗങ്ങൾ), പ്രത്യയശാസ്ത്രം (3 വിഭാഗങ്ങൾ), 2008 വോട്ട് (3 വിഭാഗങ്ങൾ) എന്നിവയാണ്. മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, കുറഞ്ഞ ചെലവിൽ ലഭിക്കുന്ന വിവര ശേഖരങ്ങളാൽ നിർമിക്കപ്പെട്ട അവരുടെ വലിയ സാമ്പിൾ സൈസ് അവരുടെ മൂല്യനിർണയ പ്രക്രിയയിൽ കൂടുതൽ സാങ്കൽപിക അനുമാനമാക്കി മാറ്റാൻ പ്രാപ്തരാക്കി.

എന്നിരുന്നാലും, 345,858 അദ്വിതീയ പങ്കാളികളുമായിപ്പോലും വാങ്, സഹപ്രവർത്തകർക്ക് പ്രതികരിക്കാത്ത നിരവധി ഗ്രൂപ്പുകളുണ്ട്. അതുകൊണ്ട് അവർ ഓരോ ഗ്രൂപ്പിനേയും പിന്തുണയ്ക്കുന്നതിന് മൾട്ടിളവൽ റിഗ്രഷൻ എന്ന ഒരു രീതി ഉപയോഗിച്ചു. പ്രത്യേകമായി, ഒരു പ്രത്യേക ഗ്രൂപ്പിനുള്ളിൽ ഒബാമയുടെ പിന്തുണയെ വിലയിരുത്താൻ, ബഹുസ്വരമായ പിന്തിരിപ്പൻ നിരവധി അടുത്ത ഗ്രൂപ്പുകളിൽ നിന്നുള്ള വിവരങ്ങൾ ശേഖരിച്ചു. ഉദാഹരണത്തിന്, 18 നും 29 നും ഇടയിലുള്ള പെൺ ഹിസ്പാനിക് വംശജർ ഒബാമയ്ക്ക് പിന്തുണ നൽകാനാണ് ശ്രമിക്കുന്നത്. അവർ കോളേജ് ബിരുദധാരികളാണ്. അവർ ഡെമോക്രാറ്റുകളെ രജിസ്റ്റർ ചെയ്യുന്നു. അവർ മോഡറേറ്ററായി സ്വയം തിരിച്ചറിയുന്നു, 2008 ൽ ഒബാമയ്ക്ക് വോട്ട് ചെയ്തതാണ്. , വളരെ പ്രത്യേക ഗ്രൂപ്പ്, ഈ സ്വഭാവസവിശേഷതകളിൽ ആരും ഇല്ലെന്നത് സാദ്ധ്യമാണ്. അതുകൊണ്ട്, ഈ ഗ്രൂപ്പിനെക്കുറിച്ചുള്ള ഏകദേശ കണക്കുകൾ തയ്യാറാക്കാൻ, ഒന്നിലധികം റിഗ്രഷൻ, ഒരേ സമാന ഗ്രൂപ്പുകളിൽ നിന്നുള്ള ആളുകളുടെ കണക്കിൽ ഒന്നിച്ചുനിൽക്കാൻ ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക ഉപയോഗിക്കുന്നു.

അങ്ങനെ, വാൻഗും സഹപ്രവർത്തകരും ബഹുമുഖമായ പിരിമുറുക്കവും പോസ്റ്റ്-സ്ട്രാറ്റജിഫും കൂട്ടിച്ചേർത്ത് ഒരു സമീപനം സ്വീകരിച്ചു. അതിനാലാണ് അവർ തങ്ങളുടെ തന്ത്രങ്ങൾ പോസ്റ്റ് സ്ട്രാറ്റിഫിക്കേഷനുമായി ഒന്നിലേറെ തസ്തിക പിൻവലിക്കൽ അല്ലെങ്കിൽ കൂടുതൽ പ്രേമപരമായി വിളിച്ചത്. P. "XBox നോൺ പ്രോബബബിലിറ്റി സാമ്പിളിൽ നിന്ന് മൂല്യനിർണ്ണയം നടത്തുന്നതിന് വാങ് ആൻഡ് സഹപ്രവർത്തകർ മിസ്റ്റർ പി ഉപയോഗിക്കുമ്പോൾ, 2012 ലെ തെരഞ്ഞെടുപ്പിൽ ഒബാമയ്ക്ക് ലഭിച്ച മുഴുവൻ പിന്തുണയുമായും അവർ കണക്കാക്കി. വാസ്തവത്തിൽ, അവരുടെ പൊതു മൂല്യനിർണയ വോട്ടുകളെ താരതമ്യം ചെയ്യുന്നതിനേക്കാൾ കൂടുതൽ കൃത്യമായിരുന്നു അത്. അങ്ങനെ, ഈ സാഹചര്യത്തിൽ, സ്റ്റാറ്റിസ്റ്റിക്കൽ അഡ്ജസ്റ്റ്മെൻറുകൾ, പ്രത്യേകിച്ച് മിസ്റ്റർ പി.-സാധ്യതയല്ലാത്ത ഡാറ്റയിൽ പക്ഷപാതനം തിരുത്തുന്നതിന് നല്ല ജോലി ചെയ്യുക. നിങ്ങൾ പരിഹരിക്കാത്ത Xbox ഡാറ്റയിൽ നിന്ന് വിലയിരുത്തുമ്പോൾ അവ വ്യക്തമായി ദൃശ്യമാണ്.

ചിത്രം 3.8: ഡബ്ല്യൂ വാങ് മുതലായവരിൽ നിന്നുമുള്ള കണക്കുകൾ. (2015). Unjustified XBox സാമ്പിൾ തെറ്റായ കണക്കുകളെ ഉൽപാദിപ്പിച്ചു. എന്നാൽ, വെയ്റ്റഡ് XBox സാമ്പിൾ ഒരു ശരാശരി പ്രോബബിലിറ്റി അധിഷ്ഠിത ടെലഫോൺ സർവ്വേകളേക്കാൾ കൃത്യതയോടെയുള്ളതാണ്. ഡബ്ല്യു വാങിൽ നിന്നും സ്വീകരിച്ചത്. (2015), കണക്കുകൾ 2, 3.

ചിത്രം 3.8: W. Wang et al. (2015) മുതലായവരിൽ നിന്നുമുള്ള കണക്കുകൾ W. Wang et al. (2015) . Unjustified XBox സാമ്പിൾ തെറ്റായ കണക്കുകളെ ഉൽപാദിപ്പിച്ചു. എന്നാൽ, വെയ്റ്റഡ് XBox സാമ്പിൾ ഒരു ശരാശരി പ്രോബബിലിറ്റി അധിഷ്ഠിത ടെലഫോൺ സർവ്വേകളേക്കാൾ കൃത്യതയോടെയുള്ളതാണ്. W. Wang et al. (2015) നിന്നും സ്വീകരിച്ചത് W. Wang et al. (2015) , കണക്കുകൾ 2, 3.

വാങ്ങിനെയും സഹപ്രവർത്തകരുടെയും പഠനത്തിൽ നിന്നും രണ്ട് പ്രധാന പാഠങ്ങൾ ഉണ്ട്. ഒന്നാമത്തേത്, unjustified നോൺ-പ്രോബബിലിറ്റി സാമ്പിളുകൾ മോശമായ കണക്കുകളിലേക്ക് നയിച്ചേക്കാം; പല ഗവേഷകരും ഇതിനുമുന്പ് കേട്ട ഒരു പാഠമാണ് ഇത്. രണ്ടാമത്തെ പാഠം, ഗുണപരമായി വിശകലനം ചെയ്യാത്തപ്പോൾ, നല്ല ഫലമുണ്ടാക്കാൻ സാധ്യതയില്ലാത്ത സാമ്പിളുകൾ. പ്രോബബിലിറ്റി സാമ്പിളുകൾ സ്വാഭാവികമായും, സാഹിത്യ ഡൈജസ്റ്റ് കരിമ്പട്ടിക പോലുള്ളവയിലേയ്ക്ക് നയിക്കേണ്ടതില്ല.

ഒരു പ്രോബബിലിറ്റി സാംപ്ളിങ് സമീപനവും ഒരു നോൺ-പ്രോബബിലിറ്റി സാംപ്ളിങ് സമീപനവും ഉപയോഗിക്കുന്നതിന് നിങ്ങൾ തീരുമാനിക്കാൻ ശ്രമിക്കുന്നെങ്കിൽ പ്രയാസകരമായ ഒരു രീതി നേരിടാം. ചിലപ്പോൾ ഗവേഷകർക്ക് വേഗവും കർശനമായ നിയമവും വേണം (ഉദാഹരണത്തിന്, എല്ലായ്പ്പോഴും പ്രോബബിലിറ്റി സാംപ്ലിങ് രീതികൾ ഉപയോഗിക്കുക), എന്നാൽ അത്തരമൊരു നിയമം വാഗ്ദാനം ചെയ്യുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടാണ്. പ്രായോഗിക സാംക്രമിക പ്രയോഗങ്ങൾ തമ്മിലുള്ള സങ്കീർണ്ണമായ പരീക്ഷണങ്ങളിൽ ഗവേഷകരുണ്ട്. ഇത് കൂടുതൽ ചെലവേറിയതും ദൂരദർശിനിയുമാണ്. അവയുടെ ഉപയോഗം-സാധ്യതയില്ലായ്മ സാമ്പിൾ സമ്പ്രദായങ്ങളിൽ-വിലകുറഞ്ഞതും വേഗതയുമുള്ളതും എന്നാൽ കൂടുതൽ പരിചിതവും കൂടുതൽ വ്യത്യസ്തവുമാണ്. എന്നാൽ ഒരു കാര്യം വ്യക്തമാണ്, നിങ്ങളില്ലാത്ത പ്രോബബിലിറ്റി സാമ്പിളുകളോ, റിയർ ചെയ്യാത്ത വലിയ ഡാറ്റാ സ്രോതസ്സുകളോ പ്രവർത്തിക്കുന്നില്ലെങ്കിൽ (അദ്ധ്യായം 2-നോട് വീണ്ടും ചിന്തിക്കുക), തുടർന്ന് പോസ്റ്റ് സ്ട്രാറ്റാലിറ്റി ഉപയോഗിച്ച് നടത്തിയ മൂല്യനിർണ്ണയങ്ങൾ വിശ്വസിക്കാൻ ശക്തമായ കാരണങ്ങളുണ്ട് അനിയന്ത്രിതമായ, അസംസ്കൃത കണക്കുകളേക്കാൾ മെച്ചപ്പെട്ടതാണ് സാങ്കേതികവിദ്യ.