ഗണിത കുറിപ്പുകൾ

ഈ അനുബന്ധത്തിൽ, ഞാൻ അധ്യായത്തിൽ നിന്നും കുറച്ച് ആശയങ്ങൾ അല്പം കൂടുതൽ ഗണിതരൂപത്തിൽ വിവരിക്കുന്നു. ഗവേഷണ ഗവേഷകർ ഉപയോഗിക്കുന്ന നൊട്ടേഷൻ, ഗണിത ചട്ടക്കൂട് എന്നിവയ്ക്കൊപ്പം നിങ്ങളെ സഹായിക്കുന്നതിനാണ് ഇവിടെ ലക്ഷ്യമിടുന്നത്, അതിലൂടെ നിങ്ങൾക്ക് ഈ വിഷയങ്ങളിൽ കൂടുതൽ സാങ്കേതിക കാര്യങ്ങളിലേക്ക് മാറ്റാൻ കഴിയും. ഞാൻ പ്രോബബിലിറ്റി സാംപ്ലിങ് പരിചയപ്പെടുത്തുകയും തുടർന്ന് നോൺ റേഷൻമാളുമൊത്ത് ഒടുവിൽ പ്രോബബിലിറ്റി സാംപ്ലിങിലേക്ക് നീങ്ങുകയും ആരംഭിക്കുകയും ചെയ്യും.

പ്രോബബിലിറ്റി സാംപ്ലിംഗ്

അമേരിക്കൻ ഐക്യനാടുകളിലെ തൊഴിലില്ലായ്മ നിരക്ക് കണക്കാക്കുന്നതിനുള്ള ലക്ഷ്യം നോക്കാം. നമുക്ക് \(U = \{1, \ldots, k, \ldots, N\}\) ലക്ഷ്യം ദേശാടനം വിട്ടയച്ചു \(y_k\) വ്യക്തി ഷിന്ച്ചി വേരിയബിൾ മൂല്യം പ്രകാരം \(k\) . ഈ ഉദാഹരണത്തിൽ \(y_k\) എന്നത് വ്യക്തി \(k\) തൊഴിൽരഹിതനാണോ എന്നതാണ്. അവസാനമായി, ഫ്രെയിം ജനസംഖ്യയായിരിക്കണം \(F = \{1, \ldots, k, \ldots, N\}\) , അത് ലക്ഷ്യം ജനസംഖ്യയെപ്പോലെ ഒന്നായി കണക്കാക്കാം.

ഒരു അടിസ്ഥാന സാംപ്ലിംഗ് ഡിസൈൻ മാറ്റി പകരം വയ്ക്കാതെ ലളിതമായ സാംക്രമിക മാതൃകയാണ്. ഈ സാഹചര്യത്തിൽ, ഓരോ ആൾക്കും മാതൃകയിൽ \(s = \{1, \ldots, i, \ldots, n\}\) . ഈ സാംപ്ളിങ് ഡിസൈനിനൊപ്പം ഡാറ്റ ശേഖരിച്ചാൽ, ഒരു സാമ്പിൾ ശരാശരി ജനസംഖ്യയിൽ തൊഴിലില്ലായ്മ നിരക്ക് ഗവേഷകർക്ക് വിലയിരുത്താനാകും:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

ഇവിടെ \(\bar{y}\) എന്നത് തൊഴിലില്ലായ്മാ നിരക്കി ജനസംഖ്യയിൽ \(\hat{\bar{y}}\) എന്നത് തൊഴിലില്ലായ്മയുടെ (" \(\hat{ }\) ഒരു മൂല്യനിർണ്ണയം സൂചിപ്പിക്കാൻ ഉപയോഗിക്കുന്നു).

വാസ്തവത്തിൽ, ഗവേഷകർ അപൂർവ്വമായി ലളിതമായ റാൻഡം സാമ്പിളുകൾ ഉപയോഗിക്കാതെ തന്നെ ഉപയോഗിക്കുന്നു. പല കാരണങ്ങളാൽ (ഒരു നിമിഷത്തിൽ ഞാൻ വിവരിക്കാറുണ്ട്), ഗവേഷകർ പലപ്പോഴും അസമത്വത്തെ കൂട്ടിച്ചേർക്കാൻ സാധ്യതയുള്ള സാമ്പിളുകളുണ്ടാക്കുന്നു. ഉദാഹരണത്തിന്, ഫ്ലോറിഡയിലെ ജനങ്ങൾ കാലിഫോർണിയയിലെ ജനങ്ങളെ അപേക്ഷിച്ച് കൂടുതലായി ഉൾപ്പെടുത്താൻ സാധ്യതയുള്ളവരാണ് ഗവേഷകർ. ഈ സാഹചര്യത്തിൽ, സാമ്പിൾ അർത്ഥമാക്കുന്നത് (ഉദാഹരണം 3.1) ഒരു നല്ല മൂല്യനിർണ്ണയമാകണമെന്നില്ല. പകരം, ഉൾപ്പെടുത്താത്ത അസമത്വങ്ങൾ ഉണ്ടാകുമ്പോൾ, ഗവേഷകർ ഉപയോഗിക്കുന്നു

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

ഇവിടെ \(\hat{\bar{y}}\) എന്നത് തൊഴിലില്ലായ്മയുടെ കണക്കുകളാണെന്നും \(\pi_i\) വ്യക്തി \(i\) എന്നതിന്റെ സംഭാവ്യതയാണ് \(\hat{\bar{y}}\) . സ്റ്റാൻഡേർഡ് പ്രാക്ടീലിനെ പിന്തുടർന്ന്, ഞാൻ എസ്റ്റിമേറ്ററിലേക്ക് വിളിക്കും. 3.2 ഹോർവിറ്റ്സ് തോംപ്സൺ എക്സിക്യൂട്ടീറ്റർ ഹോർവിറ്റ്-തോംപ്സൺ എക്സിക്യൂട്ടർ വളരെ പ്രയോജനകരമാണ്, കാരണം ഇത് ഏതെങ്കിലും പ്രോബബിലിറ്റി സാംപ്ലിംഗ് ഡിസൈൻ (Horvitz and Thompson 1952) കണക്കുകളും നൽകുന്നു. ഹോർവിറ്റ്-തോംപ്സൺ എക്സിക്യൂട്ടർ നിരന്തരം വരുന്നത് കാരണം, അത് പോലെ തന്നെ പുനർരൂപകൽപ്പന ചെയ്യാനാകുമെന്നത് ശ്രദ്ധേയമാണ്

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

ഇവിടെ \(w_i = 1 / \pi_i\) . Eq ആയി. 3.3 ഹൊർവിറ്റ്സ്-തോംപ്സൺ എക്സിക്യൂട്ടർ ഒരു വെയിറ്റിംഗ് സാമ്പിൾ ആണ്, ഇവിടെ തൂക്കങ്ങൾ അവയുമായുള്ള ബന്ധത്തിന്റെ സാധ്യതയുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. മറ്റൊരു രീതിയിൽ പറഞ്ഞാൽ, ഒരു വ്യക്തിയെ മാതൃകയിൽ ഉൾപ്പെടുത്താൻ സാധ്യത കുറവാണെങ്കിൽ, ആ മതിപ്പുവിലയിൽ ആ വ്യക്തിക്ക് കൂടുതൽ ഭാരം ലഭിക്കും.

നേരത്തേ പറഞ്ഞതുപോലെ, ഗവേഷകർ മിക്കപ്പോഴും ആൾക്കാരെ ഉൾപ്പെടുത്താനുള്ള സാധ്യതയില്ലായ്മയുമാണ്. ഉൾപ്പെടുത്താനുള്ള അസമത്വ സാധ്യതകളെ നയിക്കാൻ കഴിയുന്ന ഒരു മാതൃകയുടെ ഒരു ഉദാഹരണം സ്ട്രാറ്റജിഫൈഡ് സാംപ്ലിംഗ് ആണ് , അത് മനസ്സിലാക്കാൻ വളരെ പ്രധാനപ്പെട്ടതാണ്, കാരണം ഇത് പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ എന്ന് കണക്കാക്കൽ പ്രക്രിയയുമായി വളരെ അടുത്താണ്. സ്ട്രാറ്റജിഫൈഡ് സാമ്പിളുകളിൽ, ഒരു ഗവേഷകൻ ലക്ഷ്യമിടുന്ന ജനസംഖ്യ \(H\) പരസ്പരം പൂർണമായും സമഗ്രമായ ഗ്രൂപ്പുകളായി വിഭജിക്കുന്നു. ഈ ഗ്രൂപ്പുകൾ തന്നെ- വിളിക്കപ്പെടുകയും സൂചിപ്പിച്ചു ചെയ്യുന്നു \(U_1, \ldots, U_h, \ldots, U_H\) . ഈ ഉദാഹരണത്തിൽ, strata states ആകുന്നു. ഗ്രൂപ്പുകളുടെ വലുപ്പം \(N_1, \ldots, N_h, \ldots, N_H\) . രാജ്യത്ത് മതിയായ തൊഴിലില്ലായ്മ ഉണ്ടെന്ന് ഉറപ്പുവരുത്താൻ ഒരു ഗവേഷകൻ സ്ട്രാറ്റജിഫൈഡ് സാംപ്ലിംഗ് ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്നുണ്ടാകും.

ജനസംഖ്യ തന്നെ- കയറി പിളര്ന്ന് കഴിഞ്ഞാൽ, ഗവേഷകൻ വലിപ്പം മാറ്റാതെ ഒരു ലളിതമായ റാൻഡം സാമ്പിളിൽ തിരഞ്ഞെടുക്കുന്നതിന് അനുമാനിക്കേണ്ടതാണ് \(n_h\) സ്വതന്ത്രമായി ഓരോ തന്നെ- നിന്ന്. കൂടാതെ, സാമ്പിളിൽ തിരഞ്ഞെടുക്കപ്പെട്ട എല്ലാവരും പ്രതികരിക്കപ്പെടുമെന്ന് ഞാൻ അനുമാനിക്കുന്നു (അടുത്ത വിഭാഗത്തിൽ ഞാൻ പ്രതികരണമില്ലാതെയാണ് പ്രവർത്തിക്കുന്നത്). ഈ സാഹചര്യത്തിൽ, ഉൾപ്പെടുത്തുന്നതിന്റെ സംഭാവ്യതയാണ്

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

ഈ സാദ്ധ്യതകൾ വ്യക്തിപരമായി വ്യത്യാസപ്പെടാമെന്നതിനാൽ, ഈ മാതൃകാ രൂപകല്പനയിൽ നിന്ന് ഒരു കണക്കെടുക്കുമ്പോൾ, ഗവേഷകർ തങ്ങളുടെ ഹൊർവിറ്റ്സ്-തോംപ്സൺ എക്സിക്യൂട്ടർ (ഉദാ: 3.2) ഉപയോഗിച്ച് ഉൾപ്പെടുത്താനുള്ള അവരുടെ സംഭാവ്യതയുടെ വിപരീത ഫലമായി ഓരോരുത്തരും പ്രതികരിക്കേണ്ടതുണ്ട്.

ഹോർവിറ്റ്-തോംപ്സൺ എക്സിക്യൂട്ടർ നിഷ്ക്രിയമായെങ്കിലും, ഗവേഷകർ കൂടുതൽ കൃത്യമായ (അതായത്, താഴ്ന്ന വേരിയൻസ്) മൂല്യനിർണ്ണയ മാതൃക ഉപയോഗിച്ച് സാമ്പിളുകൾ ശേഖരിക്കും . തികച്ചും എക്സിക്യൂട്ട് ചെയ്യപ്പെട്ട പ്രോബബിലിറ്റി സാംപ്ലിങ് ഉള്ളപ്പോൾ പോലും ഇത് ശരിയാണെന്ന് ചിലർ ചിന്തിക്കുന്നുണ്ട്. സഹായക വിവരങ്ങൾ ഉപയോഗിച്ചുള്ള ഈ സാങ്കേതിക വിദ്യകൾ വളരെ പ്രധാനമാണ്, കാരണം ഞാൻ പിന്നീട് കാണിക്കുന്നതുപോലെ, പ്രോബബിലിറ്റി സാമ്പിളുകളിൽ നിന്ന് നോൺ റേഷനിൽ നിന്നും നോൺ പ്രോബബിലിറ്റി സാമ്പിളുകളിൽ നിന്നും കണക്കുകൾ നിർണ്ണയിക്കാൻ സഹായ വിവരം വളരെ പ്രധാനമാണ്.

സഹായ വിവരങ്ങൾ ഉപയോഗിക്കുന്നതിനുള്ള ഒരു സാധാരണ രീതി പോസ്റ്റ് സ്ട്രാറ്റിഫിക്കേഷനാണ് . ഉദാഹരണത്തിന്, ഒരു ഗവേഷകൻ 50 സംസ്ഥാനങ്ങളിൽ ഓരോ പുരുഷൻമാരുടെയും സ്ത്രീകളുടെയും അറിയാം. ഈ ഗ്രൂപ്പിന്റെ വലുപ്പം \(N_1, N_2, \ldots, N_{100}\) ആയി നമുക്ക് സൂചിപ്പിക്കാം. സാമ്പിളുമായി ഈ സഹായ വിവരങ്ങൾ കൂട്ടിച്ചേർക്കുന്നതിന് ഗവേഷകന് \(H\) ഗ്രൂപ്പുകളിൽ (ഈ കേസിൽ 100) ലയിപ്പിക്കാൻ കഴിയും, ഓരോ ഗ്രൂപ്പിനും ഒരു അനുമാനം ഉണ്ടാക്കുക, തുടർന്ന് ഈ ഗ്രൂപ്പിന്റെ ഒരു ശരാശരി ശരാശരി ഉണ്ടാക്കുക:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

ഏതാണ്ട്, 3.5 അറിയപ്പെടുന്ന ജനസംഖ്യാ \(N_h\) വിവരങ്ങൾ - ( \(N_h\) അസന്തുലിതമായ സാമ്പിൾ തിരഞ്ഞെടുക്കുന്നെങ്കിൽ കൃത്യമായ കണക്കുകൂട്ടലുകളായി ഉപയോഗിക്കുന്നു. അതിനെക്കുറിച്ച് ചിന്തിക്കാനായി ഒരു മാർഗ്ഗം, ഇതിനകം ശേഖരിച്ച ഡാറ്റ സ്ട്രാറ്റജിഫിക്കേഷൻ പോലെയാണ്.

ചുരുക്കത്തിൽ, ഈ വിഭാഗത്തിൽ ഏതാനും സാംപ്ളിങ് ഡിസൈനിനെ വിവരിക്കുന്നുണ്ട്: മാറ്റിസ്ഥാപിക്കലുകൾ ഇല്ലാതെ ലളിതമായ ക്രമരഹിത സാംപ്ലിംഗ്, സാദ്ധ്യതയില്ലായ്മ, സാംക്രമിക സംഖ്യ, സാംക്രമിക സാംസ്റ്റിംഗ്. ഹൊവിവിറ്റ്-തോംപ്സൺ എക്സിക്യൂട്ടർ, പോസ്റ്റ്-സ്ട്രാറ്റജിഫിക്കേഷൻ എന്നിവയെ സംബന്ധിച്ചുള്ള രണ്ടു പ്രധാന ആശയങ്ങളും ഇത് വിശദീകരിച്ചിട്ടുണ്ട്. പ്രോബബിലിറ്റി സാംപ്ലിങ് ഡിസൈനുകളുടെ കൂടുതൽ ഔപചാരിക നിർവ്വചനത്തിന്, Särndal, Swensson, and Wretman (2003) അദ്ധ്യായം 2 കാണുക. സ്ട്രാറ്റജിഫൈഡ് സാംപ്ലിംഗ് കൂടുതൽ ഔപചാരികവും പൂർണ്ണവുമായ ചികിത്സയ്ക്കായി, Särndal, Swensson, and Wretman (2003) വകുപ്പ് 3.7 കാണുക. ഹോർവിറ്റ്-തോംപ്സൺ മൂല്യനിർണ്ണയത്തിന്റെ സവിശേഷതകളെക്കുറിച്ചുള്ള ഒരു സാങ്കേതിക വിവരണത്തിന്, Horvitz and Thompson (1952) , Overton and Stehman (1995) , അല്ലെങ്കിൽ @ sarndal_model_2003 ന്റെ വിഭാഗം 2.8 കാണുക. പോസ്റ്റ്-സ്ട്രാറ്റജിഫിക്കേഷന്റെ കൂടുതൽ ഔപചാരികമായ ചികിത്സയ്ക്കായി Holt and Smith (1979) , Smith (1991) , Little (1993) , അല്ലെങ്കിൽ Särndal, Swensson, and Wretman (2003) വിഭാഗങ്ങൾ 7.6 കാണുക.

അജ്ഞാത മറുപടി

മിക്കവാറും എല്ലാ യഥാർത്ഥ സർവേകളിലും നോൺ റസിഷനുകൾ ഉണ്ട്. അതായത്, മാതൃകാ ജനസംഖ്യയിലുള്ള എല്ലാവരും ഓരോ ചോദ്യത്തിനും ഉത്തരം നൽകുന്നില്ല. റഫറൻസ് രണ്ട് പ്രധാന തരങ്ങളുണ്ട്: ഇനം നോൺ റേഷൻസ് ആൻഡ് യൂണിറ്റ് റീസൺസ് . ഇനങ്ങളുടെ നോൺ റേഷനിൽ, ചില പ്രതികകൾ ചില ഇനങ്ങൾക്ക് മറുപടി നൽകുന്നില്ല (ഉദാ. ചിലപ്പോൾ പ്രതികരിക്കുന്നവർ തന്ത്രപ്രധാനമായി പരിഗണിക്കുന്ന ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ ആഗ്രഹിക്കുന്നില്ല). യൂണിറ്റ് അജ്ഞാത മറുപടിയിൽ, സാമ്പിൾ ജനങ്ങൾക്ക് തിരഞ്ഞെടുത്ത ചില ആളുകൾ സർവേയിൽ പ്രതികരിക്കുന്നില്ല. യൂണിറ്റ് നോൺ റേഷനുകൾക്കുള്ള ഏറ്റവും സാധാരണമായ കാരണങ്ങൾ സാംപ്ളർ ചെയ്ത വ്യക്തിയെ ബന്ധപ്പെടാൻ കഴിയില്ല, സാമ്പിൾ വ്യക്തിയെ ബന്ധപ്പെടുത്തും, എന്നാൽ പങ്കെടുക്കാൻ വിസമ്മതിക്കുന്നു. ഈ വിഭാഗത്തിൽ യൂണിറ്റിന്റെ നോട്ടിഫിക്കേഷനിൽ ഞാൻ ശ്രദ്ധ കേന്ദ്രീകരിക്കും. ഇനം നോൺ റസിഷനിൽ താൽപര്യമുള്ള വായനക്കാർ ലിറ്റിൽ ആന്റ് റൂബിൻ (2002) .

രണ്ടു ഘട്ടങ്ങളിൽ സാമ്പിൾ സമ്പ്രദായമെന്ന നിലയിൽ, യൂണിറ്റുകളുടെ പ്രതികരണങ്ങളുമായി ബന്ധപ്പെട്ട ഗവേഷകരാണ് പലപ്പോഴും ചിന്തിക്കുന്നത്. ആദ്യ ഘട്ടത്തിൽ, ഓരോ വ്യക്തിക്കും ഉൾപ്പെടുത്താനുള്ള ഒരു സംഭാവ്യത \(\pi_i\) , \(0 < \pi_i \leq 1\) എന്ന ഗവേഷകന് ഒരു സാമ്പിൾ \(s\) തിരഞ്ഞെടുക്കുന്നു. രണ്ടാമത്തെ ഘട്ടത്തിൽ, മാതൃകയിൽ തിരഞ്ഞെടുക്കപ്പെട്ട ആളുകൾ, സംഭാവ്യത \(\phi_i\) ഉപയോഗിച്ച് പ്രതികരിക്കണം (ഇവിടെ \(0 < \phi_i \leq 1\) ). ഈ രണ്ടു ഘട്ടങ്ങളിലൂടെ ഫലത്തിൽ പ്രതികരിക്കുന്ന ആളുകളുടെ സമവാക്യം \(r\) . ഈ രണ്ട് ഘട്ടങ്ങളടങ്ങുന്ന ഒരു പ്രധാന വ്യത്യാസം, ഗവേഷകകർ സാമ്പിൾ തിരഞ്ഞെടുക്കുന്ന പ്രക്രിയയെ നിയന്ത്രിക്കുന്നു എന്നതാണ്. എന്നാൽ, ആ സാമ്പിളുകൾ ജനങ്ങളോട് പ്രതികരിക്കുന്നതിനെ നിയന്ത്രിക്കുന്നില്ല. ഈ രണ്ടു പ്രക്രിയകൾ ഒരുമിച്ച് കൂട്ടിച്ചേർക്കുക, ഒരാൾ പ്രതികരിക്കാനുള്ള സാധ്യതയാണ്

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

ലളിതമായി പറഞ്ഞതിന്, യഥാർത്ഥ സാമ്പിൾ ഡിസൈൻ മാറ്റി പകരം വയ്ക്കാതെ ലളിതമായ സാംക്രമിക കേസിന്റെ കാര്യം ഞാൻ പരിഗണിക്കുന്നു. ഒരു ഗവേഷകൻ വലിപ്പം ഒരു സാമ്പിൾ സമ്മതമെങ്കിൽ \(n_s\) നല്കും എന്ന് \(n_r\) : പ്രതികരിച്ചവരിൽ, ഒപ്പം ഗവേഷകൻ നോൺ-പ്രതികരണം അവഗണിക്കുകയും പ്രതികരിച്ച ശരാശരി ഉപയോഗിക്കുന്നു ചെയ്താൽ കണക്ക് എന്ന ബയസ് ആയിരിക്കും

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

(ഉദാ: തൊഴിലില്ലായ്മ സ്റ്റാറ്റസ്), \(S(y)\) തമ്മിലുള്ള ജനസംഖ്യ തമ്മിലുള്ള ബന്ധമാണ് \(cor(\phi, y)\) , ഫലത്തിന്റെ ജനസംഖ്യ വ്യതിയാനം (ഉദാ: തൊഴിലില്ലായ്മ, സ്റ്റാറ്റസ്), \(S(\phi)\) എന്നത് പ്രതികരണ പ്രോത്സാഹനത്തിൻറെ ജനസംഖ്യ സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ ആണ്, കൂടാതെ \(\bar{\phi}\) എന്നത് ജനസംഖ്യയുടെ ശരാശരി പ്രതികരണ പ്രഭാവം (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

Eq. 3.7 താഴെ പറയുന്ന ഏതെങ്കിലും വ്യവസ്ഥകൾ പാലിക്കപ്പെട്ടിട്ടുണ്ടെങ്കിൽ nonresponse ന്റെ പക്ഷപാതത്തെ അവതരിപ്പിക്കുന്നില്ലെന്ന് കാണിക്കുന്നു:

  • \((S(y) = 0)\) യിൽ തൊഴിലില്ലായ്മ നിലയിലെ വ്യത്യാസമില്ല.
  • പ്രതികരണ പ്രഭാവങ്ങളിലും \((S(\phi) = 0)\) .
  • പ്രതിബദ്ധതയും തൊഴിലില്ലായ്മയുടയും തമ്മിലുള്ള ബന്ധം ഇല്ല. \((cor(\phi, y) = 0)\) .

നിർഭാഗ്യവശാൽ, ഈ അവസ്ഥകളിൽ ഒന്നുപോലും സാധ്യതയില്ലെന്ന് തോന്നുന്നു. തൊഴിലവസര നിലവാരത്തിൽ യാതൊരു മാറ്റവും ഉണ്ടാകില്ലെന്നോ അല്ലെങ്കിൽ പ്രതികരണത്തിനുള്ള സാധ്യതകളിൽ യാതൊരു വ്യത്യാസവുമുണ്ടാകില്ലെന്നത് തികച്ചും അർത്ഥരഹിതമായി തോന്നുന്നു. അങ്ങനെ, eq ലെ പ്രധാന പദം. 3.7 എന്നത് പരസ്പരബന്ധമാണ്: \(cor(\phi, y)\) . ഉദാഹരണത്തിന്, തൊഴിലില്ലായ്മ ചെയ്യുന്ന ആളുകൾക്ക് പ്രതികരിക്കാൻ കൂടുതൽ സാധ്യതയുണ്ടെങ്കിൽ തൊഴിലവസരനിരക്ക് ഉയർത്തണം.

നോൺ റെസ്പോൺസസ് ഉള്ളപ്പോൾ അക്സിലിയറി വിവരങ്ങൾ ഉപയോഗിക്കുക എന്നതിന്റെ മൂല്യനിർണ്ണയം നടത്തുന്നതിനുള്ള ഹാട്രിക്. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് സഹായ സഹായ വിവരങ്ങൾ ഉപയോഗിക്കാൻ കഴിയുന്ന ഒരു മാർഗ്ഗം പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷനാണ് (മുകളിലുള്ള eq 3.5 ഓട് തിരിച്ചുവിളിക്കുക). പോസ്റ്റ് സ്ട്രാറ്ററാഫിക്കേഷൻ എസ്റ്റിമേറ്റർസിന്റെ പക്ഷപാതിത്വം ഇതാണ്:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

അവിടെ \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , ഗ്രൂപ്പിലെ \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) ഗ്രൂപ്പുകളിൽ മാത്രം പരിമിതപ്പെടുത്തിയിരിക്കുന്നു, \(\bar{\phi}^{(h)}\) ഓരോ പോസ്റ്റ് സ്ട്രാറ്റിഫിക്കേഷൻ ഗ്രൂപ്പിലും പക്ഷപാതിത്വം വളരെ ചെറുതാണെങ്കിൽ ആകെ പക്ഷപാതിത്വം ചെറുതായിരിക്കും. ഓരോ പോസ്റ്റ് സ്ട്രാറ്റിഫിക്കേഷൻ ഗ്രൂപ്പിലും ബസുകളെ ചെറിയതാക്കുന്നതിനെ കുറിച്ച് ചിന്തിക്കാൻ ഞാൻ രണ്ട് വഴികളുണ്ട്. ആദ്യം \(S(\phi)^{(h)} \approx 0\) , ( \(S(y)^{(h)} \approx 0\) , \(S(\phi)^{(h)} \approx 0\) , \(S(\phi)^{(h)} \approx 0\) , \(S(y)^{(h)} \approx 0\) ). രണ്ടാമതായി, നിങ്ങൾ കാണുന്ന ജനങ്ങൾ നിങ്ങൾ കാണാത്ത ജനങ്ങളെ പോലെയാണ് ഗ്രൂപ്പുകൾ രൂപപ്പെടുത്താൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നത് ( \(cor(\phi, y)^{(h)} \approx 0\) ). Eq നെ താരതമ്യം ചെയ്യുന്നു. 3.7, eq എന്നിവ. 3.8 പോസ്റ്റ്-സ്ട്രാറ്റജിഫിക്കേഷൻ നോൺ റസിഷൻസ് കാരണം പക്ഷപാതപരമായ കുറയ്ക്കാൻ കഴിയുമ്പോഴാണ് വ്യക്തമാക്കുന്നത്.

ഉപസംഹാരമായി, ഈ വിഭാഗം പ്രതികരണമില്ലാതെ പ്രോബബിലിറ്റി സാംപ്ളിനായുള്ള ഒരു മോഡൽ നൽകിയിരിക്കുന്നു, കൂടാതെ പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ ക്രമീകരിക്കലുകളില്ലാതെ നോൺ റസിഷൻസ് അവതരിപ്പിക്കാനാകുന്ന പക്ഷപാതി കാണിക്കുന്നു. Bethlehem (1988) കൂടുതൽ സാധാരണ സാംപ്ലിങ് ഡിസൈനുകൾക്കുള്ള നോൺ റീസസ് കാരണം ഉണ്ടാകുന്ന വ്യത്യാസങ്ങൾ അവതരിപ്പിക്കുന്നു. നോൺ റെസ്പോൺസിൽ ക്രമീകരിക്കാനായി പോസ്റ്റ് സ്ട്രാറ്ററാഫിക്കേഷനെ കൂടുതൽ ഉപയോഗിക്കുന്നതിന് Smith (1991) , Gelman and Carlin (2002) . കാലിബ്രേഷൻ മൂല്യനിർണ്ണയങ്ങൾ എന്നറിയപ്പെടുന്ന കൂടുതൽ സാധാരണ കുടുംബ Särndal and Lundström (2005) ഭാഗമാണ് പോസ്റ്റ് സ്ട്രാറ്റാഫിക്കേഷൻ, ഒരു ലേഖനം നീണ്ട ചികിത്സയ്ക്കായി ഷാംഗി (2000) , പുസ്തകം നീളം ചികിത്സയ്ക്കായി Särndal and Lundström (2005) എന്നിവ കാണുക. നോൺ Kalton and Flores-Cervantes (2003) വേണ്ടി ക്രമീകരിക്കുന്നതിന് മറ്റു Kalton and Flores-Cervantes (2003) രീതികളിൽ കൂടുതൽ അറിയാൻ Kalton and Flores-Cervantes (2003) , Brick (2013) , Särndal and Lundström (2005) .

നോൺ പ്രോബബിലിറ്റി സാംപ്ലിംഗ്

നോൺ പ്രോബബിലിറ്റി സാംപ്ളിങിൽ വലിയ ഡിസൈനുകൾ ഉണ്ട് (Baker et al. 2013) . വാങ്ങും സഹപ്രവർത്തകരും (W. Wang et al. 2015) Xbox ന്റെ ഉപയോക്താക്കളുടെ മാതൃകയിൽ പ്രത്യേകം ശ്രദ്ധ കേന്ദ്രീകരിക്കുമ്പോൾ, സാമ്പിൾ രൂപകൽപ്പനയിലെ പ്രധാന ഭാഗം \(\pi_i\) ( \(\pi_i\) ഉൾക്കൊള്ളുന്ന ഗവേഷണ-നിർവഹിക്കപ്പെട്ട പ്രോബബിലിറ്റി) എന്നാൽ \(\phi_i\) (പ്രതികരിക്കപ്പെട്ട പ്രതികരണ പ്രഭാവങ്ങൾ). സ്വാഭാവികമായും, ഇത് \(\phi_i\) , കാരണം \(\phi_i\) അജ്ഞാതമാണ്. എന്നാൽ, വാങ്ങും സഹപ്രവർത്തകരും കാണിക്കുന്നതുപോലെ, ഇത്തരത്തിലുള്ള ഓപ്റ്റ്-ഇൻ സാമ്പിൾ-ഒരു മാസ്റ്റർപ്രിംഗ് ഫ്രെയിം ഉപയോഗിച്ച് വലിയൊരു കവറേജ് പിഴവ്-പോലും ഗവേഷകർക്ക് നല്ല സഹായ സഹായകരമായ വിവരങ്ങൾ ഉണ്ടെങ്കിൽ ഈ പ്രശ്നങ്ങൾക്ക് ഒരു നല്ല സ്റ്റാറ്റിസ്റ്റിക്കൽ മോഡൽ ഉണ്ടെങ്കിൽ ദുരന്തമുണ്ടാകരുത്.

Bethlehem (2010) അനൌപചാരികവും കവറേജ് തകരാറുകളും ഉൾപ്പെടുത്തുന്നതിന് പോസ്റ്റ് സ്ട്രേറ്ററ്റിനെ കുറിച്ചുള്ള നിരവധി ഡെറിവേറ്റേഷനുകളെ വിപുലീകരിക്കുന്നു. പോസ്റ്റ് സ്ട്രാറ്റാലിറ്റി കൂടാതെ, (Ansolabehere and Rivers 2013; ??? ) ജോലി ചെയ്യുന്നതിനുള്ള മറ്റ് സാങ്കേതികവിദ്യകൾ, കൂടാതെ മാദ്ധ്യമങ്ങളും (Ansolabehere and Rivers 2013; ??? ) തകരാറുകളുമൊക്കെയുള്ള സംവേദനക്ഷമതയുള്ള സാമ്പിളുകൾ, സാമ്പിൾ പൊരുത്തപ്പെടുന്നവ (Ansolabehere and Rivers 2013; ??? ) , (Ansolabehere and Rivers 2013; ??? ) സ്കോർ വെയ്റ്റിംഗ് (Lee 2006; Schonlau et al. 2009) , കാലിബ്രേഷൻ (Lee and Valliant 2009) . ഈ സാങ്കേതിക വിദ്യകൾക്കിടയിൽ ഒരു പൊതു ആശയം സഹായ ഏജൻസിയുടെ ഉപയോഗമാണ്.