ಗಣಿತದ ಟಿಪ್ಪಣಿಗಳು

ಈ ಅನುಬಂಧದಲ್ಲಿ, ಅಧ್ಯಾಯದಿಂದ ಸ್ವಲ್ಪ ಹೆಚ್ಚು ಗಣಿತದ ರೂಪದಲ್ಲಿ ನಾನು ಕೆಲವು ಕಲ್ಪನೆಗಳನ್ನು ವಿವರಿಸುತ್ತೇನೆ. ಸಮೀಕ್ಷೆಯ ಸಂಶೋಧಕರು ಬಳಸುವ ಅಂಕಿತ ಮತ್ತು ಗಣಿತದ ಚೌಕಟ್ಟನ್ನು ನೀವು ಆರಾಮದಾಯಕವಾಗಿರಲು ಸಹಾಯ ಮಾಡುವುದು ಇಲ್ಲಿನ ಗುರಿಯಾಗಿದೆ, ಈ ವಿಷಯಗಳಲ್ಲಿ ನೀವು ಬರೆದ ಕೆಲವು ತಾಂತ್ರಿಕ ವಸ್ತುಗಳನ್ನು ನೀವು ಪರಿವರ್ತಿಸಬಹುದು. ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳನ್ನು ಪರಿಚಯಿಸುವ ಮೂಲಕ ನಾನು ಪ್ರಾರಂಭಿಸುತ್ತೇನೆ, ನಂತರ ಸಂಭವನೀಯತೆ ಮಾದರಿಗೆ ನಾನ್ಪ್ರೊಸ್ಪೆನ್ಸ್ಗೆ ತೆರಳುತ್ತಾರೆ, ಮತ್ತು ಅಂತಿಮವಾಗಿ, ಸಂಭವನೀಯತೆ ಸಂಭವನೀಯತೆ.

ಸಂಭವನೀಯತೆ ಮಾದರಿ

ಚಾಲನೆಯಲ್ಲಿರುವ ಉದಾಹರಣೆಯಾಗಿ, ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ನಲ್ಲಿನ ನಿರುದ್ಯೋಗ ದರವನ್ನು ಅಂದಾಜು ಮಾಡುವ ಗುರಿ ನೋಡೋಣ. ಲಕ್ಷ್ಯ \(U = \{1, \ldots, k, \ldots, N\}\) ಲಕ್ಷ್ಯದ ಜನಸಂಖ್ಯೆ ಮತ್ತು \(y_k\) ಅನ್ನು ವ್ಯಕ್ತಿಯ \(k\) ಫಲಿತಾಂಶದ ವೇರಿಯಬಲ್ನ ಮೌಲ್ಯದಿಂದ \(y_k\) . ಈ ಉದಾಹರಣೆಯಲ್ಲಿ \(y_k\) ವ್ಯಕ್ತಿಯು \(k\) ನಿರುದ್ಯೋಗಿಯಾಗಿದ್ದಾರೆಯೇ ಎಂಬುದು. ಅಂತಿಮವಾಗಿ, \(F = \{1, \ldots, k, \ldots, N\}\) ಫ್ರೇಮ್ ಜನಸಂಖ್ಯೆಯಾಗಲಿ, ಸರಳತೆಗೆ ಗುರಿಯಾಗಿದ ಜನಸಂಖ್ಯೆ ಒಂದೇ ಆಗಿರುತ್ತದೆ.

ಮೂಲ ಮಾದರಿ ವಿನ್ಯಾಸವು ಬದಲಿಯಾಗಿ ಸರಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿಯಾಗಿದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಪ್ರತಿ ವ್ಯಕ್ತಿಯು \(s = \{1, \ldots, i, \ldots, n\}\) ಮಾದರಿಯಲ್ಲಿ ಸೇರ್ಪಡೆಗೊಳ್ಳಲು ಸಾಧ್ಯತೆ ಇದೆ. ಈ ನಮೂನೆಯ ವಿನ್ಯಾಸದೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದಾಗ, ಸಂಶೋಧಕರು ಜನಸಂಖ್ಯೆಯ ನಿರುದ್ಯೋಗ ದರವನ್ನು ಮಾದರಿಯೊಂದಿಗೆ ಅಂದಾಜು ಮಾಡಬಹುದು:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

ಅಲ್ಲಿ \(\bar{y}\) ಜನಸಂಖ್ಯೆಯಲ್ಲಿನ ನಿರುದ್ಯೋಗ ದರ ಮತ್ತು \(\hat{\bar{y}}\) ನಿರುದ್ಯೋಗ ದರ ( \(\hat{ }\) ಅಂದಾಜುದಾರನನ್ನು ಸೂಚಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ).

ವಾಸ್ತವವಾಗಿ, ಸಂಶೋಧಕರು ವಿರಳವಾಗಿ ಬದಲಿ ಇಲ್ಲದೆ ಸರಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಬಳಸಿ. ವಿವಿಧ ಕಾರಣಗಳಿಗಾಗಿ (ಅದರಲ್ಲಿ ನಾನು ಒಂದು ಕ್ಷಣದಲ್ಲಿ ವಿವರಿಸುತ್ತೇನೆ), ಸಂಶೋಧಕರು ಹೆಚ್ಚಾಗಿ ಸೇರ್ಪಡೆಯ ಅಸಮಾನ ಸಂಭವನೀಯತೆಗಳೊಂದಿಗೆ ಮಾದರಿಗಳನ್ನು ರಚಿಸುತ್ತಾರೆ. ಉದಾಹರಣೆಗೆ, ಕ್ಯಾಲಿಫೊರ್ನಿಯಾದ ಜನರಿಗಿಂತ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಸಂಭವನೀಯತೆಯನ್ನು ಹೊಂದಿರುವ ಫ್ಲೋರಿಡಾದ ಜನರನ್ನು ಸಂಶೋಧಕರು ಆಯ್ಕೆ ಮಾಡಬಹುದು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಮಾದರಿ ಸರಾಸರಿ (eq. 3.1) ಉತ್ತಮ ಅಂದಾಜು ಮಾಡದಿರಬಹುದು. ಬದಲಿಗೆ, ಸೇರ್ಪಡೆಯ ಅಸಮಾನ ಸಂಭವನೀಯತೆಗಳಿದ್ದಾಗ, ಸಂಶೋಧಕರು ಬಳಸುತ್ತಾರೆ

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

ಅಲ್ಲಿ \(\hat{\bar{y}}\) ನಿರುದ್ಯೋಗ ದರವನ್ನು ಅಂದಾಜು ಮಾಡುತ್ತದೆ ಮತ್ತು \(\pi_i\) ಸೇರ್ಪಡೆಯ ವ್ಯಕ್ತಿ \(i\) ನ ಸಂಭವನೀಯತೆಯಾಗಿದೆ. ಪ್ರಮಾಣಿತ ಅಭ್ಯಾಸದ ನಂತರ, ನಾನು eq ನಲ್ಲಿ ಅಂದಾಜುದಾರನನ್ನು ಕರೆಯುತ್ತೇನೆ. 3.2 ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುಗಾರ. ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುದಾರನು ಅತ್ಯಂತ ಉಪಯುಕ್ತವಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ಯಾವುದೇ ಸಂಭವನೀಯ ಮಾದರಿ ವಿನ್ಯಾಸ (Horvitz and Thompson 1952) ಗೆ ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜುಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ. ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುಗಾರನು ಆಗಾಗ್ಗೆ ಬರಲಿರುವುದರಿಂದ, ಇದನ್ನು ಮರು-ಬರೆಯಬಹುದು ಎಂದು ಗಮನಿಸುವುದು ಸಹಾಯಕವಾಗುತ್ತದೆ

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

ಅಲ್ಲಿ \(w_i = 1 / \pi_i\) . ಇಕ್. 3.3 ಬಹಿರಂಗಪಡಿಸಿದರೆ, ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುದಾರನು ತೂಕದ ಮಾದರಿಯೆಂದರೆ ತೂಕವು ಆರಿಸುವಿಕೆಯ ಸಂಭವನೀಯತೆಗೆ ವಿಲೋಮವಾಗಿ ಸಂಬಂಧಿಸಿದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಮಾದರಿಯಲ್ಲಿ ಒಬ್ಬ ವ್ಯಕ್ತಿಯನ್ನು ಸೇರಿಸಿಕೊಳ್ಳುವುದು ಕಡಿಮೆಯಾಗುತ್ತದೆ, ಆ ವ್ಯಕ್ತಿಯು ಹೆಚ್ಚು ತೂಕವನ್ನು ಅಂದಾಜಿನಲ್ಲಿ ಪಡೆಯಬೇಕು.

ಮೊದಲೇ ವಿವರಿಸಿದಂತೆ, ಸಂಶೋಧಕರು ಆಗಾಗ್ಗೆ ಸೇರ್ಪಡೆ ಮಾಡುವ ಅಸಮಾನ ಸಂಭವನೀಯತೆಯನ್ನು ಹೊಂದಿರುವ ಜನರನ್ನು ಮಾದರಿಸುತ್ತಾರೆ. ಸೇರ್ಪಡೆಯ ಅಸಮಾನ ಸಂಭವನೀಯತೆಗಳಿಗೆ ಕಾರಣವಾಗುವ ವಿನ್ಯಾಸದ ಒಂದು ಉದಾಹರಣೆ ಸ್ತರರೂಪದ ಮಾದರಿಯಾಗಿದೆ , ಇದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮುಖ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಇದು ನಂತರದ ಶ್ರೇಣೀಕರಣದ ಅಂದಾಜು ಪ್ರಕ್ರಿಯೆಯೊಂದಿಗೆ ನಿಕಟವಾಗಿ ಸಂಬಂಧಿಸಿದೆ. ಶ್ರೇಣೀಕೃತ ಮಾದರಿಗಳಲ್ಲಿ, ಒಂದು ಸಂಶೋಧಕವು ಗುರಿಯ ಜನಸಂಖ್ಯೆಯನ್ನು \(H\) ಪರಸ್ಪರ ಪ್ರತ್ಯೇಕ ಮತ್ತು ಸಮಗ್ರ ಗುಂಪುಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ. ಈ ಗುಂಪುಗಳನ್ನು ಸ್ತರವನ್ನು ಕರೆಯಲಾಗುತ್ತದೆ ಮತ್ತು \(U_1, \ldots, U_h, \ldots, U_H\) ಎಂದು ಸೂಚಿಸಲಾಗುತ್ತದೆ. ಈ ಉದಾಹರಣೆಯಲ್ಲಿ, ಸ್ತರಗಳು ರಾಜ್ಯಗಳಾಗಿವೆ. ಗುಂಪುಗಳ ಗಾತ್ರವನ್ನು \(N_1, \ldots, N_h, \ldots, N_H\) . ಸಂಶೋಧಕರು ಪ್ರತಿ ರಾಜ್ಯದಲ್ಲಿ ಸಾಕಷ್ಟು ಜನರನ್ನು ನಿರುದ್ಯೋಗದ ಸ್ಥಿತಿಗತಿಗೆ ಅಂದಾಜು ಮಾಡಬೇಕೆಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಶ್ರೇಣೀಕೃತ ಮಾದರಿಗಳನ್ನು ಬಳಸಲು ಬಯಸಬಹುದು.

ಒಮ್ಮೆ ಜನಸಂಖ್ಯೆಯ ಸ್ತರ ವಿಭಜಿಸಲಾಗಿತ್ತು ಮಾಡಲಾಗಿದೆ, ಸಂಶೋಧಕ ಸರಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಗಾತ್ರದ ಬದಲಾವಣೆ ಇಲ್ಲದೆ ಆಯ್ಕೆ ಭಾವಿಸುತ್ತವೆ \(n_h\) , ಸ್ವತಂತ್ರವಾಗಿ ಪ್ರತಿ ಸ್ತರಗಳ. ಇದಲ್ಲದೆ, ಸ್ಯಾಂಪಲ್ನಲ್ಲಿ ಆಯ್ಕೆ ಮಾಡಿದ ಎಲ್ಲರೂ ಪ್ರತಿಕ್ರಿಯಿಸುವವರಾಗಿದ್ದಾರೆಂದು ಭಾವಿಸಿ (ಮುಂದಿನ ವಿಭಾಗದಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನಾನು ನಿಭಾಯಿಸುತ್ತೇನೆ). ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸೇರ್ಪಡೆಯ ಸಂಭವನೀಯತೆ

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

ಈ ಸಂಭವನೀಯತೆಗಳು ವ್ಯಕ್ತಿಯಿಂದ ವ್ಯಕ್ತಿಗೆ ಬದಲಾಗಬಹುದು, ಈ ಮಾದರಿಯ ವಿನ್ಯಾಸದಿಂದ ಅಂದಾಜು ಮಾಡುವಾಗ, ಸಂಶೋಧಕರು ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜಿನ (ಇಕ್ಯೂ 3.2) ಬಳಸಿಕೊಂಡು ಸೇರ್ಪಡೆಗೊಳ್ಳುವಿಕೆಯ ಸಂಭವನೀಯತೆಯ ವಿಲೋಮದಿಂದ ಪ್ರತಿ ಪ್ರತಿಕ್ರಿಯಿಸುವವರ ತೂಕವನ್ನು ಹೊಂದಿರಬೇಕು.

ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುದಾರ ಪಕ್ಷಪಾತವಿಲ್ಲದಿದ್ದರೂ ಸಹ, ಸಹಾಯಕ ಮಾಹಿತಿಯೊಂದಿಗೆ ಮಾದರಿಯನ್ನು ಸಂಯೋಜಿಸುವ ಮೂಲಕ ಸಂಶೋಧಕರು ಹೆಚ್ಚು ನಿಖರವಾದ (ಅಂದರೆ, ಕಡಿಮೆ ವ್ಯತ್ಯಾಸಗಳು) ಅಂದಾಜುಗಳನ್ನು ಉತ್ಪಾದಿಸಬಹುದು. ಕೆಲವು ಸಂಭವನೀಯ ಸಂಭವನೀಯ ಮಾದರಿಗಳನ್ನು ಸಹ ಇರುವಾಗ ಇದು ನಿಜ ಎಂದು ಕೆಲವು ಜನರು ಆಶ್ಚರ್ಯಪಡುತ್ತಾರೆ. ಸಹಾಯಕ ಮಾಹಿತಿಗಳನ್ನು ಬಳಸುವ ಈ ತಂತ್ರಗಳು ಮುಖ್ಯವಾಗಿರುವುದರಿಂದ, ನಾನು ನಂತರ ತೋರಿಸಿದಂತೆ, ಸಂಭಾವ್ಯತೆಯಿಂದ ಮಾದರಿಗಳ ಸಂಭಾವ್ಯ ಮಾದರಿಗಳಿಂದ ಮತ್ತು ಸಂಭವನೀಯತೆ-ಅಲ್ಲದ ಮಾದರಿಗಳಿಂದ ಅಂದಾಜು ಮಾಡಲು ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ವಿಮರ್ಶಿಸಲಾಗುತ್ತದೆ.

ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಒಂದು ಸಾಮಾನ್ಯ ವಿಧಾನವೆಂದರೆ ಪೋಸ್ಟ್-ಸ್ತರೀಕರಣ . ಉದಾಹರಣೆಗೆ, 50 ರಾಜ್ಯಗಳಲ್ಲಿ ಪ್ರತಿಯೊಬ್ಬ ಪುರುಷರ ಮತ್ತು ಮಹಿಳೆಯರ ಸಂಖ್ಯೆಯನ್ನು ಸಂಶೋಧಕರು ತಿಳಿದಿದ್ದಾರೆ ಎಂದು ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ; ನಾವು ಈ ಗುಂಪು ಗಾತ್ರವನ್ನು \(N_1, N_2, \ldots, N_{100}\) ಎಂದು ಸೂಚಿಸಬಹುದು. ಮಾದರಿಯೊಂದಿಗೆ ಈ ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ಸಂಯೋಜಿಸಲು, ಸಂಶೋಧಕರು ಮಾದರಿಯನ್ನು \(H\) ಗುಂಪುಗಳಾಗಿ ವಿಭಜಿಸಬಹುದು (ಈ ಸಂದರ್ಭದಲ್ಲಿ 100), ಪ್ರತಿ ಗುಂಪಿಗೆ ಒಂದು ಅಂದಾಜು ಮಾಡಲು, ತದನಂತರ ಈ ಗುಂಪಿನ ಸರಾಸರಿ ತೂಕವನ್ನು ರಚಿಸಬಹುದು:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

ಸ್ಥೂಲವಾಗಿ, eq ರಲ್ಲಿ ಅಂದಾಜು. 3.5 ಹೆಚ್ಚು ನಿಖರವಾದ ಸಾಧ್ಯತೆಯಿದೆ ಏಕೆಂದರೆ ಇದು ತಿಳಿದಿರುವ ಜನಸಂಖ್ಯೆಯ ಮಾಹಿತಿಯನ್ನು- \(N_h\) -ಒಂದು ಸಮತೂಕವಿಲ್ಲದ ಮಾದರಿ ಆಯ್ಕೆ ಮಾಡಲು ಸಂಭವಿಸಿದಲ್ಲಿ ಸರಿಯಾದ ಅಂದಾಜುಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಅದರ ಬಗ್ಗೆ ಯೋಚಿಸಲು ಒಂದು ವಿಧಾನವೆಂದರೆ, ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಈಗಾಗಲೇ ಸಂಗ್ರಹಿಸಲ್ಪಟ್ಟ ನಂತರ ಶ್ರೇಣೀಕರಣದ ಅಂದಾಜಿನಂತೆ ಇರುತ್ತದೆ.

ಕೊನೆಯಲ್ಲಿ, ಈ ವಿಭಾಗವು ಕೆಲವು ಮಾದರಿ ವಿನ್ಯಾಸಗಳನ್ನು ವಿವರಿಸಿದೆ: ಸರಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿಗಳು ಬದಲಿ ಇಲ್ಲದೆ, ಅಸಮ ಸಂಭವನೀಯತೆ ಮತ್ತು ಶ್ರೇಣೀಕೃತ ಮಾದರಿಗಳ ಮಾದರಿ. ಇದು ಅಂದಾಜಿನ ಬಗ್ಗೆ ಎರಡು ಪ್ರಮುಖ ವಿಚಾರಗಳನ್ನು ವಿವರಿಸಿದೆ: ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜುದಾರ ಮತ್ತು ನಂತರದ-ಶ್ರೇಣೀಕರಣ. ಸಂಭವನೀಯತೆ ಮಾದರಿ ವಿನ್ಯಾಸಗಳ ಅಧಿಕ ಔಪಚಾರಿಕ ವ್ಯಾಖ್ಯಾನಕ್ಕಾಗಿ, Särndal, Swensson, and Wretman (2003) ಅಧ್ಯಾಯ 2 ನೋಡಿ. ಸ್ಟ್ರ್ಯಾಟಿಫೈಡ್ ಸ್ಯಾಂಪಲಿಂಗ್ನ ಹೆಚ್ಚು ಔಪಚಾರಿಕ ಮತ್ತು ಸಂಪೂರ್ಣ ಚಿಕಿತ್ಸೆಗಾಗಿ, Särndal, Swensson, and Wretman (2003) ವಿಭಾಗ 3.7 ಅನ್ನು ನೋಡಿ. ಹೋರ್ವಿಟ್ಜ್-ಥಾಂಪ್ಸನ್ ಅಂದಾಜಿನ ಗುಣಲಕ್ಷಣಗಳ ತಾಂತ್ರಿಕ ವಿವರಣೆಯನ್ನು ನೋಡಿ, Horvitz and Thompson (1952) , Overton and Stehman (1995) , ಅಥವಾ @ ಸೆರ್ನ್ಡಲ್_ಮಾಡೆಲ್ಡ್003003 ರ ವಿಭಾಗ 2.8 ಅನ್ನು ನೋಡಿ. ನಂತರದ ಶ್ರೇಣೀಕರಣದ ಹೆಚ್ಚು ಔಪಚಾರಿಕ ಚಿಕಿತ್ಸೆಗಳಿಗಾಗಿ, Holt and Smith (1979) , Smith (1991) , Little (1993) , ಅಥವಾ Särndal, Swensson, and Wretman (2003) ವಿಭಾಗ 7.6 ಅನ್ನು ನೋಡಿ.

ಸಂಭಾವ್ಯತೆಯೊಂದಿಗೆ ಸಂಭವನೀಯತೆ ಮಾದರಿ

ಬಹುತೇಕ ಎಲ್ಲ ನೈಜ ಸಮೀಕ್ಷೆಗಳು ನಾನ್ಸ್ಪೋನ್ಸ್ನ್ನು ಹೊಂದಿವೆ; ಅಂದರೆ, ಮಾದರಿ ಜನಸಂಖ್ಯೆಯಲ್ಲಿನ ಪ್ರತಿಯೊಬ್ಬರೂ ಪ್ರತಿ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸುವುದಿಲ್ಲ. ಎರಡು ಪ್ರಮುಖ ವಿಧದ ಪ್ರತಿಕ್ರಿಯೆಗಳಿಲ್ಲ: ಐಟಂ ಮಾನ್ಯತೆ ಮತ್ತು ಘಟಕ ಮಾರಣಾಂತಿಕತೆ . ಐಟಂ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ಕೆಲವು ಪ್ರತಿಕ್ರಿಯಿಸಿದವರು ಕೆಲವು ವಸ್ತುಗಳನ್ನು ಉತ್ತರಿಸುವುದಿಲ್ಲ (ಉದಾ. ಕೆಲವೊಮ್ಮೆ ಪ್ರತಿಕ್ರಿಯಿಸುವವರು ಅವರು ಸೂಕ್ಷ್ಮತೆಯನ್ನು ಪರಿಗಣಿಸುವ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು ಬಯಸುವುದಿಲ್ಲ). ಯೂನಿಟ್ನ ಪ್ರತಿಕ್ರಿಯೆಗಳಿಲ್ಲದೆ, ಮಾದರಿ ಜನಸಂಖ್ಯೆಗೆ ಆಯ್ಕೆ ಮಾಡಲಾದ ಕೆಲವು ಜನರನ್ನು ಸಮೀಕ್ಷೆಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುವುದಿಲ್ಲ. ಘಟಕವು ಪ್ರತಿಕ್ರಿಯಿಸದ ಎರಡು ಸಾಮಾನ್ಯ ಕಾರಣಗಳು, ಮಾದರಿ ವ್ಯಕ್ತಿಗೆ ಸಂಪರ್ಕಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ ಮತ್ತು ಮಾದರಿ ವ್ಯಕ್ತಿಯು ಸಂಪರ್ಕಗೊಳ್ಳುತ್ತಾನೆ ಆದರೆ ಭಾಗವಹಿಸಲು ನಿರಾಕರಿಸುತ್ತಾನೆ. ಈ ವಿಭಾಗದಲ್ಲಿ, ನಾನು ಯೂನಿಟ್ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಕೇಂದ್ರೀಕರಿಸುತ್ತೇನೆ; ಐಟಂ ಪ್ರತಿಕ್ರಿಯೆಗಳಿಗಾಗಿ ಆಸಕ್ತಿ ಹೊಂದಿರುವ ಓದುಗರು ಲಿಟಲ್ ಮತ್ತು ರೂಬಿನ್ (2002) ನೋಡಬೇಕು.

ಎರಡು-ಹಂತದ ಮಾದರಿ ಪ್ರಕ್ರಿಯೆಯಂತೆ ಸಂಶೋಧಕರು ಹೆಚ್ಚಾಗಿ ಪ್ರತಿಕ್ರಿಯೆಯಲ್ಲದ ಘಟಕಗಳೊಂದಿಗೆ ಸಮೀಕ್ಷೆಗಳ ಬಗ್ಗೆ ಯೋಚಿಸುತ್ತಾರೆ. ಮೊದಲ ಹಂತದಲ್ಲಿ, ಪ್ರತಿ ವ್ಯಕ್ತಿಯು ಸೇರ್ಪಡೆಗೊಳ್ಳುವ ಸಂಭವನೀಯತೆಯನ್ನು \(\pi_i\) (ಅಲ್ಲಿ \(0 < \pi_i \leq 1\) ) ಹೊಂದಿರುವಂತಹ ಮಾದರಿ \(s\) ಸಂಶೋಧಕರು ಆಯ್ಕೆಮಾಡುತ್ತಾರೆ. ನಂತರ, ಎರಡನೇ ಹಂತದಲ್ಲಿ, ಮಾದರಿಗೆ ಆಯ್ಕೆಮಾಡುವ ಜನರು ಸಂಭವನೀಯತೆ \(\phi_i\) (ಅಲ್ಲಿ \(0 < \phi_i \leq 1\) ) ನೊಂದಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತಾರೆ. ಈ ಎರಡು-ಹಂತದ ಪ್ರಕ್ರಿಯೆಯು ಪ್ರತಿಸ್ಪಂದಕರ ಅಂತಿಮ ಗುಂಪಿನಲ್ಲಿ ಫಲಿತಾಂಶವನ್ನು ನೀಡುತ್ತದೆ \(r\) . ಈ ಎರಡು ಹಂತಗಳ ನಡುವಿನ ಪ್ರಮುಖ ವ್ಯತ್ಯಾಸವೆಂದರೆ, ಸಂಶೋಧಕರು ಮಾದರಿಯನ್ನು ಆಯ್ಕೆ ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿಯಂತ್ರಿಸುತ್ತಾರೆ, ಆದರೆ ಆ ಮಾದರಿಯ ಜನರಲ್ಲಿ ಪ್ರತಿಸ್ಪಂದಕರಾಗಲು ಅವರು ನಿಯಂತ್ರಿಸುವುದಿಲ್ಲ. ಈ ಎರಡು ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಒಟ್ಟಿಗೆ ಹಾಕಿದರೆ, ಒಬ್ಬರು ಪ್ರತಿಕ್ರಿಯಿಸುವವರು ಎಂದು ಸಂಭವನೀಯತೆ

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

ಸರಳತೆಗಾಗಿ, ಮೂಲ ಮಾದರಿಯ ವಿನ್ಯಾಸವು ಬದಲಿ ಇಲ್ಲದೆ ಸರಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಎಲ್ಲಿದೆಯೆಂದು ನಾನು ಪರಿಗಣಿಸುತ್ತೇನೆ. ಸಂಶೋಧಕರು \(n_r\) ಪ್ರತಿಸ್ಪರ್ಧಿಗಳನ್ನು ನೀಡುವ ಗಾತ್ರದ \(n_s\) ಮಾದರಿಯನ್ನು ಆಯ್ಕೆ ಮಾಡಿದರೆ ಮತ್ತು ಸಂಶೋಧಕರು ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು \(n_r\) ಮತ್ತು ಪ್ರತಿಸ್ಪಂದಕರ \(n_r\) ಬಳಸಿದರೆ, ಅಂದಾಜಿನ ಪಕ್ಷಪಾತವು \(n_r\) :

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

ಅಲ್ಲಿ \(cor(\phi, y)\) ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ಮತ್ತು ಫಲಿತಾಂಶದ ನಡುವಿನ ಜನಸಂಖ್ಯೆಯ ಸಂಬಂಧವಾಗಿದೆ (ಉದಾಹರಣೆಗೆ, ನಿರುದ್ಯೋಗ ಸ್ಥಿತಿ), \(S(y)\) ಫಲಿತಾಂಶದ ಜನಸಂಖ್ಯೆಯ ವಿಚಲನ (ಉದಾಹರಣೆಗೆ, ನಿರುದ್ಯೋಗ \(S(\phi)\) \(\bar{\phi}\) ಜನಸಂಖ್ಯೆ ಸರಾಸರಿ ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .

Eq. ಕೆಳಗಿನ ಯಾವುದೇ ಷರತ್ತುಗಳನ್ನು ಪೂರೈಸಿದರೆ ನಾನ್ಸ್ಪೋನ್ಸ್ ಪಕ್ಷಪಾತವನ್ನು ಪರಿಚಯಿಸುವುದಿಲ್ಲ ಎಂದು 3.7 ತೋರಿಸುತ್ತದೆ:

  • ನಿರುದ್ಯೋಗ ಸ್ಥಿತಿಯಲ್ಲಿ ಬದಲಾವಣೆಗಳಿಲ್ಲ \((S(y) = 0)\) .
  • ಪ್ರತಿಕ್ರಿಯೆ ಪ್ರವೃತ್ತಿಯಲ್ಲಿ ಯಾವುದೇ ಬದಲಾವಣೆಗಳಿಲ್ಲ \((S(\phi) = 0)\) .
  • ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ಮತ್ತು ನಿರುದ್ಯೋಗ ಸ್ಥಿತಿಯ ನಡುವೆ ಯಾವುದೇ ಸಂಬಂಧವಿಲ್ಲ \((cor(\phi, y) = 0)\) .

ದುರದೃಷ್ಟವಶಾತ್, ಈ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ಯಾವುದೂ ಸಾಧ್ಯತೆಯಿಲ್ಲ. ಉದ್ಯೋಗದ ಸ್ಥಿತಿಗೆ ಯಾವುದೇ ಬದಲಾವಣೆಗಳಿಲ್ಲ ಅಥವಾ ಪ್ರತಿಕ್ರಿಯೆಯ ಪ್ರವೃತ್ತಿಯಲ್ಲಿ ವ್ಯತ್ಯಾಸವಿಲ್ಲ ಎಂದು ಅದು ಅಸಂಭವನೀಯವಾಗಿ ತೋರುತ್ತದೆ. ಹೀಗಾಗಿ, eq ನಲ್ಲಿ ಪ್ರಮುಖ ಪದ. 3.7 ಎಂಬುದು ಪರಸ್ಪರ ಸಂಬಂಧ: \(cor(\phi, y)\) . ಉದಾಹರಣೆಗೆ, ಜನರು ನಿರುದ್ಯೋಗಿಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುವ ಸಾಧ್ಯತೆ ಹೆಚ್ಚು ಇದ್ದರೆ, ನಂತರ ಅಂದಾಜು ಉದ್ಯೋಗದ ದರವನ್ನು ಮೇಲ್ಮುಖವಾಗಿ ಪಕ್ಷಪಾತ ಮಾಡಲಾಗುತ್ತದೆ.

ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ಬಳಸುವುದು ನಾನ್ ರೆಸ್ಪಾನ್ಸ್ ಆಗಿದ್ದಾಗ ಅಂದಾಜು ಮಾಡುವ ಟ್ರಿಕ್. ಉದಾಹರಣೆಗೆ, ಸಹಾಯಕ ಮಾಹಿತಿಯನ್ನು ನೀವು ಬಳಸಬಹುದಾದ ಒಂದು ವಿಧಾನವೆಂದರೆ ಪೋಸ್ಟ್-ಸ್ತರೀಕರಣ (ಮೇಲ್ಭಾಗದಿಂದ eq 3.5 ಅನ್ನು ಮರುಪಡೆಯಿರಿ). ಪೋಸ್ಟ್-ಸ್ಟೆಟಿಫಿಕೇಷನ್ ಅಂದಾಜಿನ ಪಕ್ಷಪಾತವು ಈ ರೀತಿಯಾಗಿದೆ:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

\(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , ಮತ್ತು \(\bar{\phi}^{(h)}\) ಮೇಲೆ ವ್ಯಾಖ್ಯಾನಿಸಲಾಗಿದೆ ಆದರೆ ಗುಂಪು \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) ನಲ್ಲಿ ಜನರಿಗೆ ನಿರ್ಬಂಧಿಸಲಾಗಿದೆ. ಹೀಗಾಗಿ, ಪ್ರತಿಯೊಂದು ಪೋಸ್ಟ್-ಸ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಗ್ರೂಪ್ನಲ್ಲಿನ ಪಕ್ಷಪಾತವು ಚಿಕ್ಕದಾದರೆ ಒಟ್ಟಾರೆ ಪಕ್ಷಪಾತವು ಸಣ್ಣದಾಗಿರುತ್ತದೆ. ಪ್ರತಿ ಪೋಸ್ಟ್-ಸ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಗ್ರೂಪ್ನಲ್ಲಿ ಪಕ್ಷಪಾತವನ್ನು ಚಿಕ್ಕದಾಗಿಸುವ ಬಗ್ಗೆ ಯೋಚಿಸಲು ನಾನು ಎರಡು ಮಾರ್ಗಗಳಿವೆ. ಮೊದಲನೆಯದು, ಪ್ರತಿಕ್ರಿಯೆ ಒಲವು ( \(S(\phi)^{(h)} \approx 0\) ) ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ( \(S(y)^{(h)} \approx 0\) ). ಎರಡನೆಯದು, ನೀವು ನೋಡುತ್ತಿರುವ ಜನರು ನೀವು \(cor(\phi, y)^{(h)} \approx 0\) ) ಇರುವ ಗುಂಪುಗಳನ್ನು ರಚಿಸಬೇಕೆಂದು ನೀವು ಬಯಸುತ್ತೀರಿ. ಇಕ್ ಅನ್ನು ಹೋಲಿಸುವುದು. 3.7 ಮತ್ತು ಇಕ್. ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಪಕ್ಷಪಾತವಿಲ್ಲದ ಪಕ್ಷಪಾತವನ್ನು ಕಡಿಮೆಗೊಳಿಸಿದಾಗ 3.8 ಸ್ಪಷ್ಟವಾಗಿ ತಿಳಿಸುತ್ತದೆ.

ಕೊನೆಯಲ್ಲಿ, ಈ ವಿಭಾಗವು ಸಂಭವನೀಯತೆಯ ಮಾದರಿಗಳಿಗೆ ಒಂದು ಪ್ರತಿಕ್ರಿಯೆ ಒದಗಿಸಿಲ್ಲ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯಿಲ್ಲದೆ ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್ ಹೊಂದಾಣಿಕೆಯೊಂದಿಗೆ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಪಡೆಯುವ ಪಕ್ಷಪಾತವನ್ನು ತೋರಿಸಿದೆ. Bethlehem (1988) ಹೆಚ್ಚು ಸಾಮಾನ್ಯ ಮಾದರಿ ವಿನ್ಯಾಸಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯೆಯಿಲ್ಲದೆ ಉಂಟಾಗುವ ಪಕ್ಷಪಾತದ ಒಂದು ವ್ಯುತ್ಪನ್ನವನ್ನು ನೀಡುತ್ತದೆ. ಅನಧಿಕೃತವಾಗಿ ಹೊಂದಾಣಿಕೆ ಮಾಡಲು ಪೋಸ್ಟ್-ಸ್ತರೀಕರಣವನ್ನು ಬಳಸುವುದಕ್ಕಾಗಿ, Smith (1991) ಮತ್ತು Gelman and Carlin (2002) . ಮಾಪನಾಂಕ ನಿರ್ಣಯ ಅಂದಾಜುಗಳು ಎಂಬ ಸಾಮಾನ್ಯ ಕೌಟುಂಬಿಕ ತಂತ್ರಗಳ ಒಂದು ಭಾಗವೆಂದರೆ ಪೋಸ್ಟ್-ಸ್ಟ್ರ್ಯಾಟಿಫಿಕೇಷನ್, ಪುಸ್ತಕ-ಉದ್ದದ ಚಿಕಿತ್ಸೆಗಾಗಿ ಝಾಂಗ್ (2000) ಲೇಖನ-ಉದ್ದದ ಚಿಕಿತ್ಸೆಗಾಗಿ ಮತ್ತು Särndal and Lundström (2005) . Kalton and Flores-Cervantes (2003) ಸರಿಹೊಂದಿಸಲು ಇತರ ಇತರ ತೂಕದ ವಿಧಾನಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿಗಾಗಿ, ನೋಡಿ Kalton and Flores-Cervantes (2003) , Brick (2013) , ಮತ್ತು Särndal and Lundström (2005) .

ಸಂಭವನೀಯತೆ ಸಂಭವನೀಯತೆ

ಸಂಭವನೀಯತೆಯ ಸಂಭಾವ್ಯತೆಯು ಒಂದು ದೊಡ್ಡ ವಿವಿಧ ವಿನ್ಯಾಸಗಳನ್ನು ಒಳಗೊಂಡಿದೆ (Baker et al. 2013) . ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು (W. Wang et al. 2015) ರವರು ಎಕ್ಸ್ಬಾಕ್ಸ್ ಬಳಕೆದಾರರ ಮಾದರಿಯಲ್ಲಿ ನಿರ್ದಿಷ್ಟವಾಗಿ ಕೇಂದ್ರೀಕರಿಸಿದರೆ, ಮಾದರಿಯ ವಿನ್ಯಾಸದ ಪ್ರಮುಖ ಭಾಗವು \(\pi_i\) ಒಂದು ರೀತಿಯ ಮಾದರಿಯನ್ನು ನೀವು ಯೋಚಿಸಬಹುದು. ಸೇರ್ಪಡೆಯ ಸಂಶೋಧಕ ಚಾಲಿತ ಸಂಭವನೀಯತೆ) ಆದರೆ \(\phi_i\) (ಪ್ರತಿಸ್ಪಂದಕ-ಚಾಲಿತ ಪ್ರತಿಕ್ರಿಯೆಯ ಒಲವು). ಸ್ವಾಭಾವಿಕವಾಗಿ, ಇದು ಸೂಕ್ತವಲ್ಲ ಏಕೆಂದರೆ \(\phi_i\) ಅಜ್ಞಾತವಾಗಿದೆ. ಆದರೆ, ವಾಂಗ್ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ತೋರಿಸಿದಂತೆ, ಈ ರೀತಿಯ ಆಪ್ಟ್-ಇನ್ ಮಾದರಿ-ಅಗಾಧ ಕವರೇಜ್ ದೋಷದೊಂದಿಗೆ ಮಾದರಿ ಚೌಕಟ್ಟಿನಿಂದಲೂ-ಸಂಶೋಧಕರಿಗೆ ಉತ್ತಮ ಸಹಾಯಕ ಮಾಹಿತಿ ಮತ್ತು ಈ ಸಮಸ್ಯೆಗಳಿಗೆ ಕಾರಣವಾಗುವ ಉತ್ತಮ ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಮಾದರಿ ಇದ್ದರೆ ದುರಂತವಾಗಿರಬಾರದು.

Bethlehem (2010) ಅನಧಿಕೃತ ಮತ್ತು ಕವರೇಜ್ ದೋಷಗಳನ್ನು ಒಳಗೊಳ್ಳಲು ನಂತರದ-ಶ್ರೇಣೀಕರಣದ ಕುರಿತು ಮೇಲಿನ ಹಲವು ಉತ್ಪನ್ನಗಳನ್ನು ವಿಸ್ತರಿಸುತ್ತದೆ. ನಂತರದ ಶ್ರೇಣೀಕರಣದ ಜೊತೆಗೆ, (Ansolabehere and Rivers 2013; ??? ) ದೋಷಗಳು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯಿಲ್ಲದ ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳು-ಮತ್ತು ಸಂಭವನೀಯತೆ ಮಾದರಿಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಇತರ ವಿಧಾನಗಳು (Ansolabehere and Rivers 2013; ??? ) ಮಾದರಿ ಹೊಂದಾಣಿಕೆಯು (Ansolabehere and Rivers 2013; ??? ) , (Ansolabehere and Rivers 2013; ??? ) ಸ್ಕೋರ್ ತೂಕದ (Lee 2006; Schonlau et al. 2009) , ಮತ್ತು ಮಾಪನಾಂಕ ನಿರ್ಣಯ (Lee and Valliant 2009) . ಈ ತಂತ್ರಗಳ ಪೈಕಿ ಒಂದು ಸಾಮಾನ್ಯ ವಿಷಯವೆಂದರೆ ಸಹಾಯಕ ಮಾಹಿತಿಯ ಬಳಕೆ.