3.6.1 ಸುಧಾರಿತ ಕೇಳುವುದು

ಪುಷ್ಟೀಕರಿಸಿದ ಕೇಳುವಲ್ಲಿ, ಸಮೀಕ್ಷೆಯ ಮಾಹಿತಿಯು ಕೆಲವು ಪ್ರಮುಖ ಅಳತೆಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಒಂದು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲದ ಸುತ್ತ ಸನ್ನಿವೇಶವನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ ಆದರೆ ಇತರರನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ.

ಸಮೀಕ್ಷೆ ಡೇಟಾ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಒಂದು ವಿಧಾನವೆಂದರೆ ನಾನು ಸಮೃದ್ಧವಾದ ಕೇಳುವಿಕೆಯನ್ನು ಕರೆಯುವ ಪ್ರಕ್ರಿಯೆ. ಪುಷ್ಟೀಕರಿಸಿದ ಕೇಳುವಲ್ಲಿ, ಒಂದು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲವು ಕೆಲವು ಪ್ರಮುಖ ಅಳತೆಗಳನ್ನು ಹೊಂದಿದೆ ಆದರೆ ಇತರ ಅಳತೆಗಳನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ ಆದ್ದರಿಂದ ಸಂಶೋಧಕರು ಈ ಕಾಣೆಯಾದ ಅಳತೆಗಳನ್ನು ಸಮೀಕ್ಷೆಯಲ್ಲಿ ಸಂಗ್ರಹಿಸುತ್ತಾರೆ ಮತ್ತು ನಂತರ ಎರಡು ಡೇಟಾ ಮೂಲಗಳನ್ನು ಒಟ್ಟಿಗೆ ಸಂಪರ್ಕಿಸುತ್ತಾರೆ. ಪುಷ್ಟೀಕರಿಸಿದ Burke and Kraut (2014) ಒಂದು ಉದಾಹರಣೆಯೆಂದರೆ Burke and Kraut (2014) , ಫೇಸ್ಬುಕ್ನಲ್ಲಿ ಪರಸ್ಪರ ಪ್ರಭಾವ ಬೀರುವ ಸ್ನೇಹ ಬಲವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಎಂಬುದರ ಕುರಿತು ನಾನು ವಿಭಾಗ 3.2 ರಲ್ಲಿ ವಿವರಿಸಿದೆ). ಆ ಸಂದರ್ಭದಲ್ಲಿ, ಬರ್ಕ್ ಮತ್ತು ಕ್ರಾಟ್ ಫೇಸ್ಬುಕ್ ಲಾಗ್ ಡೇಟಾವನ್ನು ಸಮೀಕ್ಷೆ ಡೇಟಾವನ್ನು ಸಂಯೋಜಿಸಿದ್ದಾರೆ.

ಆದಾಗ್ಯೂ, ಬರ್ಕ್ ಮತ್ತು ಕ್ರಾಟ್ ಕೆಲಸ ಮಾಡುತ್ತಿರುವ ಸೆಟ್ಟಿಂಗ್ಗಳು, ಸಂಶೋಧಕರು ಉತ್ಕೃಷ್ಟವಾದ ಕೇಳುವುದನ್ನು ಕೇಂದ್ರೀಕರಿಸುವ ಎರಡು ದೊಡ್ಡ ಸಮಸ್ಯೆಗಳನ್ನು ಎದುರಿಸಬೇಕಾಗಿಲ್ಲ ಎಂದರ್ಥ. ಮೊದಲನೆಯದಾಗಿ, ವೈಯಕ್ತಿಕ ಮಟ್ಟದ ಡೇಟಾ ಸೆಟ್ಗಳನ್ನು ನಿಜವಾಗಿ ಜೋಡಿಸುವುದು , ರೆಕಾರ್ಡ್ ಲಿಂಕ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಪ್ರಕ್ರಿಯೆ ಎರಡೂ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ಅನನ್ಯ ಗುರುತಿಸುವಿಕೆ ಇಲ್ಲದಿದ್ದರೆ ಕಷ್ಟವಾಗಬಹುದು, ಅದು ಒಂದು ದತ್ತಾಂಶ ಸಂಗ್ರಹದಲ್ಲಿ ಸರಿಯಾದ ದಾಖಲೆಯು ಸರಿಯಾದ ದಾಖಲೆಯನ್ನು ಹೊಂದಿದೆಯೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಬಳಸಬಹುದು ಇತರ ಡೇಟಾಬೇಸ್ನಲ್ಲಿ. ಪುಷ್ಟೀಕರಿಸಿದ ಕೇಳುವಿಕೆಯೊಂದಿಗಿನ ಎರಡನೆಯ ಮುಖ್ಯ ಸಮಸ್ಯೆ ಸಂಶೋಧಕರು ನಿರ್ಣಯಿಸಲು ಆಗಾಗ್ಗೆ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲದ ಗುಣಮಟ್ಟವನ್ನು ಕಷ್ಟವಾಗಿಸುತ್ತದೆ, ಏಕೆಂದರೆ ಡೇಟಾವನ್ನು ರಚಿಸಿದ ಪ್ರಕ್ರಿಯೆಯು ಮಾಲೀಕತ್ವವನ್ನು ಹೊಂದಿರಬಹುದು ಮತ್ತು ಅಧ್ಯಾಯ 2 ರಲ್ಲಿ ವಿವರಿಸಿರುವ ಹಲವು ಸಮಸ್ಯೆಗಳಿಗೆ ಒಳಗಾಗಬಹುದು. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಪುಷ್ಟೀಕರಿಸಿದ ಕೇಳುವಿಕೆಯು ಆಗಾಗ್ಗೆ ಅಜ್ಞಾತ ಗುಣಮಟ್ಟದ ಬ್ಲಾಕ್-ಬಾಕ್ಸ್ ಡೇಟಾ ಮೂಲಗಳಿಗೆ ಸಮೀಕ್ಷೆಗಳ ದೋಷ-ಪೀಡಿತ ಲಿಂಕ್ಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಈ ಸಮಸ್ಯೆಗಳ ಹೊರತಾಗಿಯೂ, ಅಮೆರಿಕದ ಮತದಾನ ಮಾದರಿಗಳ ಬಗೆಗಿನ ಅವರ ಸಂಶೋಧನೆಯಲ್ಲಿ ಸ್ಟಿಫನ್ ಅನ್ಸೊಲಾಬೆರೆ ಮತ್ತು ಐಟನ್ ಹೆರ್ಷ್ (2012) ಪ್ರದರ್ಶಿಸಿದಂತೆ, ಸುಸಂಸ್ಕೃತ ಕೇಳುವುದನ್ನು ಪ್ರಮುಖ ಸಂಶೋಧನೆ ನಡೆಸಲು ಬಳಸಬಹುದು.

ಮತದಾರರ ಮತದಾನವು ರಾಜಕೀಯ ವಿಜ್ಞಾನದಲ್ಲಿ ವ್ಯಾಪಕ ಸಂಶೋಧನೆಯ ವಿಷಯವಾಗಿದೆ, ಮತ್ತು ಹಿಂದೆ, ಯಾರ ಮತಗಳನ್ನು ಸಂಶೋಧಕರು ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದಾರೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಸಮೀಕ್ಷೆಯ ಡೇಟಾದ ವಿಶ್ಲೇಷಣೆಯ ಆಧಾರದ ಮೇಲೆ ಏಕೆ. ಆದಾಗ್ಯೂ, ಪ್ರತಿ ನಾಗರಿಕನು ಮತ ಚಲಾಯಿಸಿದ್ದಾನೆ ಎಂಬುದನ್ನು ಸರ್ಕಾರವು ದಾಖಲಿಸುತ್ತದೆ ಎಂಬ ಅಸಾಮಾನ್ಯವಾದ ನಡವಳಿಕೆಯು ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್ನಲ್ಲಿ ಮತದಾನ ಮಾಡುತ್ತಿದೆ (ಸಹಜವಾಗಿ, ಪ್ರತಿ ನಾಗರಿಕ ಮತಗಳನ್ನು ಯಾರು ಸರ್ಕಾರ ದಾಖಲಿಸಿಕೊಳ್ಳುವುದಿಲ್ಲ). ಅನೇಕ ವರ್ಷಗಳಿಂದ, ಈ ಸರ್ಕಾರಿ ಮತದಾನದ ದಾಖಲೆಗಳು ಕಾಗದದ ರೂಪದಲ್ಲಿ ಲಭ್ಯವಿವೆ, ದೇಶಾದ್ಯಂತ ವಿವಿಧ ಸ್ಥಳೀಯ ಸರ್ಕಾರಿ ಕಚೇರಿಗಳಲ್ಲಿ ಚದುರಿದವು. ಇದು ರಾಜಕೀಯ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಮತದಾರರ ಸಂಪೂರ್ಣ ಚಿತ್ರಣವನ್ನು ಹೊಂದಲು ಮತ್ತು ತಮ್ಮ ನಿಜವಾದ ಮತದಾನದ ವರ್ತನೆ (Ansolabehere and Hersh 2012) ಮತದಾನದ ಬಗ್ಗೆ ಸಮೀಕ್ಷೆಗಳಲ್ಲಿ ಜನರು ಏನು ಹೇಳುತ್ತಾರೆಂದು ಹೋಲಿಸಲು ಇದು ತುಂಬಾ ಕಷ್ಟಕರವಾಗಿದೆ, ಆದರೆ ಅಸಾಧ್ಯವಲ್ಲ.

ಆದರೆ ಈ ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಈಗ ಡಿಜಿಟೈಸ್ ಮಾಡಲಾಗಿದೆ, ಮತ್ತು ಹಲವಾರು ಖಾಸಗಿ ಕಂಪನಿಗಳು ವ್ಯವಸ್ಥಿತವಾಗಿ ಸಂಗ್ರಹಿಸಿ ಅವುಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ ಸಮಗ್ರ ಮಾಸ್ಟರ್ ಮತದಾನದ ಫೈಲ್ಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಎಲ್ಲ ಅಮೆರಿಕನ್ನರ ಮತದಾನದ ವರ್ತನೆಗಳನ್ನು ಒಳಗೊಂಡಿವೆ. ಮತದಾರರ ಉತ್ತಮ ಚಿತ್ರಣವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಸಹಾಯವಾಗುವಂತೆ ಅವರ ಮಾಸ್ಟರ್ ಮತದಾನದ ಫೈಲ್ ಅನ್ನು ಬಳಸಿಕೊಳ್ಳುವ ಸಲುವಾಗಿ ಅನ್ಸೊಲಾಬೀಹೆರ್ ಮತ್ತು ಹರ್ಷ ಈ ಕಂಪನಿಗಳಲ್ಲಿ ಒಂದಾದ ಕ್ಯಾಟಲಿಸ್ಟ್ ಎಲ್ಸಿಸಿ ಜೊತೆ ಪಾಲುದಾರಿಕೆಯನ್ನು ಹೊಂದಿದ್ದರು. ಇದಲ್ಲದೆ, ಡೇಟಾ ಸಂಗ್ರಹ ಮತ್ತು ಸುಸಂಗತತೆಗೆ ಗಣನೀಯ ಪ್ರಮಾಣದ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಹೂಡಿದ ಕಂಪೆನಿಯಿಂದ ಸಂಗ್ರಹಿಸಲಾದ ಮತ್ತು ಸಂಗ್ರಹಿಸಲಾದ ಡಿಜಿಟಲ್ ದಾಖಲೆಗಳ ಮೇಲೆ ತಮ್ಮ ಅಧ್ಯಯನವು ಅವಲಂಬಿಸಿರುವುದರಿಂದ, ಕಂಪೆನಿಗಳ ಸಹಾಯವಿಲ್ಲದೆ ಮತ್ತು ಅನಲಾಗ್ ದಾಖಲೆಗಳನ್ನು ಬಳಸದೆ ಹಿಂದಿನ ಪ್ರಯತ್ನಗಳ ಮೇಲೆ ಇದು ಹಲವಾರು ಪ್ರಯೋಜನಗಳನ್ನು ನೀಡಿತು.

ಅಧ್ಯಾಯ 2 ರ ಹಲವು ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲಗಳಂತೆ, ಕ್ಯಾಟಲಿಸ್ಟ್ ಮಾಸ್ಟರ್ ಕಡತವು ಜನಸಂಖ್ಯಾ, ಧನಾತ್ಮಕ, ಮತ್ತು ವರ್ತನೆಯ ಮಾಹಿತಿಯನ್ನೂ ಅನ್ಸೊಬೆಬೆಹೆರ್ ಮತ್ತು ಹೆರ್ಷ್ನ ಅಗತ್ಯತೆಗಳನ್ನು ಒಳಗೊಂಡಿರಲಿಲ್ಲ. ವಾಸ್ತವವಾಗಿ, ಅವರು ಪ್ರಮಾಣೀಕೃತ ಮತದಾನ ವರ್ತನೆಯನ್ನು (ಅಂದರೆ, ಕ್ಯಾಟಲಿಸ್ಟ್ ಡೇಟಾಬೇಸ್ನಲ್ಲಿರುವ ಮಾಹಿತಿಯೊಂದಿಗೆ) ಸಮೀಕ್ಷೆಗಳಲ್ಲಿ ವರದಿ ಮಾಡಿದ ಮತದಾನ ವರ್ತನೆಯನ್ನು ಹೋಲಿಸುವಲ್ಲಿ ವಿಶೇಷವಾಗಿ ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರು. ಆದ್ದರಿಂದ ಈ ಅಧ್ಯಾಯದಲ್ಲಿ ಉಲ್ಲೇಖಿಸಲಾದ CCES, ಒಂದು ದೊಡ್ಡ ಸಾಮಾಜಿಕ ಸಮೀಕ್ಷೆಯಾಗಿ ಅನ್ಸ್ಸೊಲಾಹೇರಿ ಮತ್ತು ಹರ್ಶ್ ಈ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದರು. ನಂತರ ಅವರು ತಮ್ಮ ಡೇಟಾವನ್ನು ಕ್ಯಾಟಲಿಸ್ಟ್ಗೆ ನೀಡಿದರು, ಮತ್ತು ಕ್ಯಾಟಲಿಸ್ಟ್ ಅವರನ್ನು ವಿಲೀನಗೊಳಿಸಿದ ಡಾಟಾ ಫೈಲ್ ಅನ್ನು ನೀಡಿದರು, ಇದರಲ್ಲಿ ಮೌಲ್ಯಾಂಕಿತ ಮತದಾನ ವರ್ತನೆಯನ್ನು (ಕ್ಯಾಟಲಿಸ್ಟ್ನಿಂದ), ಸ್ವ-ವರದಿ ಮಾಡಿದ ಮತದಾನ ವರ್ತನೆಯನ್ನು (ಸಿ.ಸಿ.ಇ.ಎಸ್ನಿಂದ) ಮತ್ತು ಜನಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಗಳ ವರ್ತನೆಗಳು (ಸಿಸಿಎಸ್ಗಳಿಂದ) 3.13). ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಆನ್ಸೊಲಾಬೆರೆ ಮತ್ತು ಹರ್ಶ್ ಮತದಾನದ ದಾಖಲೆಗಳ ದತ್ತಾಂಶವನ್ನು ಸಮೀಕ್ಷೆಯ ದತ್ತಾಂಶದೊಂದಿಗೆ ಒಟ್ಟುಗೂಡಿಸಿ ಸಂಶೋಧನೆ ನಡೆಸುತ್ತಾರೆ, ಇದು ದತ್ತಾಂಶ ಮೂಲವನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಬಳಸಲಾಗುವುದಿಲ್ಲ.

ಚಿತ್ರ 3.13: ಆನ್ಸೊಲಾಬೆರೈ ಮತ್ತು ಹರ್ಷ (2012) ಅವರಿಂದ ಮಾಡಲ್ಪಟ್ಟ ಅಧ್ಯಯನದ ರೂಪರೇಖೆ. ಮಾಸ್ಟರ್ ಡೇಟಾಫೈಲ್ ರಚಿಸಲು, ಕ್ಯಾಟಲಿಸ್ಟ್ ಸಂಯೋಜಿಸುತ್ತದೆ ಮತ್ತು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಮಾಹಿತಿಯನ್ನು ಸಮನ್ವಯಗೊಳಿಸುತ್ತದೆ. ವಿಲೀನಗೊಳಿಸುವ ಈ ಪ್ರಕ್ರಿಯೆಯು ಎಷ್ಟು ಜಾಗರೂಕತೆಯಿಲ್ಲ, ಮೂಲ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ದೋಷಗಳನ್ನು ಪ್ರಸಾರ ಮಾಡುತ್ತದೆ ಮತ್ತು ಹೊಸ ದೋಷಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ. ದೋಷಗಳ ಎರಡನೇ ಮೂಲವೆಂದರೆ ಸಮೀಕ್ಷೆಯ ಡೇಟಾ ಮತ್ತು ಮಾಸ್ಟರ್ ಡೇಟಾಫೈಲ್ ನಡುವಿನ ದಾಖಲೆಯ ಸಂಪರ್ಕ. ಪ್ರತಿಯೊಬ್ಬ ವ್ಯಕ್ತಿಯು ಎರಡೂ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ಸ್ಥಿರ, ಅನನ್ಯ ಗುರುತನ್ನು ಹೊಂದಿದ್ದರೆ, ನಂತರ ಸಂಪರ್ಕವು ಅಲ್ಪಪ್ರಮಾಣದಲ್ಲಿರುತ್ತದೆ. ಆದರೆ, ಕ್ಯಾಟಲಿಸ್ಟ್ ಈ ಸಂದರ್ಭದಲ್ಲಿ ಹೆಸರು, ಲಿಂಗ, ಜನ್ಮ ವರ್ಷ ಮತ್ತು ಮನೆಯ ವಿಳಾಸದಲ್ಲಿ ಅಪೂರ್ಣ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಸಂಪರ್ಕವನ್ನು ಮಾಡಬೇಕಾಗಿತ್ತು. ದುರದೃಷ್ಟವಶಾತ್, ಹಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಅಪೂರ್ಣ ಅಥವಾ ನಿಖರವಾದ ಮಾಹಿತಿಯಿಲ್ಲ; ಹೋಮರ್ ಸಿಂಪ್ಸನ್ ಎಂಬ ಓರ್ವ ಮತದಾರನು ಹೋಮರ್ ಜೇ ಸಿಂಪ್ಸನ್, ಹೋಮಿ ಜೆ ಸಿಂಪ್ಸನ್, ಅಥವಾ ಹೋಮರ್ ಸ್ಯಾಂಪ್ಸಿನ್ ಆಗಿ ಕಾಣಿಸಿಕೊಳ್ಳಬಹುದು. ಕ್ಯಾಟಲಿಸ್ಟ್ ಮಾಸ್ಟರ್ ಡಾಟಾಫೈಲ್ ಮತ್ತು ರೆಕಾರ್ಡ್ ಲಿಂಕ್ನಲ್ಲಿರುವ ದೋಷಗಳಲ್ಲಿ ದೋಷಗಳ ಸಂಭಾವ್ಯತೆಯ ಹೊರತಾಗಿಯೂ, ಅನ್ಸೊಲಾಬೆಹೆರೆ ಮತ್ತು ಹೆರ್ಷ್ ಅವರು ಹಲವಾರು ಅಂದಾಜು ಪರೀಕ್ಷೆಗಳ ಮೂಲಕ ತಮ್ಮ ಅಂದಾಜುಗಳಲ್ಲಿ ವಿಶ್ವಾಸವನ್ನು ಬೆಳೆಸಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಯಿತು.

ಚಿತ್ರ 3.13: Ansolabehere and Hersh (2012) ಅವರಿಂದ Ansolabehere and Hersh (2012) ಅಧ್ಯಯನದ ರೂಪರೇಖೆ. ಮಾಸ್ಟರ್ ಡೇಟಾಫೈಲ್ ರಚಿಸಲು, ಕ್ಯಾಟಲಿಸ್ಟ್ ಸಂಯೋಜಿಸುತ್ತದೆ ಮತ್ತು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಮಾಹಿತಿಯನ್ನು ಸಮನ್ವಯಗೊಳಿಸುತ್ತದೆ. ವಿಲೀನಗೊಳಿಸುವ ಈ ಪ್ರಕ್ರಿಯೆಯು ಎಷ್ಟು ಜಾಗರೂಕತೆಯಿಲ್ಲ, ಮೂಲ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ದೋಷಗಳನ್ನು ಪ್ರಸಾರ ಮಾಡುತ್ತದೆ ಮತ್ತು ಹೊಸ ದೋಷಗಳನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ. ದೋಷಗಳ ಎರಡನೇ ಮೂಲವೆಂದರೆ ಸಮೀಕ್ಷೆಯ ಡೇಟಾ ಮತ್ತು ಮಾಸ್ಟರ್ ಡೇಟಾಫೈಲ್ ನಡುವಿನ ದಾಖಲೆಯ ಸಂಪರ್ಕ. ಪ್ರತಿಯೊಬ್ಬ ವ್ಯಕ್ತಿಯು ಎರಡೂ ಡೇಟಾ ಮೂಲಗಳಲ್ಲಿ ಸ್ಥಿರ, ಅನನ್ಯ ಗುರುತನ್ನು ಹೊಂದಿದ್ದರೆ, ನಂತರ ಸಂಪರ್ಕವು ಅಲ್ಪಪ್ರಮಾಣದಲ್ಲಿರುತ್ತದೆ. ಆದರೆ, ಕ್ಯಾಟಲಿಸ್ಟ್ ಈ ಸಂದರ್ಭದಲ್ಲಿ ಹೆಸರು, ಲಿಂಗ, ಜನ್ಮ ವರ್ಷ ಮತ್ತು ಮನೆಯ ವಿಳಾಸದಲ್ಲಿ ಅಪೂರ್ಣ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಸಂಪರ್ಕವನ್ನು ಮಾಡಬೇಕಾಗಿತ್ತು. ದುರದೃಷ್ಟವಶಾತ್, ಹಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ ಅಪೂರ್ಣ ಅಥವಾ ನಿಖರವಾದ ಮಾಹಿತಿಯಿಲ್ಲ; ಹೋಮರ್ ಸಿಂಪ್ಸನ್ ಎಂಬ ಓರ್ವ ಮತದಾರನು ಹೋಮರ್ ಜೇ ಸಿಂಪ್ಸನ್, ಹೋಮಿ ಜೆ ಸಿಂಪ್ಸನ್, ಅಥವಾ ಹೋಮರ್ ಸ್ಯಾಂಪ್ಸಿನ್ ಆಗಿ ಕಾಣಿಸಿಕೊಳ್ಳಬಹುದು. ಕ್ಯಾಟಲಿಸ್ಟ್ ಮಾಸ್ಟರ್ ಡಾಟಾಫೈಲ್ ಮತ್ತು ರೆಕಾರ್ಡ್ ಲಿಂಕ್ನಲ್ಲಿರುವ ದೋಷಗಳಲ್ಲಿ ದೋಷಗಳ ಸಂಭಾವ್ಯತೆಯ ಹೊರತಾಗಿಯೂ, ಅನ್ಸೊಲಾಬೆಹೆರೆ ಮತ್ತು ಹೆರ್ಷ್ ಅವರು ಹಲವಾರು ಅಂದಾಜು ಪರೀಕ್ಷೆಗಳ ಮೂಲಕ ತಮ್ಮ ಅಂದಾಜುಗಳಲ್ಲಿ ವಿಶ್ವಾಸವನ್ನು ಬೆಳೆಸಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಯಿತು.

ಅವರ ಸಂಯೋಜಿತ ದತ್ತಾಂಶಗಳ ಕಡತದೊಂದಿಗೆ, ಅನ್ಸೊಬೆಬೀ ಮತ್ತು ಹರ್ಷ ಮೂರು ಪ್ರಮುಖ ತೀರ್ಮಾನಗಳಿಗೆ ಬಂದವು. ಮೊದಲನೆಯದಾಗಿ, ಮತದಾನದ ಅತಿ ಹೆಚ್ಚು ವರದಿಗಳು ಅತಿರೇಕದವಾಗಿವೆ: ಬಹುತೇಕ ಮತದಾರರ ಪೈಕಿ ಅರ್ಧದಷ್ಟು ಮಂದಿ ಮತದಾನವನ್ನು ವರದಿ ಮಾಡಿದ್ದಾರೆ ಮತ್ತು ಯಾರಾದರೂ ಮತದಾನ ಮಾಡಿದರೆ, ಅವರು ನಿಜವಾಗಿ ಮತ ಹಾಕಿದ 80% ಅವಕಾಶವಿದೆ. ಎರಡನೆಯದಾಗಿ, ಅತಿ-ವರದಿ ಮಾಡುವಿಕೆಯು ಯಾದೃಚ್ಛಿಕವಲ್ಲ: ಸಾರ್ವಜನಿಕ ವ್ಯವಹಾರಗಳಲ್ಲಿ ತೊಡಗಿರುವ ಉನ್ನತ ಆದಾಯದ, ಸುಶಿಕ್ಷಿತ, ಪಕ್ಷಪಾತದವರಲ್ಲಿ ಹೆಚ್ಚು ವರದಿಯಾಗಿದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಮತ ಚಲಾಯಿಸುವ ಬಹುಪಾಲು ಜನರು ಮತದಾನದ ಬಗ್ಗೆ ಸುಳ್ಳು ಹೇಳಲು ಸಾಧ್ಯವಿದೆ. ಮೂರನೆಯದಾಗಿ ಮತ್ತು ಹೆಚ್ಚು ವಿಮರ್ಶಾತ್ಮಕವಾಗಿ, ಅತಿಯಾದ ವರದಿ ಮಾಡುವಿಕೆಯ ವ್ಯವಸ್ಥಿತ ಸ್ವಭಾವದ ಕಾರಣ, ಮತದಾರರು ಮತ್ತು ನಾನ್ವೋಟರ್ಗಳ ನಡುವಿನ ನಿಜವಾದ ವ್ಯತ್ಯಾಸಗಳು ಸಮೀಕ್ಷೆಗಳಿಂದ ಅವುಗಳು ಕಾಣಿಸಿಕೊಳ್ಳುವುದಕ್ಕಿಂತ ಚಿಕ್ಕದಾಗಿರುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ಸ್ನಾತಕೋತ್ತರ ಪದವಿ ಹೊಂದಿರುವವರು ಮತದಾನವನ್ನು ವರದಿ ಮಾಡಲು ಸುಮಾರು 22 ಶೇಕಡಾ ಪಾಯಿಂಟ್ಗಳು ಹೆಚ್ಚು ಸಾಧ್ಯತೆಗಳಿವೆ, ಆದರೆ ವಾಸ್ತವವಾಗಿ ಶೇಕಡ 10 ರಷ್ಟು ಮಾತ್ರ ಮತ ಚಲಾಯಿಸಬಹುದು. ಮತದಾನ ವರದಿ ಮಾಡುವವರು ಯಾರು (ಯಾರು ಹಿಂದೆ ಸಂಶೋಧಕರು ಬಳಸಿದ ಡೇಟಾ) ಯಾರು ನಿಜವಾಗಿ ಮತಗಳನ್ನು ಊಹಿಸುತ್ತಿದ್ದಾರೆಂದು ಊಹಿಸುವ ಬಗ್ಗೆ ಊಹಿಸುವ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸಂಪನ್ಮೂಲ-ಆಧಾರಿತ ಸಿದ್ಧಾಂತಗಳು ಹೆಚ್ಚು ಉತ್ತಮವೆಂದು ಬಹುಶಃ ಆಶ್ಚರ್ಯಕರವಲ್ಲ. ಹೀಗಾಗಿ, ಹೊಸ ಸಿದ್ಧಾಂತಗಳಿಗೆ ಮತದಾನವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮತ್ತು ಊಹಿಸಲು Ansolabehere and Hersh (2012) ನ ಪ್ರಾಯೋಗಿಕ ಸಂಶೋಧನೆ.

ಆದರೆ ಈ ಫಲಿತಾಂಶಗಳನ್ನು ನಾವು ಎಷ್ಟು ನಂಬಬೇಕು? ನೆನಪಿಡಿ, ಈ ಫಲಿತಾಂಶಗಳು ದೋಷಪೂರಿತ ಲಿಂಕ್ ಅನ್ನು ಕಪ್ಪು ಪೆಟ್ಟಿಗೆ ಡೇಟಾಕ್ಕೆ ಅಜ್ಞಾತ ಪ್ರಮಾಣದಲ್ಲಿ ದೋಷದೊಂದಿಗೆ ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಹೆಚ್ಚು ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, ಫಲಿತಾಂಶಗಳು ಎರಡು ಮುಖ್ಯ ಹಂತಗಳಲ್ಲಿ ಇರುತ್ತವೆ: (1) ನಿಖರವಾದ ಮಾಸ್ಟರ್ ಡಾಟಾಫೈಲ್ ಮತ್ತು (2) ಸಮೀಕ್ಷೆಯ ಡೇಟಾವನ್ನು ಅದರ ಮಾಸ್ಟರ್ ಡೇಟಾಫೈಲ್ಗೆ ಜೋಡಿಸಲು ಸಾಮರ್ಥ್ಯ ನೀಡುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿರುವ ಅನೇಕ ವಿಭಿನ್ನ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಸಂಯೋಜಿಸಲು ಕ್ಯಾಟಲಿಸ್ಟ್ನ ಸಾಮರ್ಥ್ಯ. ಈ ಪ್ರತಿಯೊಂದು ಹಂತಗಳು ಕಷ್ಟ, ಮತ್ತು ಎರಡೂ ಹಂತಗಳಲ್ಲಿನ ದೋಷಗಳು ಸಂಶೋಧಕರನ್ನು ತಪ್ಪು ನಿರ್ಣಯಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು. ಹೇಗಾದರೂ, ದತ್ತಾಂಶ ಸಂಸ್ಕರಣೆ ಮತ್ತು ಸಂಪರ್ಕ ಎರಡೂ ಕಂಪನಿಯಾಗಿ ಕ್ಯಾಟಲಿಸ್ಟ್ನ ಮುಂದುವರಿದ ಅಸ್ತಿತ್ವಕ್ಕೆ ವಿಮರ್ಶಾತ್ಮಕವಾಗಿರುತ್ತವೆ, ಆದ್ದರಿಂದ ಈ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುವಲ್ಲಿ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಹೂಡಿಕೆ ಮಾಡಬಹುದು, ಅನೇಕ ವೇಳೆ ಶೈಕ್ಷಣಿಕ ಸಂಶೋಧಕರು ಹೊಂದಾಣಿಕೆಯಾಗುವುದಿಲ್ಲ ಎಂದು ಪ್ರಮಾಣದಲ್ಲಿ. ಅವರ ಕಾಗದದಲ್ಲಿ, ಅನ್ಸೊಲಾಬೀರೆ ಮತ್ತು ಹೆರ್ಷ್ ಈ ಎರಡು ಹಂತಗಳ ಫಲಿತಾಂಶಗಳನ್ನು ಪರಿಶೀಲಿಸಲು ಹಲವು ಹಂತಗಳನ್ನು ಅನುಸರಿಸುತ್ತಾರೆ-ಅವುಗಳಲ್ಲಿ ಕೆಲವು ಮಾಲೀಕತ್ವ ಹೊಂದಿದ್ದರೂ ಸಹ- ಮತ್ತು ಈ ಸಂಶೋಧನೆಗಳು ಸಮೀಕ್ಷೆಯ ಡೇಟಾವನ್ನು ಕಪ್ಪು ಪೆಟ್ಟಿಗೆ ದೊಡ್ಡ ಡೇಟಾಗೆ ಸಂಪರ್ಕಿಸಲು ಬಯಸುವ ಇತರ ಸಂಶೋಧಕರಿಗೆ ಸಹಾಯವಾಗಬಹುದು. ಮೂಲಗಳು.

ಸಂಶೋಧಕರು ಈ ಅಧ್ಯಯನದಿಂದ ಸೆಳೆಯಬಹುದಾದ ಸಾಮಾನ್ಯ ಪಾಠಗಳು ಯಾವುವು? ಮೊದಲನೆಯದಾಗಿ, ಸಮೀಕ್ಷೆಯ ಡೇಟಾದೊಂದಿಗೆ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಸಮೃದ್ಧಗೊಳಿಸುವುದರಿಂದ ಮತ್ತು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳೊಂದಿಗೆ ಸಮೀಕ್ಷೆ ಡೇಟಾವನ್ನು ಸಮೃದ್ಧಗೊಳಿಸುವುದರಿಂದ ಭಾರೀ ಮೌಲ್ಯವಿದೆ (ನೀವು ಈ ಅಧ್ಯಯನವನ್ನು ನೋಡಬಹುದಾಗಿದೆ). ಈ ಎರಡು ಡೇಟಾ ಮೂಲಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ, ಸಂಶೋಧಕರು ಪ್ರತ್ಯೇಕವಾಗಿ ಅಸಾಧ್ಯವಾದ ಏನಾದರೂ ಮಾಡಲು ಸಾಧ್ಯವಾಯಿತು. ಎರಡನೆಯ ಸಾಮಾನ್ಯ ಪಾಠವೆಂದರೆ, ಕ್ಯಾಟಲಿಸ್ಟ್ನ ದತ್ತಾಂಶಗಳಂತಹ ಒಟ್ಟುಗೂಡಿದ, ವಾಣಿಜ್ಯ ಡೇಟಾ ಮೂಲಗಳು ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ "ನೆಲದ ಸತ್ಯ" ಎಂದು ಪರಿಗಣಿಸಬಾರದು, ಅವು ಉಪಯುಕ್ತವಾಗಬಹುದು. ಸಂದೇಹವಾದಿಗಳು ಈ ಒಟ್ಟುಗೂಡಿಸಿದ, ವಾಣಿಜ್ಯ ಡೇಟಾ ಮೂಲವನ್ನು ಸಂಪೂರ್ಣವಾದ ಸತ್ಯದೊಂದಿಗೆ ಹೋಲಿಸಿ ಮತ್ತು ಈ ಡೇಟಾ ಮೂಲಗಳು ಕಡಿಮೆಯಾಗಿವೆ ಎಂದು ತಿಳಿಸುತ್ತವೆ. ಆದಾಗ್ಯೂ, ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸಂದೇಹವಾದಿಗಳು ತಪ್ಪು ಹೋಲಿಕೆ ಮಾಡುತ್ತಿದ್ದಾರೆ: ಸಂಶೋಧಕರು ಸಂಪೂರ್ಣ ಸತ್ಯವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಬಳಸುತ್ತಿರುವ ಎಲ್ಲಾ ಡೇಟಾ. ಬದಲಾಗಿ, ಒಟ್ಟುಗೂಡಿಸಿದ, ವಾಣಿಜ್ಯ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಇತರ ಲಭ್ಯವಿರುವ ಡೇಟಾ ಮೂಲಗಳೊಂದಿಗೆ ಹೋಲಿಸಿ (ಉದಾ. ಸ್ವಯಂ-ವರದಿ ಮಾಡಿದ ಮತದಾನದ ವರ್ತನೆ), ಇದು ದೋಷಗಳನ್ನು ಹೊಂದಿದ್ದು. ಅಂತಿಮವಾಗಿ, ಅನ್ಸೊಲಾಬೆರೈ ಮತ್ತು ಹರ್ಷನ ಅಧ್ಯಯನದ ಮೂರನೆಯ ಸಾಮಾನ್ಯ ಪಾಠವೆಂದರೆ ಕೆಲವು ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಂಕೀರ್ಣವಾದ ಸಾಮಾಜಿಕ ಡೇಟಾ ಸೆಟ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸುವ ಮತ್ತು ಸುಸಂಘಟಿಸಲು ಹಲವಾರು ಖಾಸಗಿ ಕಂಪನಿಗಳು ಮಾಡುವ ದೊಡ್ಡ ಹೂಡಿಕೆಯಿಂದ ಸಂಶೋಧಕರು ಪ್ರಯೋಜನ ಪಡೆಯಬಹುದು.