3.6.1 ਪੁੱਛੇ ਗਏ 3.6.1

ਭਰਪੂਰ ਪੁੱਛੇ, ਸਰਵੇਖਣ ਡਾਟਾ ਇੱਕ ਵੱਡੇ ਡੇਟਾ ਸ੍ਰੋਤ ਦੇ ਸੰਦਰਭ ਨੂੰ ਤਿਆਰ ਕਰਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਕੁਝ ਅਹਿਮ ਮਾਪ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ ਪਰ ਦੂਜਿਆਂ ਦੀ ਘਾਟ

ਸਰਵੇਖਣ ਡਾਟਾ ਅਤੇ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਨੂੰ ਜੋੜਨ ਦਾ ਇੱਕ ਤਰੀਕਾ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿਸ ਨੂੰ ਮੈਂ ਬੜੀ ਖੁਸ਼ਹਾਲ ਸੱਦੇਗਾ. ਭਰਪੂਰ ਪੁੱਛੇ, ਇੱਕ ਵੱਡਾ ਡੇਟਾ ਸ੍ਰੋਤ ਵਿੱਚ ਕੁਝ ਮਹੱਤਵਪੂਰਣ ਮਾਪ ਹਨ ਪਰ ਇਸ ਵਿੱਚ ਹੋਰ ਮਾਪ ਦੀ ਘਾਟ ਹੈ ਤਾਂ ਜੋ ਖੋਜਕਾਰ ਇੱਕ ਸਰਵੇਖਣ ਵਿੱਚ ਇਹ ਗੁੰਮ ਮਾਪ ਇਕੱਠਾ ਕਰੇ ਅਤੇ ਫਿਰ ਦੋ ਡਾਟਾ ਸਰੋਤਾਂ ਨੂੰ ਜੋੜ ਕੇ ਜੋੜਦਾ ਹੈ. ਭਰਪੂਰ ਪੁੱਛਗਿੱਛ ਦਾ ਇੱਕ ਉਦਾਹਰਨ Burke and Kraut (2014) ਦੁਆਰਾ ਅਧਿਐਨ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਕੀ ਫੇਸਬੁੱਕ 'ਤੇ ਗੱਲਬਾਤ ਨਾਲ ਮਿੱਤਰਤਾ ਦੀ ਤਾਕਤ ਵਧਦੀ ਹੈ, ਜਿਸ ਬਾਰੇ ਮੈਂ ਭਾਗ 3.2 ਵਿਚ ਵਰਣਨ ਕੀਤਾ ਹੈ). ਉਸ ਕੇਸ ਵਿੱਚ, ਬਕਰ ਅਤੇ ਕਰੌਟ ਦੁਆਰਾ ਮਿਲਾਏ ਗਏ ਸਰਵੇਖਣ ਦੇ ਅੰਕੜੇ ਫੇਸਬੁੱਕ ਲਾਗ ਡਾਟਾ ਦੇ ਨਾਲ

ਜਿਸ ਬੁਕ ਅਤੇ ਕਰੌਟ ਕੰਮ ਕਰ ਰਹੇ ਸਨ, ਉਹਨਾਂ ਦਾ ਅਰਥ ਇਹ ਸੀ ਕਿ ਉਨ੍ਹਾਂ ਨੂੰ ਦੋ ਵੱਡੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨਾਲ ਨਜਿੱਠਣਾ ਨਹੀਂ ਸੀ ਜੋ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਆਮ ਤੌਰ ਤੇ ਪੁੱਛੇ ਗਏ ਸਮੂਹਿਕ ਸਮਸਿਆਵਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਹੁੰਦਾ ਸੀ. ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਵਿਅਕਤੀਗਤ ਪੱਧਰ ਦੇ ਡਾਟਾ ਸੈੱਟਾਂ ਨੂੰ ਜੋੜਨ ਨਾਲ, ਇੱਕ ਰਿਕਾਰਡ ਜੋ ਰਿਕਾਰਡ ਰਿਕਾਰਡ ਹੈ , ਮੁਸ਼ਕਿਲ ਹੋ ਸਕਦਾ ਹੈ ਜੇਕਰ ਦੋਨੋ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਵਿੱਚ ਕੋਈ ਵਿਲੱਖਣ ਪਛਾਣਕਰਤਾ ਨਹੀਂ ਹੈ ਤਾਂ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿ ਇੱਕ ਡਾਟਾ ਸੈਟ ਵਿੱਚ ਸਹੀ ਰਿਕਾਰਡ ਸਹੀ ਰਿਕਾਰਡ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਹੋਰ ਡਾਟਾਬੇਸ ਵਿੱਚ ਭਰਪੂਰ ਪੁੱਛਗਿੱਛ ਦੇ ਨਾਲ ਦੂਜੀ ਮੁੱਖ ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤ ਦੀ ਗੁਣਵੱਤਾ ਅਕਸਰ ਮੁਸ਼ਕਲ ਹੋਵੇਗੀ ਕਿਉਂਕਿ ਜਿਸ ਪ੍ਰਕਿਰਿਆ ਦੁਆਰਾ ਡੇਟਾ ਤਿਆਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਉਹ ਮਾਲਕੀ ਹੋ ਸਕਦਾ ਹੈ ਅਤੇ ਅਧਿਆਇ 2 ਵਿਚ ਦੱਸੇ ਗਏ ਬਹੁਤ ਸਾਰੀਆਂ ਸਮੱਸਿਆਵਾਂ ਲਈ ਸੰਭਾਵਤ ਹੋ ਸਕਦਾ ਹੈ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਖੁਸ਼ਹਾਲ ਪੁੱਛਗਿੱਛ ਅਕਸਰ ਅਗਿਆਤ ਗੁਣਵੱਤਾ ਦੇ ਬਲੈਕ-ਬਾਕਸ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਨੂੰ ਸਰਵੇਖਣਾਂ ਦੀ ਗਲਤੀ-ਪ੍ਰਭਾਵੀ ਜੋੜਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ. ਇਨ੍ਹਾਂ ਸਮੱਸਿਆਵਾਂ ਦੇ ਬਾਵਜੂਦ, ਖੁਸ਼ਹਾਲ, ਮਹੱਤਵਪੂਰਨ ਖੋਜ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਅਮਰੀਕਾ ਵਿੱਚ ਵੋਟਿੰਗ ਦੇ ਪੈਟਰਨਾਂ ਬਾਰੇ ਆਪਣੇ ਖੋਜ ਵਿੱਚ ਸਟੀਫਨ ਅਜ਼ੋਲਾਬੀਅਰ ਅਤੇ ਈਟਨ ਹਰਸ਼ (2012) ਦੁਆਰਾ ਦਿਖਾਇਆ ਗਿਆ ਸੀ.

ਰਾਜਨੀਤਕ ਵਿਗਿਆਨ ਵਿੱਚ ਵਿਸ਼ਾਲ ਖੋਜ ਦਾ ਵਿਸ਼ਾ ਵੋਟਰ ਦੁਆਰਾ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ, ਪਹਿਲਾਂ, ਸਰਵੇਖਣ ਡੇਟਾ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਆਧਾਰ ' ਸੰਯੁਕਤ ਰਾਜ ਵਿਚ ਵੋਟਿੰਗ, ਇਕ ਅਜੀਬ ਵਰਤਾਓ ਹੈ, ਜਿਸ ਵਿਚ ਸਰਕਾਰ ਦਾ ਰਿਕਾਰਡ ਹੈ ਕਿ ਹਰੇਕ ਨਾਗਰਿਕ ਨੇ ਵੋਟ ਪਾਈ ਹੈ (ਬੇਸ਼ਕ, ਸਰਕਾਰ ਇਹ ਨਹੀਂ ਦੱਸਦੀ ਕਿ ਹਰੇਕ ਨਾਗਰਿਕ ਦੇ ਵੋਟ ਕੌਣ ਹਨ). ਕਈ ਸਾਲਾਂ ਤਕ, ਇਹਨਾਂ ਸਰਕਾਰੀ ਵੋਟਿੰਗ ਦੇ ਰਿਕਾਰਡ ਕਾਗਜ਼ਾਂ ਦੇ ਫਾਰਮ ਤੇ ਉਪਲਬਧ ਸਨ, ਜੋ ਦੇਸ਼ ਭਰ ਦੇ ਕਈ ਸਥਾਨਕ ਸਰਕਾਰੀ ਦਫਤਰਾਂ ਵਿਚ ਖਿੰਡੇ ਹੋਏ ਸਨ. ਇਸਨੇ ਬਹੁਤ ਮੁਸ਼ਕਲ ਬਣਾ ਦਿੱਤਾ, ਪਰ ਅਸੰਭਵ ਨਹੀਂ, ਸਿਆਸੀ ਵਿਗਿਆਨੀਆਂ ਨੂੰ ਵੋਟਰਾਂ ਦੀ ਪੂਰੀ ਤਸਵੀਰ ਰੱਖਣ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਅਸਲੀ ਵੋਟਿੰਗ ਵਿਹਾਰ (Ansolabehere and Hersh 2012) ਨਾਲ ਵੋਟ ਪਾਉਣ ਬਾਰੇ ਸਰਵੇਖਣਾਂ ਵਿੱਚ ਜੋ ਲੋਕ ਕਹਿੰਦੇ ਹਨ ਉਸਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ.

ਪਰ ਇਹ ਵੋਟਿੰਗ ਰਿਕਾਰਡ ਹੁਣ ਡਿਜੀਟਲ ਕੀਤੇ ਗਏ ਹਨ ਅਤੇ ਬਹੁਤ ਸਾਰੇ ਪ੍ਰਾਈਵੇਟ ਕੰਪਨੀਆਂ ਨੇ ਯੋਜਨਾਬੱਧ ਢੰਗ ਨਾਲ ਇਕੱਠੀ ਕੀਤੀ ਗਈ ਹੈ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਵਿਆਪਕ ਮਾਸਟਰ ਵੋਟਿੰਗ ਫਾਈਲਾਂ ਤਿਆਰ ਕਰਨ ਲਈ ਮਿਲਾਇਆ ਹੈ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਸਾਰੇ ਅਮਰੀਕਨਾਂ ਦੇ ਵੋਟਿੰਗ ਵਿਹਾਰ ਸ਼ਾਮਲ ਹਨ. ਐਂਸੋਲਾਬੇਅਰ ਅਤੇ ਹਿਰਸ਼ ਨੇ ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਕਿਸੇ ਇਕ ਕੰਪਨੀ- ਕੈਟਾਲਿਸਟ ਐਲ ਸੀ ਸੀ ਨਾਲ ਭਾਈਵਾਲੀ ਕੀਤੀ ਤਾਂ ਕਿ ਵੋਟਰਾਂ ਦੀ ਬਿਹਤਰ ਤਸਵੀਰ ਨੂੰ ਵਿਕਸਿਤ ਕਰਨ ਲਈ ਆਪਣੀ ਮਾਸਟਰ ਵੋਟਿੰਗ ਫਾਈਮ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਸਕੇ. ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕਿਉਂਕਿ ਉਨ੍ਹਾਂ ਦਾ ਅਧਿਐਨ ਡਿਜੀਟਲ ਰਿਕਾਰਡਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਜਿਸ ਨੇ ਇਕੱਠੀ ਕੀਤੀ ਅਤੇ ਬਣਾਈ ਗਈ ਕੰਪਨੀ ਦੁਆਰਾ ਮਹੱਤਵਪੂਰਨ ਸੰਸਾਧਨਾਂ ਵਿਚ ਨਿਵੇਸ਼ ਕੀਤਾ ਅਤੇ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਅਤੇ ਇਕਸਾਰਤਾ ਵਿੱਚ ਨਿਵੇਸ਼ ਕੀਤਾ, ਇਸ ਨੇ ਪਿਛਲੇ ਯਤਨਾਂ ਨੂੰ ਕਈ ਕੰਪਨੀਆਂ ਦੀ ਸਹਾਇਤਾ ਤੋਂ ਬਿਨਾਂ ਕੀਤਾ ਅਤੇ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਐਂਲੋਜ ਰਿਕਾਰਡਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ.

ਅਧਿਆਇ 2 ਵਿਚ ਬਹੁਤ ਸਾਰੇ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਵਾਂਗ, ਕੈਟਾਲਿਸਟ ਮਾਸਟਰ ਫਾਈਲ ਵਿਚ ਜ਼ਿਆਦਾਤਰ ਜਨ-ਅੰਕਣ, ਸੰਕਲਪ, ਅਤੇ ਵਰਤਾਉਂ ਸੰਬੰਧੀ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਨਹੀਂ ਕੀਤੀ ਗਈ ਸੀ, ਜੋ ਕਿ ਅੋਨੋਲਾਬੇਅਰ ਅਤੇ ਹਰਸ਼ ਨੂੰ ਲੋੜੀਂਦਾ ਸੀ ਵਾਸਤਵ ਵਿੱਚ, ਉਹ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਵੋਟਿੰਗ ਵਤੀਰੇ ਨਾਲ ਸਰਵੇਖਣਾਂ (ਜਿਵੇਂ, ਕੈਟਾਲਿਸਟ ਡੈਟਾਬੇਸ ਵਿਚਲੀ ਜਾਣਕਾਰੀ) ਨਾਲ ਰਿਪੋਰਟਿੰਗ ਵੋਟਿੰਗ ਰਵੱਈਏ ਦੀ ਤੁਲਨਾ ਕਰਨ ਵਿੱਚ ਦਿਲਚਸਪੀ ਰੱਖਦੇ ਸਨ. ਇਸ ਲਈ ਅਜ਼ੋਲਾਬੇਅਰ ਅਤੇ ਹਰਸ਼ ਨੇ ਉਹਨਾਂ ਡੇਟਾ ਨੂੰ ਇਕੱਠਾ ਕੀਤਾ ਜੋ ਉਹ ਇਸ ਸਮਾਚਾਰ ਵਿਚ ਪਹਿਲਾਂ ਜ਼ਿਕਰ ਕੀਤੇ ਵੱਡੇ ਸਮਾਜਿਕ ਸਰਵੇਖਣ ਸੀਸੀਐਸ ਦੇ ਤੌਰ ਤੇ ਚਾਹੁੰਦੇ ਸਨ. ਫਿਰ ਉਨ੍ਹਾਂ ਨੇ ਆਪਣਾ ਡਾਟਾ ਕੇਟਲਿਸਟ ਨੂੰ ਦਿੱਤਾ, ਅਤੇ ਕੈਟਾਲਿਸਟ ਨੇ ਉਨ੍ਹਾਂ ਨੂੰ ਇਕ ਮਿਸ਼ਰਤ ਡਾਟਾ ਫਾਈਲ ਵਾਪਸ ਕਰ ਦਿੱਤੀ ਜਿਸ ਵਿਚ ਵੈਧ ਵੋਟਿੰਗ ਰਵੱਈਆ (ਕੈਟਾਲਿਸਟ ਤੋਂ), ਸਵੈ-ਰਿਪੋਰਟ ਕੀਤੀ ਵੋਟਿੰਗ ਵਿਵਹਾਰ (ਸੀਸੀਈਐਸ ਤੋਂ) ਅਤੇ ਉੱਤਰਦਾਤਾਵਾਂ ਦੀ ਜਨਸੰਖਿਆ ਅਤੇ ਰਵੱਈਏ (ਸੀ.ਈ.ਈ.ਐਸ. 3.13). ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿਚ, ਐਂਸੋਲਾਬੇਅਰ ਅਤੇ ਹਰਸ਼ ਨੇ ਸਰਵੇਖਣ ਡਾਟਾ ਨਾਲ ਵੋਟਿੰਗ ਰਿਕਾਰਡ ਡਾਟਾ ਮਿਲਾਇਆ, ਜਿਸ ਵਿਚ ਖੋਜ ਕੀਤੀ ਗਈ ਹੋਵੇ ਜੋ ਡਾਟਾ ਸੋਰਸ ਦੇ ਨਾਲ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਸੰਭਵ ਨਹੀਂ ਸੀ.

ਚਿੱਤਰ 3.13: ਅਜ਼ੋਲਬੀਅਰ ਅਤੇ ਹਰਸ਼ ਦੁਆਰਾ ਅਧਿਐਨ ਦੇ ਯੋਜਨਾਬੱਧ (2012). ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਬਣਾਉਣ ਲਈ, ਕੈਟਾਲਿਸਟ ਕਈ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਜੋੜ ਅਤੇ ਸੁਮੇਲ ਕਰਦਾ ਹੈ. ਮਿਲਾਨ ਕਰਨ ਦੀ ਇਹ ਪ੍ਰਕ੍ਰਿਆ, ਭਾਵੇਂ ਕਿੰਨੀ ਵੀ ਸਾਵਧਾਨੀ ਨਾਲ, ਅਸਲ ਡਾਟਾ ਸਰੋਤਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਦਾ ਪ੍ਰਚਾਰ ਕਰੇ ਅਤੇ ਨਵੀਆਂ ਗਲਤੀਆਂ ਪੇਸ਼ ਕੀਤੀਆਂ ਜਾਣਗੀਆਂ. ਗਲਤੀਆਂ ਦਾ ਦੂਜਾ ਸਰੋਤ ਸਰਵੇਖਣ ਡਾਟਾ ਅਤੇ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਦੇ ਵਿਚਕਾਰ ਰਿਕਾਰਡ ਸਬੰਧ ਹੈ. ਜੇ ਹਰ ਵਿਅਕਤੀ ਕੋਲ ਦੋਨੋ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਵਿਚ ਇਕ ਸਥਿਰ, ਵਿਲੱਖਣ ਪਛਾਣਕਰਤਾ ਸੀ, ਤਾਂ ਇਹ ਲਿੰਕ ਛੋਟੀ ਹੋਵੇਗਾ. ਪਰ, ਕੈਟਾਲਿਸਟ ਨੂੰ ਅਪੂਰਣ ਪਛਾਣਕਰਤਾ, ਇਸ ਕੇਸ ਦੇ ਨਾਮ, ਲਿੰਗ, ਜਨਮ ਦਾ ਸਾਲ, ਅਤੇ ਘਰ ਦੇ ਪਤੇ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਲਿੰਕ ਕਰਨਾ ਪਿਆ ਸੀ. ਬਦਕਿਸਮਤੀ ਨਾਲ, ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ ਅਧੂਰਾ ਜਾਂ ਗਲਤ ਜਾਣਕਾਰੀ ਹੋ ਸਕਦੀ ਹੈ; ਹੋਮਰ ਸਿਪਸਨ ਨਾਮ ਦਾ ਇੱਕ ਵੋਟਰ ਹੋਮਰ ਜੈ ਸਿਪਸਨ, ਹੋਮੀ ਜੰਮੂ ਸਿਪਸਨ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਹੋਮਰ ਸੈਕਸੀਨ ਵੀ ਹੋ ਸਕਦਾ ਹੈ. ਕੈਟਾਲਿਸਟ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਵਿਚ ਗਲਤੀਆਂ ਅਤੇ ਰਿਕਾਰਡ ਲਿੰਕਾ ਵਿਚ ਗਲਤੀਆਂ ਦੀ ਸੰਭਾਵਨਾ ਦੇ ਬਾਵਜੂਦ, ਅਜ਼ੋਲਬੀਅਰ ਅਤੇ ਹਰਸ਼ ਆਪਣੇ ਅਨੁਮਾਨਾਂ ਵਿਚ ਕਈ ਵੱਖੋ-ਵੱਖਰੇ ਪ੍ਰਕਾਰ ਦੇ ਜਾਂਚਾਂ ਰਾਹੀਂ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕਰਨ ਦੇ ਸਮਰੱਥ ਸਨ.

ਚਿੱਤਰ 3.13: Ansolabehere and Hersh (2012) ਦੁਆਰਾ ਅਧਿਐਨ ਦੇ ਯੋਜਨਾਬੱਧ Ansolabehere and Hersh (2012) . ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਬਣਾਉਣ ਲਈ, ਕੈਟਾਲਿਸਟ ਕਈ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਜੋੜ ਅਤੇ ਸੁਮੇਲ ਕਰਦਾ ਹੈ. ਮਿਲਾਨ ਕਰਨ ਦੀ ਇਹ ਪ੍ਰਕ੍ਰਿਆ, ਭਾਵੇਂ ਕਿੰਨੀ ਵੀ ਸਾਵਧਾਨੀ ਨਾਲ, ਅਸਲ ਡਾਟਾ ਸਰੋਤਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਦਾ ਪ੍ਰਚਾਰ ਕਰੇ ਅਤੇ ਨਵੀਆਂ ਗਲਤੀਆਂ ਪੇਸ਼ ਕੀਤੀਆਂ ਜਾਣਗੀਆਂ. ਗਲਤੀਆਂ ਦਾ ਦੂਜਾ ਸਰੋਤ ਸਰਵੇਖਣ ਡਾਟਾ ਅਤੇ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਦੇ ਵਿਚਕਾਰ ਰਿਕਾਰਡ ਸਬੰਧ ਹੈ. ਜੇ ਹਰ ਵਿਅਕਤੀ ਕੋਲ ਦੋਨੋ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਵਿਚ ਇਕ ਸਥਿਰ, ਵਿਲੱਖਣ ਪਛਾਣਕਰਤਾ ਸੀ, ਤਾਂ ਇਹ ਲਿੰਕ ਛੋਟੀ ਹੋਵੇਗਾ. ਪਰ, ਕੈਟਾਲਿਸਟ ਨੂੰ ਅਪੂਰਣ ਪਛਾਣਕਰਤਾ, ਇਸ ਕੇਸ ਦੇ ਨਾਮ, ਲਿੰਗ, ਜਨਮ ਦਾ ਸਾਲ, ਅਤੇ ਘਰ ਦੇ ਪਤੇ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਲਿੰਕ ਕਰਨਾ ਪਿਆ ਸੀ. ਬਦਕਿਸਮਤੀ ਨਾਲ, ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ ਅਧੂਰਾ ਜਾਂ ਗਲਤ ਜਾਣਕਾਰੀ ਹੋ ਸਕਦੀ ਹੈ; ਹੋਮਰ ਸਿਪਸਨ ਨਾਮ ਦਾ ਇੱਕ ਵੋਟਰ ਹੋਮਰ ਜੈ ਸਿਪਸਨ, ਹੋਮੀ ਜੰਮੂ ਸਿਪਸਨ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਹੋਮਰ ਸੈਕਸੀਨ ਵੀ ਹੋ ਸਕਦਾ ਹੈ. ਕੈਟਾਲਿਸਟ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਵਿਚ ਗਲਤੀਆਂ ਅਤੇ ਰਿਕਾਰਡ ਲਿੰਕਾ ਵਿਚ ਗਲਤੀਆਂ ਦੀ ਸੰਭਾਵਨਾ ਦੇ ਬਾਵਜੂਦ, ਅਜ਼ੋਲਬੀਅਰ ਅਤੇ ਹਰਸ਼ ਆਪਣੇ ਅਨੁਮਾਨਾਂ ਵਿਚ ਕਈ ਵੱਖੋ-ਵੱਖਰੇ ਪ੍ਰਕਾਰ ਦੇ ਜਾਂਚਾਂ ਰਾਹੀਂ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕਰਨ ਦੇ ਸਮਰੱਥ ਸਨ.

ਆਪਣੀ ਸਾਂਝੀ ਡਾਟਾ ਫਾਈਲ ਨਾਲ, ਅਜ਼ੋਲਬੀਅਰ ਅਤੇ ਹਰਸ਼ ਨੇ ਤਿੰਨ ਅਹਿਮ ਸਿੱਟੇ ਕੱਢੇ ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਵੋਟਿੰਗ ਦੀ ਜ਼ਿਆਦਾ ਰਿਪੋਰਟਿੰਗ ਫੈਲੀ ਹੋਈ ਹੈ: ਨਾਗਰਿਕਾਂ ਦੇ ਤਕਰੀਬਨ ਅੱਧੇ ਲੋਕਾਂ ਨੇ ਵੋਟਿੰਗ ਦੀ ਰਿਪੋਰਟ ਦਿੱਤੀ ਹੈ ਅਤੇ ਜੇਕਰ ਕਿਸੇ ਨੂੰ ਵੋਟਿੰਗ ਦੀ ਰਿਪੋਰਟ ਦਿੱਤੀ ਗਈ ਹੈ, ਤਾਂ ਸਿਰਫ 80% ਦੀ ਸੰਭਾਵਨਾ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਅਸਲ ਵਿੱਚ ਵੋਟ ਪਾਈ. ਦੂਜਾ, ਓਵਰ-ਰਿਪੋਰਟਾਂ ਬੇਤਰਤੀਬ ਨਹੀਂ ਹਨ: ਉੱਚ-ਆਮਦਨੀ, ਚੰਗੀ-ਪੜ੍ਹੇ-ਲਿਖੇ, ਪੱਖਪਾਤੀ, ਜੋ ਜਨਤਕ ਮਾਮਲਿਆਂ ਵਿਚ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ, ਵਿਚ ਓਵਰ-ਰਿਪੋਰਟਿੰਗ ਜ਼ਿਆਦਾ ਆਮ ਹੈ. ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿਚ, ਜਿਹੜੇ ਲੋਕ ਵੋਟ ਪਾਉਣ ਦੀ ਜ਼ਿਆਦਾ ਸੰਭਾਵਨਾ ਰੱਖਦੇ ਹਨ, ਉਹ ਵੀ ਵੋਟਿੰਗ ਬਾਰੇ ਝੂਠ ਬੋਲਣ ਦੀ ਜ਼ਿਆਦਾ ਸੰਭਾਵਨਾ ਰੱਖਦੇ ਹਨ. ਤੀਜੇ ਅਤੇ ਸਭ ਤੋਂ ਵੱਧ ਆਲੋਚਕ, ਓਵਰ-ਰਿਪੋਰਟਿੰਗ ਦੇ ਵਿਵਸਥਿਤ ਪ੍ਰਕ੍ਰਿਤੀ ਦੇ ਕਾਰਨ, ਵੋਟਰਾਂ ਅਤੇ ਗੈਰ-ਵਿਕਟਰਾਂ ਵਿਚਕਾਰ ਅਸਲ ਅੰਤਰ ਸਰਵੇਖਣਾਂ ਤੋਂ ਬਹੁਤ ਘੱਟ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ. ਉਦਾਹਰਣ ਵਜੋਂ, ਜਿਨ੍ਹਾਂ ਕੋਲ ਬੈਚਲਰ ਦੀ ਡਿਗਰੀ ਹੈ ਉਹਨਾਂ ਨੂੰ ਵੋਟਿੰਗ ਦੀ ਰਿਪੋਰਟ ਦੇਣ ਦੀ ਸੰਭਾਵਨਾ 22 ਪ੍ਰਤਿਸ਼ਤ ਜ਼ਿਆਦਾ ਹੁੰਦੀ ਹੈ, ਪਰ ਅਸਲ ਵਿੱਚ ਵੋਟ ਪਾਉਣ ਦੀ ਸੰਭਾਵਨਾ ਸਿਰਫ਼ 10 ਪ੍ਰਤੀਸ਼ਤ ਜ਼ਿਆਦਾ ਹੈ. ਇਹ ਨਤੀਜਾ ਨਿਕਲਿਆ ਹੈ, ਸ਼ਾਇਦ ਇਹ ਹੈਰਾਨੀ ਦੀ ਗੱਲ ਨਹੀਂ ਕਿ ਵੋਟਿੰਗ ਦੇ ਮੌਜੂਦਾ ਸਰੋਤ-ਅਧਾਰਤ ਸਿਧਾਂਤ ਬਹੁਤ ਵਧੀਆ ਹਨ ਜੋ ਵੋਟਿੰਗ ਦੀ ਰਿਪੋਰਟ (ਜੋ ਕਿ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਅਤੀਤ ਵਿੱਚ ਵਰਤਿਆ ਹੈ) ਦੀ ਤੁਲਨਾ ਕਰਨ ਨਾਲੋਂ, ਜੋ ਅਸਲ ਵਿੱਚ ਵੋਟਾਂ ਪਾਉਣ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲੇ ਲੋਕਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਹੈ. ਇਸ ਤਰ੍ਹਾਂ, Ansolabehere and Hersh (2012) ਦੀ ਅਨੁਭਵੀ ਖੋਜ ਨੇ ਵੋਟਿੰਗ ਨੂੰ ਸਮਝਣ ਅਤੇ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਲਈ ਨਵੇਂ ਸਿਧਾਂਤ ਦੀ ਮੰਗ ਕੀਤੀ ਹੈ.

ਪਰ ਸਾਨੂੰ ਇਨ੍ਹਾਂ ਨਤੀਜਿਆਂ 'ਤੇ ਕਿੰਨਾ ਭਰੋਸਾ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਯਾਦ ਰੱਖੋ, ਇਹ ਨਤੀਜਾ ਅਜੀਬ ਕਿਸਮ ਦੀ ਗਲਤੀ ਨਾਲ ਬਲੈਕ-ਬਾਕਸ ਡਾਟਾ ਨੂੰ ਗਲਤੀ ਨਾਲ ਜੋੜਨ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ. ਵਧੇਰੇ ਖਾਸ ਤੌਰ ਤੇ, ਨਤੀਜੇ ਦੇ ਦੋ ਮਹੱਤਵਪੂਰਣ ਕਦਮਾਂ 'ਤੇ ਰਿਸੀਵ ਪਾਈ ਜਾਂਦੀ ਹੈ: (1) ਕੈਟਾਲਿਸਟ ਦੀ ਯੋਗਤਾ ਲਈ ਬਹੁਤ ਸਾਰੇ ਵੱਖ-ਵੱਖ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਨੂੰ ਸਹੀ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਤਿਆਰ ਕਰਨ ਅਤੇ (2) ਸਰਟਿਧੀ ਡਾਟਾ ਨੂੰ ਇਸ ਦੇ ਮਾਸਟਰ ਡਾਟਾਫਾਇਲ ਨਾਲ ਜੋੜਨ ਲਈ ਕੈਟਾਲਿਸਟ ਦੀ ਯੋਗਤਾ ਨੂੰ ਮਿਲਾਉਣਾ. ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਹਰ ਇੱਕ ਕਦਮ ਮੁਸ਼ਕਿਲ ਹੈ ਅਤੇ ਕਿਸੇ ਵੀ ਕਦਮ ਵਿੱਚ ਗਲਤੀ ਨਾਲ ਖੋਜਕਾਰਾਂ ਨੂੰ ਗਲਤ ਸਿੱਟੇ ਵਜੋਂ ਜਾਣਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਹਾਲਾਂਕਿ, ਡੇਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਲਿੰਕ ਦੋਨਾਂ ਨੂੰ ਕੈਟਾਲਿਸਟ ਦੀ ਇੱਕ ਕੰਪਨੀ ਦੇ ਤੌਰ ਤੇ ਜਾਰੀ ਰਹਿਣ ਦੀ ਸਮੱਸਿਆ ਹੈ, ਇਸ ਲਈ ਇਹ ਇਹਨਾਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਵਸੀਲਿਆਂ ਦਾ ਨਿਵੇਸ਼ ਕਰ ਸਕਦਾ ਹੈ, ਅਕਸਰ ਅਜਿਹੇ ਪੈਮਾਨੇ ਤੇ ਜੋ ਕਿਸੇ ਅਕਾਦਮਿਕ ਖੋਜਕਾਰ ਨਾਲ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ. ਆਪਣੇ ਕਾਗਜ਼ਾਂ ਵਿਚ, ਐਂਜੋਲੈਬਰੇਅ ਅਤੇ ਹੇਰਸ ਇਹਨਾਂ ਦੋ ਕਦਮਾਂ ਦੇ ਨਤੀਜਿਆਂ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਕਈ ਕਦਮ ਚੁੱਕਦੇ ਹਨ-ਹਾਲਾਂਕਿ ਇਹਨਾਂ ਵਿੱਚੋਂ ਕੁਝ ਮਾਲਕੀ ਹਨ- ਅਤੇ ਇਹ ਜਾਂਚ ਦੂਜੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੋ ਸਕਦੇ ਹਨ ਜੋ ਸਰਵੇਖਣ ਡਾਟਾ ਨੂੰ ਬਲੈਕ-ਬਾਕਸ ਵੱਡੇ ਡੇਟਾ ਨਾਲ ਜੋੜਨਾ ਚਾਹੇਗਾ. ਸਰੋਤ

ਅਧਿਐਨ ਕਰਨ ਵਾਲੇ ਆਮ ਸਬਕ ਖੋਜ ਕਰਤਾ ਕੀ ਕਰ ਸਕਦੇ ਹਨ? ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਸਰਵੇਖਣ ਡੇਟਾ ਦੇ ਨਾਲ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਨੂੰ ਸੰਪੂਰਨ ਕਰਨ ਅਤੇ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦੇ ਨਾਲ ਸਰਵੇਖਣ ਡੇਟਾ ਨੂੰ ਸੰਨ੍ਹ ਲਗਾਉਣ ਤੋਂ ਬਹੁਤ ਵੱਡਾ ਮੁੱਲ ਹੈ (ਤੁਸੀਂ ਇਹ ਅਧਿਐਨ ਕਿਸੇ ਤਰੀਕੇ ਨਾਲ ਵੇਖ ਸਕਦੇ ਹੋ). ਇਨ੍ਹਾਂ ਦੋ ਡਾਟਾ ਸਰੋਤਾਂ ਦਾ ਸੰਯੋਗ ਕਰਕੇ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਅਜਿਹਾ ਕੁਝ ਕੀਤਾ ਜੋ ਕਿਸੇ ਇਕਲੇ ਨਾਲ ਅਸੰਭਵ ਸੀ. ਦੂਜੀ ਸਧਾਰਨ ਸਬਕ ਇਹ ਹੈ ਕਿ ਸੰਖੇਪ, ਵਪਾਰਕ ਡੇਟਾ ਸ੍ਰੋਤਾਂ, ਜਿਵੇਂ ਕੈਟਾਲਿਸਟ ਤੋਂ ਡਾਟਾ, ਨੂੰ ਕੁਝ ਮਾਮਲਿਆਂ ਵਿੱਚ "ਜਮੀਨੀ ਸੱਚ" ਨਹੀਂ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਉਹ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦੇ ਹਨ. ਸੰਦੇਹਵਾਦੀ ਕਦੇ-ਕਦੇ ਇਨ੍ਹਾਂ ਸੰਪੂਰਨ, ਕਮਰਸ਼ੀਅਲ ਡਾਟਾ ਸ੍ਰੋਤ ਦੀ ਨਿਰਪੱਖਤਾ ਨਾਲ ਤੁਲਨਾ ਕਰਦੇ ਹਨ ਅਤੇ ਦੱਸਦੇ ਹਨ ਕਿ ਇਹ ਡਾਟਾ ਸ੍ਰੋਤ ਘਟਦੇ ਹਨ. ਹਾਲਾਂਕਿ, ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਸ਼ੱਕੀ ਲੋਕ ਗਲਤ ਤੁਲਨਾ ਕਰ ਰਹੇ ਹਨ: ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਪੂਰਨ ਸੱਚ ਦੀ ਘੱਟ ਗਿਣਤੀ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੇ ਸਾਰੇ ਡੇਟਾ ਇਸਦੇ ਬਜਾਏ, ਹੋਰ ਉਪਲੱਬਧ ਡੇਟਾ ਸ੍ਰੋਤਾਂ (ਉਦਾਹਰਨ ਲਈ ਸਵੈ-ਰਿਪੋਰਟ ਕੀਤੇ ਵੋਟਿੰਗ ਵਰਤਾਓ) ਦੇ ਨਾਲ ਇਕਸਾਰ, ਵਪਾਰਕ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨੀ ਬਿਹਤਰ ਹੈ, ਜਿਸ ਵਿੱਚ ਲਗਾਤਾਰ ਗਲਤੀਆਂ ਹੁੰਦੀਆਂ ਹਨ. ਅੰਤ ਵਿੱਚ, ਅੱਸੋਂਸੋਲਬੇਅਰ ਅਤੇ ਹਰਸ਼ ਦੇ ਅਧਿਐਨ ਦਾ ਤੀਜਾ ਆਮ ਸਬਕ ਇਹ ਹੈ ਕਿ ਕੁਝ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਵੱਡੇ ਨਿਵੇਸ਼ਾਂ ਤੋਂ ਫਾਇਦਾ ਮਿਲ ਸਕਦਾ ਹੈ ਜੋ ਕਿ ਕਈ ਪ੍ਰਾਈਵੇਟ ਕੰਪਨੀਆਂ ਗੁੰਝਲਦਾਰ ਸਮਾਜਕ ਡੇਟਾ ਸੈਟਾਂ ਨੂੰ ਇੱਕਠਾ ਕਰਨ ਅਤੇ ਸੁਮੇਲ ਬਣਾਉਣ ਵਿੱਚ ਕਰ ਰਹੀਆਂ ਹਨ.