2.2 ਵੱਡੇ ਡਾਟਾ

ਵੱਡੇ ਡਾਟਾ ਨੂੰ ਬਣਾਇਆ ਹੈ ਅਤੇ ਖੋਜ ਨੂੰ ਵੱਧ ਹੋਰ ਉਦੇਸ਼ ਲਈ ਸਰਕਾਰ ਨਾਲ ਇਕੱਠਾ ਕਰ ਰਹੇ ਹਨ. ਖੋਜ ਲਈ ਇਹ ਡਾਟਾ ਦਾ ਇਸਤੇਮਾਲ, ਇਸ ਲਈ, repurposing ਦੀ ਲੋੜ ਹੈ.

ਸਮਾਜਿਕ ਖੋਜ ਦੀ ਇੱਕ idealized ਝਲਕ ਇਕ ਵਿਗਿਆਨੀ ਇੱਕ ਵਿਚਾਰ ਹੋਣ ਅਤੇ ਫਿਰ, ਜੋ ਕਿ ਵਿਚਾਰ ਨੂੰ ਟੈਸਟ ਕਰਨ ਲਈ ਡਾਟਾ ਇਕੱਠਾ ਕਲਪਨਾ. ਖੋਜ ਦੀ ਇਹ ਸ਼ੈਲੀ ਖੋਜ ਸਵਾਲ ਅਤੇ ਡਾਟਾ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਤੰਗ ਫਿੱਟ ਕਰਨ ਦੀ ਅਗਵਾਈ ਕਰਦਾ ਹੈ, ਪਰ ਇਸ ਨੂੰ ਸੀਮਤ ਇੱਕ ਵਿਅਕਤੀ ਨੂੰ ਖੋਜਕਾਰ ਅਕਸਰ ਵਸੀਲੇ ਅਜਿਹੇ, ਵੱਡੇ ਅਮੀਰ ਅਤੇ ਕੌਮੀ-ਦੇ ਨੁਮਾਇੰਦੇ ਡਾਟਾ ਡਾਟਾ ਉਹ ਦੀ ਲੋੜ ਹੈ, ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ, ਨਾ ਹੈ, ਕਿਉਕਿ ਹੈ. ਅਜਿਹੇ ਜਨਰਲ ਸੋਸ਼ਲ ਸਰਵੇ (GSS), ਅਮਰੀਕੀ ਨੈਸ਼ਨਲ ਇਲੈਕਸ਼ਨ ਸਟੱਡੀ (ANES), ਅਤੇ ਆਮਦਨ ਡਾਇਨਾਮਿਕਸ ਦੇ ਪੈਨਲ ਅਧਿਐਨ (PSID) ਦੇ ਤੌਰ ਤੇ ਇਸ ਲਈ, ਪਿਛਲੇ ਵਿੱਚ ਸਮਾਜਿਕ ਖੋਜ ਦਾ ਇੱਕ ਬਹੁਤ ਸਾਰਾ ਵਰਤਿਆ ਕੀਤਾ ਹੈ ਵੱਡੇ ਪੈਮਾਨੇ ਸਮਾਜਿਕ ਸਰਵੇਖਣ,. ਇਹ ਵੱਡੇ ਪੈਮਾਨੇ ਸਰਵੇਖਣ ਆਮ ਤੌਰ 'ਤੇ ਖੋਜਕਾਰ ਦੀ ਇੱਕ ਟੀਮ ਦੁਆਰਾ ਚਲਾਏ ਜਾ ਰਹੇ ਹਨ ਅਤੇ ਉਹ ਡਾਟਾ ਹੈ, ਜੋ ਕਿ ਬਹੁਤ ਸਾਰੇ ਖੋਜਕਾਰ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ. ਇਹ ਵੱਡੇ ਪੈਮਾਨੇ ਸਰਵੇਖਣ ਦੇ ਟੀਚੇ ਦੇ ਕਰਕੇ, ਬਹੁਤ ਦੇਖਭਾਲ ਡਾਟਾ ਇਕੱਠਾ ਤਿਆਰ ਹੈ ਅਤੇ ਖੋਜਕਾਰ ਦੇ ਵਰਤਣ ਲਈ, ਨਤੀਜੇ ਡਾਟਾ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਪਾ ਦਿੱਤਾ ਗਿਆ ਹੈ. ਇਹ ਡਾਟਾ ਖੋਜਕਾਰ ਕੇ ਅਤੇ ਖੋਜਕਾਰ ਲਈ ਹਨ.

ਡਿਜ਼ੀਟਲ ਦੀ ਉਮਰ ਸਰੋਤ ਵਰਤ ਜ਼ਿਆਦਾਤਰ ਸਮਾਜਿਕ ਖੋਜ, ਪਰ, ਬੁਨਿਆਦੀ ਵੱਖ ਵੱਖ ਹੁੰਦਾ ਹੈ. ਇਸ ਦੀ ਬਜਾਇ ਖੋਜਕਾਰ ਕੇ ਅਤੇ ਖੋਜਕਾਰ ਲਈ ਇਕੱਠਾ ਡਾਟਾ ਵਰਤਣ ਦੀ ਹੈ, ਇਸ ਨੂੰ ਡਾਟਾ ਸਰੋਤ ਬਣਾਇਆ ਹੈ ਅਤੇ ਅਜਿਹੇ, ਇੱਕ ਮੁਨਾਫ਼ਾ ਬਣਾਉਣ ਲਈ ਇੱਕ ਸੇਵਾ ਮੁਹੱਈਆ, ਜ ਇੱਕ ਕਾਨੂੰਨ ਪਰਸ਼ਾਸ਼ਨ ਦੇ ਤੌਰ ਤੇ ਆਪਣੇ ਹੀ ਮਕਸਦ ਲਈ ਕਾਰੋਬਾਰ ਅਤੇ ਸਰਕਾਰ ਦੁਆਰਾ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਸਨ, ਜੋ ਕਿ ਵਰਤਦਾ ਹੈ. ਇਹ ਕਾਰੋਬਾਰ ਅਤੇ ​​ਸਰਕਾਰ ਡਾਟਾ ਸਰੋਤ ਵੱਡੇ ਡਾਟਾ ਕਿਹਾ ਜਾ ਕਰਨ ਲਈ ਆਇਆ ਹੈ. ਵੱਡੇ ਡਾਟਾ ਨਾਲ ਖੋਜ ਕਰਨ ਦਾ ਡਾਟਾ ਹੈ, ਜੋ ਕਿ ਅਸਲ ਵਿੱਚ ਖੋਜ ਦੇ ਲਈ ਬਣਾਇਆ ਗਿਆ ਸੀ ਦੇ ਨਾਲ ਖੋਜ ਕਰ ਰਹੇ ਵੱਧ ਵੱਖ-ਵੱਖ ਹੈ. ਤੁਲਨਾ, ਉਦਾਹਰਨ ਲਈ, ਅਜਿਹੇ ਟਵਿੱਟਰ ਦੇ ਤੌਰ ਤੇ ਇੱਕ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਵੈੱਬਸਾਈਟ,, ਅਜਿਹੇ ਜਨਰਲ ਸੋਸ਼ਲ ਸਰਵੇ (GSS) ਦੇ ਤੌਰ ਤੇ ਇੱਕ ਰਵਾਇਤੀ ਜਨਤਕ ਰਾਏ ਸਰਵੇਖਣ ਦੇ ਨਾਲ. ਟਵਿੱਟਰ ਦੇ ਮੁੱਖ ਟੀਚੇ ਨੂੰ ਇਸ ਦੇ ਉਪਭੋਗੀ ਨੂੰ ਇੱਕ ਸੇਵਾ ਮੁਹੱਈਆ ਕਰਨ ਲਈ ਹੈ ਅਤੇ ਇੱਕ ਲਾਭ ਕਰਨ ਲਈ ਹੁੰਦੇ ਹਨ. ਇਹ ਟੀਚੇ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ, ਟਵਿੱਟਰ ਡਾਟਾ ਜਨਤਕ ਰਾਏ ਦੇ ਕੁਝ ਪਹਿਲੂ ਦਾ ਅਧਿਐਨ ਦੇ ਲਈ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ ਬਣਾਉਦਾ ਹੈ. ਪਰ, ਜਨਰਲ ਸੋਸ਼ਲ ਸਰਵੇ (GSS) ਦੇ ਉਲਟ, ਟਵਿੱਟਰ, ਨਾ ਮੁੱਖ ਤੌਰ ਸਮਾਜਿਕ ਖੋਜ 'ਤੇ ਧਿਆਨ ਹੈ.

ਮਿਆਦ ਵੱਡੇ ਡਾਟਾ frustratingly ਅਸਪਸ਼ਟ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਬਹੁਤ ਸਾਰੇ ਵੱਖ-ਵੱਖ ਕੁਝ ਗਰੁੱਪ ਇਕੱਠੇ. ਸਮਾਜਿਕ ਖੋਜ ਦੇ ਉਦੇਸ਼ ਲਈ, ਮੈਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਇਸ ਨੂੰ ਵੱਡੇ ਡਾਟਾ ਸਰੋਤ ਦੇ ਦੋ ਕਿਸਮ ਦੇ ਵਿਚਕਾਰ ਵੱਖ ਕਰਨ ਲਈ ਸਹਾਇਕ ਹੈ:. ਸਰਕਾਰ ਨੇ ਪ੍ਰਸ਼ਾਸਨਿਕ ਰਿਕਾਰਡ ਅਤੇ ਕਾਰੋਬਾਰ ਨੂੰ ਪ੍ਰਬੰਧਕੀ ਰਿਕਾਰਡ ਦਾ ਸਰਕਾਰ ਪ੍ਰਸ਼ਾਸਨਿਕ ਰਿਕਾਰਡ ਦਾ ਡਾਟਾ ਆਪਣੇ ਰੁਟੀਨ ਦੇ ਕੰਮ ਦੇ ਹਿੱਸੇ ਦੇ ਤੌਰ ਸਰਕਾਰ ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਹਨ, ਜੋ ਕਿ ਹਨ. ਦੇ ਰਿਕਾਰਡ ਦੀ ਇਹ ਕਿਸਮ-ਅਜਿਹੇ ਪਿਛਲੇ ਸਟੱਡੀ ਕਰ ਜਨਮ, ਵਿਆਹ ਅਤੇ ਮੌਤ ਦੇ ਰਿਕਾਰਡ-ਪਰ ਸਰਕਾਰ ਵਧਦੀ ਇਕੱਠੇ ਕਰਨ ਅਤੇ analyzable ਫਾਰਮ ਵਿੱਚ ਵਿਸਥਾਰ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਜਾਰੀ ਕਰ ਰਹੇ ਹਨ ਮਰਦਮਸ਼ੁਾਰੀ ਦੇ ਤੌਰ ਤੇ ਖੋਜਕਾਰ ਨੇ ਵਰਤਿਆ ਗਿਆ ਹੈ. ਮਿਸਾਲ ਲਈ, ਨਿਊਯਾਰਕ ਸਿਟੀ ਦੀ ਸਰਕਾਰ ਨੇ ਸ਼ਹਿਰ ਵਿੱਚ ਹਰ ਟੈਕਸੀ ਦੇ ਅੰਦਰ ਡਿਜ਼ੀਟਲ ਮੀਟਰ ਇੰਸਟਾਲ ਹੈ. ਇਹ ਮੀਟਰ ਡਰਾਈਵਰ, ਸ਼ੁਰੂ ਵਾਰ ਅਤੇ ਸਥਾਨ, ਸਟਾਪ ਵਾਰ ਅਤੇ ਸਥਾਨ, ਅਤੇ ਕਿਰਾਇਆ ਵੀ ਸ਼ਾਮਲ ਹੈ, ਹਰ ਟੈਕਸੀ ਰਾਈਡ ਬਾਰੇ ਡਾਟਾ ਦੇ ਹਰ ਕਿਸਮ ਦੇ ਰਿਕਾਰਡ. ਇੱਕ ਅਧਿਐਨ ਹੈ, ਜੋ ਕਿ ਮੈਨੂੰ ਇਸ ਅਧਿਆਇ ਵਿਚ ਬਾਅਦ ਵਿਚ ਦੱਸ ਦੇਣਗੇ ਵਿੱਚ, ਹੈਨਰੀ Farber (2015) ਘੰਟੇ ਦੀ ਤਨਖਾਹ ਅਤੇ ਘੰਟੇ ਕੰਮ ਕੀਤਾ ਦੀ ਗਿਣਤੀ ਦੇ ਵਿਚਕਾਰ ਰਿਸ਼ਤੇ ਬਾਰੇ ਲੇਬਰ ਅਰਥ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਬਹਿਸ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਇਹ ਡਾਟਾ repurposed.

ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਵੱਡੇ ਡਾਟਾ ਦੇ ਦੂਜੇ ਮੁੱਖ ਕਿਸਮ ਦੇ ਕਾਰੋਬਾਰ ਨੂੰ ਪ੍ਰਬੰਧਕੀ ਦੇ ਰਿਕਾਰਡ ਹੈ. ਇਹ ਡਾਟਾ, ਜੋ ਕਿ ਕਾਰੋਬਾਰ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਆਪਣੇ ਰੁਟੀਨ ਦੇ ਕੰਮ ਦੇ ਹਿੱਸੇ ਦੇ ਤੌਰ ਇਕੱਠਾ ਕਰਦੇ ਹਨ. ਇਹ ਕਾਰੋਬਾਰ ਪ੍ਰਬੰਧਕੀ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਅਕਸਰ ਡਿਜ਼ੀਟਲ ਟਰੇਸ ਕਹਿੰਦੇ ਹਨ, ਅਤੇ ਖੋਜ ਇੰਜਣ ਕਿਊਰੀ ਲਾਗ ਨੂੰ, ਸੋਸ਼ਲ ਮੀਡੀਆ ਪੋਸਟ ਵਰਗੇ ਕੁਝ ਸ਼ਾਮਲ ਹੈ, ਅਤੇ ਮੋਬਾਇਲ ਫੋਨ ਤੱਕ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਕਾਲ ਕਰੋ. ਨਾਜ਼ੁਕ, ਇਹ ਕਾਰੋਬਾਰ ਪ੍ਰਬੰਧਕੀ ਦੇ ਰਿਕਾਰਡ ਨੂੰ ਸਿਰਫ ਆਨਲਾਈਨ ਵਿਵਹਾਰ ਨੂੰ ਇਸ ਬਾਰੇ ਨਹੀ ਹਨ. ਮਿਸਾਲ ਲਈ, ਸਟੋਰ ਹੈ, ਜੋ ਕਿ ਚੈੱਕ-ਆਊਟ ਸਕੈਨਰ ਨੂੰ ਵਰਤਣ ਵਰਕਰ ਉਤਪਾਦਕਤਾ ਦੇ ਅਸਲੀ-ਵਾਰ ਉਪਾਅ ਬਣਾਉਣ ਰਹੇ ਹਨ. ਇੱਕ ਅਧਿਐਨ ਹੈ, ਜੋ ਕਿ ਮੈਨੂੰ ਤੁਹਾਨੂੰ ਇਸ ਅਧਿਆਇ ਵਿਚ ਇਸ ਬਾਰੇ ਬਾਅਦ ਵਿੱਚ ਦੱਸ ਦੇਣਗੇ ਵਿੱਚ, Alexandre Mas ਅਤੇ Enrico Moretti (2009) ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਇਕ ਵਰਕਰ 'ਉਤਪਾਦਕਤਾ ਆਪਣੇ ਹਾਣੀ ਦੀ ਉਤਪਾਦਕਤਾ ਨਾਲ ਪ੍ਰਭਾਵਿਤ ਕਰ ਰਿਹਾ ਹੈ ਇਸ ਨੂੰ ਸੁਪਰ ਚੈੱਕ-ਆਊਟ ਡਾਟਾ repurposed.

ਇਹ ਮਿਸਾਲ ਦੇ ਦੋਨੋ ਮਿਸਾਲ ਦੇ ਤੌਰ ਤੇ, repurposing ਦੇ ਵਿਚਾਰ ਵੱਡੇ ਡਾਟਾ ਤੱਕ ਸਿੱਖਣ ਲਈ ਬੁਨਿਆਦੀ ਹੈ. ਮੇਰੇ ਅਨੁਭਵ ਨੂੰ ਵਿੱਚ, ਸਮਾਜਿਕ ਵਿਗਿਆਨੀ ਅਤੇ ਡਾਟਾ ਵਿਗਿਆਨੀ ਇਸ ਨੂੰ ਬਹੁਤ ਹੀ ਵੱਖਰੇ repurposing ਲਈ ਪਹੁੰਚ. ਸੋਸ਼ਲ ਵਿਗਿਆਨੀ, ਜੋ ਖੋਜ ਦੇ ਲਈ ਤਿਆਰ ਕੀਤਾ ਡਾਟਾ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਆਦਤ ਹੈ, repurposed ਡਾਟਾ ਨਾਲ ਸਮੱਸਿਆ ਨੂੰ ਬਾਹਰ ਇਸ਼ਾਰਾ ਕਰਨ ਲਈ, ਜਦਕਿ ਇਸ ਦੇ ਤਾਕਤ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਤੇਜ਼ ਹਨ. ਦੂਜੇ ਪਾਸੇ, ਡਾਟਾ ਵਿਗਿਆਨੀ repurposed ਡਾਟਾ ਦੇ ਲਾਭ ਬਾਹਰ ਇਸ਼ਾਰਾ ਕਰਨ ਲਈ, ਜਦਕਿ ਇਸ ਦੇ ਕਮਜ਼ੋਰੀ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਤੇਜ਼ ਹਨ. ਕੁਦਰਤੀ, ਵਧੀਆ ਪਹੁੰਚ ਇੱਕ ਹਾਈਬ੍ਰਿਡ ਹੋਣਾ ਸੀ. ਜੋ ਕਿ ਖੋਜਕਾਰ ਦੇ ਡਾਟਾ-ਚੰਗੇ ਅਤੇ ਬੁਰੇ-ਅਤੇ ਫਿਰ ਸਿੱਖ ਦਾ ਤਰੀਕਾ ਦੱਸੋ ਬਾਹਰ ਦਾ ਿਹਸਾਬ ਇਹ ਨ੍ਯੂ ਸਰੋਤ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਸਮਝਣ ਦੀ ਲੋੜ ਹੈ, ਹੈ. ਅਤੇ, ਜੋ ਕਿ ਇਸ ਅਧਿਆਇ ਦਾ ਬਾਕੀ ਲਈ ਯੋਜਨਾ ਹੈ. ਅੱਗੇ, ਮੈਨੂੰ ਦੇ ਕਾਰੋਬਾਰ ਅਤੇ ਸਰਕਾਰ ਪ੍ਰਬੰਧਕੀ ਡਾਟਾ ਦੇ ਦਸ ਆਮ ਗੁਣ ਦਾ ਵਰਣਨ ਕਰੇਗਾ. ਜੋ ਕਿ ਬਾਅਦ, ਮੈਨੂੰ ਤਿੰਨ ਖੋਜ ਪਹੁੰਚ ਹੈ, ਜੋ ਕਿ ਇਹ ਡਾਟਾ, ਤਰੀਕੇ, ਜੋ ਕਿ ਨਾਲ ਨਾਲ ਇਸ ਨੂੰ ਡਾਟਾ ਦੇ ਗੁਣ ਨੂੰ ਅਨੁਕੂਲ ਹਨ, ਦੇ ਨਾਲ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਵਰਣਨ ਹੋਵੇਗਾ.