2.1 ਪਛਾਣ

ਐਨਾਲਾਗ ਦੀ ਉਮਰ ਵਿਚ, ਵਿਹਾਰ ਬਾਰੇ ਡੈਟਾ ਇਕੱਠਾ ਕਰਨਾ - ਕੌਣ ਕਰਦਾ ਹੈ ਅਤੇ ਕਦੋਂ ਮਹਿੰਗਾ ਸੀ, ਅਤੇ ਇਸਲਈ ਮੁਕਾਬਲਤਨ ਬਹੁਤ ਘੱਟ ਮਿਲਦਾ. ਹੁਣ, ਡਿਜੀਟਲ ਦੀ ਉਮਰ ਵਿੱਚ, ਅਰਬਾਂ ਲੋਕਾਂ ਦੇ ਵਿਵਹਾਰ ਰਿਕਾਰਡ ਕੀਤੇ, ਸਟੋਰ ਕੀਤੇ ਅਤੇ ਜਾਂਚਣ ਯੋਗ ਹਨ. ਉਦਾਹਰਨ ਲਈ, ਜਦੋਂ ਵੀ ਤੁਸੀਂ ਕਿਸੇ ਵੈਬਸਾਈਟ ਤੇ ਕਲਿਕ ਕਰਦੇ ਹੋ, ਆਪਣੇ ਮੋਬਾਈਲ ਫੋਨ 'ਤੇ ਕਾਲ ਕਰੋ ਜਾਂ ਆਪਣੇ ਕ੍ਰੈਡਿਟ ਕਾਰਡ ਨਾਲ ਕਿਸੇ ਚੀਜ਼ ਦਾ ਭੁਗਤਾਨ ਕਰੋ, ਤੁਹਾਡੇ ਵਿਹਾਰ ਦਾ ਇੱਕ ਡਿਜੀਟਲ ਰਿਕਾਰਡ ਕਾਰੋਬਾਰ ਦੁਆਰਾ ਬਣਾਇਆ ਅਤੇ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ. ਕਿਉਂਕਿ ਇਹ ਕਿਸਮ ਦੇ ਲੋਕ ਲੋਕਾਂ ਦੀਆਂ ਰੋਜ਼ਾਨਾ ਕਿਰਿਆਵਾਂ ਦਾ ਉਪ-ਉਤਪਾਦ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਅਕਸਰ ਡਿਜੀਟਲ ਟਰੇਸ ਕਿਹਾ ਜਾਂਦਾ ਹੈ . ਬਿਜਨਸ ਦੁਆਰਾ ਰੱਖੇ ਗਏ ਇਨ੍ਹਾਂ ਟਰੇਸ ਤੋਂ ਇਲਾਵਾ, ਸਰਕਾਰਾਂ ਨੇ ਲੋਕਾਂ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਦੋਨਾਂ ਬਾਰੇ ਬਹੁਤ ਅਮੀਰ ਅੰਕੜੇ ਵੀ ਪੇਸ਼ ਕੀਤੇ ਹਨ. ਇਕੱਠੇ ਇਹ ਕਾਰੋਬਾਰ ਅਤੇ ਸਰਕਾਰੀ ਰਿਕਾਰਡ ਅਕਸਰ ਵੱਡੀਆਂ ਡਾਟਾ ਕਹਿੰਦੇ ਹਨ.

ਵੱਡੇ ਡਾਟਾ ਦੇ ਲਗਾਤਾਰ ਹੜ੍ਹ ਵਾਲਾ ਹੜ੍ਹ ਇਹ ਹੈ ਕਿ ਅਸੀਂ ਅਜਿਹੀ ਦੁਨੀਆਂ ਤੋਂ ਪ੍ਰੇਰਿਤ ਹੋਈ ਹਾਂ ਜਿੱਥੇ ਵਿਵਹਾਰਕ ਡੇਟਾ ਇੱਕ ਅਜਿਹੇ ਸੰਸਾਰ ਲਈ ਬਹੁਤ ਘੱਟ ਸੀ ਜਿੱਥੇ ਵਿਵਹਾਰਕ ਡੇਟਾ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ ਵੱਡੀ ਡੈਟਾ ਤੋਂ ਸਿੱਖਣ ਲਈ ਪਹਿਲਾ ਕਦਮ ਇਹ ਜਾਣਨਾ ਹੈ ਕਿ ਇਹ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਦੇ ਡੇਟਾ ਦਾ ਹਿੱਸਾ ਹੈ ਜੋ ਕਈ ਸਾਲਾਂ ਤੋਂ ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਵਰਤਿਆ ਗਿਆ ਹੈ: ਨਿਰੀਖਣ ਡੇਟਾ ਲਗਭਗ, ਨਿਰੀਖਣ ਡੇਟਾ ਕੋਈ ਅਜਿਹਾ ਡਾਟਾ ਹੈ ਜੋ ਕਿਸੇ ਤਰੀਕੇ ਨਾਲ ਕਿਸੇ ਦਖਲ ਤੋਂ ਬਿਨਾਂ ਸਮਾਜਿਕ ਪ੍ਰਬੰਧ ਦੇਖਣ ਤੋਂ ਮਿਲਦਾ ਹੈ. ਇਸ ਬਾਰੇ ਸੋਚਣ ਦਾ ਇਕ ਕਾਲੀ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਨਿਰੀਖਣ ਡੇਟਾ ਉਹ ਹਰ ਚੀਜ ਹੈ ਜੋ ਲੋਕਾਂ ਨਾਲ ਗੱਲ ਕਰਨਾ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ (ਜਿਵੇਂ ਸਰਵੇਖਣਾਂ, ਅਧਿਆਇ 3 ਦਾ ਵਿਸ਼ਾ) ਜਾਂ ਲੋਕਾਂ ਦੇ ਵਾਤਾਵਰਨ ਬਦਲਣਾ (ਜਿਵੇਂ ਕਿ ਪ੍ਰਯੋਗਾਂ, ਅਧਿਆਇ 4 ਦਾ ਵਿਸ਼ਾ). ਇਸ ਤਰ੍ਹਾਂ, ਵਪਾਰ ਅਤੇ ਸਰਕਾਰੀ ਰਿਕਾਰਡ ਤੋਂ ਇਲਾਵਾ, ਨਿਰੀਖਣ ਡੇਟਾ ਵਿੱਚ ਅਖ਼ਬਾਰਾਂ ਦੇ ਲੇਖਾਂ ਅਤੇ ਸੈਟੇਲਾਈਟ ਫੋਟੋਆਂ ਦੇ ਪਾਠ ਦੀ ਤਰ੍ਹਾਂ ਵੀ ਚੀਜ਼ਾਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ.

ਇਸ ਅਧਿਆਇ ਵਿੱਚ ਤਿੰਨ ਭਾਗ ਹਨ. ਪਹਿਲੀ, ਭਾਗ 2.2 ਵਿਚ, ਮੈਂ ਵੱਡੇ ਡੈਟਾ ਸ੍ਰੋਤਾਂ ਦਾ ਹੋਰ ਵਿਸਥਾਰ ਵਿਚ ਵਰਨਨ ਕਰਦਾ ਹਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਵਿਚ ਅਤੇ ਉਹਨਾਂ ਡੇਟਾਾਂ ਵਿਚ ਬੁਨਿਆਦੀ ਫਰਕ ਨੂੰ ਸਪੱਸ਼ਟ ਕਰਦਾ ਹੈ ਜੋ ਆਮ ਤੌਰ ਤੇ ਬੀਤੇ ਵਿਚ ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ. ਫੇਰ, ਭਾਗ 2.3 ਵਿੱਚ, ਮੈਂ ਵੱਡੇ ਡਾਟਾ ਸ੍ਰੋਤਾਂ ਦੀਆਂ ਦਸ ਆਮ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹਾਂ. ਇਹਨਾਂ ਲੱਛਣਾਂ ਨੂੰ ਸਮਝਣ ਨਾਲ ਤੁਸੀਂ ਮੌਜੂਦਾ ਸਰੋਤਾਂ ਦੀ ਮਜ਼ਬੂਤੀ ਅਤੇ ਕਮਜ਼ੋਰੀਆਂ ਨੂੰ ਜਲਦੀ ਪਛਾਣ ਸਕੋਗੇ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ ਉਪਲਬਧ ਹੋਣ ਵਾਲੇ ਨਵੇਂ ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਿੱਚ ਤੁਹਾਡੀ ਮਦਦ ਕਰਨਗੇ. ਅੰਤ ਵਿੱਚ, ਭਾਗ 2.4 ਵਿੱਚ, ਮੈਂ ਤਿੰਨ ਮੁੱਖ ਰਿਸਰਚ ਰਣਨੀਤੀਆਂ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹਾਂ ਜੋ ਤੁਸੀਂ ਨਿਰੀਖਣ ਡੇਟਾ ਤੋਂ ਸਿੱਖਣ ਲਈ ਵਰਤ ਸਕਦੇ ਹੋ: ਚੀਜ਼ਾਂ ਦੀ ਗਿਣਤੀ, ਚੀਜ਼ਾਂ ਦੀ ਪੂਰਵ ਸੂਚਨਾ, ਅਤੇ ਇੱਕ ਤਜਰਬੇ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣਾ.