2.4.1.3 ਚੀਨੀ ਸਰਕਾਰ ਨੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਦੇ ਸਸਰਿਸ਼ਪ

ਖੋਜਕਾਰ ਸਸਰਿਸ਼ਪ ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਚੀਨੀ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਾਈਟ ਉਖਾੜਿਆ. ਉਹ ਦੱਬੇ-ਗੁਣ ਅਨੁਿਾਨ ਨਾਲ ਅਧੂਰਾਪਨ ਨਾਲ ਪੇਸ਼.

ਦੋ ਪਿਛਲੇ ਉਦਾਹਰਣ ਵਿੱਚ ਵਰਤਿਆ ਵੱਡੇ ਡਾਟਾ ਨੂੰ ਇਸ ਦੇ ਨਾਲ, ਖੋਜਕਾਰ ਨੂੰ ਵੀ ਆਪਣੇ ਹੀ observational ਡਾਟਾ, ਦੇ ਅਚਰਜ ਗੈਰੀ ਰਾਜਾ, ਜੈਨੀਫ਼ਰ ਪੈਨ, ਅਤੇ ਮੌਲੀ ਰੌਬਰਟਸ 'ਨੇ ਸਮਝਾਇਆ ਸੀ, ਨੂੰ ਇਕੱਠਾ ਕਰ ਸਕਦੇ ਹੋ (2013) ਸਸਰਿਸ਼ਪ ਤੇ ਖੋਜ ਚੀਨੀ ਸਰਕਾਰ ਨੇ.

ਚੀਨ ਵਿਚ ਸੋਸ਼ਲ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਇੱਕ ਬਹੁਤ ਵੱਡੀ ਰਾਜ ਦੇ ਸੰਦ ਹੈ, ਜੋ ਕਿ ਲੋਕ ਦੇ ਹਜ਼ਾਰ ਦੇ ਦਹਿ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਸੋਚਿਆ ਹੈ ਕੇ censored ਹਨ. ਖੋਜਕਾਰ ਅਤੇ ਨਾਗਰਿਕ, ਪਰ, ਇਹ censors ਦਾ ਫ਼ੈਸਲਾ ਕੀ ਹੈ ਸਮੱਗਰੀ ਨੂੰ ਸੋਸ਼ਲ ਮੀਡੀਆ ਤੱਕ ਹਟਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਦੀ ਥੋੜਾ ਭਾਵਨਾ ਹੈ. ਚੀਨ ਦੇ ਵਿਦਵਾਨ ਅਸਲ ਵਿੱਚ ਵਿਰੋਧੀ ਉਮੀਦ ਪੋਸਟ ਦੇ ਕਿਸਮ ਹੈ, ਜੋ ਕਿ ਇਸ ਬਾਰੇ ਸਭ ਨੂੰ ਹਟਾਇਆ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਹਨ. ਕੁਝ ਸੋਚਦੇ ਹਨ ਕਿ censors ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਰਾਜ ਦੇ ਨਾਜ਼ੁਕ ਹੁੰਦੇ ਹਨ, ਜਦਕਿ ਹੋਰ ਸੋਚਦੇ ਹਨ ਕਿ ਉਹ ਪੋਸਟ, ਅਜਿਹੇ ਰੋਸ ਦੇ ਤੌਰ ਤੇ ਹੈ, ਜੋ ਕਿ ਸਮੂਹਕ ਵਿਵਹਾਰ ਨੂੰ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਤੇ ਧਿਆਨ ਤੇ ਧਿਆਨ. ਬਾਹਰ ਦਾ ਿਹਸਾਬ ਹੈ, ਜੋ ਕਿ ਇਹ ਉਮੀਦ ਦੀ ਸਹੀ ਹੈ ਖੋਜਕਾਰ ਚੀਨ ਅਤੇ ਹੋਰ ਤਾਨਾਸ਼ਾਹ ਸਰਕਾਰ ਹੈ, ਜੋ ਕਿ ਸਸਰਿਸ਼ਪ ਵਿਚ ਹਿੱਸਾ ਸਮਝਣ ਦੀ ਲਈ ਪਰ੍ਭਾਵ ਹੈ. ਇਸ ਲਈ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਕਦੇ ਹਟਾਇਆ ਨੂੰ ਹਟਾਇਆ ਤੁਲਨਾ ਕਰਨਾ ਚਾਹੁੰਦਾ ਸੀ.

ਇਹ ਪੋਸਟ ਇੱਕਠੀ ਸ਼ਾਮਲ ਸੰਬੰਧਤ ਪੋਸਟ-ਵੱਖ ਸਫ਼ਾ ਲੇਆਉਟ-ਲੱਭਣ, ਅਤੇ ਫਿਰ ਇਹ ਪੋਸਟ ਦੁਬਾਰਾ ਵੇਖਣ ਲਈ, ਜਿਸ ਨੂੰ ਬਾਅਦ ਹਟਾਇਆ ਗਿਆ ਸੀ ਦੇ ਨਾਲ ਹੋਰ ਵੀ ਵੱਧ 1000 ਚੀਨੀ ਸੋਸ਼ਲ ਮੀਡੀਆ ਵੈੱਬਸਾਈਟ-ਹਰ ਇੱਕ ਰਿੜ੍ਹਨਾ ਦੀ ਹੈਰਾਨੀਜਨਕ ਇੰਜੀਨੀਅਰਿੰਗ ਕਾਰਨਾਮਾ. ਵੱਡੇ ਪੱਧਰ ਵੈੱਬ-ਰਿੜ੍ਹਨਾ ਨਾਲ ਸੰਬੰਧਿਤ ਆਮ ਇੰਜੀਨੀਅਰਿੰਗ ਦੀ ਸਮੱਸਿਆ ਨੂੰ ਇਸ ਦੇ ਨਾਲ, ਇਸ ਪ੍ਰਾਜੈਕਟ ਜੋੜੇ ਚੁਣੌਤੀ ਹੈ, ਜੋ ਕਿ ਇਸ ਨੂੰ ਬਹੁਤ ਹੀ ਤੇਜ਼ੀ ਨਾਲ ਹੋਣ ਦੀ ਹੈ, ਕਿਉਕਿ ਬਹੁਤ ਸਾਰੇ censored ਪੋਸਟ ਘੱਟ ਵੱਧ 24 ਘੰਟੇ ਵਿੱਚ ਲਿਆ ਰਹੇ ਹਨ ਦੀ ਲੋੜ ਸੀ. ਹੋਰ ਸ਼ਬਦ ਵਿੱਚ, ਇੱਕ ਹੌਲੀ crawler ਪੋਸਟ ਹੈ, ਜੋ ਕਿ censored ਗਏ ਸਨ ਦੀ ਲਾਟ ਨੂੰ ਮਿਸ ਕਰੇਗਾ. ਅੱਗੇ, ਸਪਾਇਡਰ ਕਿਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਵੈੱਬਸਾਈਟ ਪਹੁੰਚ ਨੂੰ ਬਲਾਕ ਜ ਹੋਰ ਅਧਿਐਨ ਕਰਨ ਦੇ ਜਵਾਬ ਵਿੱਚ ਆਪਣੇ ਪਾਲਸੀ ਨੂੰ ਬਦਲ ਹੈ, ਜਦਕਿ ਖੋਜ ਚੋਰੀ ਇਹ ਸਭ ਡਾਟਾ ਇਕੱਠਾ ਨੂੰ ਕੀ ਕਰਨ ਦੀ ਸੀ.

ਇੱਕ ਵਾਰ ਇਸ ਨੂੰ ਵੱਡੇ ਇੰਜੀਨੀਅਰਿੰਗ ਕੰਮ ਪੂਰਾ ਹੋ ਗਿਆ ਸੀ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ 85 ਵੱਖ-ਵੱਖ ਵਿਸ਼ੇ ਹੈ, ਜੋ ਕਿ ਪ੍ਰੀ-ਨਿਰਧਾਰਿਤ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦੇ ਆਪਣੇ ਉਮੀਦ ਪੱਧਰ '' ਤੇ ਅਧਾਰਿਤ ਸਨ ਤੇ ਇਸ ਬਾਰੇ 11 ਕਰੋੜ ਪੋਸਟ ਪ੍ਰਾਪਤ ਕਰ ਲਈ ਸੀ. ਮਿਸਾਲ ਲਈ, ਉੱਚ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦਾ ਇੱਕ ਵਿਸ਼ਾ ਅਈ Weiwei, ਹੈਵਲ ਕਲਾਕਾਰ ਹੈ; ਮੱਧ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦਾ ਇੱਕ ਵਿਸ਼ਾ ਕਦਰ ਅਤੇ ਚੀਨੀ ਕਰੰਸੀ ਦੀ devaluation ਹੈ, ਅਤੇ ਘੱਟ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਦਾ ਇੱਕ ਵਿਸ਼ਾ ਵਿਸ਼ਵ ਕੱਪ ਹੈ. ਇਹ 11 ਲੱਖ ਪੋਸਟ ਦੇ ਬਾਰੇ 2 ਲੱਖ censored ਗਿਆ ਸੀ, ਪਰ ਬਹੁਤ ਹੀ ਸੰਵੇਦਨਸ਼ੀਲ ਵਿਸ਼ੇ 'ਤੇ ਪੋਸਟ ਮੱਧ ਅਤੇ ਘੱਟ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਵਿਸ਼ੇ' ਤੇ ਪੋਸਟ ਵੱਧ ਸਿਰਫ ਥੋੜ੍ਹਾ ਹੋਰ ਅਕਸਰ censored ਗਏ ਸਨ. ਹੋਰ ਸ਼ਬਦ ਵਿੱਚ, ਚੀਨੀ censors ਬਾਰੇ ਇੱਕ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਇੱਕ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਵਿਸ਼ਵ ਕੱਪ ਦਾ ਜ਼ਿਕਰ ਦੇ ਤੌਰ ਤੇ ਅਈ Weiwei ਜ਼ਿਕਰ ਸਸਰ ਦੀ ਸੰਭਾਵਨਾ ਹੈ. ਇਹ ਖੁਲਾਸੇ ਸਧਾਰਨ ਵਿਚਾਰ ਨੂੰ ਹੈ, ਜੋ ਕਿ ਸਰਕਾਰ ਨੂੰ ਸੰਵੇਦਨਸ਼ੀਲ ਵਿਸ਼ੇ 'ਤੇ ਸਾਰੇ ਪੋਸਟ censors ਮੇਲ ਨਹੀ ਸੀ.

ਵਿਸ਼ੇ ਕੇ ਸਸਰਿਸ਼ਪ ਦੀ ਦਰ ਦੀ ਇਹ ਹੀ ਸਧਾਰਨ ਹਿਸਾਬ ਗੁੰਮਰਾਹਕੁੰਨ ਹੋ ਸਕਦਾ ਹੈ, ਪਰ. ਮਿਸਾਲ ਲਈ, ਸਰਕਾਰ ਨੇ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਅਈ Weiwei ਦੇ ਸਹਾਇਕ ਹਨ, ਪਰ ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਉਸ ਦੀ ਨਾਜ਼ੁਕ ਹਨ ਨੂੰ ਛੱਡ ਸਸਰ ਸਕਦਾ ਹੈ. ਕ੍ਰਮ ਹੋਰ ਧਿਆਨ ਨਾਲ ਪੋਸਟ ਦੇ ਵਿਚਕਾਰ ਵੱਖ ਕਰਨ ਲਈ, ਖੋਜਕਾਰ ਹਰ ਇੱਕ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਨੂੰ ਮਾਪਣ ਲਈ ਲੋੜ ਹੈ. ਇਸ ਲਈ, ਇਕ ਤਰੀਕਾ ਹੈ ਇਸ ਬਾਰੇ ਸੋਚਣ ਲਈ ਹੈ, ਜੋ ਕਿ ਹਰ ਇੱਕ ਪੋਸਟ ਦੀ ਇੱਕ ਅਹਿਮ ਲਾਗਾਦੇਗਾ ਫੀਚਰ ਨੂੰ ਵਿੱਚ ਹਰੇਕ ਪੋਸਟ ਦੀ ਭਾਵਨਾ. ਬਦਕਿਸਮਤੀ ਨਾਲ, ਬਹੁਤ ਸਾਰਾ ਕੰਮ ਦੇ ਬਾਵਜੂਦ, ਪ੍ਰੀ-ਮੌਜੂਦਾ ਕੋਸ਼ ਵਰਤ ਭਾਵਨਾ ਖੋਜ ਦੀ ਪੂਰੀ ਸਵੈ-ਚਾਲਤ ਢੰਗ ਨੂੰ ਅਜੇ ਵੀ ਨਹੀ ਬਹੁਤ ਸਾਰੇ ਹਾਲਾਤ ਵਿੱਚ ਬਹੁਤ ਹੀ ਚੰਗੇ ਹਨ (ਸਮੱਸਿਆ ਹਿੱਸਾ 2.3.2.6 ਤੱਕ 11 ਸਤੰਬਰ, 2001 ਦੇ ਇੱਕ ਭਾਵਨਾਤਮਕ ਟਾਈਮਲਾਈਨ ਬਣਾਉਣ ਲਈ ਵਾਪਸ ਸੋਚਦੇ). ਇਸ ਲਈ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਹੈ ਕਿ ਉਹ 1 ਸਨ) ਰਾਜ ਦੇ ਨਾਜ਼ੁਕ ਕਰਨ ਦੇ ਤੌਰ ਤੇ ਆਪਣੇ 11 ਲੱਖ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਲੇਬਲ ਕਰਨ ਲਈ ਇੱਕ ਢੰਗ ਦੀ ਲੋੜ ਹੈ, 2) ਰਾਜ ਦੇ, ਜ ਘਟਨਾ ਬਾਰੇ 3) ਦੇ ਅਨੁਰੂਪ ਹੀ ਜ ਸਾਰਹੀਣ ਰਿਪੋਰਟ ਦੇ ਸਹਾਇਕ. ਇਹ ਇੱਕ ਵੱਡੇ ਨੌਕਰੀ ਵਰਗਾ ਆਵਾਜ਼, ਪਰ ਉਹ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੈਟ੍ਰਿਕ ਵਰਤ ਕੇ ਇਸ ਨੂੰ ਹੱਲ; ਇੱਕ ਡਾਟਾ ਵਿਗਿਆਨ ਵਿਚ ਆਮ ਹੈ, ਪਰ ਇਸ ਵੇਲੇ ਮੁਕਾਬਲਤਨ ਸਮਾਜਿਕ ਵਿਗਿਆਨ ਵਿੱਚ ਬਹੁਤ ਘੱਟ ਹੁੰਦਾ ਹੈ, ਜੋ ਕਿ.

ਪਹਿਲੀ, ਇਕ ਕਦਮ ਦੇ ਆਮ ਤੌਰ ਪ੍ਰੀ-ਨੂੰ ਕਾਰਵਾਈ ਕਰਨ ਕਹਿੰਦੇ ਹਨ, ਖੋਜਕਾਰ ਇਕ ਦਸਤਾਵੇਜ਼ ਮਿਆਦ ​​ਮੈਟਰਿਕਸ, ਜਿੱਥੇ ਹਰ ਇੱਕ ਦਸਤਾਵੇਜ਼ ਲਈ ਇੱਕ ਕਤਾਰ ਹੈ ਅਤੇ ਇੱਕ ਕਾਲਮ ਹੈ, ਜੋ ਕਿ ਦਰਜ ਹੈ ਕਿ ਕੀ ਪੋਸਟ ਨੂੰ ਇੱਕ ਖਾਸ ਸ਼ਬਦ ਨੂੰ ਸ਼ਾਮਿਲ ਹੈ, ਉੱਥੇ ਸੀ ਵਿੱਚ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਤਬਦੀਲ (ਉਦਾਹਰਨ ਲਈ, ਰੋਸ, ਆਵਾਜਾਈ, ਆਦਿ). ਅੱਗੇ, ਖੋਜ ਸਹਾਇਕ ਦੇ ਇੱਕ ਗਰੁੱਪ ਪੋਸਟ ਦਾ ਇੱਕ ਨਮੂਨਾ ਦੀ ਭਾਵਨਾ ਹੱਥ-ਲੇਬਲ. ਤਦ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਨੂੰ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਇਸ ਦੇ ਗੁਣ ਦੇ ਆਧਾਰ 'ਤੇ ਇੱਕ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਮਹਤਵ ਕਰ ਸਕਦਾ ਹੈ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਇਸ ਨੂੰ ਹੱਥ-ਲੇਬਲ ਡਾਟਾ ਵਰਤਿਆ. ਅੰਤ ਵਿੱਚ, ਉਹ ਸਾਰੇ 11 ਲੱਖ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਇਸ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਵਰਤਿਆ. ਇਸ ਲਈ, ਨਾ ਕਿ ਇਸ ਨੂੰ ਦਸਤੀ ਨੂੰ ਪੜ੍ਹਨ ਅਤੇ ਲੇਬਲਿੰਗ 11 ਲੱਖ ਪੋਸਟ (ਜੋ logistically ਅਸੰਭਵ ਹੋ ਜਾਵੇਗਾ), ਉਹ ਇਸ ਨੂੰ ਦਸਤੀ ਪੋਸਟ ਦੀ ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਗਿਣਤੀ ਦਾ ਲੇਬਲ ਅਤੇ ਫਿਰ ਵਰਤਿਆ ਕਿਹੜਾ ਡਾਟਾ ਵਿਗਿਆਨੀ ਸਾਰੇ ਪੋਸਟ ਦੇ ਵਰਗ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਨਿਰੀਖਣ ਸਿੱਖਣ ਨੂੰ ਕਾਲ ਕਰੋ ਜਾਵੇਗਾ. ਇਸ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦੇ ਬਾਅਦ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਹੈ, ਜੋ ਕਿ ਸਿੱਟਾ ਕਰਨ ਦੇ ਯੋਗ ਸਨ, ਕੁਝ ਹੈਰਾਨੀ ਹੈ, ਇੱਕ ਪੋਸਟ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਹਟਾਇਆ ਜਾ ਰਿਹਾ ਹੈ ਕਿ ਕੀ ਇਸ ਨੂੰ ਰਾਜ ਦੇ ਨਾਜ਼ੁਕ ਜ ਰਾਜ ਦੇ ਸਹਾਇਕ ਸੀ ਸੰਬੰਧ ਸੀ.

ਚਿੱਤਰ 2.3: ਰਾਜਾ, ਪੈਨ ਵਿੱਚ ਵਰਤਿਆ ਵਿਧੀ ਲਈ ਸਧਾਰਨ ਯੋਜਨਾਬੱਧ ਅਤੇ ਰੌਬਰਟਸ (2013) 11 ਲੱਖ ਚੀਨੀ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਦਾ ਅਨੁਮਾਨ ਹੈ. ਪਹਿਲੀ, ਇਕ ਕਦਮ ਦੇ ਆਮ ਤੌਰ ਪ੍ਰੀ-ਨੂੰ ਕਾਰਵਾਈ ਕਰਨ ਕਹਿੰਦੇ ਹਨ, ਖੋਜਕਾਰ ਇਕ ਦਸਤਾਵੇਜ਼ ਮਿਆਦ ਮੈਟਰਿਕਸ ਵਿੱਚ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਤਬਦੀਲ (Grimmer ਅਤੇ ਸਟੀਵਰਟ (2013) ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ ਵੇਖੋ). ਦੂਜਾ, ਖੋਜਕਾਰ ਪੋਸਟ ਦੇ ਇੱਕ ਛੋਟੇ ਨਮੂਨੇ ਦੀ ਭਾਵਨਾ ਹੱਥ-ਕੋਡਿਡ. ਤੀਜਾ, ਖੋਜਕਾਰ ਪੋਸਟ ਦੇ ਭਾਵਨਾ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਇੱਕ ਨਿਰੀਖਣ ਸਿੱਖਣ ਮਾਡਲ ਸਿਖਲਾਈ ਦਿੱਤੀ. ਚੌਥਾ, ਖੋਜਕਾਰ ਸਾਰੇ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਨਿਰੀਖਣ ਸਿੱਖਣ ਮਾਡਲ ਵਰਤਿਆ. ਇੱਕ ਹੋਰ ਵਿਸਥਾਰ ਜਾਣਕਾਰੀ ਲਈ ਰਾਜਾ, ਪੈਨ, ਅਤੇ ਰੌਬਰਟਸ (2013), ਅੰਤਿਕਾ B ਵੇਖੋ.

ਚਿੱਤਰ 2.3: ਵਿੱਚ ਵਰਤਿਆ ਵਿਧੀ ਲਈ ਸਧਾਰਨ ਯੋਜਨਾਬੱਧ King, Pan, and Roberts (2013) 11 ਲੱਖ ਚੀਨੀ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਦਾ ਅਨੁਮਾਨ ਹੈ. ਪਹਿਲੀ, ਇਕ ਕਦਮ ਦੇ ਆਮ ਤੌਰ ਪ੍ਰੀ-ਨੂੰ ਕਾਰਵਾਈ ਕਰਨ ਕਹਿੰਦੇ ਹਨ, ਖੋਜਕਾਰ ਇਕ ਦਸਤਾਵੇਜ਼ ਮਿਆਦ ​​ਮੈਟਰਿਕਸ ਵਿੱਚ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਪੋਸਟ ਤਬਦੀਲ (ਨੂੰ ਵੇਖ Grimmer and Stewart (2013) ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ). ਦੂਜਾ, ਖੋਜਕਾਰ ਪੋਸਟ ਦੇ ਇੱਕ ਛੋਟੇ ਨਮੂਨੇ ਦੀ ਭਾਵਨਾ ਹੱਥ-ਕੋਡਿਡ. ਤੀਜਾ, ਖੋਜਕਾਰ ਪੋਸਟ ਦੇ ਭਾਵਨਾ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਇੱਕ ਨਿਰੀਖਣ ਸਿੱਖਣ ਮਾਡਲ ਸਿਖਲਾਈ ਦਿੱਤੀ. ਚੌਥਾ, ਖੋਜਕਾਰ ਸਾਰੇ ਪੋਸਟ ਦੀ ਭਾਵਨਾ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਨਿਰੀਖਣ ਸਿੱਖਣ ਮਾਡਲ ਵਰਤਿਆ. ਦੇਖੋ King, Pan, and Roberts (2013) ਇੱਕ ਹੋਰ ਵਿਸਥਾਰ ਜਾਣਕਾਰੀ ਲਈ, ਅੰਤਿਕਾ B.

, ਪੋਰਨੋਗ੍ਰਾਫੀ censors ਦੀ ਆਲੋਚਨਾ ਹੈ, ਅਤੇ ਉਹ ਹੈ, ਜੋ ਕਿ ਸਮੂਹਿਕ ਕਾਰਵਾਈ ਸੰਭਾਵੀ ਸੀ (ਭਾਵ, ਵੱਡੇ ਪੈਮਾਨੇ ਰੋਸ ਕਰਨ ਲਈ ਮੋਹਰੀ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ): ਅੰਤ ਵਿੱਚ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਕਿ ਪੋਸਟ ਦੇ ਸਿਰਫ ਤਿੰਨ ਕਿਸਮ ਨਿਯਮਿਤ censored ਗਏ ਸਨ. ਪੋਸਟ ਹੈ, ਜੋ ਕਿ ਹਟਾਇਆ ਹੈ ਅਤੇ ਪੋਸਟ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਹਟਾਇਆ ਨਾ ਗਿਆ ਸੀ, ਦੀ ਇੱਕ ਵੱਡੀ ਗਿਣਤੀ ਨੂੰ ਦੇਖ ਕੇ, ਰਾਜਾ ਅਤੇ ਸਾਥੀ ਸਿੱਖ ਦਾ ਤਰੀਕਾ ਦੱਸੋ censors ਦੇਖ ਰਿਹਾ ਹੈ ਅਤੇ ਗਿਣਤੀ ਨੂੰ ਸਿਰਫ਼ ਕੰਮ ਕਰਨ ਦੇ ਯੋਗ ਸਨ. ਇਸ ਉਪਰੰਤ ਖੋਜ ਵਿੱਚ, ਉਹ ਅਸਲ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਚੀਨੀ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਵਾਤਾਵਰਣ ਵਿੱਚ ਯੋਜਨਾਬੱਧ ਵੱਖ-ਵੱਖ ਸਮੱਗਰੀ ਅਤੇ ਮਾਪਣ, ਜਿਸ ਨੂੰ censored ਹੀ ਨਾਲ ਪੋਸਟ ਬਣਾਉਣ ਦੇ ਕੇ ਦਖ਼ਲ (King, Pan, and Roberts 2014) . ਸਾਨੂੰ ਅਧਿਆਇ 4. ਹੋਰ ਵਿਚ ਤਜਰਬੇ ਤਰੀਕੇ ਬਾਰੇ ਹੋਰ ਸਿੱਖਣ ਜਾਵੇਗਾ, ਜੋ ਕਿ ਕਿਤਾਬ ਨੂੰ ਭਰ ਵਾਪਰ ਜਾਵੇਗਾ ਕਿ ਇੱਕ ਥੀਮ foreshadowing, ਇਹ ਦੱਬੇ-ਗੁਣ ਅਨੁਿਾਨ ਸਮੱਸਿਆ-, ਜੋ ਕਿ ਕਈ ਵਾਰ ਦੇ ਨਾਲ ਹੱਲ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਨਿਰੀਖਣ ਸਿੱਖਣ-ਚਾਲੂ ਕਰਨ ਲਈ ਬਾਹਰ ਦੇ ਸਮਾਜਿਕ ਖੋਜ ਵਿਚ ਬਹੁਤ ਹੀ ਆਮ ਹੋਣ ਦਾ ਡਿਜ਼ੀਟਲ ਦੀ ਉਮਰ. ਤੁਹਾਨੂੰ ਤਸਵੀਰ ਬਹੁਤ ਹੀ ਅਧਿਆਇ 3 (ਸਵਾਲ ਪੁੱਛਣ) ਅਤੇ 5 ਵਿੱਚ 2.3 ਚਿੱਤਰ ਨੂੰ ਵੀ ਇਸੇ ਦੇਖਣ ਜਾਵੇਗਾ (ਪੁੰਜ ਸਹਿਯੋਗ ਬਣਾਉਣਾ); ਇਸ ਨੂੰ ਕੁਝ ਵਿਚਾਰ ਹੈ, ਜੋ ਕਿ ਕਈ ਕਈ ਅਧਿਆਇ ਵਿੱਚ ਪ੍ਰਗਟ ਦੇ ਇੱਕ ਹੈ.

ਇਹ ਮਿਸਾਲ-ਟੈਕਸੀ ਡਰਾਈਵਰ ਨ੍ਯੂ ਯਾਰ੍ਕ ਵਿੱਚ, ਵਿਦਿਆਰਥੀ ਨੇ ਦੋਸਤੀ ਗਠਨ, ਅਤੇ ਚੀਨੀ ਸਰਕਾਰ ਨੂੰ-ਲੱਗਦਾ ਹੈ ਕਿ observational ਡਾਟਾ ਦੇ ਮੁਕਾਬਲਤਨ ਸਧਾਰਨ ਗਿਣਤੀ ਲਿਖਤੀ ਸ਼ਬਦ ਨੂੰ ਟੈਸਟ ਕਰਨ ਲਈ ਖੋਜਕਾਰ ਯੋਗ ਕਰ ਸਕਦੇ ਹੋ ਦੇ ਸਮਾਜਿਕ ਮੀਡੀਆ ਨੂੰ ਸਸਰਿਸ਼ਪ ਰਵੱਈਏ ਦੇ ਕੰਮ ਕਰ ਰਵੱਈਏ ਦੇ ਸਾਰੇ ਤਿੰਨ. ਕੁਝ ਹਾਲਾਤ ਵਿੱਚ, ਵੱਡੇ ਡਾਟਾ ਤੁਹਾਨੂੰ ਮੁਕਾਬਲਤਨ ਸਿੱਧਾ ਹੀ ਇਸ ਗਿਣਤੀ ਨੂੰ ਕੀ ਕਰਨ ਦੀ (ਨ੍ਯੂ ਯਾਰ੍ਕ ਟੈਕਸੀ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਦੇ ਰੂਪ ਵਿੱਚ) ਨੂੰ ਯੋਗ ਕਰਦਾ ਹੈ. ਹੋਰ ਕੇਸ ਵਿੱਚ, ਖੋਜਕਾਰ ਆਪਣੇ ਹੀ observational ਡਾਟਾ (ਚੀਨੀ ਸਸਰਿਸ਼ਪ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਦੇ ਰੂਪ ਵਿੱਚ) ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇਗੀ; ਇਕੱਠੇ ਡਾਟਾ ਮਰਜਿੰਗ (ਨੈੱਟਵਰਕ ਵਿਕਾਸਵਾਦ ਦੇ ਮਾਮਲੇ 'ਚ) ਦੇ ਤੌਰ ਤੇ ਅਧੂਰਾਪਨ ਨਾਲ ਨਜਿੱਠਣ; ਜ ਲਾਗਾਦੇਗਾ-ਗੁਣ ਘੜਨ ਦਾ ਕਿਸੇ ਰੂਪ ਕਰ (ਚੀਨੀ ਸਸਰਿਸ਼ਪ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਦੇ ਰੂਪ ਵਿੱਚ). ਮੈਨੂੰ ਉਮੀਦ ਹੈ ਕਿ ਇਹ ਉਦਾਹਰਣ ਦਿਖਾਉਣ, ਖੋਜਕਾਰ ਦਿਲਚਸਪ ਸਵਾਲ ਪੁੱਛਣ ਲਈ ਯੋਗ ਹੁੰਦੇ ਹਨ, ਜੋ ਇਸ ਲਈ, ਵੱਡੇ ਮਹਾਨ ਵਾਅਦਾ ਕੀਤਾ ਹੈ.