2.4.1.3 சீன அரசாங்கம் சமூக ஊடக தணிக்கை

ஆராய்ச்சியாளர்கள் தணிக்கை படிக்க சீன சமூக ஊடக தளங்களில் தள்ளப்பட்ட. அவர்கள் உள்ளுறை-பண்பின் அனுமானம் கொண்டு முற்றுப்பெறாத தீர்க்கப்பட.

முந்தைய இரு உதாரணங்கள் பயன்படுத்தப்படும் பெரிய தரவு கூடுதலாக, ஆராய்ச்சியாளர்கள் தங்கள் சொந்த உற்றுநோக்கல் தரவு போன்ற பிரமாதமாக கேரி கிங், ஜெனிபர் பான், மற்றும் மோலி ராபர்ட்ஸ் 'மூலம் நன்கு வெளிப்படுகிறது சேகரிக்க முடியும் (2013) , சீன அரசாங்கம் தணிக்கை ஆராய்ச்சி.

சீனாவில் சமூக ஊடக பதிவுகள் பல்லாயிரக்கணக்கான மக்கள் அடங்கும் என்று கருதப்படுகிறது என்று ஒரு மகத்தான அரச இயந்திரத்தை மூலம் தணிக்கை செய்யப்பட்டுள்ளன. ஆராய்ச்சியாளர்கள் மற்றும் குடிமக்கள், எனினும், இந்த தணிக்கைகள் உள்ளடக்கத்தை சமூக ஊடக இலிருந்து அழிக்கப்பட வேண்டும் என்ன முடிவு எப்படி சிறிய உணர்வு வேண்டும். சீன அறிஞர்கள் உண்மையில் முரண்பட்ட எதிர்பார்ப்புகளை பதிவுகள் வகையான நீக்கப்படும் பெரும்பாலும் இது பற்றி வேண்டும். சில தணிக்கைகள் மற்றவர்கள் அவர்கள் கூட்டு நடத்தை ஊக்குவிக்கும் என்று பதிவுகள் போன்ற எதிர்ப்புக்கள் கவனம் யோசிக்கும் போது மாநில முக்கியமானதாக இருக்கும் பதிவுகள் கவனம் செலுத்த வேண்டும் என்று நான் நினைக்கிறேன். இந்த எதிர்பார்ப்புகளை சரியான இது கண்டறிவதன் ஆராய்ச்சியாளர்கள் சீனா மற்றும் தணிக்கை ஈடுபடும் மற்ற எதேச்சாதிகார அரசாங்கங்கள் புரிந்து எப்படி வழிவகுக்கிறது. எனவே, கிங் மற்றும் சக வெளியிடப்பட்ட அதன் பின், வெளியிடப்பட்ட மற்றும் இல்லை என்று நீக்கப்பட்ட பதிவுகள் நீக்கப்பட்டன பதிவுகள் ஒப்பிட்டு வேண்டும்.

இந்த பதிவுகள் சேகரித்தல் தொடர்புடைய பதிவுகள் வெவ்வேறு பக்கம் அமைப்பு-கிடைப்பது, பின் இது பின்னர் நீக்கப்பட்டன பார்க்க இந்த பதிவுகள் அடைவதை கொண்டு 1,000 க்கும் மேற்பட்ட சீன சமூக ஊடக வலைத்தளங்கள்-ஒவ்வொரு ஊர்ந்து அற்புதமான பொறியியல் சாதனையை சம்பந்தப்பட்ட. பெரிய அளவில் வலை ஊர்ந்து தொடர்புடைய சாதாரண பொறியியல் பிரச்சினைகள் கூடுதலாக, இந்த திட்டம் பல தணிக்கை செய்யப்பட்ட பதிவுகள் 24 மணி நேரத்திற்கும் குறைவாக கீழே எடுக்கப்படும் ஏனெனில் இது மிகவும் வேகமாக இருக்க வேண்டும் என்று சவாலாக இருந்தது. வேறு வார்த்தைகளில் கூறுவதானால், ஒரு மெதுவான கிராலர் தணிக்கைசெய்தனர் என்று பதிவுகள் நிறைய தவற விடும். மேலும், நகர்வுகளில் சமூக ஊடக வலைத்தளங்கள் அணுகலை தடுக்க அல்லது இல்லையெனில் ஆய்வு பதில் தங்கள் கொள்கைகளை மாற்ற போகின்றீர் கண்டறிதல் தவிர்த்துவிட்டு, அனைத்து இந்த தரவு சேகரிப்பு செய்ய வேண்டியிருந்தது.

இந்த மகத்தான பொறியியல் பணி நிறைவடைந்த பின்னர், கிங் மற்றும் சக முன் குறிப்பிட்ட உணர்திறன் தங்கள் எதிர்பார்க்கப்படுகிறது நிலை அடிப்படையில் என்று 85 வெவ்வேறு தலைப்புகளில் சுமார் 11 மில்லியன் பதிவுகள் பெற்றிருந்தனர். உதாரணமாக, அதிக உணர்திறன் ஒரு தலைப்பு ஆயி Weiwei, அதிருப்தியடைந்த கலைஞர்; நடுத்தர உணர்திறன் ஒரு தலைப்பை பாராட்டு மற்றும் சீன நாணயம் மதிப்பிறக்கம், மற்றும் குறைந்த உணர்திறன் ஒரு தலைப்பை உலக கோப்பை ஆகும். இந்த 11 மில்லியன் பதிவுகள் சுமார் 2 மில்லியன் தணிக்கை செய்யப்பட்ட இருந்த, ஆனால் மிகவும் தலைப்புகளில் பதிவுகள் நடுத்தர மற்றும் குறைந்த உணர்திறன் தலைப்புகளில் பதிவுகள் விட சற்று அடிக்கடி தணிக்கைக்கு உட்படுத்தப்பட்டன. வேறு வார்த்தைகளில் கூறுவதானால், சீன தணிக்கைகள் உலக கோப்பை குறிப்பிடுகிறார் என்று ஒரு பதவியை ஆயி Weiwei குறிப்பிடுகிறார் என்று ஒரு பதவியை தணிக்கை செய்ய பற்றி நினைத்திருக்கக் கூடும். இந்த கண்டுபிடிப்புகள் அரசு முக்கிய தலைப்புகளில் அனைத்து பதிவுகள் தணிக்கை என்று எளிமையான யோசனை பொருந்தவில்லை.

தலைப்பு தணிக்கை விகிதம் இந்த எளிய கணக்கீடு எனினும், தவறான இருக்க முடியும். உதாரணமாக, அரசாங்கத்தின் ஆயி Weiwei ஆதரவாக உள்ளனர் என்று, ஆனால் அவரைப் பற்றித் என்று பதிவுகள் விட்டு பதிவுகள் தணிக்கை கூடும். இன்னும் கவனமாக பதிவுகள் வேறுபடுத்தி பொருட்டு, ஆராய்ச்சியாளர்கள் ஒவ்வொரு பதவியை உணர்வு அளவிட வேண்டும். எனவே, அது பற்றி யோசிக்க ஒரு வழி உள்ளது ஒவ்வொரு பதவியை ஒரு முக்கிய உள்ளுறை அம்சம் உள்ள ஒவ்வொரு இடுகையின் உணர்வு என்று. துரதிருஷ்டவசமாக, அந்த வேலை போதிலும், முன் இருக்கும் அகராதிகள் பயன்படுத்தி உணர்வு கண்டறிதல் முழுமையாக தானியங்கி முறைகள் இன்னும் பல சூழ்நிலைகளில் மிகவும் நல்லது (பிரிவு 2.3.2.6 இருந்து செப்டம்பர் 11, 2001 ஒரு உணர்ச்சி காலவரிசை உருவாக்குவதில் பிரச்சினைகள் திரும்ப நினைத்தால்). எனவே, கிங் மற்றும் சக ஊழியர்கள் 1 இருந்தன என்பதை) மாநில கண்டிக்கின்ற தங்கள் 11 மில்லியன் சமூக ஊடக பதிவுகள் லேபிள் ஒரு வழி தேவை, 2) மாநில, அல்லது 3) நிகழ்வுகள் பற்றி பொருத்தமற்ற அல்லது உண்மை அறிக்கைகளின் ஆதரவு. இந்த ஒரு பாரிய வேலை போல் தெரிகிறது, ஆனால் அவர்கள் ஒரு சக்தி வாய்ந்த தந்திரம் பயன்படுத்தி அது தீர்க்கப்பட; தரவு அறிவியல் பொதுவான ஆனால் தற்போது ஒப்பீட்டளவில் சமூக அறிவியலில் அரிதாக உள்ளது என்று ஒரு.

முதல், ஒரு படி பொதுவாக முன் செயலாக்கம் என்று, ஆராய்ச்சியாளர்கள் ஒவ்வொரு ஆவணம் ஒரு வரிசையில் மற்றும் பிந்தைய ஒரு குறிப்பிட்ட சொல் கொண்டிருந்தது என்பதை பதிவு ஒரு பத்தியில் அங்கு இருந்த ஒரு ஆவணம் கால அணி, ஒரு சமூக ஊடக பதிவுகள் மாற்றப்படுகிறது (எ.கா., எதிர்ப்பு, முதலியன) போக்குவரத்து. அடுத்து, ஆராய்ச்சி உதவியாளர்கள் ஒரு குழு பதவியை ஒரு மாதிரி உணர்வுகளை கை பெயரிடப்பட்ட. பின்னர், கிங் மற்றும் சக அதன் பண்புகள் அடிப்படையில் ஒரு பதவியை உணர்வுகளை உய்த்துணர முடியும் என்று ஒரு இயந்திர கற்றல் மாதிரி மதிப்பிட இந்த கை-பெயரிடப்பட்ட தரவு பயன்படுத்தப்பட்டது. இறுதியாக, அவர்கள் அனைத்து 11 மில்லியன் பதிவுகள் உணர்வை மதிப்பிட இந்த இயந்திர கற்றல் மாதிரி பயன்படுத்தப்படும். இவ்வாறு, கைமுறையாக படித்து விட மற்றும் பெயரிடல் 11 மில்லியன் பதிவுகள் (தளவாட இயலாது என்று), அவர்கள் கைமுறையாக பதிவுகள் ஒரு சிறிய எண்ணிக்கையிலான பெயரிடப்பட்ட பின்னர் விஞ்ஞானிகள் அனைத்து பதிவுகள் பிரிவுகள் மதிப்பிட மேற்பார்வையில் கற்றலில் என்று அழைக்கிறோம் தரவு பயன்படுத்தப்பட்டது. இந்த ஆய்வு முடித்த பிறகு, கிங் மற்றும் சக சற்றே ஆச்சரியமான, ஒரு பதவியை நிகழ்தகவு அது மாநில விமர்சிக்கும் அல்லது மாநில ஆதரவாக இருந்தது என்பதை தொடர்பில்லாமல் இருந்தது நீக்கப்படுகின்றன, அந்த முடிவுக்கு முடிந்தது.

படம் 2.3: கிங், பான் பயன்படுத்தப்படும் செயல்முறை எளிமைப்படுத்தப்பட்ட திட்ட, மற்றும் ராபர்ட்ஸ் (2013) 11 மில்லியன் சீன சமூக ஊடக பதிவுகள் உணர்வுகளை திட்டமிடவும் வேண்டும். முதல், ஒரு படி பொதுவாக முன் செயலாக்கம் என்று, ஆராய்ச்சியாளர்கள் ஒரு ஆவணம் கால அணி சமூக ஊடக பதிவுகள் மாற்றப்படுகிறது (மேலும் தகவலுக்கு இறுக்கமானதாக மற்றும் ஸ்டீவர்ட் (2013) பார்க்க). இரண்டாவது, ஆராய்ச்சியாளர்கள் பதிவுகள் ஒரு சிறிய மாதிரி உணர்வு கை குறியீட்டு. மூன்றாவது, ஆராய்ச்சியாளர்கள் பதிவுகள் உணர்வை வகைப்படுத்த கண்காணிக்கப்படும் கற்றல் மாதிரி பயிற்சி. நான்காம், ஆராய்ச்சியாளர்கள் அனைத்து பதிவுகள் உணர்வை மதிப்பிட மேற்பார்வையில் கற்றலில் மாதிரி பயன்படுத்தப்படும். ஒரு விரிவான விளக்கம் கிங், பான், மற்றும் ராபர்ட்ஸ் (2013), இணைப்பு B பார்க்கவும்.

படம் 2.3: பயன்படுத்தப்படும் செயல்முறை எளிமைப்படுத்தப்பட்ட திட்ட King, Pan, and Roberts (2013) 11 மில்லியன் சீன சமூக ஊடக பதிவுகள் உணர்வுகளை திட்டமிடவும் வேண்டும். முதல், ஒரு படி பொதுவாக முன் செயலாக்கம் என்று, ஆராய்ச்சியாளர்கள் ஒரு ஆவணம் கால அணி சமூக ஊடக பதிவுகள் மாற்றப்படுகிறது (பார்க்க Grimmer and Stewart (2013) மேலும் தகவலுக்கு). இரண்டாவது, ஆராய்ச்சியாளர்கள் பதிவுகள் ஒரு சிறிய மாதிரி உணர்வு கை குறியீட்டு. மூன்றாவது, ஆராய்ச்சியாளர்கள் பதிவுகள் உணர்வை வகைப்படுத்த கண்காணிக்கப்படும் கற்றல் மாதிரி பயிற்சி. நான்காம், ஆராய்ச்சியாளர்கள் அனைத்து பதிவுகள் உணர்வை மதிப்பிட மேற்பார்வையில் கற்றலில் மாதிரி பயன்படுத்தப்படும். பார்க்க King, Pan, and Roberts (2013) ஒரு கூடுதல் தகவல்களுக்கு, இணைப்பு B.

, ஆபாசம் தணிக்கைகள் விமர்சனம், மற்றும் கூட்டு நடவடிக்கை சாத்தியம் என்று அந்த (அதாவது, பெரிய அளவிலான ஏற்படுத்தியது சாத்தியம்): இறுதியில், கிங் மற்றும் சக பதிவுகள் மட்டும் மூன்று வகையான வழக்கமாக தணிக்கைசெய்தனர் என்று கண்டுபிடிக்கப்பட்டது. நீக்கப்படவில்லை என்று நீக்கப்பட்ட மற்றும் பதிவுகள் என்று பதிவுகள் ஒரு பெரிய எண் கவனிப்பதன் மூலம், கிங் மற்றும் சக தணிக்கைகள் பார்த்து எண்ணி தான் வேலை எப்படி அறிய முடிந்தது. தொடர்ந்த ஆராய்ச்சி, அவர்கள் உண்மையில் நேரடியாக சீன சமூக ஊடக சுற்றுச்சூழல் தணிக்கை செய்யப்பட்ட செய்து முறையாக வேறுபட்ட உள்ளடக்கத்தை மற்றும் அளவிடுதல் ஆகியவற்றுடன் பதிவுகள் உருவாக்குவதன் மூலம் தலையிட்டு (King, Pan, and Roberts 2014) . நாம் புத்தகம் முழுவதும் ஏற்படும் என்று ஒரு தீம் foreshadowing, பாடம் 4. மேலும் உள்ள சோதனை அணுகுமுறைகள் பற்றி மேலும் அறிய, இந்த உள்ளுறை பண்பு அனுமானம் பிரச்சினைகள்-சில நேரங்களில் தீர்த்துவிட முடியும் மேற்பார்வையில் கற்றலில்-திரும்ப சமூக ஆராய்ச்சி மிகவும் பொதுவான இருக்க வேண்டும் டிஜிட்டல் வயது. நீங்கள் (வெகுஜன கூட்டு) படம் அத்தியாயங்கள் 3 (கேள்வியும் கேட்காமல்) மற்றும் 5 ல் 2.3 படங்கள் மிகவும் ஒத்த பார்ப்போம்; அது பல அத்தியாயங்களில் தோன்றும் சில கருத்துக்கள் ஒன்றாகும்.

இந்த உதாரணங்கள்-நியூயார்க் டாக்சி டிரைவர்கள், மாணவர்கள் மூலம் நட்பு உருவாக்கம், மற்றும் உற்றுநோக்கல் தரவு ஒப்பீட்டளவில் எளிதான எண்ணும் தத்துவார்த்த கணிப்புகள் சோதிக்க ஆராய்ச்சியாளர்கள் செயல்படுத்த முடியும் என்று சீன அரசாங்கம்-நிகழ்ச்சியின் சமூக ஊடக தணிக்கை நடத்தை வேலை நடத்தை அனைத்து மூன்று. சில சந்தர்ப்பங்களில், பெரிய தரவு நீங்கள் ஒப்பீட்டளவில் நேரடியாக இந்த எண்ணுவோம்.சிறிது (நியூயார்க் டாக்சிகள் வழக்கில் போன்ற) செயல்படுத்துகிறது. மற்ற நேரங்களில், ஆராய்ச்சியாளர்கள், அவர்களின் சொந்த உற்றுநோக்கல் தரவு சேகரிக்க (சீன தணிக்கை வழக்கில் போன்ற) வேண்டும்; (நெட்வொர்க் பரிணாம வளர்ச்சி வழக்கில் போன்ற) ஒன்றாக தரவு ஒன்றிணைப்பதன் மூலம் முற்றுப்பெறாத சமாளிக்க; அல்லது (சீன தணிக்கை வழக்கில் போன்ற) உள்ளுறை-பண்பின் அனுமானம் சில வடிவத்தில் நிகழ்ச்சி. நான் நம்புகிறேன் இந்த உதாரணங்கள் சுவாரஸ்யமான கேள்விகளை கேட்க முடியும் என்று ஆராய்ச்சியாளர்கள், பெரிய பெரிய கூடங்களை, காட்ட.