2.4.1.3 БНХАУ-ын Засгийн газраас нийгмийн хэвлэл мэдээллийн Цензур

Судлаачид цензур судлах Хятадын нийгмийн хэвлэл мэдээллийн сайтуудыг хусах. Тэд далд-шинж чанар гаргалгаа нь дутсан нь хандсан.

Өмнөх хоёр жишээн дээр ашигласан том мэдээллээс гадна, судлаачид өөрсдийн ажиглалтын мэдээ, гайхалтай Гари хаан, Женнифер тогоо, болон Molly Робертс "харж байхад цуглуулж болно (2013) БНХАУ-ын Засгийн газраас хяналт судалгаа.

БНХАУ-ын Нийгмийн мэдээллийн хэрэгсэл бичлэг ард түмний хэдэн арван мянган оруулах гэж бодож байна асар их төрийн аппаратаар цензур байна. Судлаачид, иргэд, Гэсэн хэдий ч эдгээр мэдээллийн орчноос агуулга нь олон нийтийн мэдээллийн хэрэгслээр хасагдах ёстой юу яаж шийдэх бага мэдрэмжийг байна. БНХАУ-ын эрдэмтэд нь үнэндээ аль-ий тухай бичлэг төрлийн устгасан авах хамгийн их магадлалтай байдаг зөрчилдөөнтэй хүлээлт байна. Зарим цензур зарим нь ийм эсэргүүцлийн талаар хамтын ажиллагааг дэмжих бичлэг анхаарлаа хандуулах гэж бодож байна, харин төрийн чухал байдаг бичлэг анхаарлаа хандуулах гэж бодож байна. Энэ хүлээлт нь зөв юм гарч мэдэх судлаачид Хятад, хяналт оролцох бусад захиргаадалтын засгийн газрыг хэрхэн ойлгох нь ач холбогдолтой юм. Тиймээс Хаан болон хамт хэвлэн нийтэлж, дараа нь юм нийтэлж, хэзээ ч байсан устгасан бичлэг устгагдсан бичлэгүүдийг харьцуулах хүссэн юм.

Эдгээр бичлэгүүдийг цуглуулах холбогдох бичлэгүүдийг өөр хуудсанд байрлал-олж, дараа нь дараа нь устгагдах байсан нь харахын тулд эдгээр бичлэгүүдийг revisiting нь 1000-аас дээш Хятадын нийгмийн хэвлэл мэдээллийн вэб сайт, тус бүр мөлхөж гайхалтай инженерийн амжилтаа оролцсон. том хэмжээний вэб мөлхөж холбоотой хэвийн инженерийн асуудлын гадна энэ төсөл учраас олон цензур бичлэгүүд нь 24-аас доошгүй цагийн дотор доош авсан байна энэ нь маш хурдан байх хэрэгтэй нэмж сорилт байсан. Өөрөөр хэлбэл, удаан гинжит цензур байсан бичлэг маш их санаж байна. Цаашилбал, мөлхөгчид нийгмийн хэвлэл мэдээллийн вэб сайт судалгааны хариуд нь тэдний бодлогыг өөрчлөх хандалтыг хаах, эсвэл өөрөөр вий илрүүлэх гэтлэн бол энэ бүх мэдээлэл цуглуулах хийх байсан юм.

Энэ их хэмжээний инженерийн ажил дууссан дараа хаан болон түүний хамтрагчид урьдчилан заасан мэдрэмтгий тэдний хүлээгдэж буй түвшинд үндэслэн байсан 85 өөр өөр сэдвээр 11 орчим сая бичлэгүүдийг олж авсан байв. Жишээ нь, өндөр мэдрэмтгий сэдэв Ai Weiwei, тэрс үзэлтэн зураач юм; дунд эмзэг сэдэв чангаралт, Хятадын валютын ханшны бууралт юм, бага эмзэг сэдэв ДАШТ юм. Эдгээр 11 сая бичлэг 2 сая орчим цензур байсан ч маш эмзэг сэдвээр бичлэг, дунд, бага мэдрэмжийн сэдвээр бичлэг бодвол бага зэрэг л илүү их цензур байсан. Өөрөөр хэлбэл, Хятадын цензур Ai Weiwei Дэлхийн цомын дурдсан бичлэг гэж дурдсан нь бичлэгийг тавихыг тухай гэх мэт магадлалтай. Эдгээр үр дүнг Засгийн газрын эмзэг сэдвүүдээр-ий бүх бичлэгүүдийг хянаж байна гэсэн хялбаршуулсан санаа таарахгүй байна.

сэдвийн хамт цензур ханш Энэ хялбар тооцоо Гэсэн хэдий ч буруу байж болох юм. Жишээ нь, Засгийн газар Ai Weiwei дэмжиж байгаа, гэхдээ түүнд чухал байдаг бичлэгүүдийг орхиж бичлэгүүдийг тавихыг байж болох юм. Илүү их анхааралтай бичлэг ялгахын тулд судлаачид шуудангаар бүрийн зүйлийг хэмжих хэрэгтэй. Тиймээс энэ талаар бодож нэг арга юм шуудангаар тус бүр нэг чухал далд онцлог нь шуудангаар бүрийн ухамсар юм. Харамсалтай нь, их ажил байгаа ч, өмнө нь байсан толь ашиглан үзэл илрүүлэх бүрэн автомат аргууд нь одоо ч гэсэн тийм ч олон нөхцөл байдалд маш сайн байна (Section 2.3.2.6-аас есдүгээр сарын 11, 2001 нь сэтгэл санааны цагийн хуваарийг бий болгох асуудлыг эргэж боддог). Тиймээс Хаан болон түүний хамтрагчид тэд 1-р байдалд чухал байсан эсэх) зэрэг нь тэдний 11 сая нь нийгмийн хэвлэл мэдээллийн бичлэгүүдийг хаяглах арга замыг шаардлагатай, 2) төрийн, эсвэл 3) үйл явдлын талаар хамааралгүй, эсвэл баримт тайлан нь дэмжсэн. Энэ нь асар их ажил шиг сонсогдож байна, гэхдээ тэдгээр нь хүчтэй үүнийг ашиглан үүнийг шийдвэрлэж, мэдээллийн шинжлэх ухааны нийтлэг боловч нийгмийн шинжлэх ухааны чиглэлээр одоогоор харьцангуй ховор байдаг нэг юм.

Нэгдүгээрт, алхам ихэвчлэн урьдчилан боловсруулах гэж нэрлэдэг, судлаачид баримт бичиг хугацааны матриц, баримт бичиг тус бүр нэг эгнээ болон дараах тодорхой үгийг агуулсан эсэхийг бүртгэж нэг багана нь байсан болгон нийгмийн хэвлэл мэдээллийн бичлэгүүдийг хөрвүүлсэн (жишээ нь, эсэргүүцлийн, замын хөдөлгөөний гэх мэт). Дараа нь, эрдэм шинжилгээний туслах бүлэг албан тушаалд нь дээж зүйлийг гараар тэмдэглэсэн. Дараа нь хаан болон түүний хамтрагчид түүний шинж чанар дээр үндэслэн Шуудангаар зүйлийг хэлж болох машин сургалтын загвар тооцоолох энэ гар тэмдэглэсэн мэдээллийг ашигласан. Эцэст нь, тэд бүгд 11 сая бичлэгүүдийг зүйлийг тооцох энэ машин сургалтын загварыг ашигласан байна. Тиймээс гараар уншиж, хаяглах 11 сая бичлэг (-техникийн боломжгүй байх нь) биш харин тэд гараар бичлэг нь цөөн тооны шийддэг болон хаяглагдсан болон дараа нь ямар мэдээлэл эрдэмтэд бүх албан тушаалын зэрэглэлийг тооцох хяналттай суралцах гэж нэрлэдэг байв ашигласан байна. Энэ шинжилгээ хийсний дараа хаан болон түүний хамтрагчид зарим гайхалтай, бичлэг магадлал устгасан байгаа нь төрийн чухал, эсвэл төрийн дэмжлэг байсан эсэхийг холбоогүй байсан гэж дүгнэж чадсан юм.

Зураг 2.3: Хаан, Pan ашигласан процедурын хувьд хялбаржуулсан бүдүүвч болон Робертс (2013) 11 сая нь Хятадын нийгмийн хэвлэл мэдээллийн бичлэгүүдийг зүйлийг тооцох юм. Нэгдүгээрт, алхам ихэвчлэн урьдчилан боловсруулах гэж нэрлэдэг, судлаачид баримт бичиг хугацааны матриц болгон нийгмийн хэвлэл мэдээллийн бичлэгүүдийг хөрвүүлсэн (Дэлгэрэнгүй мэдээллийг Grimmer болон Stewart (2013) үзнэ үү). Хоёрдугаарт, судлаачид албан тушаалд нь жижиг дээжийг зүйлийг Гар кодлогдсон. Гуравдугаарт, судлаачид албан тушаалын зүйлийг ангилах нь хяналттай сургалтын загвар сургасан. Дөрөвдүгээрт, судлаачид бүх бичлэгүүдийг зүйлийг тооцох хяналттай сургалтын загварыг ашигласан байна. илүү дэлгэрэнгүй мэдээлэл тайлбарыг нь хаан, тогоо, болон Roberts (2013), Хавсралт B үзнэ үү.

Зураг 2.3: ашиглаж процедурын хувьд хялбаржуулсан бүдүүвч King, Pan, and Roberts (2013) 11 сая нь Хятадын нийгмийн хэвлэл мэдээллийн бичлэгүүдийг зүйлийг тооцох юм. Нэгдүгээрт, алхам ихэвчлэн урьдчилан боловсруулах гэж нэрлэдэг, судлаачид баримт бичиг хугацааны матриц болгон нийгмийн хэвлэл мэдээллийн бичлэгүүдийг хөрвүүлсэн (үзнэ үү Grimmer and Stewart (2013) Дэлгэрэнгүй мэдээллийг). Хоёрдугаарт, судлаачид албан тушаалд нь жижиг дээжийг зүйлийг Гар кодлогдсон. Гуравдугаарт, судлаачид албан тушаалын зүйлийг ангилах нь хяналттай сургалтын загвар сургасан. Дөрөвдүгээрт, судлаачид бүх бичлэгүүдийг зүйлийг тооцох хяналттай сургалтын загварыг ашигласан байна. Үзнэ үү King, Pan, and Roberts (2013) илүү дэлгэрэнгүй тайлбарыг Хавсралт Б.

, Цензур нь шүүмжлэл болон порнограф, хамтын ажиллагааны боломж байсан гэж хүмүүс (өөрөөр хэлбэл, томоохон хэмжээний эсэргүүцлийн тэргүүлэх боломж): Эцэст нь хэлэхэд, хаан болон түүний хамтрагчид бичлэг нь зөвхөн гурван төрлийн тогтмол хянаж байна гэдгийг олж мэдсэн. устгагдаагүй байна устгасан болон бичлэгүүд байсан бичлэг нь асар олон тооны ажиглан, хаан болон түүний хамтрагчид мэдээллийн орчноос хэрхэн харж, тоолох зүгээр л ажиллаж сурах боломжтой байв. Дараагийн судалгаагаар, тэдгээр нь яг үнэндээ шууд Хятадын нийгмийн хэвлэл мэдээллийн экосистемийн руу системтэйгээр өөр өөр агуулга, хэмжих цензур авах нь бичлэгүүдийг бий болгох замаар интервенц (King, Pan, and Roberts 2014) . Бид энэ номонд гарч болно сэдвийг үеийг угтан харж, Бүлэг 4. Цаашид дахь туршилтын арга талаар илүү ихийг мэдэх болно, эдгээр далд-шинж чанар дүгнэлт асуудал, заримдаа шийдэж болно хяналттай сургалтын эргэж нийгмийн судалгаа нь маш элбэг байх нь дижитал нас. Та (масс хамтын ажиллагааг бий болгох) зураг маш 5-р бүлэгт 3 (асуулт асуух) ба 2.3 Зураг төстэй харах болно; Энэ нь хэд хэдэн бүлэгт гарч хэд хэдэн санаа нэг юм.

Эдгээр жишээнүүд-Нью-Йорк хотын таксины жолооч, оюутнууд нөхөрлөл үүсэх болон ажиглалтын мэдээллийн харьцангуй энгийн тоолох онолын таамаглал шалгах судлаачдад идэвхжүүлж болно БНХАУ-ын засгийн газрын шоуны нийгмийн хэвлэл мэдээллийн цензур зан ажлын зан бүх гурван. Зарим тохиолдолд том өгөгдөл та (Нью-Йоркийн такси тохиолдолд гэх мэт) харьцангуй шууд энэ тоолох хийх боломжийг олгодог. Бусад тохиолдолд, судлаачид (Хятадын цензур тохиолдолд гэх мэт) өөрсдийн ажиглалтын мэдээллийг цуглуулах хэрэгтэй болно; Хамтдаа мэдээллийг нэгтгэх (сүлжээний хувьслын тохиолдолд гэх мэт) нь дутсан шийдвэрлэх; эсвэл (Хятадын цензур тохиолдолд гэх мэт) далд-шинж чанар гаргалгаа зарим хэлбэрийг хийж. Би найдаж байдлаар эдгээр жишээ нь сонирхолтой асуулт асуух боломжтой судлаачдын том их найдвар төрүүлж, харуулж байна.