5.2.2 ฝูงชนการเข้ารหัสของแถลงการณ์ทางการเมือง

Coding แถลงการณ์ทางการเมืองสิ่งที่มักจะทำโดยผู้เชี่ยวชาญสามารถดำเนินการโดยโครงการการคำนวณของมนุษย์ที่เกิดขึ้นในการทำสำเนาและมีความยืดหยุ่นมากขึ้น

คล้ายกับสวนสัตว์กาแล็กซี่มีหลาย ๆ สถานการณ์ที่นักวิจัยทางสังคมต้องการรหัสจำแนกหรือฉลากภาพหรือชิ้นส่วนของข้อความ ตัวอย่างของชนิดของงานวิจัยนี้คือการเข้ารหัสของแถลงการณ์ทางการเมือง ในช่วงการเลือกตั้งพรรคการเมืองแถลงนโยบายอธิบายตำแหน่งนโยบายและปรัชญาแนวทาง ยกตัวอย่างเช่นที่นี่เป็นชิ้นส่วนของแถลงการณ์ของพรรคแรงงานในสหราชอาณาจักรในปี 2010 นี้:

"คนหลายล้านคนที่ทำงานในการให้บริการสาธารณะของเรารวบรวมค่าที่ดีที่สุดของสหราชอาณาจักรช่วยเพิ่มขีดความสามารถคนที่จะทำให้มากที่สุดของชีวิตของตัวเองในขณะที่ปกป้องพวกเขาจากความเสี่ยงที่พวกเขาไม่ควรจะต้องทนอยู่กับพวกเขาเอง เพียงเท่านี้เราจะต้องมีความโดดเด่นยิ่งขึ้นเกี่ยวกับบทบาทของรัฐบาลในการทำตลาดทำงานอย่างเป็นธรรมที่เรายังจำเป็นที่จะต้องปฏิรูปตัวหนาของรัฐบาล. "

แถลงการณ์เหล่านี้มีข้อมูลที่มีคุณค่าสำหรับนักวิทยาศาสตร์ทางการเมืองโดยเฉพาะอย่างยิ่งการเลือกตั้งการศึกษาและการเปลี่ยนแปลงของการอภิปรายนโยบาย เพื่อให้ระบบการดึงข้อมูลจากแถลงการณ์เหล่านี้นักวิจัยสร้าง แถลงการณ์โครงการ ซึ่งจัดนักรัฐศาสตร์รหัส 4,000 แถลงการณ์จากเกือบ 1,000 ฝ่ายใน 50 ประเทศทั่วโลก ประโยคในแต่ละแถลงการณ์แต่ละคนได้รับการเขียนโดยผู้เชี่ยวชาญโดยใช้รูปแบบ 56 หมวดหมู่ ผลมาจากความพยายามร่วมกันครั้งนี้เป็นชุดข้อมูลขนาดใหญ่สรุปข้อมูลที่ฝังอยู่ในแถลงการณ์เหล่านี้และชุดนี้ได้ถูกนำมาใช้ในกว่า 200 เอกสารทางวิทยาศาสตร์

เคนเน็ ธ เบอนัวต์และเพื่อนร่วมงาน (2015) ตัดสินใจที่จะใช้งานการเข้ารหัสแถลงการณ์ที่ได้รับก่อนหน้านี้ดำเนินการโดยผู้เชี่ยวชาญและทำให้มันกลายเป็นโครงการการคำนวณของมนุษย์ เป็นผลให้พวกเขาสร้างกระบวนการการเข้ารหัสที่มีความสามารถทำซ้ำได้มากขึ้นและมีความยืดหยุ่นมากขึ้นไม่ต้องพูดถึงราคาถูกกว่าและเร็วขึ้น

การทำงานกับ 18 manifestos สร้างขึ้นในระหว่างหกเลือกตั้งที่ผ่านมาในสหราชอาณาจักร, เบอนัวต์และเพื่อนร่วมงานที่ใช้แยกสมัคร-รวมกลยุทธ์กับแรงงานจากตลาดแรงงานไมโครงาน (Amazon วิศวกรรมเติร์กและ CrowdFlower เป็นตัวอย่างของตลาดแรงงานไมโครงาน; สำหรับข้อมูลเพิ่มเติม ในตลาดแรงงานไมโครงานโปรดดูบทที่ 4) นักวิจัยเอาแต่ละแถลงการณ์และแยกลงในประโยค ถัดไปคะแนนของมนุษย์ถูกนำไปใช้แต่ละประโยค โดยเฉพาะอย่างยิ่งถ้าประโยคที่เกี่ยวข้องกับการแถลงนโยบายก็เป็นรหัสพร้อมสองมิติ: เศรษฐกิจ (จากซ้ายไปมากมากขวา) และสังคม (จากเสรีนิยมอนุรักษ์นิยม) (รูปที่ 5.5) แต่ละประโยคที่ถูกเขียนโดยประมาณ 5 คนที่แตกต่างกัน ในที่สุดการจัดอันดับเหล่านี้มารวมกันโดยใช้แบบจำลองทางสถิติที่คิดเป็นผลกระทบทั้งผู้ประเมินบุคคลและความยากลำบากของผลกระทบประโยค ในทุกเบอนัวต์และเพื่อนร่วมงานที่เก็บรวบรวม 200,000 การให้คะแนนจากประมาณ 1,500 คนงาน

รูปที่ 5.5: การเข้ารหัสรูปแบบจากเบอนัวต์, et al (2015) (รูปที่ 1)

รูปที่ 5.5: การเข้ารหัสรูปแบบจาก Benoit et al. (2015) (รูปที่ 1)

เพื่อประเมินคุณภาพของการเข้ารหัสฝูงชน, เบอนัวต์และเพื่อนร่วมงานยังมีประมาณ 10 ผู้เชี่ยวชาญอาจารย์และนักศึกษาระดับบัณฑิตศึกษาในรัฐศาสตร์อัตรา manifestos เดียวกันโดยใช้ขั้นตอนที่คล้ายกัน แม้ว่าการให้คะแนนจากสมาชิกของฝูงชนที่มีตัวแปรมากขึ้นกว่าการจัดอันดับจากผู้เชี่ยวชาญที่ให้คะแนนฉันทามติฝูงชนที่มีข้อตกลงที่โดดเด่นด้วยการให้คะแนนฉันทามติผู้เชี่ยวชาญ (รูปที่ 5.6) การเปรียบเทียบนี้แสดงให้เห็นว่าเช่นเดียวกับสวนสัตว์ Galaxy โครงการการคำนวณของมนุษย์สามารถให้ผลลัพธ์ที่มีคุณภาพสูง

รูปที่ 5.6: ประมาณการของผู้เชี่ยวชาญ (แกน x) และประมาณการฝูงชน (แกน y) อยู่ในข้อตกลงที่น่าทึ่งเมื่อการเข้ารหัส 18 แถลงการณ์พรรคจากสหราชอาณาจักร (เบอนัวต์ et al, 2015). แถลงการณ์รหัสการมาจากสามฝ่ายการเมือง (หัวโบราณแรงงานเสรีนิยมพรรคประชาธิปัตย์) และหกเลือกตั้ง (1987, 1992 ปี 1997 ปี 2001 ปี 2005 2010)

รูปที่ 5.6: ประมาณการของผู้เชี่ยวชาญ (แกน x) และประมาณการฝูงชน (แกน y) อยู่ในข้อตกลงที่น่าทึ่งเมื่อการเข้ารหัส 18 แถลงการณ์พรรคจากสหราชอาณาจักร (Benoit et al. 2015) แถลงการณ์รหัสการมาจากสามฝ่ายการเมือง (หัวโบราณแรงงานเสรีนิยมพรรคประชาธิปัตย์) และหกเลือกตั้ง (1987, 1992 ปี 1997 ปี 2001 ปี 2005 2010)

อาคารในผลนี้เบอนัวต์และเพื่อนร่วมงานที่ใช้ระบบการเข้ารหัสฝูงชนของพวกเขาในการทำวิจัยที่เป็นไปไม่ได้กับโครงการประกาศ ตัวอย่างเช่นโครงการแถลงการณ์ไม่ได้รหัสแถลงการณ์ในหัวข้อของการอพยพเพราะนั่นคือไม่ได้เป็นหัวข้อเด่นเมื่อโครงการการเข้ารหัสได้รับการพัฒนาในช่วงกลางทศวรรษที่ 1980 และในจุดนี้มันเป็นไปไม่ logistically โครงการประกาศจะกลับไปอีกครั้งรหัสแถลงการณ์ของพวกเขาในการจับภาพข้อมูลนี้ ดังนั้นก็จะปรากฏว่านักวิจัยสนใจศึกษาการเมืองของตรวจคนเข้าเมืองจะออกจากโชค อย่างไรก็ตามเบอนัวต์และเพื่อนร่วมงานก็สามารถที่จะใช้ระบบการคำนวณมนุษย์ของพวกเขาจะทำเช่นนี้การเข้ารหัสที่กำหนดเองเพื่อการวิจัยของพวกเขาคำถามอย่างรวดเร็วและง่ายดาย

เพื่อที่จะศึกษานโยบายการอพยพพวกเขารหัส manifestos สำหรับแปดฝ่ายในการเลือกตั้งในสหราชอาณาจักร 2010 ประโยคในแต่ละแถลงการณ์แต่ละคนถูกกำหนดเป็นไปได้ว่ามันเกี่ยวข้องกับการตรวจคนเข้าเมืองและถ้าเป็นเช่นนั้นไม่ว่าจะเป็นโปรตรวจคนเข้าเมืองที่มีความเป็นกลางหรือป้องกันการตรวจคนเข้าเมือง ภายในระยะเวลา 5 ชั่​​วโมงของการเปิดตัวโครงการของพวกเขาผลที่อยู่ใน. พวกเขาได้รวบรวมมากกว่า 22,000 คำตอบที่ค่าใช้จ่ายรวมของ $ 360 นอกจากนี้การประมาณการจากฝูงชนที่แสดงให้เห็นว่าข้อตกลงที่โดดเด่นด้วยการสำรวจก่อนหน้านี้ของผู้เชี่ยวชาญ จากนั้นเป็นแบบทดสอบสุดท้ายสองเดือนต่อมานักวิจัยทำซ้ำฝูงชนการเข้ารหัสของพวกเขา ภายในไม่กี่ชั่วโมงพวกเขาได้สร้างชุดข้อมูลที่ฝูงชนที่ใช้รหัสใหม่ที่ตรงกับฝูงชนอย่างใกล้ชิดรหัสข้อมูลชุดเดิม ในคำอื่น ๆ การคำนวณของมนุษย์ช่วยให้พวกเขาในการสร้างการเข้ารหัสของตำราทางการเมืองที่เห็นด้วยกับการประเมินของผู้เชี่ยวชาญและทำซ้ำได้ นอกจากนี้เนื่องจากการคำนวณของมนุษย์ได้อย่างรวดเร็วและราคาถูกมันเป็นเรื่องง่ายสำหรับพวกเขาในการปรับแต่งการเก็บรวบรวมข้อมูลของพวกเขากับคำถามการวิจัยของพวกเขาเกี่ยวกับการตรวจคนเข้าเมืองที่เฉพาะเจาะจง