5.2.2 ฝูงชนการเข้ารหัสของแถลงการณ์ทางการเมือง

Coding แถลงการณ์ทางการเมืองสิ่งที่มักจะทำโดยผู้เชี่ยวชาญสามารถดำเนินการโดยโครงการการคำนวณของมนุษย์ที่เกิดขึ้นในการทำสำเนาและมีความยืดหยุ่นมากขึ้น

คล้ายกับสวนสัตว์ Galaxy มีหลายกรณีที่นักวิจัยทางสังคมต้องการที่จะจำแนกจัดแบ่งประเภทหรือติดฉลากภาพหรือชิ้นส่วนของข้อความ ตัวอย่างของการวิจัยประเภทนี้คือการเข้ารหัสของ manifestos ทางการเมือง ในระหว่างการเลือกตั้งพรรคการเมืองจะผลิต manifestos อธิบายตำแหน่งทางนโยบายของพวกเขาและแนวทางปรัชญา ตัวอย่างเช่นนี่เป็นส่วนหนึ่งของแถลงการณ์ของพรรคแรงงานในสหราชอาณาจักรตั้งแต่ปีพ. ศ. 2553:

"คนหลายล้านคนที่ทำงานในการให้บริการสาธารณะของเรารวบรวมค่าที่ดีที่สุดของสหราชอาณาจักรช่วยเพิ่มขีดความสามารถคนที่จะทำให้มากที่สุดของชีวิตของตัวเองในขณะที่ปกป้องพวกเขาจากความเสี่ยงที่พวกเขาไม่ควรจะต้องทนอยู่กับพวกเขาเอง เพียงเท่านี้เราจะต้องมีความโดดเด่นยิ่งขึ้นเกี่ยวกับบทบาทของรัฐบาลในการทำตลาดทำงานอย่างเป็นธรรมที่เรายังจำเป็นที่จะต้องปฏิรูปตัวหนาของรัฐบาล. "

manifestos เหล่านี้มีข้อมูลที่มีค่าสำหรับนักวิทยาศาสตร์ทางการเมืองโดยเฉพาะผู้ที่ศึกษาการเลือกตั้งและพลวัตของการอภิปรายนโยบาย เพื่อให้ได้ข้อมูลจาก manifestos เหล่านี้อย่างเป็นระบบนักวิจัยได้สร้าง Manifesto Project ซึ่งรวบรวม manifestos จากเกือบ 1,000 กิจการใน 4 ประเทศ 50 ประเทศและจัดให้นักวิทยาศาสตร์ทางการเมืองจัดระบบรหัสเหล่านี้อย่างเป็นระบบ แต่ละประโยคในแต่ละประโยคถูกเขียนโดยผู้เชี่ยวชาญที่ใช้รูปแบบ 56 หมวดหมู่ ผลของความพยายามร่วมกันนี้เป็นชุดข้อมูลขนาดใหญ่ที่สรุปข้อมูลที่ฝังอยู่ใน manifestos เหล่านี้และชุดข้อมูลนี้ถูกนำมาใช้ในเอกสารทางวิทยาศาสตร์มากกว่า 200 ฉบับ

เคนเน็ ธ เบอนัวต์และเพื่อนร่วมงาน (2016) ตัดสินใจที่จะใช้งานการเขียนโค้ดการแจกแจงซึ่งก่อนหน้านี้ได้ดำเนินการโดยผู้เชี่ยวชาญและทำให้กลายเป็นโครงการคำนวณของมนุษย์ เป็นผลให้พวกเขาสร้างกระบวนการเข้ารหัสที่ทำซ้ำได้มากขึ้นและมีความยืดหยุ่นมากขึ้นไม่ต้องพูดถึงราคาถูกและเร็วขึ้น

การทำงานกับ 18 manifestos ที่เกิดขึ้นในระหว่างการเลือกตั้งเมื่อเร็ว ๆ นี้ในสหราชอาณาจักรเบอนัวต์และเพื่อนร่วมงานใช้ยุทธศาสตร์ split-apply-combine กับแรงงานจากตลาดแรงงานขนาดเล็ก (Amazon Mechanical Turk และ CrowdFlower เป็นตัวอย่างของตลาดแรงงานขนาดเล็กสำหรับข้อมูลเพิ่มเติมเกี่ยวกับตลาดดังกล่าว ดูบทที่ 4) นักวิจัยได้แถลงการณ์แต่ละฉบับและ แยกออก เป็นประโยค ถัดไปคน ใช้ รูปแบบการเขียนโปรแกรมสำหรับแต่ละประโยค (ซ้ายหรือขวา) นโยบายทางสังคม (เสรีนิยมหรือหัวโบราณ) หรือไม่ (รูปที่ 5.5) แต่ละประโยคเขียนโดยประมาณห้าคน ในที่สุดการให้คะแนนเหล่านี้ถูก รวมเข้าด้วยกัน โดยใช้แบบจำลองทางสถิติที่มีผลต่อทั้งผลกระทบของแต่ละบุคคลและความยากลำบากของประโยค ในทั้งหมด Benoit และเพื่อนร่วมงานได้รวบรวมการจัดอันดับจากผู้ชมประมาณ 200,000 คน

รูปที่ 5.5: โครงร่างการเข้ารหัสจาก Benoit et al. (2016) ผู้อ่านได้รับการขอให้จัดประเภทประโยคแต่ละข้อตามนโยบายเศรษฐกิจ (ซ้ายหรือขวา) เป็นนโยบายทางสังคม (เสรีนิยมหรือหัวโบราณ) หรือไม่ ดัดแปลงมาจาก Benoit et al. (2016) รูปที่ 1

รูปที่ 5.5: โครงร่างการเข้ารหัสจาก Benoit et al. (2016) ผู้อ่านได้รับการขอให้จัดประเภทประโยคแต่ละข้อตามนโยบายเศรษฐกิจ (ซ้ายหรือขวา) เป็นนโยบายทางสังคม (เสรีนิยมหรือหัวโบราณ) หรือไม่ ดัดแปลงมาจาก Benoit et al. (2016) รูปที่ 1

เพื่อประเมินคุณภาพของการเข้ารหัสข้อมูลเบ็ดเตล็ดเบอนัวต์และเพื่อนร่วมงานก็มีผู้เชี่ยวชาญประมาณ 10 คนและนักศึกษาระดับบัณฑิตศึกษาสาขาวิทยาศาสตร์ทางการเมืองด้วยเช่นกัน แม้ว่าการให้คะแนนจากสมาชิกในกลุ่มต่างๆมีความผันผวนมากกว่าการให้คะแนนจากผู้เชี่ยวชาญการจัดอันดับของกลุ่มผู้ร่วมประชุมมีข้อตกลงที่น่าทึ่งกับการให้คะแนนผู้เชี่ยวชาญด้านความเห็นร่วมกัน (รูปที่ 5.6) การเปรียบเทียบนี้แสดงให้เห็นว่าเช่นเดียวกับ Galaxy Zoo โครงการการคำนวณของมนุษย์สามารถให้ผลลัพธ์ที่มีคุณภาพสูง

รูปที่ 5.6: ค่าประมาณของผู้เชี่ยวชาญ (แกน x) และค่าประมาณของกลุ่ม (แกน y) อยู่ในข้อตกลงที่น่าทึ่งเมื่อเขียนโค้ด manifestos 18 จากสหราชอาณาจักร (Benoit et al. 2016) manifestos รหัสจากสามพรรคการเมือง (หัวโบราณแรงงานและเสรีนิยมเดโมแครต) และหกเลือกตั้ง (2530, 2535, 2540, 2544, 2548 และ 2553) ดัดแปลงมาจาก Benoit et al. (2016), รูปที่ 3

รูปที่ 5.6: ค่าประมาณของผู้เชี่ยวชาญ ( \(x\) -axis) และค่าประมาณของกลุ่ม ( \(y\) -axis) อยู่ในข้อตกลงที่น่าทึ่งเมื่อทำการเข้ารหัส 18 manifestos จากสหราชอาณาจักร (Benoit et al. 2016) manifestos รหัสจากสามพรรคการเมือง (หัวโบราณแรงงานและเสรีนิยมเดโมแครต) และหกเลือกตั้ง (2530, 2535, 2540, 2544, 2548 และ 2553) ดัดแปลงมาจาก Benoit et al. (2016) , รูปที่ 3

จากผลดังกล่าว Benoit และเพื่อนร่วมงานใช้ระบบการเข้ารหัสฝูงชนเพื่อทำวิจัยซึ่งเป็นไปไม่ได้ด้วยระบบการเข้ารหัสที่ใช้โดยผู้เชี่ยวชาญในโครงการ Manifesto ตัวอย่างเช่นโครงการ Manifesto ไม่ได้กำหนดรหัส manifestos ไว้ในหัวข้อเรื่องการย้ายถิ่นฐานเนื่องจากนั่นไม่ใช่หัวข้อสำคัญเมื่อมีการพัฒนารูปแบบการเข้ารหัสในช่วงกลางทศวรรษที่ 1980 และเมื่อมาถึงจุดนี้มันก็เป็นไปไม่ได้ที่ล้นพ้นได้สำหรับโครงการ Manifesto Project เพื่อกลับไปแก้ไขข้อมูล manifestos เพื่อรวบรวมข้อมูลนี้ ดังนั้นจึงปรากฏว่านักวิจัยที่สนใจในการศึกษาเรื่องการเมืองของคนเข้าเมืองก็โชคดี อย่างไรก็ตามเบอนัวต์และเพื่อนร่วมงานสามารถใช้ระบบการคำนวณของมนุษย์เพื่อทำแบบกำหนดเองเพื่อการวิจัยได้อย่างรวดเร็วและง่ายดาย

เพื่อที่จะศึกษานโยบายการอพยพพวกเขาได้จัดทำเป็น manifestos สำหรับแปดพรรคในการเลือกตั้งทั่วไปในสหราชอาณาจักร ประโยคแต่ละประโยคแต่ละฉบับถูกเขียนว่าเกี่ยวข้องกับการอพยพและถ้าเป็นเช่นนั้นไม่ว่าจะเป็นเรื่องการตรวจคนเข้าเมืองการเป็นกลางหรือการต่อต้านการอพยพ ภายใน 5 ชั่วโมงหลังจากเปิดตัวโครงการผลลัพธ์ที่ได้มาพวกเขาได้รวบรวมการตอบสนองมากกว่า 22,000 รายการโดยมีค่าใช้จ่ายทั้งหมด 360 เหรียญ นอกจากนี้ประมาณการจากฝูงชนมีข้อตกลงที่โดดเด่นกับการสำรวจก่อนหน้านี้ของผู้เชี่ยวชาญ จากนั้นเป็นแบบทดสอบขั้นสุดท้ายสองเดือนต่อมานักวิจัยได้ทำซ้ำการเข้ารหัสข้อมูลแบบฝูงชน ภายในเวลาไม่กี่ชั่วโมงพวกเขาได้สร้างชุดข้อมูลแบบฝูงชนใหม่ซึ่งตรงกับชุดข้อมูลที่มีการเข้ารหัสลับแบบเดิมอย่างใกล้ชิด กล่าวอีกนัยหนึ่งการคำนวณของมนุษย์ช่วยให้พวกเขาสร้างรหัสของตำราทางการเมืองที่เห็นด้วยกับการประเมินของผู้เชี่ยวชาญและสามารถทำซ้ำได้ นอกจากนี้เนื่องจากการคำนวณของมนุษย์เป็นไปอย่างรวดเร็วและราคาถูกมันเป็นเรื่องง่ายสำหรับพวกเขาที่จะปรับแต่งการเก็บรวบรวมข้อมูลของพวกเขาเพื่อคำถามการวิจัยเฉพาะของพวกเขาเกี่ยวกับการอพยพ