5.2.2 الحشد الترميز من بياناته السياسية

الترميز بياناته السياسية، القيام بشيء ما عادة من قبل خبراء، يمكن أن يقوم بها مشروع حساب البشري مما يؤدي إلى مزيد من استنساخ والمرونة.

على غرار حديقة حيوانات جالاكسي ، هناك العديد من الحالات التي يرغب فيها الباحثون الاجتماعيون في ترميز أو تصنيف أو تصنيف صورة أو جزء من النص. مثال على هذا النوع من الأبحاث هو ترميز البيانات السياسية. خلال الانتخابات ، تنتج الأحزاب السياسية بيانًا يصف مواقفها السياسية وتوجيه الفلسفات. على سبيل المثال ، هنا جزء من بيان حزب العمل في المملكة المتحدة من عام 2010:

"الملايين من الناس الذين يعملون في الخدمات العامة لدينا تجسد أفضل القيم لبريطانيا، مما يساعد تمكين الناس من الاستفادة القصوى من حياتهم الخاصة وحمايتها من المخاطر التي لا ينبغي أن تحمل من تلقاء نفسها. وكما أننا بحاجة إلى أن تكون أكثر جرأة حول دور الحكومة في جعل الأسواق تعمل إلى حد ما، ونحن بحاجة أيضا إلى أن تكون الإصلاحيين جريئة من الحكومة ".

تحتوي هذه البيانات على بيانات قيّمة للعلماء السياسيين ، لا سيما أولئك الذين يدرسون الانتخابات وديناميكيات المناقشات السياسية. من أجل استخراج المعلومات بشكل منهجي من هذه البيانات ، أنشأ الباحثون مشروع البيان ، الذي جمع 4000 بيان من ما يقرب من 1000 طرف في 50 دولة ومن ثم نظّموا علماء سياسيين لتدوينها بشكل منهجي. تم ترميز كل جملة في كل بيان من قبل خبير باستخدام مخطط 56 فئة. نتيجة هذا الجهد التعاوني هو مجموعة بيانات ضخمة تلخص المعلومات المضمنة في هذه البيانات ، وقد تم استخدام مجموعة البيانات هذه في أكثر من 200 ورقة علمية.

قرر كينيث بينوا وزملاؤه (2016) أخذ مهمة الترميز التشكيلي التي سبق أن قام بها الخبراء وتحويلها إلى مشروع حساب بشري. ونتيجة لذلك ، أنشأوا عملية ترميز أكثر قابلية للتكرار وأكثر مرونة ، ناهيك عن أرخص وأسرع.

من خلال العمل مع 18 بيانًا تم إصداره خلال ست انتخابات أخيرة في المملكة المتحدة ، استخدم بينوا وزملاؤه استراتيجية الانقسام المنفصل مع عمال من سوق عمل microtask (أما Amazon Mechanical Turk و CrowdFlower فهي أمثلة على أسواق العمل microtask ؛ للمزيد عن هذه الأسواق ، انظر الفصل 4). أخذ الباحثون كل بيان واقسموه إلى جمل. بعد ذلك ، قام شخص بتطبيق نظام الترميز على كل جملة. على وجه الخصوص ، تمت مطالبة القراء بتصنيف كل جملة على أنها تشير إلى السياسة الاقتصادية (يسارًا أو يمينًا) ، أو إلى السياسة الاجتماعية (الليبرالية أو المحافظة) ، أو إلى أيا منهما (الشكل 5.5). تم ترميز كل جملة من قبل حوالي خمسة أشخاص مختلفين. وأخيرًا ، تم دمج هذه التقديرات باستخدام نموذج إحصائي يمثل كل من التأثيرات الفردية وتأثيرات صعوبة الجملة. وبشكل عام ، جمعت بينوا وزملاؤها 200000 تقدير من حوالي 1500 شخص.

الشكل 5.5: مخطط التشفير من Benoit et al. (2016). وطُلب من القراء تصنيف كل جملة على أنها تشير إلى السياسة الاقتصادية (يسارًا أو يمينًا) ، أو إلى السياسة الاجتماعية (الليبرالية أو المحافظة) ، أو إلى أيا منهما. مقتبس من Benoit وآخرون. (2016) ، الشكل 1.

الشكل 5.5: مخطط التشفير من Benoit et al. (2016) . وطُلب من القراء تصنيف كل جملة على أنها تشير إلى السياسة الاقتصادية (يسارًا أو يمينًا) ، أو إلى السياسة الاجتماعية (الليبرالية أو المحافظة) ، أو إلى أيا منهما. مقتبس من Benoit et al. (2016) ، الشكل 1.

من أجل تقييم جودة ترميز الحشود ، كان لدى بينوا وزملاؤه أيضًا حوالي 10 خبراء - أساتذة وطلاب دراسات عليا في العلوم السياسية - يقدرون نفس البيانات باستخدام إجراء مشابه. على الرغم من أن التصنيفات من أعضاء الحشد كانت أكثر تغيراً من تقديرات الخبراء ، إلا أن تقييم الحشد الإجماعي كان متفوقاً على تقدير الخبير بالإجماع (الشكل 5.6). تظهر هذه المقارنة أنه ، كما هو الحال مع حديقة حيوانات جالاكسي ، يمكن لمشروعات حساب الإنسان أن تنتج نتائج عالية الجودة.

الشكل 5.6: تقديرات الخبراء (المحور x) وتقديرات الحشود (y-axis) كانت في اتفاقية ملحوظة عند تشفير 18 بيانًا رسميًا من المملكة المتحدة (Benoit et al. 2016). وكانت البيانات المشفرة من ثلاثة أحزاب سياسية (حزب المحافظين والعمل والديمقراطيين الليبراليين) وستة انتخابات (1987 و 1992 و 1997 و 2001 و 2005 و 2010). مقتبس من Benoit وآخرون. (2016) ، الشكل 3.

اﻟﺸﻜﻞ 5.6: ﺗﻘﺪﻳﺮات اﻟﺨﺒﺮاء ( \(x\) اﻟﻤﺤﻴﻂ) وﺗﻘﺪﻳﺮات اﻟﺤﺸﻮد ( \(y\) ﻣﻜﺮر) آﺎﻧﺖ ﻓﻲ اﺗﻔﺎق ﻣﻠﺤﻮظ ﻋﻨﺪ ﺗﺮآﻴﺐ 18 ﺑﻴﺎﻧﺎً ﺣﺰﺑﻴﺎً ﻣﻦ اﻟﻤﻤﻠﻜﺔ اﻟﻤﺘﺤﺪة (Benoit et al. 2016) . وكانت البيانات المشفرة من ثلاثة أحزاب سياسية (حزب المحافظين والعمل والديمقراطيين الليبراليين) وستة انتخابات (1987 و 1992 و 1997 و 2001 و 2005 و 2010). مقتبس من Benoit et al. (2016) ، الشكل 3.

وبناءً على هذه النتيجة ، استخدم بينوا وزملاؤه نظام ترميز الحشود لإجراء أبحاث مستحيلة مع نظام الترميز الذي يديره الخبراء والذي يستخدمه مشروع البيان. على سبيل المثال ، لم يشر مشروع البيان إلى البيان المتعلق بموضوع الهجرة لأن ذلك لم يكن موضوعًا بارزًا عندما تم تطوير مخطط التشفير في منتصف الثمانينات. وفي هذه المرحلة ، من غير المنطقي من الناحية اللوجيستية أن يعود مشروع البيان إلى الوراء ويعيد ترتيب بياناته لالتقاط هذه المعلومات. لذلك ، يبدو أن الباحثين المهتمين بدراسة سياسات الهجرة ليسوا محظوظين. ومع ذلك ، كان بينوا وزملاؤه قادرين على استخدام نظام حساب الإنسان الخاص بهم للقيام بهذا الترميز - المخصص لسؤالهم البحثي - بسرعة وسهولة.

من أجل دراسة سياسة الهجرة ، قاموا بترميز البيان لثمانية أحزاب في الانتخابات العامة لعام 2010 في المملكة المتحدة. تم ترميز كل جملة في كل بيان فيما يتعلق بما إذا كانت متعلقة بالهجرة ، وإذا كان الأمر كذلك ، سواء أكانت مؤيدة للهجرة أو محايدة أو مضادة للهجرة. في غضون 5 ساعات من إطلاق مشروعهم ، كانت النتائج. جمعت أكثر من 22000 رد بتكلفة إجمالية قدرها 360 دولارًا. علاوة على ذلك ، أظهرت التقديرات من الحشد موافقة ملحوظة مع مسح سابق للخبراء. بعد ذلك ، وبعد شهرين ، قام الباحثون بإعادة إنتاج ترميزهم. في غضون ساعات قليلة ، قاموا بإنشاء مجموعة بيانات جديدة مشفرة بواسطة الجماهير والتي تطابق إلى حد كبير مجموعة البيانات الأصلية المشفرة. وبعبارة أخرى ، فإن الحساب البشري مكنها من توليد تشفير النصوص السياسية التي اتفقت مع تقييمات الخبراء وكانت قابلة للتكرار. علاوة على ذلك ، لأن الحساب البشري كان سريعًا ورخيصًا ، كان من السهل عليهم تخصيص جمع بياناتهم إلى سؤالهم البحثي الخاص حول الهجرة.