5.2.2 толпы кодирование политических манифестов

Этот перевод был создан с помощью компьютера. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.2.2 толпы кодирование политических манифестов

Кодирование политических манифестов, что - то , как правило , делается экспертами, могут быть выполнены с помощью человеческого проекта вычислений , что приводит к большей воспроизводимости и гибкости.

Подобно Galaxy Zoo, есть много ситуаций, когда социальные исследователи хотят кода, классифицировать или этикетку изображение или фрагмент текста. Примером такого рода исследований является кодирование политических манифестов. Во время выборов, политические партии производят манифесты, описывающие свои позиции политики и руководящих философий. Например, вот часть манифеста Лейбористской партии в Великобритании с 2010 года:

"Миллионы людей, работающих в наших общественных услуг, воплощают лучшие значения Великобритании, помогая дать людям возможность сделать большую часть своей собственной жизни, защищая их от рисков, которые они не должны нести на своих собственных. Подобно тому, как мы должны быть смелыми о роли правительства в заставить рынки работать честно, мы также должны быть смелые реформаторы правительства ".

Эти манифесты содержат ценные данные для политологов, особенно те, изучающие выборы и динамику политических дискуссий. Для того , чтобы систематически извлекать информацию из этих манифестов, исследователи создали манифеста проект , который организовал политологи кодировать 4000 манифестов из почти 1000 партий в 50 странах мира. Каждое предложение в каждом манифеста был закодирован экспертом по схеме 56-категории. Результатом этой совместной деятельности является массовый набор данных обобщения информации, встроенной в этих манифестов, и этот набор данных был использован в более чем 200 научных работ.

Кеннет Бенуа и его коллеги (2015) решил взять задачу кодирования манифест , которые ранее были выполнены специалистами и превратить его в проект вычисления человека. В результате, они создали процесс кодирования, который является более воспроизводимым и более гибким, не говоря уже о дешевле и быстрее.

Работа с 18 манифестов, генерируемых в течение шести последних выборов в Великобритании, Benoit и его коллеги использовали раскол применить-сочетать стратегию с рабочими из рынка труда микро-задачи (Amazon Mechanical Turk и CrowdFlower являются примерами рынков труда микро-задач, для более на рынках труда микро-задач см главу 4). Исследователи взяли каждый манифест и разделить его на предложения. Затем человеческий рейтинг был применен к каждому предложению. В частности, если предложение участвовать заявление о политике, он был закодирован по двум направлениям: экономические (от очень слева очень справа) и социальный (от либеральных до консервативной) (рис 5.5). Каждое предложение было закодировано около 5 разных людей. Наконец, эти рейтинги были объединены с использованием статистической модели , которая учитывается как индивидуальных эффектов рейтер и трудности наказания эффектов. В целом, Benoit и его коллеги собрали 200000 рейтинги от около 1500 рабочих.

Рисунок 5.5: Схема кодирования от Benoit и др. (2015) (рис 1).

Рисунок 5.5: Схема кодирования от Benoit et al. (2015) и Benoit et al. (2015) (рис 1).

Для того чтобы оценить качество кодирования толпы, Benoit и его коллеги также имели около 10 специалистов-профессоров и аспирантов в области политических наук-курса те же манифесты, используя аналогичную процедуру. Хотя рейтинги от членов толпы были более изменчивыми, чем рейтинги от экспертов, консенсус рейтинга толпа замечательное согласие с рейтингом консенсус экспертов (рис 5.6). Это сравнение показывает, что, как и Galaxy Zoo, проекты вычислений человека могут производить высококачественные результаты.

Рисунок 5.6: экспертные оценки (ось х) и оценки толпы (ось у) были в замечательном согласии при кодировании 18 партий манифестов из Великобритании (Benoit et al. 2015) и (Benoit et al. 2015) . Манифесты кодированные были от трех политических партий (Консервативная, трудовых, либерал-демократы) и шести выборах (1987, 1992, 1997, 2001, 2005, 2010).

Опираясь на этот результат, Benoit и его коллеги использовали их толпы кодирования системы для проведения исследований, что было невозможно с проектом манифеста. Например, проект манифеста не кодировать манифестов на тему иммиграции, потому что не было характерной темой, когда схема кодирования была разработана в середине 1980-х годов. И в этот момент, это логистически неосуществимым для проекта манифеста, чтобы вернуться и перекодировки их манифесты, чтобы захватить эту информацию. Поэтому, казалось бы, что исследователи, заинтересованные в изучении политики иммиграции не повезло. Тем не менее, Бенуа и его коллеги смогли использовать свою человеческую систему вычислений, чтобы сделать это кодирование к индивидуальным требованиям заказчика для своих исследований вопрос-быстро и легко.

Для изучения иммиграционной политики, они закодировали манифестов для восьми партий в выборах 2010 года в Великобритании. Каждое предложение в каждом манифеста был закодирован, чтобы связанные ли он к иммиграции, и если да, то было ли это проиммиграционно, нейтральное или Антииммиграционные. В течение 5 часов запуска своего проекта, результаты были. Они собрали более 22000 ответов на общую сумму в $ 360. Кроме того, оценки из толпы показали замечательное согласие с ранее опроса экспертов. Затем, в качестве финального теста, два месяца спустя, исследователи воспроизведен их толпы кодирование. В течение нескольких часов они создали новую толпу кодировкой набора данных, которые близко соответствовали их первоначальной толпы кодировкой набора данных. Другими словами, человек вычисление позволило им произвести кодирование политических текстов, которые согласились с оценками экспертов и воспроизводимым. Кроме того, поскольку человек вычисление было быстро и дешево, это было легко для них, чтобы настроить их сбор данных для их конкретного вопроса исследования об иммиграции.