5.2.2 Crowd კოდირება პოლიტიკური manifestos

კოდირების პოლიტიკური manifestos, რაღაც, როგორც წესი კეთდება ექსპერტების მიერ, შეიძლება შესრულდეს ადამიანის გამოთვლები პროექტის შედეგად უფრო reproducibility და მოქნილობა.

მსგავსი Galaxy Zoo- ის მსგავსად, არსებობს მრავალი შემთხვევა, როდესაც სოციალური მკვლევარები სურთ ტექსტის გამოსახულების ან ნაწილის კოდის, კლასიფიცირების ან იარლიყოს. ამგვარი კვლევის მაგალითია პოლიტიკური მანიფესტების კოდირება. არჩევნების დროს პოლიტიკური პარტიები წარმოადგენენ მანიფესტებს, რომლებიც აღწერენ თავიანთ პოლიტიკურ პოზიციებს და ფილოსოფიურ სახელმძღვანელოებს. მაგალითად, აქ არის ლეიბორისტული პარტიის მანიფესტის ნაწილი გაერთიანებული სამეფოში 2010 წლიდან:

"მილიონობით ადამიანი მუშაობს კომუნალური მომსახურება განასახიერებს საუკეთესო ღირებულებების ბრიტანეთში, ეხმარება ხალხს მისცეს, რათა ყველაზე საკუთარი ცხოვრება ხოლო დაცვის მათ რისკების ისინი არ უნდა ჰქონდეს საკუთარი. ისევე, როგორც ჩვენ უნდა იყოს თამამი შესახებ მთავრობის როლის მიღების ბაზრებზე მუშაობა საკმაოდ, ჩვენ ასევე უნდა იყოს გაბედული რეფორმატორების მთავრობა. "

ეს მანიფესტიები შეიცავს პოლიტიკურ მეცნიერთათვის მნიშვნელოვან მონაცემებს, განსაკუთრებით არჩევნების შესწავლას და პოლიტიკის დებატების დინამიკას. ამ მანიფესტის მონაცემების სისტემატურად ამონაწერის მიზნით, მკვლევარებმა შექმნეს მანიფესტის პროექტი, რომელიც შეგროვდა 50 000 მანიფესტიდან 50 ქვეყანაში, შემდეგ კი პოლიტიკურ მეცნიერებს სისტემატურად დაამუშაო. თითოეული მანიფესტის თითოეული წინადადება კოდირებული იქნა ექსპერტის მიერ 56 კატეგორიის სქემით. ამ ერთობლივი ძალისხმევის შედეგია ამ მანიფესტში ჩართული ინფორმაციის შეჯამებული მასიური მონაცემები, ხოლო ამ მონაცემთა ნაკრებს გამოყენებულია 200-ზე მეტი სამეცნიერო ნაშრომი.

Kenneth Benoit და კოლეგებმა (2016) გადაწყვიტეს, რომ Manifesto კოდირების ამოცანა, რომელიც ადრე შესრულებული იყო ექსპერტების მიერ და გადაიქცევა ადამიანის გამოთვლითი პროექტში. შედეგად, მათ შექმნეს კოდირების პროცესი, რომელიც უფრო რეპროდუცირებადია და უფრო მოქნილია, რომ არ უნდა აღინიშნოს უფრო იაფი და სწრაფად.

გაერთიანებული სამეფოს ექვსი ბოლოდროინდელი არჩევნების დროს წარმოებული 18 მანიფესტებთან მუშაობა, ბენოიტი და კოლეგები იყენებდნენ მიკროსტაქსის შრომის ბაზრის (Amazon Mechanical Turk და CrowdFlower) მუშაკთა გაყოფა-გამოყენებას-კომბინირებული სტრატეგია microtask შრომის ბაზრების მაგალითები, , თავი 4). მკვლევარებმა თითოეული მანიფესტი წაიღეს და გაითვალისწინეს ის სასჯელი. შემდეგ, თითოეულმა სასჯელისთვის გამოყენებულ იქნა კოდირების სქემა. კერძოდ, მკითხველებმა მოითხოვეს თითოეული სასჯელის კლასიფიცირება ეკონომიკური პოლიტიკის (მარცხნივ ან მარჯვნივ), სოციალური პოლიტიკის (ლიბერალური ან კონსერვატიული) მიმართ, ან არც (5.5). თითოეული წინადადება კოდირებული იყო დაახლოებით ხუთი სხვადასხვა ადამიანის მიერ. საბოლოო ჯამში, ეს რეიტინგები კომბინირებული იყო გამოყენებით სტატისტიკური მოდელი, რომელიც აღწერს როგორც ინდივიდუალურ-გამაჯანსაღებელ ეფექტებს, ასევე სირთულე-განაჩენის შედეგებს. საერთოდ, ბენოიტმა და კოლეგებმა დაახლოებით 1 500 ადამიანი შეაგროვეს 200 000 რეიტინგი.

ფიგურა 5.5: კოდირების სქემა ბონოიტისა და ალ. (2016). მკითხველებმა მოითხოვეს თითოეული სასჯელის კლასიფიცირება ეკონომიკურ პოლიტიკასთან (მარცხნივ ან მარჯვნივ), სოციალური პოლიტიკის (ლიბერალური ან კონსერვატიული), ან არც. ადაპტირებული ბენოიტისა და ალ. (2016), ფიგურა 1.

ფიგურა 5.5: კოდირების სქემა Benoit et al. (2016) . მკითხველებმა მოითხოვეს თითოეული სასჯელის კლასიფიცირება ეკონომიკურ პოლიტიკასთან (მარცხნივ ან მარჯვნივ), სოციალური პოლიტიკის (ლიბერალური ან კონსერვატიული), ან არც. ადაპტირებული Benoit et al. (2016) , ფიგურა 1.

გულშემატკივართა კოდირების ხარისხის შესაფასებლად ბენოიტსა და კოლეგებს ასევე ჰქონდათ 10-მდე ექსპერტი-პროფესორი და სამაგისტრო პროგრამა, რომელიც პოლიტიკურ მეცნიერებათა განაკვეთზე იგივე მანიფესტებმა გამოიყენეს მსგავსი პროცედურის გამოყენებით. მიუხედავად იმისა, რომ გულშემატკივრების წევრების რეიტინგები უფრო ცვალებადი იყო, ვიდრე ექსპერტების რეიტინგები, კონსენსუსის გულშემატკივრების რეიტინგს კონსენსუსის ექსპერტთა რეიტინგთან (ფიგურა 5.6) მიაღწია. ეს შედარება გვიჩვენებს, რომ, როგორც Galaxy Zoo- ს, ადამიანთა გამოთვლითი პროექტები შეიძლება მაღალხარისხოვან შედეგებს წარმოადგენდეს.

გრაფიკი 5.6: ექსპერტთა შეფასებები (x- ღერძი) და გულშემატკივრების შეფასებები (y- ღერძი) იყო დიდი შეთანხმება, როდესაც გაერთიანებული სამეფოს 18-მა პარტიული მანიფესტის კოდი (ბენოიტი et al. მანიფესტიები კოდირებული იყო სამი პოლიტიკური პარტიიდან (კონსერვატიული, ლეიბორისტული და ლიბერალური დემოკრატები) და ექვსი არჩევნები (1987, 1992, 1997, 2001, 2005 და 2010). ადაპტირებული ბენოიტისა და ალ. (2016), ფიგურა 3.

გრაფიკი 5.6: ექსპერტთა შეფასებები ( \(x\) -საი) და გულშემატკივრების შეფასებები ( \(y\) -axis) აღსანიშნავია გაერთიანებული სამეფოს 18-მა პარტიული მანიფესტის კოდირებისას (Benoit et al. 2016) . მანიფესტიები კოდირებული იყო სამი პოლიტიკური პარტიიდან (კონსერვატიული, ლეიბორისტული და ლიბერალური დემოკრატები) და ექვსი არჩევნები (1987, 1992, 1997, 2001, 2005 და 2010). ადაპტირებული Benoit et al. (2016) , ფიგურა 3.

ამასთან დაკავშირებით, ბონოიტმა და კოლეგებმა თავიანთი გულშემატკივართა კოდირების სისტემა გამოიყენეს, რათა კვლევა ჩაეტარებინათ, რაც შეუძლებელი იყო მანიფესტის მიერ გამოყენებული ექსპერტების მიერ გამოყენებული კოდირების სისტემა. მაგალითად, მანიფესტის პროექტი არ გამოაქვეყნებს მანიფესტებს იმიგრაციის თემაზე, რადგან ეს არ იყო საკვანძო თემისას, როდესაც კოდექსის სქემა შემუშავდა 1980-იან წლებში. და ამ ეტაპზე, ეს მანიფესტის პროგნოზირება შეუძლებელია მანიფესტის პროექტში დაბრუნებისა და მათი მანიფესტების აღსადგენად. აქედან გამომდინარე, აღმოჩნდება, რომ მკვლევარებმა დაინტერესებულნი იყვნენ, რომ ისწავლონ იმიგრაციის პოლიტიკა. თუმცა, ბენოიტმა და კოლეგებმა შეძლეს საკუთარი გამოთვლითი სისტემა გამოიყენონ იმისათვის, რომ ამ კვლევის კითხვას - სწრაფად და მარტივად.

საემიგრაციო პოლიტიკის შესწავლის მიზნით, ისინი გაერთიანებული ერების ორგანიზაციის 2010 წლის საერთო არჩევნებში მონაწილეობდნენ რვა პარტიისთვის. თითოეული მანიფესტის თითოეული სასჯელი კოდირებულ იქნა იმის შესახებ, არის თუ არა ის დაკავშირებულია იმიგრაციასთან, და თუ ასეა, ეს იყო პრო-იმიგრაცია, ნეიტრალური ან ანტიმიგრაცია. პროექტის დაწყების 5 საათში, შედეგი იყო. მათ 360 ათასზე მეტი პასუხი მიიღეს. უფრო მეტიც, ხალხების შეფასებებმა აჩვენა შესანიშნავი შეთანხმება ექსპერტთა ადრე გამოკვლევასთან. შემდეგ, როგორც საბოლოო გამოცდა, ორი თვის შემდეგ, მკვლევარებმა გამრავლება მათი გულშემატკივარი- coding. რამდენიმე საათში მათ შექმნეს ახალი გულშემატკივარი-კოდირებული მონაცემები, რომლებიც მჭიდროდ იყენებდნენ თავდაპირველ ხალხმრავლობა-კოდირებულ მონაცემებს. სხვა სიტყვებით რომ ვთქვათ, ადამიანური გამოთვლები საშუალებას მისცემდა მათ შექმნან პოლიტიკური ტექსტების კოდირება, რომლებიც შეთანხმდნენ ექსპერტული შეფასებებით და რეპროდუცირებადი. გარდა ამისა, იმის გამო, რომ ადამიანის გამოთვლითი იყო სწრაფი და იაფი, ადვილი იყო მათ სახის მონაცემების შეგროვება მათი კონკრეტული კვლევის კითხვაზე იმიგრაციის შესახებ.