5.2.2 Crowd-kodeerimine poliitilise manifestides

Kodeerimise poliitilise manifestides, mida tavaliselt tehakse eksperdid, saab teostada inimese arvutusvõimsus projekti tulemuseks suurema korratavus ja paindlikkust.

Sarnaselt Galaxy Zoo, on palju olukordi, kus sotsiaalse teadlased tahavad kood, liigitada, või märgistada pilt või tekstilõiku. Näiteks selline uuring on kodeerimise poliitilise manifestides. Valimiste ajal, erakondade toota manifestides kirjeldab nende poliitilisi seisukohti ja suunavad filosoofia. Näiteks siin on tükk manifest Tööpartei Suurbritannias alates 2010. aastast:

"Miljonid inimesed, kes töötavad meie avalikud teenused kehastavad parimate väärtuste Suurbritannia, aidates anda inimestele kõige paremini oma elu samas kaitstes neid riske, mida nad ei peaks kandma oma. Nii nagu me peame olema julgem rollist valitsuse panna turud tööle üsna peame ka olla julge reformijad valitsus. "

Need valimisplatvormid sisaldavad väärtuslikke andmeid politoloogid, eriti neile, kes õpivad valimised ja dünaamika poliitilistes debattides. Selleks, et süstemaatiliselt saada teavet nende valimisprogramme, teadlased loonud Manifest Project , mis korraldati politoloogid koodi 4000 manifestides ligi 1000 osapooled 50 riigis. Iga lause igas manifest on kodeeritud ekspert kasutades 56-kategooria kava. Selle tulemusena ühiseid jõupingutusi on tohutu andmestiku, mis võtab kokku teabe varjatud neid valimisprogramme, ja see andmestik on kasutatud rohkem kui 200 teaduslikku artiklit.

Kenneth Benoit ja tema kolleegid (2015) otsustas võtta manifest kodeerimine ülesanne, mis oli eelnevalt läbi eksperdid ja muuta see inimese arvutusvõimsus projekti. Selle tulemusena nad loonud kodeerimine protsess, mis on rohkem korratav ning paindlikum, rääkimata odavam ja kiirem.

Töö 18 manifestides käigus tekkinud kuus viimastel valimistel Suurbritannias, Benoit ja tema kolleegid kasutasid split-apply-ühendada strateegia töötajate mikro-ülesanne tööturul (Amazon Mechanical Turk ja CrowdFlower näiteid mikro- ülesanne tööturud; rohkem mikro-ülesanne tööturud, vt 4. peatükk). Teadlased võtsid iga manifesti ja jagada see lauseid. Edasi inimese hinnangud kanti iga lause. Eriti siis, kui lause kaasatud poliitilise avalduse, see oli kodeeritud kaks tasandit: majandusliku (väga vasakule väga õige) ja sotsiaalne (liberaalse konservatiivne) (joonis 5.5). Iga lause oli kodeeritud umbes 5 erinevat inimest. Lõpuks need pole ühendati kasutades statistilise mudeli, mis moodustasid nii individuaalne hindaja mõju ja raske karistuse mõju. Kõigil, Benoit ja tema kolleegid kogutud 200.000 hinnangust umbes 1500 töötajat.

Joonis 5.5: kodeerimise süsteemiga alates Benoit jt. (2015) (joonis 1).

Joonis 5.5: kodeerimise süsteemiga alates Benoit et al. (2015) (joonis 1).

Selleks, et hinnata kvaliteeti rahvahulga kodeerimine, Benoit ja tema kolleegid oli ka umbes 10 eksperti-õppejõududele ja magistrantidele politoloogias määra sama manifestides sarnasel meetodil. Kuigi reitingu liikmed rahvast oli rohkem varieeruv kui pole saadud Ekspertide konsensus rahvahulga hinnangud olid märkimisväärsed kokkuleppele konsensuse ekspert hinnangud (joonis 5.6). See võrdlus näitab, et nii nagu Galaxy Zoo, inimese arvutusvõimsus projektid võivad toota kõrge kvaliteediga tulemusi.

Joonis 5.6: eksperdi hinnangul (x-telg) ja rahvahulga hinnanguid (y-telg) oli tähelepanuväärne kokkuleppele kodeerimisel 18 isikule manifestides alates Suurbritannia (Benoit et al. 2015). Tutvuvad kodeeritud olid kolme erakonna (Konservatiivne, töö- liberaaldemokraatide) ja kuus valimistel (1987, 1992, 1997, 2001, 2005, 2010).

Joonis 5.6: eksperdi hinnangul (x-telg) ja rahvahulga hinnanguid (y-telg) oli tähelepanuväärne kokkuleppele kodeerimisel 18 isikule manifestides alates Suurbritannia (Benoit et al. 2015) . Tutvuvad kodeeritud olid kolme erakonna (Konservatiivne, töö- liberaaldemokraatide) ja kuus valimistel (1987, 1992, 1997, 2001, 2005, 2010).

Toetudes see tulemus, Benoit ja tema kolleegid kasutasid oma rahvahulga kodeerimissüsteemi teha uuringuid, mis oli võimatu manifesti Project. Näiteks manifesti projekt ei koodi tutvuvad teemal sisserännet, sest see ei olnud väljapaistev teema kui kodeerimine kava loodi 1980. aastate keskpaigast. Ja sel hetkel, see on logistiliselt võimatu Manifesti Project tagasi minna ja uuesti koodi oma manifestides teabe kogumiseks. Seega tundub, et teadlased huvitatud õppimisest poliitikas sisserände ei vea. Kuid Benoit ja tema kolleegid said kasutada oma inimese arvutamise süsteem seda teha kodeerimine kohandamata oma uurimisteema-kiiresti ja lihtsalt.

Selleks, et uurida sisserändepoliitika, nad kodeeritud tutvuvad kaheksa osapoolte 2010. aasta valimiste Suurbritannias. Iga lause igas manifest oli kodeeritud, kas see on seotud immigratsiooni, ja kui on, siis kas see oli pro-sisseränne, neutraalne või immigratsioonivastaseid. 5 tunni jooksul käivitada oma projekt, olid tulemused. Nad olid kogutud üle 22000 vastuseid juures kogusummas $ 360-le. Lisaks hinnanguid tõrjuda näitas tähelepanuväärne kokkulepe varasema ekspertide uurimus. Siis, kui viimane katse, kaks kuud hiljem, teadlased reprodutseerida oma rahvahulga kodeerimine. Paari tunni jooksul olid nad loonud uue rahvahulga kodeeritud andmekogumi et lähedased oma esialgse rahvahulga kodeeritud andmete kogum. Teisisõnu, inimese arvutusvõimsus võimaldas neil luua kodeerimine poliitilise tekste, mis nõustus eksperthinnangud ja oli korratavad. Lisaks, kuna inimese arvutusvõimsus oli kiire ja odav, see oli neil lihtne kohandada andmete kogumise nende konkreetsete teadusuuringute küsimus sisseränne.