5.2.2 Crowd-kódolása politikai manifesztumok

Coding politikai manifesztumokban, valami tipikusan szakemberek végzik, el lehet végezni egy emberi számítás projekt ami nagyobb reprodukálhatóság és a rugalmasság.

A Galaxy Zoo-hoz hasonlóan sok olyan helyzet létezik, ahol a társadalmi kutatók egy kép vagy szöveg darabjait kódolni, osztályozni vagy címkézni akarják. Az ilyen típusú kutatás egyik példája a politikai manifesztek kódolása. A választások során a politikai pártok olyan manifesztumokat állítanak elő, amelyek leírják politikai pozícióikat és irányítják a filozófiákat. Például itt van egy darab a Munkáspárt manifesztuma az Egyesült Királyságban 2010-től:

"Emberek milliói dolgoznak a közszolgáltatások testesítik meg a legjobb érték a brit, így képessé az embereket, hogy a legtöbbet a saját életüket, miközben védi őket a kockázatok nem kellene viselniük a saját. Éppen úgy, ahogy kell merészebb a kormányzat szerepe a piacok működésének meglehetősen, arra is szükség van, hogy merész reformerek a kormány. "

Ezek a manifesztek értékes adatokat tartalmaznak a politológusok számára, különösen a választásokat tanulmányozó és a politikai viták dinamikáját. Az ilyen manifesztumokból származó információk szisztematikus kiaknázása érdekében a kutatók létrehozták a The Manifesto Project-et, amely 50 országból közel 1000 féllel 4000 gyűjteményt gyűjtött össze, majd politikai tudósokat szervezett, hogy rendszeresen kódolja őket. Minden egyes mondatban minden mondatot egy szakértő kódolt egy 56 osztályú sémával. Ennek az együttes erőfeszítésnek az eredménye egy hatalmas adatkészlet, amely összefoglalja az e manifesztekbe beágyazott információkat, és ezt az adatállományt több mint 200 tudományos publikációban használták fel.

Kenneth Benoit és munkatársai (2016) úgy döntöttek, hogy meghozzák a manifeszt kódolási feladatot, amelyet korábban a szakértők végeztek és emberi számítási projektgé alakítottak. Ennek eredményeként olyan kódolási folyamatot hoztak létre, amely jobban reprodukálható és rugalmasabb, nem is beszélve olcsóbb és gyorsabb.

Az Egyesült Királyságban hat legutóbbi választás során elért 18 manifesztet használva Benoit és munkatársai a mikrotábor munkaerőpiacra dolgozó munkavállalókkal a split-apply-combine stratégiát alkalmazták (az Amazon Mechanical Turk és a CrowdFlower példák a mikrotask munkaerőpiacokra, , lásd a 4. fejezetet). A kutatók minden egyes manifesztet elvetettek, és bontásra bontották . Ezután egy személy alkalmazta a kódolási sémát minden mondatra. Különösen az olvasókat arra kérték, hogy minden mondatot a gazdaságpolitikára (balra vagy jobbra), szociálpolitikára (liberális vagy konzervatív) vagy sem (5.5. Minden mondatot öt különböző ember kódolt. Végül, ezeket a minősítéseket egy statisztikai modell alkalmazásával kombináltuk , amely mind az egyéni, mind a fordított effektusokat és a nehézségi hatást kiváltó hatásokat tükrözte. Benoit és munkatársai összesen mintegy 200 embert gyűjtöttek össze.

5.5. Ábra: Benoit et al. (2016). Az olvasókat arra kérték, hogy minden mondatot a gazdaságpolitikára (balra vagy jobbra), szociálpolitikára (liberális vagy konzervatív), vagy sem. Benoit et al. (2016), 1. ábra.

5.5. Ábra: Benoit et al. (2016) . Az olvasókat arra kérték, hogy minden mondatot a gazdaságpolitikára (balra vagy jobbra), szociálpolitikára (liberális vagy konzervatív), vagy sem. Benoit et al. (2016) , 1. ábra.

A tömeg kódolásának értékelése érdekében Benoit és munkatársai körülbelül 10 szakértő-professzorral és posztgraduális hallgatókkal rendelkeztek a politikatudományban, ugyanazokat a manifeszteket hasonlították össze hasonló eljárással. Bár a tömegek tagjainak minősítése változóbb volt, mint a szakértők minősítése, a konszenzusos közönség hitelminősítői rendkívül egyetértettek a konszenzus szakértői értékeléssel (5.6. Ábra). Ez az összehasonlítás azt mutatja, hogy a Galaxy Zoo-hoz hasonlóan az emberi számítási projektek kiváló minőségű eredményeket hozhatnak.

5.6. Ábra: A szakértői becslések (x-tengely) és a tömegbecslések (y-tengely) rendkívül megegyeztek abban, amikor 18 párt-manifesztet kódoltak az Egyesült Királyságból (Benoit és mások 2016). A jelöltek három politikai pártból (konzervatív, munkaügyi és liberális demokraták) és hat választásból (1987, 1992, 1997, 2001, 2005 és 2010) voltak. Benoit et al. (2016), 3. ábra.

5.6 ábra: A szakértői becslések ( \(x\) -axis) és a tömegbecslések ( \(y\) -axis) rendkívül megegyeztek abban, hogy 18 párt-manifesztet (Benoit et al. 2016) az Egyesült Királyságból (Benoit et al. 2016) . A jelöltek három politikai pártból (konzervatív, munkaügyi és liberális demokraták) és hat választásból (1987, 1992, 1997, 2001, 2005 és 2010) voltak. Benoit et al. (2016) , 3. ábra.

Erre az eredményre támaszkodva Benoit és munkatársai tömeges kódolási rendszert használtak, hogy olyan kutatást végezhessenek, amely a Manifesto Projekt által használt, szakértelemmel működő kódolási rendszerrel nem volt lehetséges. Például a Manifesto Project nem kódolta a manifesztumokat a bevándorlás témájában, mert ez nem volt kiemelt téma, amikor a kódolási rendszert a nyolcvanas évek közepén fejlesztették ki. És ezen a ponton logisztikai szempontból lehetetlen a Manifesto Project számára, hogy visszatérjen, és visszaállítsa a manifesztumokat, hogy rögzítse ezt az információt. Ezért úgy tűnik, hogy a bevándorláspolitika tanulmányozásában érdekelt kutatók szerencsére vannak. Benoit és munkatársai azonban képesek voltak emberi számítási rendszerüket felhasználni a kutatási kérdésükre szabott kódolás érdekében - gyorsan és egyszerűen.

A bevándorlási politika megismerése érdekében az Egyesült Királyság 2010-es általános választásán nyolc pártot rendeztek. Az egyes manifesztek minden mondatát kódolták, hogy vajon a bevándorláshoz kapcsolódik-e, és ha igen, függetlenül attól, hogy a bevándorlás, semleges vagy a bevándorlás elleni küzdelem. A projekt elindításától számított 5 órán belül az eredmények beolvadtak. Több mint 22 000 válogatást gyűjtöttek össze, 360 dolláros összköltséggel. Továbbá a tömegek becslései jelentős egyetértést mutattak egy korábbi szakértői felméréssel. Ezután végső tesztként, két hónappal később, a kutatók reprodukálták tömegük kódolását. Néhány óra múlva új tömegkódolt adatkészletet hoztak létre, amely szorosan illeszkedett az eredeti tömörített adatkészlethez. Más szóval, az emberi számítás lehetővé tette számukra, hogy olyan politikai szövegek kódolását hozzák létre, amelyek a szakértői értékeléssel egyetértésben és reprodukálhatóak voltak. Továbbá, mivel az emberi számítás gyors és olcsó volt, könnyű volt számukra az adatgyűjtés testreszabása a bevándorlással kapcsolatos konkrét kutatási kérdésükre.