5.2.2 Crowd-coding ng pampulitikang manifestos

Coding pampulitika manifestos, isang bagay kadalasang ginagawa ng mga eksperto, maaaring isagawa sa pamamagitan ng isang tao na proyekto computation nagreresulta sa mas higit reproducibility at flexibility.

Katulad sa Galaxy Zoo, may mga maraming mga sitwasyon kung saan panlipunan mananaliksik na nais na code, uri-uriin, o lagyan ng label ang isang imahe o piraso ng teksto. Ang isang halimbawa ng ganitong uri ng pananaliksik ay ang coding ng pampulitikang manifestos. Sa panahon na halalan, mga partidong pampulitika makabuo manifestos naglalarawan ng kanilang mga posisyon sa patakaran at giya philosophies. Halimbawa, narito ang isang piraso ng manifesto ng Partido Labor sa Great Britain mula 2010:

"Milyun-milyong mga tao na nagtatrabaho sa aming mga pampublikong serbisyo isama ang pinakamahusay na mga halaga ng Britain, na tumutulong magbigay ng kapangyarihan sa mga tao upang gawin ang karamihan ng kanilang mga sariling buhay habang pagprotekta sa mga ito mula sa panganib na hindi sila dapat magkaroon upang pasanin sa kanilang sarili. Tulad ng kailangan natin upang maging mas agresibong tungkol sa papel na ginagampanan ng pamahalaan sa paggawa ng mga merkado gumana medyo, kami din kailangan upang maging bold reformers ng pamahalaan. "

Ang mga manifestos naglalaman ng mahalagang data para sa pampulitikang siyentipiko, lalo na ang mga pag-aaral na halalan at ang dinamika ng debates policy. Upang systematically kunin ang impormasyon mula sa mga manifestos, mga mananaliksik nilikha Ang Manifesto Project , kung saan nakaayos siyentipiko pampulitika sa code 4,000 manifestos mula sa halos 1,000 mga partido sa 50 mga bansa. Ang bawat pangungusap sa bawat manifesto ay naka-code sa pamamagitan ng isang dalubhasa gamit ang isang 56-category scheme. Ang resulta ng mga ito collaborative pagsisikap ay isang napakalaking dataset buod ng impormasyon na naka-embed sa mga manifestos, at ito dataset ay ginagamit sa higit sa 200 pang-agham papeles.

Kenneth Benoit at kasamahan (2015) ay nagpasya na gawin ang mga manifesto coding gawain na nagkaroon na dati ay ginanap sa pamamagitan ng mga eksperto at buksan ito sa isang tao na pag-compute proyekto. Bilang isang resulta, sila ay lumikha ng isang coding proseso na ay mas maaaring kopyahin at mas nababaluktot, hindi sa banggitin mas mura at mas mabilis.

Paggawa gamit ang 18 manifestos na nabuo sa panahon ng anim na kamakailang halalan sa UK, Benoit at kasamahan ginamit ang split-apply-pagsamahin diskarte sa mga manggagawa mula sa isang micro-gawain labor market (Amazon Mechanical Turk at CrowdFlower ay mga halimbawa ng micro-gawain labor merkado; para sa karagdagang sa micro-gawain labor market, tingnan ang Kabanata 4). Ang mga mananaliksik na kumuha ang bawa't manifesto at hatiin ito sa pangungusap. Next, rating ng tao ay inilapat sa bawat pangungusap. Sa partikular, kung ang pangungusap na kasangkot ng isang patakaran na pahayag, ito ay naka-code sa kahabaan ng dalawang sukat: economic (mula sa napaka-kaliwa upang maka-kanan) at social (mula liberal sa konserbatibo) (Figure 5.5). Ang bawat pangungusap ay naka-code sa pamamagitan ng tungkol sa 5 iba't ibang mga tao. Sa wakas, ang mga rating ay pinagsama ang paggamit ng isang statistical modelo na accounted para sa parehong mga indibidwal na mga epekto rater at kahirapan ng mga epekto pangungusap. Sa lahat, Benoit at kasamahan nakolekta 200,000 mga rating mula sa tungkol sa 1,500 manggagawa.

Figure 5.5: Coding scheme mula Benoit et al. (2015) (Fig 1).

Figure 5.5: Coding scheme mula Benoit et al. (2015) (Fig 1).

Upang masuri ang kalidad ng karamihan ng tao coding, Benoit at kasamahan nagkaroon din tungkol sa 10 mga eksperto-professors at graduate mga mag-aaral sa Political Science-rate ang parehong manifestos gamit ang isang katulad na pamamaraan. Kahit na ang mga rating mula sa mga miyembro ng karamihan ng tao ay mas variable kaysa sa ratings mula sa mga eksperto, ang consensus crowd rating ay kapansin-pansin na kasunduan sa mga pinagkasunduan expert rating (Figure 5.6). Paghahambing na ito ay nagpapakita na, tulad ng sa Galaxy Zoo, human computation proyekto ay maaaring makabuo ng mataas na kalidad na mga resulta.

Figure 5.6: Expert pagtatantya (x-axis) at karamihan ng tao estima (y-axis) ay nasa kapuna agreement kapag coding 18 partido manifestos mula sa Great Britain (al Benoit et 2015.). Ang manifestos naka-code ay mula sa tatlong partidong pampulitika (Conservative, Labour, Liberal Democrats) at anim na halalan (1987, 1992, 1997, 2001, 2005, 2010).

Figure 5.6: Expert pagtatantya (x-axis) at karamihan ng tao estima (y-axis) ay nasa kapuna agreement kapag coding 18 partido manifestos mula sa Great Britain (Benoit et al. 2015) . Ang manifestos naka-code ay mula sa tatlong partidong pampulitika (Conservative, Labour, Liberal Democrats) at anim na halalan (1987, 1992, 1997, 2001, 2005, 2010).

Building sa mga resultang ito, Benoit at kasamahan ginamit ang kanilang karamihan ng tao-coding system upang gawin ang pananaliksik na imposible sa Manifesto Project. Halimbawa, ang Manifesto Project ay hindi code ang manifestos sa paksa ng immigration dahil na ay hindi isang kapansin-pansin na topic kapag ang coding scheme ay binuo sa kalagitnaan ng 1980s. At, sa puntong ito, ito ay logistically infeasible para sa Manifesto Project upang bumalik at muling-code ang kanilang manipesto upang makuha ang impormasyong ito. Samakatuwid, ito ay lilitaw na ang mga mananaliksik na interesado sa pag-aaral ng pulitika ng immigration ay sa labas ng kapalaran. Gayunman, Benoit at kasamahan ay able sa gamitin ang kanilang mga tao computation system upang gawin ito coding-customize sa kanilang mga pananaliksik tanong-mabilis at madali.

Upang pag-aralan patakaran sa imigrasyon, ang mga ito na naka-code sa manifestos para sa walong mga partido sa 2010 election sa Great Britain. Ang bawat pangungusap sa bawat manifesto ay naka-code sa kung ito may kaugnayan sa imigrasyon, at kung gayon, kung ito ay pro-imigrasyon, neutral, o anti-imigrasyon. Sa loob ng 5 oras ng paglunsad ng kanilang mga proyekto, ang mga resulta ay in. Sila ay nakolekta ng higit sa 22,000 kasagutan sa isang kabuuang halaga ng $ 360. Dagdag dito, ang mga pagtatantya mula sa karamihan ng tao ay nagpakita pambihira kasunduan sa isang mas maagang survey ng mga eksperto. Pagkatapos, bilang isang pangwakas na pagsubok, dalawang buwan mamaya, ang mga mananaliksik muling ginawa ang kanilang karamihan ng tao-coding. Sa loob ng ilang oras, sila ay lumikha ng isang bagong karamihan ng tao-naka-code dataset na malapit na tumugma sa kanilang orihinal na karamihan ng tao-naka-code na data set. Sa ibang salita, human computation enable ang mga ito upang bumuo ng coding ng pampulitikang mga teksto na sumang-ayon na may mga dalubhasang mga pagsusuri at noon ay maaaring kopyahin. Bukod dito, sapagka't ang tao computation ay mabilis at murang, ito ay madali para sa kanila upang i-customize ang kanilang mga koleksyon ng data sa kanilang mga tiyak na katanungan pananaliksik tungkol sa imigrasyon.