2.4.1 Optælling ting

Simpel optælling kan være interessant, hvis du kombinerer et godt spørgsmål med gode data.

Selv om det er anbragt i sofistikeret-lydende sprog, masser af social forskning egentlig bare tæller ting. I en alder af store data kan forskere tælle mere end nogensinde, men det betyder ikke, at de bare skal begynde at tælle tilfældigt. I stedet skal forskerne spørge: Hvilke ting er værd at tælle? Dette kan virke som et helt subjektivt spørgsmål, men der er nogle generelle mønstre.

Ofte motiverer eleverne deres tællende forskning ved at sige: Jeg skal tælle noget, som ingen nogensinde har talt før. For eksempel kan en elev sige, at mange mennesker har studeret migranter, og mange har studeret tvillinger, men ingen har studeret migrant tvillinger. Efter min opfattelse fører denne strategi, som jeg kalder motivation for fravær , normalt ikke til god forskning. Motivation ved fravær er lidt som at sige, at der er et hul derovre, og jeg skal arbejde meget hårdt for at udfylde det. Men ikke hvert hul skal fyldes.

I stedet for at motivere ved fravær tror jeg, at en bedre strategi er at søge efter forskningsspørgsmål, der er vigtige eller interessante (eller ideelt begge). Begge disse vilkår er lidt svære at definere, men en måde at tænke på vigtig forskning er, at den har en vis målbar effekt eller føder til en vigtig beslutning fra beslutningstagere. For eksempel er måling af arbejdsløshedsprocenten vigtig, fordi det er en indikator for økonomien, der driver politiske beslutninger. Generelt tror jeg, at forskere har en ret god fornemmelse af, hvad der er vigtigt. Så i resten af ​​dette afsnit vil jeg give to eksempler, hvor jeg synes at tælle er interessant. I hvert tilfælde tællede forskerne ikke tilfældigt; De tæller snarere i meget bestemte indstillinger, som afslørede vigtige indsigter i mere generelle ideer om, hvordan sociale systemer fungerer. Med andre ord, meget af, hvad der gør disse særlige tælleøvelser interessant, er ikke selve dataene, det kommer fra disse mere generelle ideer.

Et eksempel på den enkle magt at tælle kommer fra Henry Farber's (2015) undersøgelse af adfærd fra New York City taxachauffører. Selv om denne gruppe måske ikke lader sig interessant, er det et strategisk forskningssted til at teste to konkurrerende teorier inden for arbejdsmarkedsøkonomi. I forbindelse med Farbers forskning er der to vigtige træk om taxichaufførernes arbejdsmiljø: 1) deres timeløn varierer fra dag til dag, dels baseret på faktorer som vejret og (2) antal timer de har Arbejdet kan svinge hver dag ud fra deres beslutninger. Disse funktioner fører til et interessant spørgsmål om forholdet mellem timeløn og arbejdstimer. Neoklassiske modeller i økonomien forudsiger, at taxichauffører vil arbejde mere på dage, hvor de har højere timeløn. Alternativt forudsiger modeller fra adfærdsmæssig økonomi nøjagtigt det modsatte. Hvis chauffører indstiller et bestemt indkomstmål - siger $ 100 per dag - og arbejder indtil det mål er opfyldt, vil chaufførerne ende med at arbejde færre timer på dage, som de tjener mere. For eksempel, hvis du var målmanden, kan du ende med at arbejde fire timer på en god dag ($ 25 pr. Time) og fem timer på en dårlig dag ($ 20 pr. Time). Så arbejder bilister flere timer på dage med højere timelønninger (som forudsagt af de neoklassiske modeller) eller flere timer på dage med lavere timeløn (som forudsagt af adfærdsmæssige økonomiske modeller)?

For at besvare dette spørgsmål har Farber opnået data på hver taxitur taget af New York City-førerhuse fra 2009 til 2013, data, der nu er offentligt tilgængelige. Disse data - som blev indsamlet af elektroniske målere, som byen kræver taxier at bruge - indeholder oplysninger om hver tur: starttidspunkt, startsted, sluttidspunkt, slutplacering, billetpris og tip (hvis tipet blev betalt med et kreditkort) . Ved hjælp af disse taxamåler data fandt Farber, at de fleste chauffører arbejder mere på dage, hvor lønningerne er højere, i overensstemmelse med den neoklassiske teori.

Ud over dette grundlæggende fund var Farber i stand til at bruge dataens størrelse til en bedre forståelse af heterogenitet og dynamik. Han fandt ud af, at nyere chauffører efterhånden lærer at arbejde flere timer på højløndage (fx lærer de at opføre sig som den neoklassiske model forudsiger). Og nye chauffører, som opfører sig mere som måltagere, er mere tilbøjelige til at holde op med at være taxachauffører. Begge disse mere subtile fund, som hjælper med at forklare den aktuelle adfærd hos nuværende drivere, var kun mulige på grund af datasættets størrelse. De var umulige at opdage i tidligere undersøgelser, der brugte (Camerer et al. 1997) fra et lille antal taxachauffører i løbet af kort tid (Camerer et al. 1997) .

Farbers undersøgelse var tæt på et bedste tilfælde for en forskning ved hjælp af en stor datakilde, fordi de data, der blev indsamlet af byen, var temmelig tæt på de data, som Farber ville have indsamlet (en forskel er, at Farber ville have ønsket data om total lønpriser plus tips-men byens data indeholder kun tips betalt med kreditkort). Dataene alene var dog ikke nok. Nøglen til Farbers forskning var at bringe et interessant spørgsmål til dataene, et spørgsmål der har større konsekvenser ud over netop denne specifikke indstilling.

Et andet eksempel på at tælle ting kommer fra forskning af Gary King, Jennifer Pan og Molly Roberts (2013) om online censur af den kinesiske regering. I dette tilfælde måtte forskerne imidlertid indsamle deres egne store data, og de måtte håndtere det faktum, at deres data var ufuldstændige.

Kong og kolleger blev motiveret af, at sociale medier i Kina er censureret af et enormt statsapparat, der antages at omfatte titusindvis af mennesker. Forskere og borgere har dog ringe følelse af, hvordan disse censorer bestemmer hvilket indhold der skal slettes. Kinesiske lærere har faktisk modstridende forventninger om, hvilke typer indlæg der sandsynligvis vil blive slettet. Nogle mener, at censorer fokuserer på stillinger, der er kritiske for staten, mens andre mener, at de fokuserer på stillinger, der fremmer kollektiv adfærd, som f.eks. Protester. At finde ud af, hvilke af disse forventninger der er korrekte, har konsekvenser for, hvordan forskere forstår Kina og andre autoritære regeringer, der beskæftiger sig med censur. Derfor ønskede konge og kolleger at sammenligne indlæg, der blev offentliggjort og derefter slettet med stillinger, der blev offentliggjort og aldrig slettet.

Indsamling disse stillinger involverede fantastiske engineering feat af kravlende mere end 1.000 kinesiske sociale medier websteder-hver med forskellige sidelayouts-finde relevante stillinger, og derefter besøge igen disse stillinger for at se, som efterfølgende er blevet slettet. Ud over de normale ingeniørmæssige problemer i forbindelse med storstilet web-crawling, dette projekt havde den ekstra udfordring, at det skulle være ekstremt hurtigt, fordi mange censurerede indlæg er taget ned på mindre end 24 timer. Med andre ord ville en langsom crawler brænde masser af stillinger, der blev censureret. Endvidere de crawlere havde at gøre alt dette dataindsamling samtidig unddrage detektion lest de sociale medier websteder blokere adgangen eller på anden måde ændre deres politik som svar på undersøgelsen.

På det tidspunkt, hvor denne massive tekniske opgave var afsluttet, havde kong og kolleger opnået omkring 11 millioner stillinger på 85 forskellige forudbestemte emner, hver med et antaget niveau af følsomhed. For eksempel er et emne med høj følsomhed Ai Weiwei, dissidentartisten; Et emne med middelfølsomhed er forståelse og devaluering af den kinesiske valuta, og et emne med lav følsomhed er VM. Af disse 11 millioner stillinger var omkring 2 millioner blevet censureret. Noget overraskende fandt konge og kolleger, at stillinger på meget følsomme emner kun blev censureret en smule oftere end indlæg på mellem- og lavfølsom emner. Med andre ord, kinesiske censorer er omtrent lige så tilbøjelige til at censurere et indlæg, der nævner Ai Weiwei som et indlæg, der nævner VM. Disse fund understøtter ikke ideen om, at regeringen censorerer alle indlæg på følsomme emner.

Denne enkle beregning af censurprisen efter emne kan imidlertid være vildledende. For eksempel kan regeringen censurere stillinger, der understøtter Ai Weiwei, men forlade stillinger, der er kritiske for ham. For at skelne mellem stillinger mere omhyggeligt, havde forskerne behov for at måle stemningen i hvert indlæg. Til trods for meget arbejde er helt automatiserede metoder til følelsesdetektion ved hjælp af eksisterende ordbøger stadig ikke særlig gode i mange situationer (tænk tilbage på problemerne med at skabe en følelsesmæssig tidslinje den 11. september 2001 beskrevet i afsnit 2.3.9). Derfor havde konge og kolleger en måde at mærke deres 11 millioner sociale medier ind på, om de var (1) kritiske over for staten, (2) statsstøttende eller (3) irrelevante eller faktuelle rapporter om begivenhederne. Det lyder som et massivt job, men de løste det ved hjælp af et kraftigt trick, der er almindeligt inden for datalogi, men relativt sjældent inden for samfundsvidenskab: overvåget læring ; se figur 2.5.

Først i et trin typisk kaldet forbehandling, forskerne konverteret medierne indlæg sociale i et dokument sigt matrix, hvor der var én række for hvert dokument og en kolonne, der er optaget, om stillingen indeholdt et bestemt ord (fx protest eller trafik) . Derefter mærkede en gruppe af forskningsassistenter følelsen af ​​en prøve af indlæg. Derefter brugte de disse håndmærkede data til at skabe en maskineindlæringsmodel, der kunne udlede et indlæg af et indlæg baseret på dets egenskaber. Endelig brugte de denne model til at estimere følelsen af ​​alle 11 millioner stillinger.

I stedet for manuelt at læse og mærke 11 millioner stillinger - hvilket ville være logistisk umuligt - Kong og kolleger manuelt mærket et lille antal stillinger og derefter brugt underviset læring til at estimere følelsen af ​​alle indlæg. Efter at have gennemført denne analyse kunne de konkludere, at sandsynligheden for, at en post blev slettet, ikke overraskende var forbundet med, om det var kritisk for staten eller støttende til staten.

Figur 2.5: Forenklet skematisk af proceduren anvendt af King, Pan og Roberts (2013) for at estimere stemningen på 11 millioner kinesiske sociale medier. For det første konverterede forskerne de sociale medier ind i en dokumentmatrixmatrix (se Grimmer og Stewart (2013) for mere information). For det andet hand-kodede de følelser af en lille stikprøve af indlæg. For det tredje trænede de en overvåget læringsmodel til at klassificere stemningen af ​​indlæg. For det fjerde brugte de den overvågede læringsmodel til at estimere følelsen af ​​alle indlæg. Se King, Pan og Roberts (2013), bilag B for en mere detaljeret beskrivelse.

Figur 2.5: Forenklet skematisk af proceduren anvendt af King, Pan, and Roberts (2013) at estimere stemningen på 11 millioner kinesiske sociale medier. Først i en forbehandling skridt, forskerne konverteret medierne indlæg sociale i et dokument sigt matrix (se Grimmer and Stewart (2013) for mere information). For det andet hand-kodede de følelser af en lille stikprøve af indlæg. For det tredje trænede de en overvåget læringsmodel til at klassificere stemningen af ​​indlæg. For det fjerde brugte de den overvågede læringsmodel til at estimere følelsen af ​​alle indlæg. Se King, Pan, and Roberts (2013) , bilag B for en mere detaljeret beskrivelse.

Til sidst opdagede kongen og kollegerne, at kun tre typer stillinger regelmæssigt blev censureret: pornografi, kritik af censorer og dem, der havde kollektivt handlingspotentiale (dvs. muligheden for at føre til store protester). Ved at observere et stort antal stillinger, der blev slettet, og indlæg, der ikke blev slettet, kunne konge og kolleger lære hvordan censorerne arbejder bare ved at se og tælle. Desuden foreskygger et tema, der vil forekomme i hele denne bog, den overvågede læringsmetode, som de brugte - håndmærkning af nogle resultater og derefter opbygning af en maskinindlæringsmodel for at mærke resten - viser sig at være meget almindelig i social forskning i den digitale tidsalder . Du vil se billeder, der ligner figur 2.5 i kapitel 3 (Stil spørgsmål) og 5 (Oprettelse af massesamarbejde); Dette er et af de få ideer, der vises i flere kapitler.

Disse eksempler - taxachaufførernes arbejdsadfærd i New York og den kinesiske regerings sociale censuradfærd - viser, at relativt enkelt optælling af store datakilder kan føre til interessant og vigtig forskning i nogle situationer. I begge tilfælde måtte forskerne dog bringe interessante spørgsmål til den store datakilde; dataene i sig selv var ikke nok.