2.3.2.1 onkomplett

Egal wéi "grouss" Ärem "grouss Daten" et wahrscheinlech net déi Informatiounen déi Dir wëllt.

Déi meescht grouss Daten Quelle sinn onvollstänneg, am Sënn datt se do net d'Informatiounen, déi Dir fir Är Recherche wëllt ginn. Dëst ass eng gemeinsam Fonktioun vun Daten, déi fir Zwecker aner wéi Fuerschung ugeluecht goufen. Vill sozial Wëssenschaftler hunn schonn d'Erfahrung vun senden der wobäi, wéi eng bestehend Ëmfro no, datt net d'Fro hutt Iech décidéiert. Leider, éischter d'Problemer vun wobäi am groussen Daten méi extrem ze ginn. An menger Erfahrung, trëtt grouss Daten dräi Zorte vun Informatiounen nëtzlech fir sozial Fuerschung gin vermësst: DEMOGRAPHIQUES, Verhalen op aner Plattformen, an Daten theoretesch gesond ze operationalize.

All dräi vun dëse Formen vun wobäi sinn an enger Etude vun Gueorgi Kossinets an Duncan Watts illustréiert (2006) iwwer d'Evolutioun vun de sozialen Netzwierk op enger Uni. Kossinets an Watts huet mat der Email Logbicher vun der Uni, déi un präzis Informatiounen no deen Mailen un där op wat Zäit geschéckt (d'Fuerscher hunn net Zougang zu den Inhalt vun de Mailen). Dës Email Toun wéi eng erstaunlech Donnéeën, mee, si-trotz hirer Gréisst an granularity-grondsätzléch onvollstänneg. Zum Beispill, och d'Email nokucken net Donnéeën iwwer d'Demographie Charakteristiken vun de Schüler, wéi Geschlecht an Alter. d'Email Logbicher och nët Informatiounen iwwer Kommunikatioun duerch anere Medien, wéi telefonéieren, SMS, oder Gesiicht-ze-Gesiicht Gespréicher weider,. Endlech, do d'Email nokucken net direkt Informatiounen iwwert Relatiounen gehéiert, déi theoretesch gesond an vill Theorien. Spéider am Kapitel, wann ech iwwer Fuerschung Strategien schwätzen, wäert Dir gesinn, wéi Kossinets an Watts dës Problemer geléist.

Vun dräi Arte vun wobäi, ass de Problem vun onkomplett Donnéeën ze operationalize theoretesch gesond der Kinneksetapp, ze léisen an zu menger Erfahrung, ass et oft Accident vun Donnéeën Wëssenschaftler präsentéieren. Ongeféier, sinn theoretesch gesond mythologesch Iddien déi sozial Wëssenschaftler studéieren, mee, leider, kann dës gesond net ëmmer Flugtransport definéiert an gemooss ginn. Zum Beispill, loosse mer virstellen vermeintlech einfach Behaaptung haut zum Test versichen, datt Leit, déi méi intelligent sinn méi Suen ze verdéngen. Fir dës Behaaptung Test du misste Mesure "Intelligenz." Ma, wat ass Intelligenz? Zum Beispill, Gardner (2011) argumentéiert, dass et eigentlech aacht verschiddene Formen vun Intelligenz sinn. An, sinn et Prozeduren, déi korrekt keng vun dëse Formen vun Intelligenz Mesure kéint? Trotz enorm Zommen vun Aarbecht vun Psychologen, nach dës Froen hutt net eendeiteg Äntwerten. Sou, och eng relativ einfach behaapten-Leit déi méi intelligent sinn verdéngen méi Suen-et schwéier ginn haut zum ze bewäerten, well et schwéier gin kann theoretesch gesond an Daten zu operationalize. Aner Beispiller vun theoretesch gesond datt wichteg sinn awer schwéier ze operationalize "Normen", och "sozial Haaptstad," a "Demokratie." Social Wëssenschaftler ruffen de Match tëscht theoretesch gesond a Donnéeën bauen Validitéit (Cronbach and Meehl 1955) . An, wéi dës Lëscht vun gesond mobiliséiert, bauen Validitéit e Problem ass, datt sozial Wëssenschaftler mat fir eng ganz laang Zäit gekämpft hunn, och wann se mat Daten sech schaffen, déi fir den Zweck vun der Fuerschung gesammelt huet. Wéini mat Daten schaffen fir Zwecker gesammelt aner wéi Recherche, sinn d'Problemer vun bauen Validitéit souguer méi usprochsvollen (Lazer 2015) .

Wann Dir eng Fuerschung Pabeier si liesen, eng schnell an nëtzlech Manéier ze bewäerten Suergen iwwert bauen Validitéit ass den Haaptgrond Fuerderung vun de Pabeier ze huelen, déi normalerweis vun Conditioune vun gesond ausgedréckt ass, an du-auszedrécken et am Beräich vun der benotzt Daten. Zum Beispill, als zwee hypothetesch Studien déi weisen behaapten dass méi intelligent Leit méi Geld verdéngen:

  • Studéieren 1: Leit, déi och op der Raven neier Matrices Test-e gutt studéiert Test vun Drëttubidder Intelligenz stoung (Carpenter, Just, and Shell 1990) -have héich gemellt Akommes op hir Steiererklärungen
  • Etude 2: Leit op Twitter déi benotzt méi Wierder sinn méi wahrscheinlech Luxusmarken ze ernimmen

An zwee Fäll, kéint Fuerscher nét, dass se gewisen, dass méi intelligent Leit méi Geld verdéngen. Mä, an déi éischt Etude sinn d'theoretesch gesond gutt vun den Donnéeën operationalized, an an der zweeter si net. Weider, wéi dëst Beispill weist, heescht méi Daten net automatesch Problemer mat bauen Validitéit léisen. Dir sollt d'Resultater vun der Etude 2 Zweiwel ob et eng Milliounen Tweets, eng Milliard Tweets Équipe, oder eng Billioun katapultéiert. Fir Fuerscher mat der Iddi vun bauen Validitéit net kennt, Table 2.2 gëtt e puer Beispiller vu Studien, déi theoretesch gesond mat digital Spuer Donnéeën operationalized hunn.

Table 2.2: Beispiller vun digitale Spure datt den Mesuren vun méi mythologesch theoretesch Konzepter benotzt ginn. Social Wëssenschaftler Opruff dësem Match bauen Validitéit an et ass eng grouss Erausfuerderung mat Hëllef grouss Daten Quelle fir sozial Fuerschung (Lazer 2015) .
digital Spuer theoretesch bauen Fro
Email Logbicher vun enger Universitéit (meta-Donnéeën nëmmen) sozial Relatiounen Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
soziale Medien posts op Fans Civic Engagement Zhang (2016)
Email Logbicher vun enger Firma (meta-Donnéeën an komplette Text) Kulturell fit an eng Organisatioun Goldberg et al. (2015)

Obwuel de Problem vun den Zertika Daten fir operationalizing theoretesch gesond relativ schwéier ass ze léisen, ginn et dräi gemeinsam Léisungen zu de Problem vun den Zertika demographescher Informatiounen an onkomplett Informatiounen iwwert Verhalen op aner Plattformen. Déi éischt ass tatsächlech d'Donnéeë sammelen dir braucht; Ech wäert Iech iwwer en Beispill vu datt mir am Kapitel 3, wann ech Iech iwwert Ëmfroen soen. Leider ass dës Zort vun Donnéeën Kollektioun net ëmmer méiglech. Déi zweet Haaptgrond Léisung ass ze maachen wat Donnéeën Wessenschaftler User-Numm Ufank ware ruffen a wat sozial Wëssenschaftler imputation ruffen. An dëser Approche, benotzen Fuerscher d'Informatioun, datt si op e puer Leit hunn Eegeschafte vun anere Leit ze soen. Déi drëtt méiglech Léisung-deejéinege benotzt vun Kossinets an Watts-gouf Multiple Datequellen ze kombinéieren. Dëse Prozess ass heiansdo wärd oder Rekord linkage genannt. Mäi Favorit Asaz fir dëse Prozess war am alleréischten Paragraph vun de ganz éischte Pabeier Kéier schrëftlech op Rekord linkage proposéiert (Dunn 1946) :

"All Persoun an der Welt schaaft e Buch vun Life. Dëst Buch fänkt mat der Gebuert an goung mat Doud. Seng Säite sinn an vun den Undeel vun de Prinzip Evenementer am Liewen huet. Rekord linkage ass den Numm fir de Prozess entscheet vun de Säite vun dësem Buch an engem Volumen gouft. "

Dëse Passage gouf 1946 geschriwwen, an op déi Zäit, Leit sech denken, datt d'Buch vun Life hätt grouss Liewen Evenementer wéi Gebuert, Bestietnes, Scheedung, an den Doud gehéiert. Mä, lo dass esou vill Informatiounen iwwer Leit opgeholl gëtt, kann d'Buch vun Life kéint eng onheemlech detailléierte Portrait, wann déi verschidde Säiten (dh, eisen digital Spure) ginn, zesumme gebonne ginn. Dëst Buch vun Life kéint e groussen Ressource fir Fuerscher ginn. Mä, kéint d'Buch vun Life och eng Datebank vun Ruin genannt ginn (Ohm 2010) , déi fir all Zorte vun Ofdreiwung Zwecker benotzt gin hätt, well méi beschriwwen ënnert wann ech iwwer d'sensibel vun der Informatioun elo ënnert déi grouss Daten Quellen erfaasst an am Kapitel 6 (IFLA-).