2.3.4 Mhux kompluta

Ma jimpurtax kemm hu kbir id-dejta kbira tiegħek, probabbilment ma jkollux l-informazzjoni li trid.

Ħafna sorsi ta 'dejta kbar mhumiex kompluti , fis-sens li m'għandhomx l-informazzjoni li trid għar-riċerka tiegħek. Din hija karatteristika komuni tad-dejta li nħolqot għal skopijiet oħra barra r-riċerka. Bosta xjenzati soċjali diġà kellhom l-esperjenza li jittrattaw in-nuqqas ta 'kompletezza, bħal stħarriġ eżistenti li ma talabx il-mistoqsija li kienet meħtieġa. Sfortunatament, il-problemi ta 'kompletezza għandhom tendenza li jkunu aktar estremi f'dejta kbira. Fl-esperjenza tiegħi, data kbira t-tendenza li tkun nieqsa tlett tipi ta 'informazzjoni utli għar-riċerka soċjali: informazzjoni demografika dwar parteċipanti, imġieba fuq pjattaformi oħra, u data biex jiġu operattivi kostruzzjonijiet teoretiċi.

Mit-tliet tipi ta 'nuqqas ta' kompletezza, il-problema ta 'data mhux kompluta għall-operazzjonalizzazzjoni ta' kostruzzjoni teoretika hija l-iktar waħda diffiċli biex tissolva. U fl-esperjenza tiegħi, ta 'spiss jiġi injorat aċċidentalment. Bejn wieħed u ieħor, il -kostrutturi teoretiċi huma ideat astratti li x-xjentisti soċjali jistudjaw u joperaw għal kostruzzjoni teoretika tfisser li tipproponi xi mod biex tinġabar dik il-kostruzzjoni b'dejta osservabbli. Sfortunatament, dan il-proċess ta 'ħoss sempliċi spiss jirriżulta pjuttost diffiċli. Per eżempju, ejja nimmaġina li tipprova empirikament ittestja t-talba apparentement sempliċi li n-nies li huma aktar intelliġenti jaqilgħu aktar flus. Sabiex tittestja din l-istqarrija, ikollok bżonn tkejjel "l-intelliġenza". Imma x'inhi l-intelliġenza? Gardner (2011) argumentat li fil-fatt hemm tmien forom differenti ta 'intelliġenza. U hemm proċeduri li jistgħu jkejlu b'mod preċiż kull waħda minn dawn il-forom ta 'intelliġenza? Minkejja l-ammonti enormi ta 'xogħol mill-psikologi, dawn il-mistoqsijiet għad m'għandhomx tweġibiet mhux ambigwi.

Għalhekk, anki talba relattivament sempliċi - il-persuni li huma aktar intelliġenti jaqilgħu aktar flus - jistgħu jkunu diffiċli biex tivvaluta b'mod empiriku minħabba li jista 'jkun diffiċli biex jiġu operattivi l-kostruzzjonijiet teoretiċi fid-data. Eżempji oħra ta 'kostrutturi teoretiċi li huma importanti iżda diffiċli biex jitħaddmu jinkludu "normi", "kapital soċjali" u "demokrazija". Ix-xjenzjati soċjali jsejħu l-logħba bejn il-kostruzzjoni teoretika u l -validità tal-kostruzzjoni tad-data (Cronbach and Meehl 1955) . Hekk kif tissuġġerixxi din il-lista qasira ta 'kostruzzjonijiet, il-validità tal-bini hija problema li x-xjenzati soċjali ħabbtu wiċċhom magħhom għal żmien twil ħafna. Iżda fl-esperjenza tiegħi, il-problemi tal-validità tal-kostruzzjoni huma saħansitra akbar meta naħdem ma 'data li ma nħolqitx għall-finijiet ta' riċerka (Lazer 2015) .

Meta tkun qiegħed tevalwa riżultat ta 'riċerka, mod wieħed rapidu u utli biex tiġi vvalutata l-validità tal-kostruzzjoni huwa li r-riżultat, li normalment jiġi espress f'termini ta' kostruzzjonijiet, jerġa 'jiġi espress f'termini tad-dejta użata. Pereżempju, tikkunsidra żewġ studji ipotetiċi li jippruvaw juru li persuni li huma aktar intelliġenti jaqilgħu aktar flus. Fl-ewwel studju, ir-riċerkatur sab li persuni li jmorru sewwa fuq it-Test tal-Matriċi Progressivi Raven - test studjat sew ta 'intelliġenza analitika (Carpenter, Just, and Shell 1990) għandhom dħul ogħla irrapportat fuq il-prospetti tat-taxxa tagħhom. Fit-tieni studju, ir-riċerkatur sab li n-nies fuq Twitter li użaw kliem itwal huma aktar probabbli li jsemmu marki ta 'lussu. Fiż-żewġ każijiet, dawn ir-riċerkaturi jistgħu jsostnu li wrew li persuni li huma aktar intelliġenti jaqilgħu aktar flus. Madankollu, fl-ewwel studju l-kostruzzjonijiet teoretiċi huma operati tajjeb bid-dejta, filwaqt li fit-tieni wieħed mhumiex. Barra minn hekk, kif juri dan l-eżempju, aktar dejta ma ssolvix awtomatikament problemi bil-validità tal-kostruzzjoni. Għandek tikkontesta r-riżultati tat-tieni studju jekk din tinvolvi miljun tweet, biljun tweet jew triljun tweets. Għar-riċerkaturi li mhumiex familjari ma 'l-idea li tinbena l-validità, it-Tabella 2.2 tipprovdi xi eżempji ta' studji li operazzjonalizzaw strutturi teoretiċi bl-użu ta 'data traċċa diġitali.

Tabella 2.2: Eżempji ta 'traċċi diġitali li ntużaw biex tiġi Operazzjonali l-Kostruzzjoni Teoretika
Sors tad-dejta Kostruzzjoni teoretika Referenzi
Ir-reġistrazzjonijiet elettroniċi minn università (meta-data biss) Relazzjonijiet soċjali Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
Postijiet tal-midja soċjali fuq Weibo Ingaġġ ċiviku Zhang (2016)
Email logs minn ditta (meta-data u test komplut) Kapaċità Kulturali f'organizzazzjoni Srivastava et al. (2017)

Għalkemm il-problema ta 'data mhux kompluta biex jinqabdu strutturi teoretiċi hija pjuttost diffiċli biex issolvi, hemm soluzzjonijiet komuni għat-tipi komuni l-oħra ta' nuqqas ta 'kompletezza: informazzjoni demografika mhux kompluta u informazzjoni mhux kompluta dwar l-imġiba fuq pjattaformi oħra. L-ewwel soluzzjoni hija li fil-fatt tiġbor id-data li għandek bżonn; Jien ser ngħidlek dwar dak fil-kapitolu 3 meta jgħidlek dwar l-istħarriġ. It-tieni soluzzjoni ewlenija hija li tagħmel liema xjentisti tad-dejta jsejħu l-inferenza ta 'l-attribut ta' l-utent u x-xjenzati soċjali jitolbu imputazzjoni . F'dan l-approċċ, ir-riċerkaturi jużaw l-informazzjoni li għandhom fuq xi nies biex jiddeduċu l-attributi ta 'nies oħra. It-tielet soluzzjoni possibbli hija li jingħaqdu diversi sorsi ta 'data. Dan il-proċess kultant jissejjaħ rabta ta 'rekords . Metafora favorita tiegħi għal dan il-proċess kien miktub minn Dunn (1946) fl-ewwel paragrafu tal-ewwel karta qatt miktuba fuq ir-rabta ta 'reġistrazzjoni:

"Kull persuna fid-dinja toħloq Ktieb tal-Ħajja. Dan il-Ktieb jibda mat-twelid u jispiċċa bil-mewt. Il-paġni tiegħu huma magħmula minn rekords tal-avvenimenti prinċipali fil-ħajja. Rabta tar-rekords hija l-isem mogħti lill-proċess ta 'assemblaġġ tal-paġni ta' dan il-ktieb f'volum. "

Meta Dunn kiteb dak il-passaġġ kien jimmaġina li l-Ktieb tal-Ħajja jista 'jinkludi avvenimenti tal-ħajja maġġuri bħal twelid, żwieġ, divorzju, u mewt. Madankollu, issa li tiġi rreġistrata tant informazzjoni dwar in-nies, il-Ktieb tal-Ħajja jista 'jkun ritratt oerhört dettaljat, jekk dawk il-paġni differenti (jiġifieri, it-traċċi diġitali tagħna) jistgħu jintrabtu flimkien. Dan il-Ktieb tal-Ħajja jista 'jkun riżors kbir għar-riċerkaturi. Iżda, tista 'tissejjaħ ukoll database ta' rovina (Ohm 2010) , li tista 'tintuża għal kull tip ta' skop mhux etiku, kif ser niddeskrivi fil-kapitolu 6 (Etika).