2.3.2.1 Neamhiomlán

Níl cuma cé chomh "mór" do "sonraí mór" is dócha nach bhfuil an t-eolas is mian leat.

An chuid is mó foinsí sonraí mór neamhiomlán, sa mhéid is nach bhfuil acu an t-eolas go mbeidh tú ag iarraidh do chuid taighde. Is gné choitianta de shonraí a cruthaíodh go chun críoch seachas taighde. Go leor eolaithe sóisialta a bhí cheana féin ar an taithí ar dhéileáil leis an neamhiomláine, ar nós suirbhé atá ann cheana nach raibh a iarraidh ar an cheist a raibh tú. Ar an drochuair, claonadh a bhíonn na fadhbanna a bhaineann neamhiomláine a bheith níos mhór i sonraí mór. I mo thaithí féin, bíonn sonraí mór a bheith in easnamh trí chineál eolais úsáideach le haghaidh taighde sóisialta: déimeagrafaic, iompar ar ardáin eile, agus sonraí a operationalize constructs teoiriciúil.

Gach trí cinn de na cineálacha neamhiomláine léirithe i staidéar ag Gueorgi Kossinets agus Duncan Watts (2006) mar gheall ar an éabhlóid an líonra sóisialta in ollscoil. Kossinets agus Watts tús leis an logs r-phost ón ollscoil, a raibh eolas beacht faoin a chuir ríomhphoist a bhfuil ar an méid ama (nach raibh na taighdeoirí rochtain a fháil ar ábhar na ríomhphoist). Na taifid r-phost fuaime cosúil le tacar sonraí iontach, ach, tá-in ainneoin a méid agus gráinneacht-bunúsach neamhiomlán siad. Mar shampla, ní fholaíonn siad na logs ríomhphost sonraí faoi thréithe déimeagrafacha na mic léinn, ar nós inscne agus aoise. Thairis sin, nach n-áirítear na logs ríomhphost eolas faoi cumarsáide trí mheáin eile, cosúil le glaonna teileafóin, teachtaireacht téacs, nó duine le duine comhrá. Ar deireadh, nach n-áirítear na logs ríomhphost go díreach eolas faoi chaidrimh, na constructs teoiriciúil i teoiricí atá ann cheana go leor. Níos déanaí sa chaibidil, nuair a labhair mé faoi straitéisí taighde, beidh tú a fheiceáil conas a Kossinets agus Watts réiteach na fadhbanna seo.

De trí chineál neamhiomláine, is é an fhadhb na sonraí neamhiomlán operationalize constructs teoiriciúil an deacra a réiteach, agus i mo thaithí féin, tá sé go minic overlooked de thaisme ag eolaithe sonraí. Garbh, tá constructs teoiriciúil smaointe teibí a eolaithe sóisialta staidéir, ach, ar an drochuair, ní féidir leis na constructs a shainiú gan athbhrí gcónaí agus a thomhas. Mar shampla, a ligean ar a shamhlú ag iarraidh a thástáil empirically an t-éileamh cosúil simplí gur daoine atá níos cliste thuilleamh níos mó airgid. D'fhonn tástáil éileamh seo bheadh ​​de dhíth ort a thomhas "faisnéis." Ach, cad é faisnéis? Mar shampla, Gardner (2011) argóint go bhfuil iarbhír ocht cineálacha éagsúla na hintleachta. Agus, tá An bhfuil nósanna imeachta a d'fhéadfadh aon cheann de na foirmeacha na hintleachta thomhas go cruinn? In ainneoin méideanna ollmhór oibre ag síceolaithe, na ceisteanna seo go fóill nach bhfuil freagraí gan athbhrí. Dá bhrí sin, fiú réasúnta simplí éileamh-daoine atá níos cliste thuilleamh níos mó airgid-Is féidir a bheith deacair a mheas empirically mar is féidir é a bheith deacair a operationalize constructs teoiriciúil i sonraí. Samplaí eile de constructs teoiriciúil atá tábhachtach ach go crua chun operationalize san áireamh "noirm," "caipiteal sóisialta," agus "daonlathas." Eolaithe sóisialta glaoch ar an gcluiche idir constructs teoiriciúil agus bailíocht sonraí thógáil (Cronbach and Meehl 1955) . Agus, mar a léiríonn an liosta de na constructs, a thógáil is bailíocht fadhb go bhfuil eolaithe sóisialta ag streachailt le ar feadh tréimhse an-fhada, fiú amháin nuair a bhí siad ag obair le sonraí a bailíodh chun críocha taighde. Nuair a bheidh ag obair le sonraí a bailíodh chun críoch seachas taighde, is iad na fadhbanna na bailíochta thógáil níos dúshlánaí (Lazer 2015) .

Nuair atá tú ag léamh ar pháipéar taighde, bealach amháin tapaidh agus úsáideach chun measúnú imní faoi bhailíocht thógáil é a chur ar an t-éileamh is mó sa pháipéar, a chuirtear in iúl de ghnáth i dtéarmaí constructs, agus ath-chur in iúl dó ó thaobh na sonraí a úsáidtear. Mar shampla, a mheas dhá staidéar hipitéiseach éilimh sin a léiriú go bhfuil daoine níos cliste thuilleamh níos mó airgid:

  • Déan staidéar 1: daoine a scór go maith sa Triail-a Raven Progressive maitrísí tástála maith staidéar na hintleachta anailíseach (Carpenter, Just, and Shell 1990) Have ioncaim tuairisc níos airde ar a dtuairisceáin chánach
  • Staidéar 2: daoine ar Twitter a bhain úsáid as bhfuil focail níos faide níos mó seans a lua brandaí só

Sa dá chás, d'fhéadfadh taighdeoirí dhearbhú go bhfuil siad léirithe go bhfuil daoine níos cliste thuilleamh níos mó airgid. Ach, sa chéad staidéar na constructs teoiriciúil á oibríochtú go maith ag na sonraí, agus sa dara nach bhfuil siad. Thairis sin, mar a léiríonn an sampla seo, níos mó sonraí ní réiteach go huathoibríoch fadhbanna a bhfuil bailíocht thógáil. Ba chóir duit amhras torthaí Staidéir 2 cibé bhain sé milliún tweets, billiún tweets, nó trilliún tweets. Do thaighdeoirí eolas maidir leis an smaoineamh bailíochta thógáil, Tábla 2.2 roinnt samplaí de staidéir a oibríochtú constructs teoiriciúil baint úsáide as sonraí rian digiteach.

Tábla 2.2: Samplaí de rianta digiteach a úsáidtear mar tomhais coincheapa teoiriciúla níos teibí. Glaoch eolaithe sóisialta an bhailíocht mheaitseáil thógáil agus is dúshlán mór le baint úsáide as foinsí sonraí mór do thaighde sóisialta (Lazer 2015) .
rian digiteach thógáil theoiriciúil lua
logs ríomhphost ó ollscoil (meta-sonraí amháin) caidrimh shóisialta Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
phoist meáin shóisialta ar Weibo rannpháirtíocht shibhialta Zhang (2016)
logs ríomhphost ó ghnólacht (meta-sonraí agus téacs iomlán) oiriúnach Cultúrtha in eagraíocht Goldberg et al. (2015)

Cé go bhfuil an fhadhb na sonraí neamhiomlán do constructs teoiriciúil operationalizing deacair go leor a réiteach, tá trí réitigh choiteanna ar fadhb na eolas déimeagrafach neamhiomlán agus faisnéis neamhiomlán ar iompraíocht ar ardáin eile. Is é an chéad a bhailiú iarbhír ar na sonraí is gá duit; Beidh mé insint duit faoi shampla de sin i gCaibidil 3 nuair a deirim libh faoi shuirbhéanna. Ar an drochuair, nach bhfuil an gcineál seo sonraí a bhailiú agus is féidir i gcónaí. Is é an réiteach dara is mó a dhéanamh cad a thugann eolaithe sonraí thátal úsáideora-tréith agus cad glao eolaithe sóisialta-leith. Sa chur chuige seo, bain úsáid as taighdeoirí an t-eolas go bhfuil siad ar roinnt daoine a tréithe daoine eile tátal a bhaint astu. An tríú fhéadfadh réiteach-an ceann a úsáideann Kossinets agus WATTS-bhí a chur le chéile foinsí sonraí éagsúla. Tá an próiseas seo Uaireanta tugtar chumascnascadh a thaifeadadh. Moladh Mo meafar is fearr leat don phróiseas seo sa chéad mhír den chéad pháipéar riamh i scríbhinn ar nasc taifead (Dunn 1946) :

"Cruthaíonn gach duine ar fud an domhain a Leabhar na Beatha. Tosaíonn sé seo Leabhar le breith agus a chríochnaíonn le bás. A leathanaigh atá déanta suas de thaifid na n-imeachtaí bprionsabal i saol. Is nasc Taifead an t-ainm a thugtar ar an bpróiseas chéile na leathanaigh an leabhair isteach i dtoirt. "

Scríobhadh an sliocht i 1946, agus ag an am sin, bhí daoine ag smaoineamh go bhféadfadh san áireamh leis an Leabhar na Beatha-imeachtaí saoil móra ar nós breith, pósadh, colscartha, agus bás. Mar sin féin, anois go bhfuil an oiread sin eolais faoi dhaoine a taifeadadh, d'fhéadfadh an Leabhar na Beatha ina portráid thar a bheith mionsonraithe, más féidir na leathanaigh éagsúla (ie, ár rianta digiteach), faoi cheangal le chéile. D'fhéadfadh sé seo Leabhar na Beatha mar acmhainn iontach do thaighdeoirí. Ach, d'fhéadfadh an Leabhar na Beatha a dtugtar freisin bunachar sonraí de ruin (Ohm 2010) , d'fhéadfaí a úsáid le haghaidh gach cineál de críocha unethical, a bhfuil cur síos níos mó faoi bhun nuair a labhair mé faoi nádúr íogair na faisnéise a bhailíonn foinsí sonraí mór thíos agus i gCaibidil 6 (Eitice).