2.2 Big dàta

Big tha dàta air a chruthachadh is a chruinneachadh le riaghaltasan airson adhbharan eile a thuilleadh air rannsachadh. Cleachdadh an fhiosrachaidh seo airson rannsachadh, mar sin, Feumaidh repurposing.

An idealized sealladh de rannsachadh sòisealta dùthaich saidheans a 'toirt beachd agus an uair sin a' tional dàta gus dearbhadh a 'bheachd sin. An stoidhle seo de rannsachaidh a 'dol gu teann freagarrach eadar ceist rannsachaidh agus dàta, ach tha e cuingealaichte air sgàth an rannsachaidh fa leth gu tric chan eil na goireasan a tha a dhìth a chruinneachadh an dàta a dh'fheumas iad, leithid sgrìobhadh mòr, beairteach, agus gu nàiseanta-riochdaire dàta. Uime sin, tha tòrr de rannsachadh sòisealta san àm a dh'fhalbh air an cleachdadh mòr-sgèile an sgrùdaidhean sòisealta, leithid Choitcheann Sòisealta Survey (GSS), Ameireaga Nàiseanta Foillseachaidhean Sgrùdadh (ANES), agus Pannal Study of Teachd a-steach Dynamics (PSID). Tha iad sin air sgèile mhòr-suirbhidh a tha sa bhitheantas air a ruith le sgioba de luchd-rannsachaidh agus tha iad a dhealbhadh gus dàta a chruthachadh a dh'fhaodar a chleachdadh le mòran luchd-rannsachaidh. Air sgàth na h-amasan sin air sgèile mhòr suirbhidhean, a 'gabhail cùram mhòr dheth air a chur a-steach dealbhadh an dàta a chruinneachadh agus a bhith ag ullachadh mar thoradh air an dàta airson a chleachdadh le luchd-rannsachaidh. Nam dàta le luchd-rannsachaidh agus dha luchd rannsachaidh.

As rannsachadh sòisealta a 'cleachdadh stòran didseatach aois, ge-tà, gu bunaiteach eadar-dhealaichte. An àite a bhith a 'cleachdadh dàta a chaidh a chruinneachadh le luchd-rannsachaidh agus do luchd-rannsachaidh, tha e a' cleachdadh tùsan dàta a chaidh a chruthachadh is a chruinneachadh le gnothachasan agus riaghaltasan aca fhèin airson adhbharan leithid a bhith a 'dèanamh prothaid, a' solarachadh seirbheis, no rianachd lagh. Nam gnothachais agus riaghaltas tobraichean dàta air a thighinn gu bhith air a ghairm mòr dàta. A 'dèanamh rannsachadh le mòr dàta eadar-dhealaichte seach a' dèanamh rannsachadh le dàta a chaidh a chruthachadh an toiseach airson rannsachadh. Coimeas eadar, mar eisimpleir, na meadhanan sòisealta làrach-lìn, leithid Twitter, le traidiseanta poblach suirbhidh beachd leithid Choitcheann Sòisealta Survey (GSS). Twitter prìomh amasan a tha gu seirbheis a thoirt do luchd-cleachdaidh aice agus prothaid a dhèanamh. Anns a 'phròiseas de bhith a' coileanadh amasan sin, a 'cruthachadh Twitter dàta a dh'fhaodadh a bhith feumail airson a bhith ag ionnsachadh an cuid de thaobhan de bheachd poblach. Ach, eu-coltach ris an t-Seanalair Sòisealta Survey (GSS), Twitter nach eil sa mhòr-chuid cuimsichte air rannsachadh sòisealta.

Tha an abairt mòr dàta e leamh neo-shoilleir, agus e buidhnean còmhla mòran rudan eadar-dhealaichte. Airson adhbharan rannsachaidh shòisealta, tha mi smaoineachadh gu bheil e feumail dealachadh a dhèanamh eadar an dà sheòrsa mhòr tobraichean dàta: riaghaltas clàran rianachd agus gnothachas clàran rianachd. Riaghaltas na clàran rianachd a tha dàta a tha air a chruthachadh le riaghaltasan mar phàirt de ghnìomhan àbhaisteach aca. Nam sheòrsaichean de na clàran air a bhith air a chleachdadh le luchd-rannsachaidh ann an cur-seachad leithid demographers ag ionnsachadh breith, pòsadh agus bàis clàran-ach riaghaltasan a 'sìor a' cruinneachadh agus a 'leigeil clàraidhean mionaideach ann analyzable foirmean. Mar eisimpleir, an New York City riaghaltas a stàladh didseatach meatair taobh a-staigh de gach tacsaidh anns a 'bhaile. Nam meatair a chlàradh h-uile seòrsa dàta mu gach tacsaidh ride gabhail a-steach an dràibhear, an toiseach àm agus àite, a 'stad àm agus àite, agus an fharadh. Ann an sgrùdadh sin innsidh mi nas fhaide air adhart sa chaibideil seo, Henry Farber (2015) repurposed dàta sin gus dèiligeadh ri bunaiteach deasbad ann an saothair chloinne eaconamachd mun dàimh eadar toirt tuarastal agus an àireamh de dh'uairean a thìde ag obair.

Tha an dàrna seòrsa de phrìomh mòr dàta airson rannsachadh sòisealta a tha gnothaichean an clàran rianachd. Tha iad seo dàta a gnothachais a chruthachadh agus a chruinneachadh mar phàirt de ghnìomhan àbhaisteach aca. Nam gnothachais clàran rianachd a tha gu tric theirear didseatach comharran, agus gabhail a-steach rudan mar search engine ceiste logaichean, na meadhanan sòisealta dreuchdan, agus ghairm clàran bho na fònaichean-làimhe. Breithneachail a dhèanamh, na gnothaichean clàran rianachd nach eil dìreach mu ghiùlan air loidhne. Mar eisimpleir, bùithean a 'cleachdadh sùil a-mach scanairean a' cruthachadh fìor-ùine cheumannan-obrach cinneasachd. Ann an sgrùdadh sin innsidh mi dhut mu dheidhinn nas fhaide air adhart sa chaibideil seo, Alexandre Mas agus Enrico Moretti (2009) repurposed seo mòr-bhùth sùil a-mach airson dàta a sgrùdadh mar a tha luchd-obrach a 'cinneasachd Tha buaidh le cinneasachd an co-aoisean.

Mar an dà chuid de na h-eisimpleirean a 'sealltainn, an smuain nan repurposing bunaiteach airson ionnsachadh bho mòr dàta. Ann m 'eòlas, saidheans sòisealta agus dàta luchd-saidheans an dòigh seo repurposing glè eadar-dhealaichte. Saidheans sòisealta, a tha eòlach air a bhith ag obair còmhla ri dàta a dhealbhadh airson rannsachadh, a tha gu luath a 'comharrachadh a-mach air na duilgheadasan le repurposed dàta leigeil seachad fhad' sa bha a neartan. Air an làimh eile, dàta luchd-saidheans a tha gu luath a 'comharrachadh a-mach na buannachdan repurposed dàta leigeil seachad fhad' sa bha a laigsean. Gu Nàdarrach, an dòigh as fheàrr a bhiodh ann dà-chonnaidh. 'S e sin, feumaidh luchd-rannsachaidh a' tuigsinn na feartan ùra seo thobraichean dàta-an dà chuid math agus dona-agus an uair sin a-mach mar a bhith ag ionnsachadh bhuapa. Agus, a tha a 'phlana airson a' chòrr den chaibideil seo. An ath-, bidh mi a 'toirt cunntas air feartan cumanta deich gnìomhachais agus rianachd dàta riaghaltais. Às dèidh sin, bidh mi a 'toirt cunntas air trì rannsachadh dòighean a dh'fhaodar a chleachdadh le dàta sin, dòighean-obrach a tha gu math freagarrach airson na feartan de an dàta seo.