2.3.2 An-còmhnaidh-air

Daonnan air mòr-dàta a 'toirt cothrom a' sgrùdadh ris nach robh dùil tachartasan agus fìor-ùine tomhas.

Tha mòran dàta mòr siostaman a tha daonnan-air; tha iad daonnan a 'tional dàta. Tha seo a 'còmhnaidh air a' toirt feart rannsachaidh le dhàta iar-astair (ie, dàta thar ùine). Tha a bhith an-còmhnaidh air Tha dà bhuaidh chudromach airson rannsachadh.

An toiseach, tha cruinneachadh dàta an-còmhnaidh a 'leigeil le luchd-rannsachaidh sgrùdadh a dhèanamh air tachartasan gun dùil ann an dòighean nach biodh comasach air a' chaochladh. Mar eisimpleir, bhiodh luchd-rannsachaidh aig a bheil ùidh ann a bhith a 'sgrùdadh gealladh Occupy Gezi anns an Tuirc ann an samhradh 2013 mar as trice ag amas air giùlan luchd-iomairt rè an tachartais. B 'urrainn do Cheren Budak agus Duncan Watts (2015) barrachd a dhèanamh le bhith a' cleachdadh nàdar an-còmhnaidh Twitter airson luchd-iomairt a sgrùdadh a chleachd iad Twitter ro, rè, agus an dèidh an tachartais. Agus, b 'urrainn dhaibh buidheann coimeas de luchd-neo-phàirteach a chruthachadh ron, rè, agus an dèidh an tachartais (figear 2.2). Gu h-iomlan, bha an tweets de 30,000 neach thairis air dà bhliadhna am pannal ex-post . Le bhith a 'cur ris an dàta a chaidh a chleachdadh gu tric bho na h-iomairtean leis an fhiosrachadh eile seo, b' urrainn do Budak agus Watts mòran a bharrachd ionnsachadh: bha e comasach dhaibh tuairmse a dhèanamh air dè na daoine a bu dualtach a bhith an sàs ann an gearan Gezi agus tuairmse a dhèanamh air na h-atharrachaidhean ann am beachdan com-pàirtichean agus neo-chompàirtichean, an dà chuid sa gheàrr-ùine (a 'dèanamh coimeas eadar ro-Gezi agus Gezi) agus san fhad-ùine (a' dèanamh coimeas eadar pre-Gezi agus Gezi às dèidh).

Figear 2.2: Dealbhadh le Budak agus Watts (2015) air a chleachdadh airson sgrùdadh a dhèanamh air na gearanan Gezi anns an Tuirc as t-samhradh 2013. Le bhith a 'cleachdadh nàdar an-còmhnaidh Twitter, chruthaich na luchd-rannsachaidh na thug iad ris a' phannal ex-post a bha a 'gabhail a-steach 30,000 neach thairis air dà bhliadhna. An coimeas ri sgrùdadh àbhaisteach a dh 'fhòcas air com-pàirtichean rè na h-iomairtean, tha am pannal ex-post a' cur 1) fiosrachadh bho chom-pàirtichean ron tachartas agus às deidh sin agus 2) dàta bho dhaoine nach robh an sàs roimhe, rè agus an dèidh an tachartais. Thug an structar dàta beartach seo cothrom do Budak agus Watts tuairmse a dhèanamh air na seòrsaichean dhaoine a bu bhuailtiche pàirt a ghabhail ann an gearan Gezi agus tuairmse a dhèanamh air na h-atharrachaidhean ann am beachdan chom-pàirtichean agus neo-chom-pàirtichean, an dà chuid sa gheàrr-ùine (a 'dèanamh coimeas eadar pre-Gezi còmhla ri Gezi ) agus san fhad-ùine (a 'dèanamh coimeas eadar prezi Gezi agus post-Gezi).

Figear 2.2: Dealbhadh le Budak and Watts (2015) airson sgrùdadh a dhèanamh air na gearanan Gezi anns an Tuirc as t-samhradh 2013. Le bhith a 'cleachdadh nàdar an-còmhnaidh Twitter, chruthaich na luchd-rannsachaidh na thug iad ris a' phannal ex-post a bha a 'gabhail a-steach 30,000 neach thairis air dà bhliadhna. An coimeas ri sgrùdadh àbhaisteach a dh 'fhòcas air com-pàirtichean rè na h-iomairtean, tha am pannal ex-post a' cur 1) fiosrachadh bho chom-pàirtichean ron tachartas agus às deidh sin agus 2) dàta bho dhaoine nach robh an sàs roimhe, rè agus an dèidh an tachartais. Thug an structar dàta beartach seo cothrom do Budak agus Watts tuairmse a dhèanamh air na seòrsaichean dhaoine a bu bhuailtiche pàirt a ghabhail ann an gearan Gezi agus tuairmse a dhèanamh air na h-atharrachaidhean ann am beachdan chom-pàirtichean agus neo-chom-pàirtichean, an dà chuid sa gheàrr-ùine (a 'dèanamh coimeas eadar pre-Gezi còmhla ri Gezi ) agus san fhad-ùine (a 'dèanamh coimeas eadar prezi Gezi agus post-Gezi).

Dh'fhaodadh fios a bhith a 'toirt a-mach gum faodadh cuid de na tuairmsean sin a bhith air a dhèanamh gun a bhith a-riamh - air stòrasan cruinneachaidh dàta (me, tuairmsean fad-ùine de atharrachadh inntinn), agus tha sin ceart, ged a bhiodh cruinneachadh den leithid seo airson 30,000 neach air a bhith gu math daor. Eadhon air sgàth buidseat gun chrìoch, ge-tà, chan urrainn dhomh smaoineachadh air dòigh sam bith eile a tha a 'toirt cothrom dha luchd-rannsachaidh siubhal air ais ann an ùine agus gu dìreach a bhith a' cumail sùil air giùlan nan com-pàirtichean san àm a dh'fhalbh. B 'e an roghainn ab' fhaisge a bhith a 'cruinneachadh aithisgean giùlan ath-dhreuchdail, ach bhiodh na h-aithisgean sin glè chinnteach agus mionaideach. Tha clàr 2.1 a 'toirt eisimpleirean eile de sgrùdaidhean a bhios a' cleachdadh stòr dàta a-mhàin gus tachartas neo-dùil a sgrùdadh.

Clàr 2.1: Eòlas air tachartasan gun dùil a 'cleachdadh stòrasan fiosrachaidh daonnan-air.
Tachartas neo-dùil Daonnan-air stòr dàta Luaidh
Gluasad gluasad Gezi anns an Tuirc Twitter Budak and Watts (2015)
Tha Umbrella a 'gearan ann an Hong Kong Weibo Zhang (2016)
Togalaichean de phoileas ann am Baile New York Aithisgean stad-agus-frisk Legewie (2016)
Duine a 'ceangal ri ISIS Twitter Magdy, Darwish, and Weber (2016)
11 Sultain 2001 ionnsaigh beòjournal.com Cohn, Mehl, and Pennebaker (2004)
11 Sultain 2001 ionnsaigh teachdaireachdan pagaidh Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

A bharrachd air a bhith a 'sgrùdadh thachartasan gun dùil, tha siostaman dàta daonnan-inntinneach cuideachd a' toirt cothrom do luchd-rannsachaidh tuairmsean fìor-ùine a dhèanamh, a dh'fhaodas a bhith cudromach ann an suidheachaidhean far a bheil poileasaidh ann an riaghaltas no gnìomhachas - ag iarraidh freagairt stèidhichte air mothachadh suidheachadh. Mar eisimpleir, faodar dàta meadhanan sòisealta a chleachdadh gus stiùireadh èiginn a stiùireadh gu mòr-thubaistean nàdarra (Castillo 2016) agus caochladh de stòran dàta mòr eadar-dhealaichte a bhith a 'toirt seachad tuairmsean fìor-ùine de ghnìomhachd eaconamach (Choi and Varian 2012) .

Ann an co-dhùnadh, tha siostaman dàta an-còmhnaidh a 'toirt comas do luchd-rannsachaidh tachartasan gun dùil a sgrùdadh agus fiosrachadh fìor-ùine a thoirt do luchd-dèanaidh phoileasaidhean. Chan eil mi a 'smaoineachadh, ge-tà, gu bheil siostaman dàta an-còmhnaidh freagarrach airson atharrachaidhean a tharraing thar ùineichean fada. Tha sin air sgàth gu bheil mòran de shiostaman dàta mòra ag atharrachadh a-riamh - pròiseas a dh 'iarr mi air drift nas fhaide air adhart sa chaibideil (earrann 2.3.7).