2.4.2 sìde agus nowcasting

Fiosachd air an àm ri teachd tha e doirbh, ach fiosachd air an t-diugh tha e nas fhasa.

Bha an dàrna prìomh ro-innleachd rannsachaidh a ghabhas cleachdadh le beachdachail dàta sìde. Tha e gu math duilich a bhith a 'dèanamh tuairmsean mun àm ri teachd, agus is dòcha airson an adhbhar sin, chan eil ro-aithris an-dràsta na phàirt mhòr de rannsachadh sòisealta (ged a tha e na phàirt bheag agus cudromach de dhualchas, eaconamas, epidemio-eòlas agus saidheans poilitigeach). An seo, ge-tà, bu mhath leam a bhith ag amas air seòrsa sònraichte de ro-ràdh ris an canar nowcasting -a teirm bho bhith a 'cur ri chèile "a-nis" agus "ro-aithris." An àite a bhith a' toirt tuairmse air an àm ri teachd, bidh oidhirpean a-nis a 'cleachdadh bheachdan bho ro-aithris gus an staid làithreach a thomhas den t-saoghal; bidh e a 'feuchainn ri "ro-innse an latha an-diugh" (Choi and Varian 2012) . Tha comas aig Nowcasting a bhith gu h-àraid feumail do riaghaltasan agus companaidhean a tha a 'feumachdainn ceumannan cruinne agus cruinneil an t-saoghail.

Aon shuidheachadh far a bheil an fheum air tomhas ùineail agus neo-mhearachdach glè shoilleir tha eus-eòlas. Beachdaich air a 'chùis mu influenza ("the flu"). Gach bliadhna, bidh galaran tinneas flù seusanail ag adhbhrachadh milleanan de thinneasan agus na ceudan de mhìltean de bhàsan air feadh an t-saoghail. A bharrachd, a h-uile bliadhna, tha e coltach gum faodadh foirm ùr de influenza nochdadh a mharbhadh milleanan. Thathar a 'meas gu bheil an cnatan 1918 a' tòiseachadh, mar eisimpleir, gun do mharbh e eadar 50 agus 100 millean duine (Morens and Fauci 2007) . Air sgàth an fheum a bhith a 'cumail sùil air agus a dh'fhaodadh a bhith a' freagairt air cnatan mòr, tha riaghaltasan air feadh an t-saoghail air siostaman faireachaidh flù a chruthachadh. Mar eisimpleir, bidh Ionadan SAM airson Smachdachadh agus Galaran Galar (CDC) a 'cruinneachadh fiosrachadh gu riaghailteach agus gu riaghailteach bho dhotairean gu cùramach air feadh na dùthcha. Ged a tha an siostam seo a 'cruthachadh dàta de dh'àrd-chàileachd, tha droch aithris aige. Tha sin, air sgàth na h-ùine a bheir e airson an dàta a tha a 'tighinn bho dhotairean a bhith air a ghlanadh, air a làimhseachadh, agus air fhoillseachadh, tha an siostam CDC a' foillseachadh tuairmsean air dè an cnatan mòr a bha ann o chionn dà sheachdain. Ach, nuair a bhios iad a 'làimhseachadh galar a tha a' tighinn am bàrr, chan eil oifigearan slàinte a 'phobaill ag iarraidh faighinn a-mach dè an cnatan mòr a bha ann o chionn dà sheachdain; tha iad airson faighinn a-mach dè an cnatan mòr a th 'ann an-dràsta.

Aig an aon àm gu bheil an CDC a 'tional dàta gus sùil a chumail air influenza, tha Google cuideachd a' tional dàta mu iomadachd influenza, ged a tha e ann an cruth eadar-dhealaichte. Bidh daoine bho air feadh an t-saoghail an-còmhnaidh a 'cur cheistean gu Google, agus cuid de na ceistean sin - mar "leigheasan cnatan mòr" agus "comharraidhean flù" - tha e a' sealltainn gu bheil am flù aig an neach a tha a 'dèanamh a' cheist. Ach, tha a bhith a 'cleachdadh nan ceistean rannsachaidh sin airson tuairmse a thoirt air ìre flù a tha duilich: chan eil a h-uile duine aig a bheil a' chnatain mhòir a 'dèanamh rannsachadh co-cheangailte ri flù, agus chan e a h-uile rannsachadh a tha a' buntainn ri cnatan mòr bho neach aig a bheil a 'chnatan mhòr.

Bha am beachd chudromach agus sgileil aig Jeremy Ginsberg agus sgioba de cho-obraichean (2009) , cuid aig Google agus cuid aig CDC, gus an dà stòras dàta sin a chur còmhla. Gu ìre, tro cho-theacsa alchemy staitistigeach, chuir na luchd-rannsachaidh an dàta luirg luath agus mì-cheart le dàta CDC slaodach agus ceart gus tomhas luath agus ceart de thionndadh cnatan mòr a dhèanamh. Is e dòigh eile air smaoineachadh air seo gun do chleachd iad an dàta rannsachaidh gus dàta CDC a dhèanamh nas luaithe.

Nas sònraichte gu sònraichte, a 'cleachdadh dàta bho 2003 gu 2007, bha Ginsberg agus co-obraichean a' meas an dàimh eadar iomadachd influenza ann an dàta CDC agus an tomhas rannsachaidh airson 50 millean teirmean eadar-dhealaichte. Bhon phròiseas seo, a bha gu tur air a stiùireadh le dàta agus nach robh feum air eòlas meidigeach speisealaichte, lorg an luchd-rannsachaidh seata de 45 ceistean eadar-dhealaichte a bha coltas gu ro-innseach mu na h-àireamhan de chnatan flù CDC. An uairsin, a 'cleachdadh nan dàimhean a dh' ionnsaich iad bho dhàta 2003-2007, rinn Ginsberg agus co-obraichean sgrùdadh air a 'mhodail aca rè seusan cnatan mòr 2007-2008. Fhuair iad a-mach gum faodadh na modhan-obrach aca a bhith a 'dèanamh a-steach feumail agus ceart a-nis (figear 2.6). Chaidh na toraidhean sin fhoillseachadh ann an Nàdar agus fhuair iad craoladh naidheachd air na meadhanan. Thàinig am pròiseact seo - ris an canar Google Flu Trends-gu bhith na dhìleas gu tric a 'nochdadh mu chumhachd dàta mòr gus an saoghal atharrachadh.

Figear 2.6: Chuir Jeremy Ginsberg agus co-oibrichean (2009) còmhla dàta rannsachaidh Google le dàta CDC gus Google Flu Trends a chruthachadh, a dh'fhaodadh a-nis ìre de thinneas coltach ri cnatan mòr (ILI) a chraoladh. Tha toraidhean anns an àireamh seo airson sgìre meadhan a 'Chuain Siar anns na Stàitean Aonaichte ann an seusan cnatan mòr 2007-2008. Ged a bha e an toiseach gu math gealltanach, rinn coileanadh Flu Flunds Google sìos tro ùine (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014). Atharrachadh bho Ginsberg et al. (2009), figear 3.

Figear 2.6: Chuir Jeremy Ginsberg agus co-oibrichean (2009) còmhla dàta rannsachaidh Google le dàta CDC gus Google Flu Trends a chruthachadh, a dh'fhaodadh a-nis ìre de thinneas coltach ri cnatan mòr (ILI) a chraoladh. Tha toraidhean anns an àireamh seo airson sgìre meadhan a 'Chuain Siar anns na Stàitean Aonaichte ann an seusan cnatan mòr 2007-2008. Ged a bha e an toiseach gu math gealltanach, rinn coileanadh Flu Flunds Google sìos tro ùine (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . Atharrachadh bho Ginsberg et al. (2009) , figear 3.

Ge-tà, thionndaidh a 'bhuaidh shoirbheachail seo gu bhith na nàire. Thar ùine, lorg luchd-rannsachaidh dà chuingealachaidhean cudromach a tha a 'ciallachadh nach bi Tinneasan Flùr Google cho iongantach na nochd e an toiseach. An toiseach, cha robh coileanadh Google Flu Trends gu math na b 'fheàrr na am modal sìmplidh a tha a' dèanamh tuairmse air an ìre de fhlù a tha stèidhichte air cur-an-aghaidh sreathach bhon dà tomhas as ùire de fhlùraichean flù (Goel et al. 2010) . Agus, thairis air cuid de thrì ùine, bha Google Flu Trends na bu mhiosa na an dòigh shìmplidh seo (Lazer et al. 2014) . Ann am faclan eile, cha do chuir Toraidhean Flu Flu Google leis a h-uile dàta, ionnsachadh innealan, agus coimpiutaireachd cumhachdach buaidh mhòr air heuristic sìmplidh agus furasta a thuigsinn. Tha seo a 'toirt fa-near, nuair a tha thu a' luachadh ro-mheas sam bith no a tha a-nis air a leigeil dheth, tha e cudromach coimeas a dhèanamh an aghaidh bun-loidhne

Is e an dàrna uaimheas cudromach a thaobh Treubhan Flùr Google gu robh a comas a bhith a 'ro-innseadh fiosrachadh flù CDC buailteach air fàilligeadh geàrr-ùine agus lùghdachadh fad-ùine air sgàth drioftaireachd agus cladhach . Mar eisimpleir, rè briseadh Flù nam Muc 2009 tha Google Flu Trends uabhasach mòr air an ìre de dh 'fhlùin, is dòcha oir tha daoine buailteach an giùlan rannsachaidh atharrachadh mar fhreagairt air eagal farsaing air galar lèir-sgaoilte san t-saoghal (Cook et al. 2011; Olson et al. 2013) S an Iar- A bharrachd air na duilgheadasan geàrr-ùine seo, rinn an coileanadh lùghdachadh mean air mhean thar ùine. Tha e duilich a bhith a 'dearbhadh na h-adhbharan airson a' chìs san fhad-ùine seach gu bheil na h-algorithms rannsachadh Google air an sealbhachadh, ach tha e coltach gu bheil Google ann an 2011 a 'moladh teirmean rannsachaidh co-cheangailte nuair a bhios daoine a' lorg comharraidhean flù mar "fiabhras" agus "casadaich" (tha e coltach cuideachd chan eil am feart seo gnìomhach tuilleadh). Is e rud gu tur reusanta a tha ann a bhith a 'cur ris an fheart seo ma tha thu a' ruith inneal-luirg, ach bha buaidh aig an atharrachadh cudthromach seo a bhith a 'cruthachadh barrachd rannsachaidhean ceangailte ri slàinte a dh' adhbhraich Google Flu Trends a bhith a 'toirt a-mach na h-ìre flù a bh' ann (Lazer et al. 2014) .

Tha an dà uaimheas seo a 'dèanamh iom-fhillte air oidhirpean a tha a-nis a' craoladh an-dràsta, ach chan eil iad a 'toirt taic dhaibh. Gu dearbh, le bhith a 'cleachdadh dhòighean nas cùramach, Lazer et al. (2014) agus Yang, Santillana, and Kou (2015) an dà dhuilgheadas sin a sheachnadh. A 'dol air adhart, tha mi an dùil gun toir sgrùdaidhean a-nis a bhios a' ceangal stòrasan dàta mòr le dàta a chaidh a chruinneachadh le companaidhean agus riaghaltasan tuairmsean nas mionaidiche agus nas cruinne a chruthachadh le bhith a 'sìor dhol suas gluasadan sam bith a thèid a dhèanamh a-rithist thar ùine le beagan lag. Tha pròiseactan an-dràsta leithid Google Flu Trends cuideachd a 'sealltainn dè a thachras ma thèid stòran dàta mòra a chur còmhla le dàta nas traidiseanta a chaidh a chruthachadh airson adhbharan rannsachaidh. Le bhith a 'smaoineachadh air an eadar-theangachadh ealain ann an caibideil 1, tha cothrom aig a-nis cothrom a thoirt còmhla ri modhan-ciùil ann an stoidhle Duchamp le modhan-ciùil ann an stoidhle Michelangelo gus tomhas nas mionaidiche agus nas mionaidiche a thoirt don luchd-co-dhùnaidh air an latha an-diugh agus na ro-innleachdan mun àm ri teachd.