2.4.2 Réamhaisnéise agus múnlaithe anois

Ag tuar na todhchaí atá deacair, ach ag tuar an láthair níos éasca.

Is é an dara straitéis is mó a úsáideann taighdeoirí le sonraí breathnadóireachta réamhaisnéise. Ag tuar na todhchaí notoriously deacair, ach is féidir é a bheith thar a bheith tábhachtach do lucht déanta cinntí, bíodh siad ag obair i gcuideachtaí nó rialtais.

Kleinberg et al. (2015) Cuireann dhá scéalta a shoiléiriú an tábhacht a bhaineann réamhaisnéise do fadhbanna áirithe beartais. Samhlaigh déantóir polasaí amháin, beidh mé glaoch uirthi Anna, atá ag bagairt ar triomach agus ní mór cinneadh a dhéanamh a fhostú shaman a dhéanamh rince báisteach chun cur leis an seans rain. déantóir polasaí eile, beidh mé glaoch air Bob, ní mór cinneadh a dhéanamh a ghlacadh ar scáth a bheith ag obair a sheachaint ag fáil fliuch ar an mbealach abhaile. Is féidir an dá Anna agus Bob abálta cinneadh níos fearr má thuigeann siad aimsir, ach is gá iad a fhios ag rudaí éagsúla. Anna mór a thuiscint cé acu is cúis leis an rince rain rain. Bob, ar an láimh eile, ní mór a thuiscint rud ar bith faoi causality; riachtanais sé ach ar réamhaisnéis cruinn. Taighdeoirí Sóisialta díriú go minic ar an méid a Kleinberg et al. (2015) glaoch "báisteach rince-mhaith" polasaí fadhbanna-iad siúd a dhíríonn ar causality-agus neamhaird a "scáth-cosúil le" fadhbanna beartais atá dírithe ar réamhaisnéise.

Ba mhaith liom díriú, áfach, ar chineál speisialta de réamhaisnéis a dtugtar múnlaithe anois -a téarma a dhíorthaítear ó chéile "anois" agus "réamhaisnéise." In áit a tuar amach anseo, iarrachtaí a thuar an láthair múnlaithe anois (Choi and Varian 2012) . I bhfocail eile, úsáideann múnlaithe anois modhanna réamhaisnéise chun fadhbanna tomhais. Dá réir sin, ba chóir é a bheith úsáideach go háirithe do rialtais a dteastaíonn bearta tráthúla cruinne faoina dtíortha. Is féidir múnlaithe anois a léiriú is soiléire leis an sampla de Google Fliú Treochtaí.

Samhlaigh go bhfuil tú ag mothú le beagán faoi an aimsir sin scríobhann tú "leigheasanna fliú" san inneall cuardaigh, gheobhaidh an leathanach na nasc mar fhreagra, agus ansin leanúint ar cheann acu go dtí leathanach gréasáin cabhrach. Anois shamhlú ngníomhaíocht á sheinm amach ó thaobh an t-inneall cuardaigh. Gach nóiméad, na milliúin ceisteanna ag teacht ar fud an domhain, agus tá sé seo sruth na bhfiosruithe-cad Battelle (2006) D'iarr an "bunachar bhfuil beartaithe" - Cuireann fuinneog uasghrádú go leanúnach isteach sa Chonaic domhanda comhchoiteann. Mar sin féin, ag casadh an sruth faisnéise i tomhas ar an leitheadúlacht an fliú deacair. Níl ort ach comhaireamh suas líon na bhfiosruithe in ionad "leigheasanna fliú" nach n-oibreoidís go maith. Níl gach duine a bhfuil na gcuardach fliú do leigheasanna fliú agus nach gach duine a searchers do leigheasanna fliú an fliú.

An trick tábhachtach agus cliste taobh thiar Google Fliú Treochtaí bhí dul fadhb tomhais i fadhb réamhaisnéise. Na Ionaid US do Rialú Galar agus a Chosc (CDC) Tá córas monatóireachta fliú a bhailíonn eolas ó dhochtúirí ar fud na tíre. Mar sin féin, tá fadhb amháin leis an gcóras CDC tá Readonly tuairiscithe coicíse; an t-am a thógann sé ar na sonraí ag teacht ó dhochtúirí a bheith glanta, próiseáilte, agus foilsithe. Ach, nuair a láimhseáil eipidéim ag teacht chun cinn, oifigí sláinte an phobail ag iarraidh a fháil amach cé mhéad fliú bhí dhá sheachtain ó shin; ba mhaith leo a fháil amach cé mhéad fliú ann ceart anois. Go deimhin, i bhfoinsí traidisiúnta go leor eile sonraí sóisialta, tá bearnaí idir tonnta bailithe sonraí agus lags tuairiscithe. An chuid is mó foinsí sonraí mór, ar an láimh eile, tá i gcónaí ar (Alt 2.3.1.2).

Dá bhrí sin, Jeremy Ginsberg agus comhghleacaithe (2009) iarracht a thuar ar na sonraí fliú CDC ó na sonraí cuardaigh Google. Is sampla de "tuar an láthair" toisc go raibh na taighdeoirí ag iarraidh a thomhas cé mhéad fliú ann anois ag tuar shonraí amach anseo ón CDC, sonraí anseo atá thomhas an láthair. Ag baint úsáide as meaisín foghlama, chuardach siad trí 50 milliún téarmaí cuardaigh éagsúla a fheiceáil atá is thuarthach de na sonraí fliú CDC. I ndeireadh na dála, fuair siad sraith de 45 fiosrúchán éagsúla gur chuma a bheidh an chuid is mó predictive, agus bhí na torthaí maithe go leor: d'fhéadfadh siad a bhaint as an sonraí cuardaigh a thuar na sonraí CDC. Bunaithe go páirteach ar pháipéar seo, a foilsíodh i Nature, tháinig Google Fliú Treochtaí an scéal rathúil minic arís agus arís eile mar gheall ar an chumhacht na sonraí mór.

Tá dhá caveats tábhachtach an rath léir, áfach, agus beidh tuiscint ar na caveats cabhrú leat meastóireacht agus réamhaisnéis agus múnlaithe anois a dhéanamh. Gcéad dul síos, bhí feidhmíocht Google Fliú Treochtaí iarbhír nach bhfuil i bhfad níos fearr ná múnla simplí a measann an méid fliú bunaithe ar eachtarshuíomh líneach ón dá thomhas is déanaí de leitheadúlacht fliú (Goel et al. 2010) . Agus, thar roinnt tréimhsí ama a bhí Google Fliú Treochtaí iarbhír níos measa ná an cur chuige simplí (Lazer et al. 2014) . I bhfocail eile, ní raibh Google Fliú Treochtaí lena sonraí go léir, foghlaim meaisín, agus ríomhaireacht cumhachtach outperform mór tagtha simplí agus níos éasca heorastúla a thuiscint. Sé seo le fios go bhfuil sé tábhachtach meastóireacht á déanamh aon réamhaisnéis nó nowcast chun comparáid gcoinne bonnlíne.

Is é an dara caveat tábhachtach faoi Google Fliú Treochtaí go raibh a chumas a thuar na sonraí fliú CDC seans maith go teip gearrthéarmach agus lobhadh fadtéarmach mar gheall ar sruth agus inbhréagnaithe algorithmic. Mar shampla, i rith na 2009 Fliú na Muc ráig Google Fliú Treochtaí mór thar-mheasta ar an méid fliú, is dócha mar an claonadh daoine a n-iompar cuardaigh fhreagra a athrú le eagla go forleathan ar Phaindéimeach domhanda (Cook et al. 2011; Olson et al. 2013) . Chomh maith leis na fadhbanna gearrthéarmacha, lofa an fheidhmíocht de réir a chéile le himeacht ama. Diagnosing na cúiseanna atá leis an meath fadtéarmach atá deacair mar go bhfuil na halgartaim cuardach Google dílseánaigh, ach dealraíonn sé go i 2011 rinne Google athruithe a bheadh ​​le fios téarmaí cuardaigh a bhaineann nuair daoine cuardach hairíonna cosúil le "fiabhras" agus "cough" (dealraíonn sé chomh go bhfuil an ghné thuilleadh gníomhach). Is é a chuirfear an ghné rud go hiomlán réasúnta le déanamh má tá tú ag reáchtáil gnó inneall cuardaigh, agus bhí sé ar an éifeacht a ghiniúint cuardaigh níos mó a bhaineann le sláinte. Bhí sé seo is dócha go bhfuil rath ar an ngnó, ach ba chúis leis Google Fliú Treochtaí go dtí os cionn-mheastachán leitheadúlacht fliú (Lazer et al. 2014) .

Fortunately, tá na fadhbanna le Google Fliú Treochtaí fixable. Go deimhin, ag baint úsáide as modhanna níos cúramach, Lazer et al. (2014) agus Yang, Santillana, and Kou (2015) bhí siad in ann a fháil torthaí níos fearr. Ag dul ar aghaidh, ag súil agam a bhailigh staidéir múnlaithe anois a chur le chéile sonraí mór le taighdeoir sonraí a chur le chéile Readymades Duchamp-stíl le Michaelangelo-stíl Custommades-cuirfidh sé ar chumas lucht déanta beartas a thabhairt ar aird níos tapúla agus níos cruinne tomhais an lae inniu agus tuar na todhchaí.