2.4.2 Come e nowcasting

Pridisci u futuru hè dura, ma chì pridisci u prisenti hè più faciuli.

I secondiori di stratiggia principali stati pudete utilizà cù e dati di observazione hè una prontazione . Cose di guesses annantu à u futuru hè noturiale difficili, è forsi per questa mutivazione, u preminuali ùn hè micca oghji una parte grande di a ricerca sociale (invece chì hè una parte petite è impurtante di a demografia, l'economia, l'epidimulugia è a scienza pulitica). Eccu, uttinutu, vogliu fussimu nantu à un tipu specìpulu di prevene chjamatu nowcasting- un termini derivatu da unificà "ora" è "previsione". Invece di predizioni di u futuru, i prucessi di issa rimette di utilizà l'idee da a previsione per mette u statutu prisenti di u mondu; u tentativu di "predice u presente" (Choi and Varian 2012) . Nowcasting hà u pudè esse specialmente utile à i guvernai è à l'imprese chì ne esse dumandate e mette timice è precisa in u mondu.

Un esempiu chì a necessità di mettezza puntuale è precisione hè assai eccessivu hè l'epidemiologia. Cunsiderate u casu di a gripe ("a gripe"). Ogni annu, l'epidemica di a influenza staggine causanu milioni di malatie è cintinhe di migliure di morte in u mondu. Aiutate, ogni annu, ci hè una pussibulità chì un furore novu di influenza puderebbenu sparghjile per esce milioni. U prugione di l'influenza di 1918, per esempiu, hè stimatu chì hà tombu trà 50 è 100 milioni di pirsuni (Morens and Fauci 2007) . A causa di a necessità di seguità è potenzalmentu risponde à i broussii influenza, i guverni di u mondu hà creatu sistemi di surviglianza di influenza. Per esempiu, i Centri di i Centri di u Centru di Centru di Preparazione è Prevenzione di a Malati (CDC) regule regularmente è sistematicamente l'infurmazioni trà i medichi currettamente selezziunate in tuttu u paese. Sparti stu sistema pruduce cume di qualità alta, hà un rapportu lag. Hè per via di u tempu avete a datu da ellu da mèdici per esse puliti, trasfurmati è publicati, u sistema CDC rimpruva estimazioni di quantu influenza c'era era duie simane. Ma, quandu si tratta una epidemica emergente, l'ufficiu di a salute publica ùn vulete sapè quantu a influenza vinia questa settimana; Vulenu sapè quantu a gripe hè quì in ora.

À u listessu tempu chì u CDC hè recullamentu di dati per a seguità di a grippa, Google hè ancu racolumentazione di dati supra a prevalenza di l'influenza, anche in una forma assai diversa. A ghjente di u mondu sò constantemente mandate di ricerca in Google, e certe chjamate quistione-cum'è "rimedii di gripe" è "sintomi di a gripe" ponu indicà chì a persona chì face a quistione hà a gripe. Ma, utilizendu sti prublemi di ricerca per stima di a prevalenza di a gripe hè sbacantatu: ùn tutti chiddi chì hà a gripe brinda una cerca influenza di a gripe, è micca micca tutti una ricerca rilativa hè di quellu chì hà a gripe.

Jeremy Ginsberg è un squadra di culleghji (2009) , certi in Google è quarchi in CDC, avianu l'idea impurtante è astuta di cunghjuntà sti dui fonti di dati. Cuscenza, traversu una tipa di alchemistia statistica, i circunsidenti jusquenu l'infurmazioni rapidi è imprecisi cù e crescente e precisa CDC di data per pruducizià rapidamente è precisa di a prevalenza di l'influenza. Una altra manera di penserallu hè chì anu utilizatu a ricerca di dati per aghjurnà a dati CDC.

Da più particularmente, utilizendu data di u 2003 à u 2007, Ginsberg è i culleghi stimanu a relazione trà a prevalenza di a gripe in i dati CDC è u voluminu di ricerca per 50 millioni di termi distinti. Da stu prucessu, chì hè stata guidata da datu è ùn deve esse cunniscenza medica specializata, i circherosteri truvaru un set di 45 dumande distintu chì parevenu più predictivi di a dati di prevalenza di a fluorida di CDC. Allora, utilizendu i relazioni chì avìanu amparatu da a data di u 2003-2007, Ginsberg è i culleghji pruvucatu a so mudele durante a staghione di a influenza 2007-2008. Hè truvatu chì i so prucessi puderanu dettighjate utile è precisu ischiadi (figura 2.6). Questi risultati eranu pubblicati in Natura è anu ricufettutu cumpratura di stampa. Stu prughjettu, chì era chjamatu Google Flu Trends, hè divintatu una paràbula ripetuta in spessu di u putere di grande datu per cambià u mondu.

Figura 2.6: Jeremy Ginsberg è i culleghji (2009) combinau a ricerca di Google da data cù e CDC per creà Google Flu Genes, chì puderanu sprimi di u ritmu di malatia influenza (ILI). Risultati in questa figura sò per a regione Mid Atlanticale di i Stati Uniti in a staghione di a influenza 2007-2008. Invece chì era inizialmente assai prometenti, i prestazioni di Google Flu Trends decayed over time (Cook et al., Olson et al 2013, Lazer et al., 2014). Adattazione di Ginsberg et al. (2009), figura 3.

Figura 2.6: Jeremy Ginsberg è i culleghji (2009) combinau a ricerca di Google da data cù e CDC per creà Google Flu Genes, chì puderanu sprimi di u ritmu di malatia influenza (ILI). Risultati in questa figura sò per a regione Mid Atlanticale di i Stati Uniti in a staghione di a influenza 2007-2008. Invece chì era inizialmente assai prometenti, i prestazioni di Google Flu Trends decayed over time (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . Adattazione di Ginsberg et al. (2009) , figura 3.

Tuttavia, sta storia di successu apparente hè stata cunversione in una vergogna. À u tempu, i ricciardi scupreru dui limitazioni impurtanti chì facenu Google Flu Trends impastanti mediu cum'è prima praticà. Prima, u prestazione di Google Flu Trends hè statu veramente un megliu megliu cà quellu di un mudellu simplice chì calcula a quantità di a gripe basendu à una estrapolazzjoni lineale da i dui rializazioni più recenti di a prevalenza di u gripe (Goel et al. 2010) . È, solu di qualchi periodu, Google Flu Genevieve Très era veramente anguli di questu approcciu solu (Lazer et al. 2014) . In altre parolle, Google Flu Trends cù tutte e so dati, l'aprenu maghjina, è un informaticu putente ùn hà micca drammatikamente supranà una heuristic simplice è più piacevule à cumprà. Questu suggerisce chì quandu avè evaluatu qualsiasi pronostichi o di riunioru, hè impurtante cuntrariarru contru una basa.

A siconda secondatu impurtante nantu à i Google Trungi di a Flu Trenta hè chì a so abilità di predizioni di a data di a fluorida di u CDC era propensu à fallimentu à pocu tempu è a decadenza longu per causa di rimbursu è cunfusioni algorithmiques . Per esempiu, durante u prugramma di a Fluenza di i Prugnoli 2009, Google Flu Genovechicamenti sopra a quantità di a influenza, forsi perchè a ghjente tendenu à cambià u so cumpurtamentu di ricerca in risposta à u timore generale di una pandemia global (Cook et al. 2011; Olson et al. 2013) . In più di sti prucessi di curretta, u praticamentu anu mancatu da u tempu. Diagnostizing i razzii di sta decadenza longa sò difficili, perchè l'algoritmi di ricerca di Google sò proprietarii, ma pare chì in u 2011 Google principia à suggerisce termi di ricerca in quandu a persone cerca di sintomi di a gripe com "febre" è "cough" (pare ancu chì sta funzione ùn hè più attivu). Adding this feature is a reasonable thing to do if you are running a search engine, ma sta mudificazione algorithmale hà avutu l'effettu di generazione di più di ricerca di a salute chì avianu causatu Google Flu Trends per sottorvaluà a prevalenza di u gripe (Lazer et al. 2014) .

Sti dui caveatate cumpone in u futuru sforura issa sulla sana, ma ùn l'anu micca cascatu. In fattu, usendu metudi più pruduttivi, Lazer et al. (2014) è Yang, Santillana, and Kou (2015) puderanu esse sti dui problema. Avanzate, cresce chì stu studiu nowcasting chì combina e grande fonti di dati cù data recullata per l'investigatore, permettà à e cumpagnie è i guverni di creà estimi più pronti è precisii, essenziale à accelerà ogni misura chì hè fatta ripetitu à u tempu cù qualchì lag. I prughjetti di Nowcasting, com'è Google Flu Trends, indetta ancu ciò chì pò succede si e grandi funziunalità di data sò cumminati cù più dati tradiziunali chì anu creati per i scopi di ricerca. Pensendu à l'analogie artuali di u Chapter 1, nowcasting hà a pussibilità di combine a struttura di Duchamp cù i custommades di stilaccii di Michelangelo per prublemà i pruduttori cù medizzioni più preziosi è più preziosi di u presentu è pronti di u futur vicinu.