2.4.2 Forecasting, nowcasting

Predi ke lavni a se difisil, men predi ke prezan nan se pi fasil.

Chèchè yo dezyèm estrateji prensipal ka itilize ak done obsèvasyonèl se prévisions . Fè devinèt sou lavni an se notwar difisil, e petèt pou rezon sa a, prévisions se pa kounye a yon gwo pati nan rechèch sosyal (byenke li se yon ti ak enpòtan pati nan demografi, ekonomi, epidemyoloji ak syans politik). Isit la, sepandan, mwen ta renmen konsantre sou yon kalite espesyal nan prévisions rele nowcasting -a tèm ki sòti nan konbine "kounye a" ak "prévisions." Olye ke predi ke tan kap vini an, eseye kounye a itilize lide soti nan prévisions mezire eta aktyèl la nan mond lan; li eseye "predi prezan an" (Choi and Varian 2012) . Lwès gen potansyèl la yo dwe itil espesyalman nan gouvènman yo ak konpayi ki mande pou alè ak egzat mezi nan mond lan.

Yon anviwònman kote bezwen an pou mezi alè ak egzat trè klè se epidemyoloji. Konsidere ka grip la ("grip la"). Chak ane, epidemi sezon grip la lakòz dè milyon de maladi ak dè santèn de milye de lanmò atravè mond lan. Pli lwen, chak ane, gen yon posibilite ke yon fòm roman nan grip ka sòti ki ta touye dè milyon. Te epidemi grip la 1918, pou egzanp, yo estime yo te touye ant 50 ak 100 milyon moun (Morens and Fauci 2007) . Paske nan bezwen an swiv ak potansyèlman reponn a epidemi grip, gouvènman atravè mond lan te kreye sistèm siveyans grip la. Pou egzanp, Sant Ameriken pou Kontwòl ak Prevansyon Maladi (CDC) regilyèman epi sistematik kolekte enfòmasyon soti nan doktè ak anpil atansyon chwazi nan tout peyi a. Malgre ke sistèm sa a pwodui done-wo kalite, li gen yon lag rapò. Sa vle di, akòz tan li pran pou done ki rive nan men doktè pou netwaye, trete, ak pibliye, CDC sistèm degaje yo estime de kantite grip la te gen de semèn de sa. Men, lè ou manyen yon epidemi émergentes, ofisyèl sante piblik yo pa vle konnen konbyen grip te gen de semèn de sa; yo vle konnen konbyen grip la gen kounye a.

An menm tan CDC a ap kolekte done pou tras grip, Google tou kolekte done sou grip prevalans, byenke nan yon fòm trè diferan. Moun ki toupatou nan mond lan toujou ap voye demann pou Google, e kèk nan demann sa yo - tankou "remèd grip" ak "sentòm grip" - kapab montre ke moun ki fè rechèch la gen grip la. Men, lè l sèvi avèk demann rechèch sa yo pou estime prevansyon grip la se difisil: se pa tout moun ki gen grip la fè yon rechèch ki gen rapò ak grip, epi se pa tout moun ki gen rapò ak grip ki soti nan yon moun ki gen grip la.

Jeremy Ginsberg ak yon ekip kòlèg (2009) , kèk nan Google ak kèk nan CDC, te gen lide nan enpòtan ak entelijan konbine de sous sa yo. Apeprè, atravè yon kalite alchimi estatistik, chèchè yo konbine done yo rechèch vit ak kòrèk ak done yo CDC ralanti ak egzat yo nan lòd yo pwodwi mezi vit ak egzat nan grip prevansyon. Yon lòt fason yo panse sou li se yo ke yo te itilize done rechèch la pi vit done CDC yo.

Plis espesyalman, lè l sèvi avèk done ki sòti nan 2003 rive 2007, Ginsberg ak kòlèg li te estime relasyon ki genyen ant prévalence grip nan done CDC yo ak volim rechèch la pou 50 milyon tèm diferan. Soti nan pwosesis sa a, ki te konplètman done kondwi ak pa t 'mande pou konesans espesyalize medikal, chèchè yo te jwenn yon seri 45 diferan demann ki te sanble yo dwe pi prediktiv nan CDC a prévalence done done. Lè sa a, lè l sèvi avèk relasyon yo ke yo te aprann nan done 2003-2007 yo, Ginsberg ak kòlèg yo teste modèl yo pandan sezon lagrip 2007-2008 la. Yo te jwenn ke pwosedi yo ta ka tout bon fè aktyèl itil ak egzat (figi 2.6). Rezilta sa yo te pibliye nan lanati ak te resevwa adorasyon laprès adorasyon. Pwojè-ki te rele Google grip tandans-te vin tounen yon parabòl souvan repete sou pouvwa a nan done gwo chanje mond lan.

Figi 2.6: Jeremy Ginsberg ak kòlèg li yo (2009) konbine done rechèch Google ak done CDC pou kreye Google grip tandans, sa ki te kapab kouche pousantaj grip tankou maladi (ILI). Rezilta nan figi sa a se pou rejyon an nan mitan Atlantik nan Etazini nan sezon grip 2007-2008 la. Malgre ke li te okòmansman trè pwomèt, pèfòmans nan Google Grip Tandans dekline sou tan (Cook et al 2011; Olson et al 2013; Lazer et al 2014). Adapte nan Ginsberg et al. (2009), figi 3.

Figi 2.6: Jeremy Ginsberg ak kòlèg li yo (2009) konbine done rechèch Google ak done CDC pou kreye Google grip tandans, sa ki te kapab kouche pousantaj grip tankou maladi (ILI). Rezilta nan figi sa a se pou rejyon an nan mitan Atlantik nan Etazini nan sezon grip 2007-2008 la. Malgre ke li te okòmansman trè pwomèt, pèfòmans nan Google Grip Tandans dekline sou tan (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . Adapte nan Ginsberg et al. (2009) , figi 3.

Sepandan, istwa sa a siksè evantyèlman tounen yon anbarasman. Apre yon sèten tan, chèchè yo dekouvri de limit enpòtan ki fè Google grip tandans mwens enpresyonan pase li te parèt okòmansman. Premyèman, pèfòmans Google Grip Tandans yo te aktyèlman pa pi bon pase sa yo ki nan yon modèl ki senp ki estime kantite lajan an nan grip ki baze sou yon ekstrapolasyon lineyè soti nan de mezi yo ki pi resan nan prevansyon grip (Goel et al. 2010) . Epi, sou kèk peryòd tan, Google Grip Tandans te aktyèlman pi mal pase apwòch sa a senp (Lazer et al. 2014) . Nan lòt mo, Google grip tandans ak tout done li yo, aprantisaj machin, ak pwisan informatique pa t 'dramatikman pèfòme yon senp ak pi fasil-a-konprann heuristic. Sa a sijere ke lè evalye nenpòt prévision oswa kounyeya, li enpòtan yo konpare kont yon debaz.

Dezyèm opozisyon an enpòtan sou Google Grip Tandans se ke kapasite li nan predi done yo grip CDC te gen tandans fè kout tèm echèk ak pasyone alontèm paske nan flote ak algorithmik konfonn . Pou egzanp, pandan epidemi grip la 2009 Swine Google Grip Tandans yo dramatikman surèstimasyon kantite grip, pwobableman paske moun yo gen tandans chanje konpòtman rechèch yo an repons a krentif pou toupatou nan yon pandemi mondyal (Cook et al. 2011; Olson et al. 2013) . Anplis de sa nan pwoblèm sa yo kout tèm, pèfòmans la piti piti pouri sou tan. Dyagnostike rezon ki fè yo pou pouri alontèm sa a yo difisil paske algoritm rechèch Google la se propriétaires, men li parèt ke nan 2011 Google te kòmanse sijere tèm rechèch ki asosye lè moun rechèch pou sentòm grip tankou "lafyèv" ak "tous" (li sanble tou ke karakteristik sa a pa aktif ankò). Ajoute karakteristik sa a se yon bagay totalman rezonab pou fè si ou ap kouri yon motè rechèch, men chanjman algorithmik sa a te gen efè de génération plis rechèch ki gen rapò ak sante ki te lakòz Google grip tandans ègzajere prevalans grip (Lazer et al. 2014) .

Sa yo opozisyon de konplike lavni boukantay efò yo, men yo pa fayit yo. An reyalite, lè l sèvi avèk metòd plis atansyon, Lazer et al. (2014) ak Yang, Santillana, and Kou (2015) te kapab evite pwoblèm sa yo de. Ale pi devan, mwen espere ke etid aktyalizasyon ki konbine gwo done done ak done chèchè-kolekte pral pèmèt konpayi yo ak gouvènman yo kreye estimasyon plis alè ak pi egzak pa esansyèlman vitès moute nenpòt mezi ki te fè repete sou tan ak kèk lag. Pwojè loue tankou tandans Grip Google yo montre tou sa ki ka rive si sous done gwo yo konbine avèk plis tradisyonèl done ki te kreye pou objektif rechèch la. Panse tounen nan analoji nan atizay nan chapit 1, nowcasting gen potansyèl la konbine Duchamp-style readymades ak Custommades Michelangelo-style yo nan lòd yo bay mizisyen desizyon ki gen plis mezi alè ak pi egzak nan prezan an ak prediksyon nan fiti prè.