2.4.2 болжолдоо жана nowcasting

Келечекти алдын ала айтуу кыйын, бирок, бул алдын ала жардам болот.

Экинчи негизги стратегиясы изилдөөчүлөр байкоо маалыматтар болжолдоо жатат менен пайдалана алат. келечеги жөнүндө чөктүрүү даярдоо мыкаачылыгы менен кыйын, ошол себептен, балким, болжолдоо учурда коомдук изилдөөлөр көп бөлүгү эмес, (ал чөйрөсүндөгү, экономика, эпидемиология жана саясий илимдер боюнча кичи жана маанилүү бөлүгү болсо да). Бул жерде болсо, мен азыркы абалын аныктоо үчүн болжолдоо идеяларды пайдаланууга аракет nowcasting, "азыр" жана "прогноздоо." Ордуна, келечекти алдын ала бириктирип алынган биригип мөөнөттүү nowcasting деп болжолдоонун өзгөчө түрү басым жасагым келет дүйнөнүн; ал "ушул алдын ала" аракет кылган (Choi and Varian 2012) . Nowcasting башкаруу органдарынын, ошондой эле дүйнөнүн өз убагында жана так иш-чараларды талап кылган компаниялар үчүн өзгөчө пайдалуу болушу ыктымал.

өз убагында жана так өлчөө үчүн муктаждык абдан айкын бир жөндөө эпидемиология болуп саналат. тумоонун ишти ( "сасык") карап көрөлү. Жыл сайын, сезондук тумоого эпидемиянын дүйнө жүзү боюнча каза ми оорулардын миллиондогон жана жүздөгөн себеп. Андан тышкары, ар бир жылы, тумоонун роман түрү миллиондогон өлтүрөм деп чыгышы мүмкүн деген божомол бар. 1918 тумоосунун Мисалы, 50 жана 100 миллион элдин ортосунда өлтүрүлгөн деп бааланат (Morens and Fauci 2007) . Анткени көзөмөлдөп, мүмкүн тумоосу жооп берүү үчүн зарыл болгон, дүйнө жүзү боюнча өкмөттөр тумоого көзөмөл системасын түзгөн. Мисалы, АКШнын борбору Ооруну көзөмөлдөө жана алдын алуу (CDC) өлкө боюнча кылдаттык менен тандалган дарыгерлер маалыматты үзгүлтүксүз жана системалуу чогултуу. бул система жогорку сапаттагы маалымат пайда болсо да, ал отчеттук крутой бар. Башкача айтканда, убакыттын, анткени ал доктурлар келген маалыматтарга тазалап алып, кайра иштетүү жана жарыяланган, канча тумоосу CDC системасы релиздер баа эки апта мурун бар болчу. Бирок, кандайдыр бир пайда эпидемияга чечүүдө, коомдук саламаттык сактоо кызматкерлери, эки апта мурун ал жерде канча тумоого эле билгиси келген эмес; азыр жок канча тумоого алар билгиси келет.

CDC тумоого көз салуу үчүн маалыматтарды чогултуу ошол эле учурда, Google да тумоого таркалышы жөнүндө маалыматтарды чогултуу, бир кыйла башкача түрүндө да берилет. дүйнөнүн ар кыл өлкөлөрүнөн келген адамдар дайыма Google сурамдарды жөнөтүү жана бул суроо-мындай "сасык каражаттар" деп кээ бир жана "сасык белгилери" суроого киши беришсин көрсөтүп сасык бар. Бирок, сасык тумоо жайылып аныктоо үчүн издөө сурамдарын колдонуу татаал болуп саналат: сасык бар ар бир адам эмес, сасык тумоо менен байланышкан издөө кылат, ар бир сасык байланыштуу издөө эмес, сасык бар адам турат.

Jeremy Ginsberg жана кесиптештеримдин тобу (2009) , Google айрым жана ЮСАИД айрым, бул эки маалымат булактарын айкалыштырууга маанилүү жана акылдуу ой бар эле. Болжол менен, статистикалык симия бир жолу, изилдөөчүлөр грипп таралышынын тез жана так өлчөө өндүрүү үчүн жай жана так CDC маалыматтар менен тез жана так эмес маалыматтарды издөө бириккен. Бул тууралуу ойлонуп көрүүгө дагы бир жолу алар CDC маалыматтарды тездетүү үчүн издөө маалыматтарды колдонгон.

Тактап айтканда, 2003-жылдан тартып 2007-жылга чейин маалыматтарды колдонуп, Ginsberg жана кесиптештер CDC маалыматтарды тумоонун жайылышы менен 50 млн айырмаланган шарттарда издөө көлөмүнүн ортосундагы мамиле бааланган. толук маалымат-кууп болгон жана адистештирилген медициналык билимди талап кылган жок, бул жараянды баштап, изилдөөчүлөр CDC сасык тумоо таралышы маалыматтардын көпчүлүгү жарыш болуп көрүнгөн 45 ар кандай суроо менен бир катар табылган. Андан кийин, алар 2003-2007 маалыматтарды үйрөнүп мамилелерди колдонуп, Ginsberg жана кесиптештер 2007-2008 гриппке мезгилинде алардын моделин сыналган. Алардын жол-жоболору, чынында эле, пайдалуу жана так nowcasts (көрсөткүч 2,6) алып келиши мүмкүн деп табылган. Бул жыйынтыктар табият-жылы басылып чыккан жана кастарлоо басма сөз орун алган жок. Google тумоосу деп аталган бул долбоор-дүйнөнү өзгөртүү үчүн чоң маалыматтарды күчү тууралуу көп жолу мисал жагдай-болуп калган.

Figure 2.6: Jeremy Ginsberg жана кесиптештери (2009) биргелешкен Google CDC маалыматтар менен издөө маалыматтар грипп сыяктуу оорунун курсун nowcast мүмкүн Google тумоосу багыттары түзүү (ILI). Бул сүрөттө Results 2007-2008 тумоого маалында Кошмо Штаттарда орто-Атлантика аймагы болуп эсептелет. башында абдан келечектүү болсо да, Google тумоосу боюнда аткаруу убакыттын өтүшү менен чирип (Кук ж.б., 2011-жыл;. Олсон .Удаалаш 2013;.. Lazer ж.б. 2014). Гинсберг алынды ылайыкташкан. (2009-жыл), 3-сүрөт.

Figure 2.6: Jeremy Ginsberg жана кесиптештери (2009) биргелешкен Google CDC маалыматтар менен издөө маалыматтар грипп сыяктуу оорунун курсун nowcast мүмкүн Google тумоосу багыттары түзүү (ILI). Бул сүрөттө Results 2007-2008 тумоого маалында Кошмо Штаттарда орто-Атлантика аймагы болуп эсептелет. Башында абдан келечектүү болсо да, Google тумоосу боюнда аткаруу убакыттын өтүшү менен чирип (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . Рубрикасына Ginsberg et al. (2009) , 3-сүрөт.

Ошентсе да, бул ачык ийгиликтүү тил табышуусу, акыр-аягы, бир уялып айланды. Убакыттын өтүшү менен, изилдөөчүлөр башында пайда караганда Google тумоосу көрүнүш азырынча анчалык таасирдүү эки маанилүү чектелүү тапкан. Биринчиден, Google тумоосу боюнда аткаруу иш жүзүндө эмес, көп сасык тумоо көбөйүп эки акыркы өлчөмдөрдөн бир сызыктуу орундуу негизинде сасык суммасын эсептеп жөнөкөй моделдин караганда жакшы болчу (Goel et al. 2010) . Ошондой эле, бир нече убакыт бою, Google тумоосу айлары ушул жөнөкөй мамиле да, чынында, андан да жаман болчу (Lazer et al. 2014) . Башка сөз менен айтканда, Google тумоосу айлары бардык маалыматтар менен, машина окутуу жана күчтүү эсептөө кескин жөнөкөй жана жөнөкөй түшүнүктүү Heuristic ашып эмес. Бул кандайдыр бир болжолу же nowcast баа берүү, ал баштапкы каршы салыштыруу маанилүү деп айтууга болот.

Google тумоосу боюнда жөнүндө экинчи маанилүү эскертүү CDC сасык маалыматтарды алдын ала өзүнүн жөндөмдүүлүгү менен кыска мёёнёттъъ аткарбагандыгы жана киришинен жана алгоритмдик адаштырышты узак мөөнөттүү жыттана жакын эле. Мисалы, 2009-жылдын чочко тумоосу Google тумоосу абалы кескин тумоонун көлөмүн көрүүгө, балким, анткени адамдар дүйнөлүк пандемия жайылган коркуп жооп издөө жүрүш-турушун өзгөртүү үчүн жакын учурунда (Cook et al. 2011; Olson et al. 2013) . Бул кыска мөөнөттүү көйгөйлөргө кошумча болуп, иштин бара-бара убакыттын өтүшү чириди. Google издөө алгоритмдер менчиги болуп саналат, анткени, бул узак мөөнөттүү ажыроо себептерин диагнозу кыйын, бирок ал 2011-жылы Google байланыштуу издөө шарттарын сунуштап баштаган адамдар "ысытма" жана "л" сыяктуу сасык белгилери боюнча издөө кийин пайда болот (ошондой эле көрүнөт бул өзгөчөлүк мындан ары жигердүү эмес). Бул өзгөчөлүктү кошумча издөө каражаты менен иштеп жатышат, анда эмне үчүн толугу менен акылга сыярлык нерсе, бирок бул алгоритмдик өзгөртүү Google тумоосу айлары тумоосу жайылып деп ойлошубузду батырган дагы ден-соолукка байланыштуу издөө генералдык таасир эткен (Lazer et al. 2014) .

Бул эки иштеди, келечектеги nowcasting ишинде кыйынчылыктарды, бирок аларды талкаланышы эмес. Чынында, кылдат ыкмаларды колдонуу менен, Lazer et al. (2014) жана Yang, Santillana, and Kou (2015) бул эки кыйынчылыктардан кача алышкан эмес. Андан аркы, мен негизинен кайра-кайра бир лаг менен убакыттын өтүшү менен жасалган кандайдыр бир өлчөө тездетүү менен nowcasting менен чоң маалымат булактарын бириктире изилдөөлөр илимий-чогултулган маалыматтарды өз убагында жана так баа түзүү компанияларды жана өкмөттөрдү мүмкүндүк берет деп ишенебиз. Nowcasting сыяктуу Google тумоосу боюнда да долбоорлор чоң маалымат булактары изилдөө максатында түзүлгөн салттуу маалыматтар менен бирге, анда эмне болушу мүмкүн экенин көрсөтүп турат. 1-бөлүмүндө көркөм аналогия кайра ойлоп, nowcasting чечим берүү өз убагында жана так өлчөөлөр менен кабыл алуучу жана жакын арада алдын-ала камсыз кылуу максатында Микеланжело стилиндеги custommades менен Duchamp стилиндеги readymades айкалыштыруу мүмкүнчүлүгү бар.