2.4.2 болжолдоо жана nowcasting

Келечекти алдын ала айтуу кыйын, бирок, бул алдын ала жардам болот.

Байкоо маалыматтар менен изилдөөчүлөр тарабынан экинчи негизги стратегия болжолдоону түшүндүрөт. Келечекти алдын ала мыкаачылыгы менен кыйын, бирок, алар компаниялар же өкмөттөрдүн иштешет же жокпу, чечим кабыл алуучу адамдар үчүн өтө маанилүү болушу мүмкүн.

Kleinberg et al. (2015) бир саясат көйгөйлөрүн божомолдоо маанисин түшүндүрүү эки окуяларды сунуштайт. бир саясат элестетип, мен кургакчылык кабылууда анын Анна, чакыруу жана жамгыр мүмкүнчүлүк жогорулатуу үчүн жамгыр бийи эмне үчүн Шаман жалдоо же жокпу, чечиши керек болот. Дагы бир саясат, Мен аны Bob чакырам, үйүнө жол нымдуу качышыбыз иштөө үчүн кол чатыр алып же жокпу, чечиши керек. Алар аба ырайы түшүнүү болсо, Анна жана Боб да жакшы чечим кабыл алышы мүмкүн, бирок, алар ар кандай нерселерди билип алышыбыз керек. Anna жамгыр бийи жамгыр себеп экендигин түшүнүү керек. Bob, экинчи жагынан, казуалдуулук тууралуу эч нерсе керек эмес; Ал жөн гана так болжолу керек. Коомдук изилдөөчүлөр көп нерсеге толугу менен багытталышы Kleinberg et al. (2015) , «жамгыр бий сыяктуу» саясаты маселелерин-деп басым себептер жана болжолдоо багытталган «чатыр сыяктуу» саясий маселелерди көрмөксөн деп аташат.

Мен белек айтканга аракет nowcasting топтоп, бирок, «азыр» жана айкалыштыруу алынган кездин мөөнөттүү болжолдоо деп nowcasting атайын түрү боюнча «божомолдоо». Тескерисинче, келечекти алдын ала жыйынтыктары келет (Choi and Varian 2012) . Башка сөз менен айтканда, nowcasting өлчөө көйгөйлөрүн божомолдоо ыкмаларды колдонот. сыяктуу, ал өз өлкөсү тууралуу өз убагында жана так иш-чараларды талап өкмөттөргө өзгөчө пайдалуу болушу керек. Nowcasting Google тумоосу боюнда бар, мисалы, өтө ачык-айкын көрүүгө болот.

сиз издөө системдеринен «сасык каражаттарын пайдалануу» деп терип, ошондуктан ырайы боюнча бир аз сезип жатабыз деп ойлойбуз, жооп шилтемелердин бет алып, анан бир пайдалуу баракка алардын бирин артынан. Эми бул иш-издөө көз карашы менен ишке ашты дейли. Ар бир көз ирмеми, сурамжылоолорду миллиондогон дүйнө жүзү боюнча келген, ал эми суроо-эмне бул агым Battelle (2006) , «ниетинин базасы» деп атаган - жамааттык дүйнөлүк сезимдин бир дайыма өзгөрүп терезени камсыз кылат. Бирок, тумоосунун жайылышы бир өлчөө маалыматты бул агым кайрылуу кыйын болуп турат. Жөн гана «сасык каражаттар» үчүн диапазону санын эсептөөнү, ошондой эле иштебей калышы мүмкүн. сасык тумоосунан каражаттар эмес, ар бир адам сасык соттук Searchers үчүн издөө сасык ээ болгон ар бир адам жок.

Google тумоосу боюнда артында маанилүү жана акылдуу куулук бир болжолдоо маселенин бир өлчөө маселени үчүн болду. Ооруну көзөмөлдөө жана алдын алуу борборлору, АКШ (CDC) өлкө боюнча дарыгерлердин маалымат чогултат тумоого мониторинг системасы бар. Бирок, бул CDC системасы менен бир маселе эки аптада отчеттук мейкиндикте жок болсо; доктурлар келген маалыматтарды алып, убакыт тазалап, кайра иштетүү жана ал жарыяланууга тийиш. Бирок, кандайдыр бир пайда эпидемияга кармоодо, коомдук саламаттык сактоо органдары эки апта мурун ал жерде канча тумоого эле билгиси келген эмес; азыр бар канча тумоого алар билгиси келет. Чынында, коомдук маалыматтарды көптөгөн башка салттуу булактардан да, маалыматтарды чогултуу толкун жана отчеттуулук лагда ортосунда ажырым бар. Абдан чоң маалымат булактары, башка жагынан алганда, дайыма-күнү (Бөлүм 2.3.1.2) болуп саналат.

Ошондуктан, Jeremy Ginsberg жана кесиптештери (2009) Google издөө маалыматтардан CDC сасык маалыматтарды алдын ала айтууга аракеттенген. Бул изилдөөчүлөр белек өлчөө жатат СДС, келечектеги маалыматтардан келечектеги маалыматтарды алдын ала аркылуу азыр канча сасык эмес өлчөө үчүн аракет кылып жатышты, анткени «азыркы алдын ала» бир мисалы болуп саналат. Машина үйрөнүү аркылуу, алар CDC сасык маалыматтардын көпчүлүгү жарыш сөз болгон үчүн 50 миллион ар түрдүү издөө жагынан изилдеген. Акыр-аягы, алар абдан жарыш болуп көрүнгөн 45 ар кандай түрүн топтомун таап, натыйжасы абдан жакшы, анткени алар CDC маалыматтарды алдын ала издөө маалыматтарды тийиши мүмкүн. Табият-жылы басылып чыккан бул кагаз, жарым-жартылай негизделген, Google тумоосу айлары чоң маалыматтарды күчү тууралуу көп жолу ийгилик окуя болуп калды.

Бирок, бул ачык ийгиликке эки маанилүү иштеди, бар, жана бул иштеди, түшүнүү Сиз жардам жана болжолдоону жана nowcasting кылат. Биринчиден, Google тумоосу боюнда аткаруу иш жүзүндө эмес, сасык суммасын эсептеп жөнөкөй моделин алда канча жакшы тумоосунун таркалышы эки акыркы өлчөөлөрдүн бир сызыктуу орундуу негизинде болду (Goel et al. 2010) . Ал эми кээ бир мөөнөттөрдө Google тумоосу тъптёлгён бул жөнөкөй мамилеге караганда, чынында жаман турду (Lazer et al. 2014) . Башкача айтканда, Google тумоосу айлары бардык маалыматтар менен, машина окутуу жана күчтүү эсептөө кескин өбөлгө түшүнүү үчүн жөнөкөй жана кыйын ашып эмес. Бул кандайдыр бир болжолу же nowcast баалоодо бул баштапкы каршы салыштыруу үчүн өтө маанилүү болуп саналат деп айтууга болот.

Google тумоосу боюнда жөнүндө экинчи маанилүү эскертүү CDC сасык маалыматтарды алдын ала мүмкүнчүлүгү кыска мөөнөттүү аткарбагандыгы жана киришинен жана алгоритмдик адаштырышты узак мөөнөттүү жыттана жакын эле. Мисалы, дүйнөлүк пандемия 2009, балким, анткени адамдар кеңири таралган коркуп жооп издөө жүрүм-турумун өзгөртүп, адатта, тумоо суммасын бааланган үстүнөн кескин чочко тумоосу келип чыккан Google тумоосу боюнда учурунда (Cook et al. 2011; Olson et al. 2013) . Бул кыска мөөнөттүү көйгөйлөргө тышкары, аткаруу акырындык менен убакыттын өтүшү чириди. Бул узак мөөнөттүү ажыроосунун себептери аныкталып, Google издөө алгоритмдер менчик болуп саналат, себеби, кыйын, бирок ал 2011-жылы Google байланыштуу издөө шарттарын сунуштап турган өзгөрүүлөрдү жасап, адамдар «ысытма» жана «л» сыяктуу белгилери боюнча издөө кийин (ал ошондой эле көрүнөт окшойт бул өзгөчөлүк мындан ары жигердүү эмес) деп. Бул сунушту кошуп сиз издөө иштеп жатса, эмне үчүн толугу менен акылга сыярлык нерсе, ал эми саламаттыкты сактоо байланыштуу издөө келүүчү терс таасир тийгизди. Бул, балким, бизнес үчүн ийгиликтүү болгон, бирок ал ашыкча баа сасык таркалышы үчүн Google тумоосу багыттары келтирилген (Lazer et al. 2014) .

Бактыга жараша, Google тумоосу жетишкендиктер менен, бул көйгөйлөр fixable болуп саналат. Чынында, кылдат ыкмаларды колдонуп, Lazer et al. (2014) жана Yang, Santillana, and Kou (2015) жакшы натыйжа бере албай калышты. Бара алдыга, мен nowcasting изилдөөчү менен чоң маалыматтарды комбайн изилдөө маалыматтарын-Duchamp стилиндеги Readymades Michaelangelo-стили менен Custommades-келечекте азыркы жана божомолдорду тез жана так өлчөө өндүрүү үчүн саясатчылар мүмкүнчүлүк биригип топтолгон деп күтүшөт.