2.4.2 ព្យាករណ៍និង nowcasting

ព្យាករថាអនាគតគឺជាការលំបាកនោះទេតែព្យាករថាបច្ចុប្បន្ននេះជាការងាយស្រួល។

យុទ្ធសាស្រ្តចម្បងទីពីរដែលត្រូវបានប្រើដោយអ្នកស្រាវជ្រាវជាមួយនឹងទិន្នន័យដែលអង្កេតមួយត្រូវបានព្យាករថា។ ការទស្សទាយនាពេលអនាគតគឺជាការលំបាកនោះទេប៉ុន្តែវាអាចជាការសំខាន់មិនគួរឱ្យជឿសម្រាប់ការធ្វើការសម្រេចចិត្តថាតើពួកគេធ្វើការនៅក្នុងក្រុមហ៊ុនឬរដ្ឋ។

Kleinberg et al. (2015) បានផ្តល់ជូននូវរឿងរ៉ាវពីរដែលបញ្ជាក់ពីសារៈសំខាន់នៃការព្យាករសម្រាប់បញ្ហាគោលនយោបាយមួយចំនួន។ ស្រមៃមើលថាអ្នកបង្កើតគោលនយោបាយមួយដែលខ្ញុំនឹងហៅអ្នកស្រី Anna របស់នាងដែលកំពុងប្រឈមនឹងគ្រោះរាំងស្ងួតហើយត្រូវតែសម្រេចចិត្តថាតើត្រូវជួលសីល៍មួយដើម្បីធ្វើរាំភ្លៀងធ្លាក់មួយដើម្បីបង្កើនឱកាសនៃការភ្លៀង។ អ្នកបង្កើតគោលនយោបាយមួយទៀតដែលខ្ញុំនឹងហៅគាត់លោក Bob, ត្រូវតែសម្រេចចិត្តថាតើត្រូវយកឆ័ត្រមួយធ្វើការដើម្បីជៀសវាងការទទួលបានសើមនៅលើវិធីផ្ទះ។ នាង Anna និងលោក Bob ទាំងពីរអាចធ្វើការសម្រេចចិត្តបានល្អប្រសើរជាងមុនប្រសិនបើពួកគេយល់ដឹងអំពីអាកាសធាតុ, ប៉ុន្តែពួកគេត្រូវដឹងថាអ្វីខុសគ្នា។ អាណាត្រូវការដើម្បីយល់ដឹងថាតើការរាំភ្លៀងធ្លាក់បណ្តាលឱ្យមានភ្លៀងធ្លាក់។ លោក Bob, នៅលើដៃផ្សេងទៀតដែលមិនត្រូវការការយល់ដឹងពីអ្វីនោះទេអំពីមូលហេតុ; គាត់គ្រាន់តែត្រូវការការព្យាករត្រឹមត្រូវ។ ក្រុមអ្នកស្រាវជ្រាវសង្គមជាញឹកញាប់ផ្តោតលើអ្វី Kleinberg et al. (2015) ហៅ "ភ្លៀងរាំដូច" ពួកគោលនយោបាយបញ្ហាផ្តោតលើមូលហេតុដែលនិងមិនអើពើបញ្ហាគោលនយោបាយ "ឆ័ត្រដូច" ដែលត្រូវបានផ្តោតទៅលើការព្យាករ។

ខ្ញុំចង់ផ្តោតទៅ, ទោះជាយ៉ាងណានៅលើប្រភេទពិសេសនៃការព្យាករក្នុងរយៈពេល -a បានគេហៅថា nowcasting ចេញមកពីការរួមបញ្ចូលគ្នា "ឥឡូវ" និង "ព្យាករ។ " ជាជាងការទស្សទាយនាពេលអនាគត nowcasting ប៉ុនប៉ងដើម្បីទស្សន៍ទាយបច្ចុប្បន្ននេះ (Choi and Varian 2012) ។ នៅក្នុងពាក្យផ្សេងទៀត nowcasting ប្រើវិធីសាស្រ្តការព្យាករសម្រាប់បញ្ហានៃការវាស់វែង។ ក្នុងនាមជាបែបនេះវាគួរតែមានប្រយោជន៍ជាពិសេសដល់រដ្ឋាភិបាលដែលតម្រូវឱ្យមានវិធានការទាន់ពេលវេលានិងត្រឹមត្រូវអំពីប្រទេសរបស់ពួកគេ។ Nowcasting អាចត្រូវបានបង្ហាញភាគច្រើនយ៉ាងច្បាស់ដោយមានឧទាហរណ៍មួយនៃក្រុមហ៊ុន Google ជំងឺគ្រុនផ្តាសាយនិន្នាការនេះ។

ស្រមៃថាអ្នកកំពុងមានអារម្មណ៍បន្តិចក្រោមអាកាសធាតុដូច្នេះអ្នកវាយ "ឱសថផ្តាសាយ" ចូលទៅក្នុងម៉ាស៊ីនស្វែងរកមួយ, ទទួលបានទំព័រនៃតំណក្នុងការឆ្លើយតបរួចហើយធ្វើតាមមួយនៃពួកគេទៅជាទំព័របណ្តាញប្រយោជន៍។ ឥឡូវនេះស្រមៃសកម្មភាពនេះត្រូវបានចាក់ចេញពីទស្សនវិស័យនៃម៉ាស៊ីនស្វែងរកនេះ។ ជារៀងរាល់ពេលរាប់លាននាក់កំពុងទៅដល់សំណួរពីជុំវិញពិភពលោកហើយការស្ទ្រីមនៃសំណួរ-តើនេះ Battelle (2006) បានហៅថាជា«មូលដ្ឋានទិន្នន័យនៃចេតនា "- ផ្តល់នូវបង្អួចមួយទៅក្នុងការធ្វើឱ្យទាន់សម័យជានិច្ចមនសិការសកលរួម។ ទោះជាយ៉ាងណា, ងាកស្ទ្រីមនៃព័តមាននេះទៅក្នុងការវាស់វែងនៃអត្រាប្រេវ៉ាឡង់នៃជំងឺផ្តាសាយនេះគឺជាការលំបាក។ រាប់ការកើនឡើងចំនួននៃសំណួរសម្រាប់ "ឱសថផ្តាសាយ" មិនអាចធ្វើការបានល្អ។ មិនមែនគ្រប់គ្នាដែលមានការស្វែងរកសម្រាប់ឱសថផ្តាសាយជំងឺផ្តាសាយនិងមិនមែនមនុស្សគ្រប់គ្នាដែលអ្នកស្វែងរកបានសម្រាប់ឱសថផ្តាសាយមានជំងឺគ្រុនផ្តាសាយ។

ល្បិចសំខាន់និងឆ្លាតដែលនៅពីក្រោយក្រុមហ៊ុន Google ជំងឺគ្រុនផ្តាសាយគឺដើម្បីបង្វែរនិន្នាការការវាស់វែងមួយចូលទៅក្នុងបញ្ហាបញ្ហាព្យាករមួយ។ មជ្ឈមណ្ឌលត្រួតពិនិត្យនិងបង្ការជំងឺ (CDC) មានប្រព័ន្ធឃ្លាំមើលផ្តាសាយដែលប្រមូលទិន្នន័យពីក្រុមគ្រូពេទ្យនៅទូទាំងប្រទេស។ ទោះជាយ៉ាងណា, បញ្ហាមួយជាមួយនឹងប្រព័ន្ធរបស់ CDC នេះគឺមានការប្រិតបត្តិការរាយការណ៍ពីរសប្តាហ៍! វាត្រូវចំណាយពេលសម្រាប់ទិន្នន័យដែលបានមកដល់ពីគ្រូពេទ្យដែលត្រូវបានសម្អាត, ដំណើរការ, និងបោះពុម្ពផ្សាយ។ ប៉ុន្តែនៅពេលដែលការដោះស្រាយការរីករាលដាលកំពុងរីកចម្រើនការិយាល័យសុខភាពសាធារណៈមិនចង់ដឹងថាតើជំងឺផ្តាសាយច្រើនមានការពីរសប្តាហ៍មកហើយ; ពួកគេចង់ដឹងថាតើជំងឺផ្តាសាយច្រើននៅទីនោះគឺពេលឥឡូវនេះ។ នៅក្នុងការពិត, នៅក្នុងប្រភពប្រពៃណីជាច្រើនផ្សេងទៀតនៃទិន្នន័យសង្គម, មានគម្លាតរវាងរលកនៃការប្រមូលទិន្នន័យនិងការខ្វះខាតច្រើនជាងរាយការណ៍គឺមាន។ ប្រភពទិន្នន័យធំបំផុត, នៅលើដៃផ្សេងទៀតនោះគឺតែងតែនៅលើ (ផ្នែក 2.3.1.2) ។

ដូច្នេះលោក Jeremy Ginsberg និងមិត្តរួមការងារ (2009) បានព្យាយាមដើម្បីទស្សន៍ទាយជំងឺផ្តាសាយរបស់ CDC ទិន្នន័យពីទិន្នន័យការស្វែងរករបស់ Google ។ នេះគឺជាឧទាហរណ៍នៃ "ការទស្សទាយបច្ចុប្បន្ននេះ" ដោយសារតែក្រុមអ្នកស្រាវជ្រាវបានព្យាយាមដើម្បីវាស់ស្ទង់ពីរបៀបដែលជំងឺផ្តាសាយច្រើនទេឥឡូវនេះគឺមានដោយព្យាករថាទិន្នន័យនាពេលអនាគតពី CDC បាន, ទិន្នន័យដែលត្រូវបានវាស់ស្ទង់នាពេលអនាគតបច្ចុប្បន្ននេះ។ ដោយប្រើការរៀនម៉ាស៊ីន, ពួកគេបានស្វែងរកតាមរយៈពាក្យស្វែងរក 50 លាននាក់ផ្សេងគ្នាក្នុងការមើលឃើញដែលជាការព្យាករណ៍ភាគច្រើនបំផុតនៃជំងឺផ្តាសាយរបស់ CDC ទិន្នន័យ។ ទីបំផុតពួកគេបានរកឃើញសំណុំនៃសំណួរ 45 ផ្សេងគ្នាដែលមើលទៅហាក់ដូចជាមានការព្យាករណ៍បំផុតនិងទទួលបានលទ្ធផលល្អណាស់: ពួកគេអាចប្រើទិន្នន័យដែលស្វែងរកដើម្បីទស្សន៍ទាយទិន្នន័យរបស់ CDC ។ មានមូលដ្ឋាននៅក្នុងផ្នែកមួយនៅលើក្រដាសនេះ, ដែលត្រូវបានចេញផ្សាយនៅក្នុងធម្មជាតិ, ក្រុមហ៊ុន Google បានក្លាយជានិន្នាការជំងឺគ្រុនផ្តាសាយរឿងជោគជ័យម្ដងហើយម្ដងទៀតអំពីអំណាចនៃទិន្នន័យធំ។

មានការរំលឹកយ៉ាងសំខាន់ពីរគឺដើម្បីទទួលបានភាពជោគជ័យជាក់ស្តែនេះ, ទោះជាយ៉ាងណា, និងការយល់ដឹងរំលឹកយ៉ាងនេះនឹងជួយឱ្យអ្នកវាយតម្លៃនិងធ្វើការព្យាករការ nowcasting ។ ដំបូង, ការសម្តែងរបស់ Google ជំងឺគ្រុនផ្តាសាយនិន្នាការនេះគឺពិតជាមិនច្រើនប្រសើរជាងការប៉ាន់ប្រមាណរបស់ម៉ូដែលសាមញ្ញមួយដែលចំនួននេះនៃជំងឺផ្តាសាយដោយផ្អែកលើលីនេអ៊ែរពីការនិយាយសរុបការវាស់ថ្មីបំផុតពីររបស់ប្រេវ៉ាឡង់ជំងឺផ្តាសាយ (Goel et al. 2010) ។ ហើយក្នុងរយៈពេលពេលវេលាមួយចំនួន Google Flu Trends គឺពិតជាអាក្រក់ជាងវិធីសាស្រ្តសាមញ្ញនេះ (Lazer et al. 2014) ។ នៅក្នុងពាក្យផ្សេង, ក្រុមហ៊ុន Google ជំងឺគ្រុនផ្តាសាយនិន្នាការជាមួយទិន្នន័យទាំងអស់របស់ខ្លួន, ការរៀនម៉ាស៊ីន, និងកុំព្យូទ័រមានអំណាចមិនអាចជោគជ័យយ៉ាងខ្លាំងធម្មតានិងមានភាពងាយស្រួលក្នុងការយល់ heuristic ។ នេះបានបង្ហាញថានៅពេលដែលការវាយតំលៃការព្យាករណាមួយឬ nowcast វាជាការសំខាន់ដើម្បីប្រៀបធៀបប្រឆាំងនឹងមូលដ្ឋាន។

នេះជាសញ្ញាព្រមានសំខាន់ទីពីរអំពី Google Flu Trends គឺថាសមត្ថភាពរបស់ខ្លួនដើម្បីទស្សន៍ទាយជំងឺផ្តាសាយរបស់ CDC ទិន្នន័យគឺងាយនឹងការបរាជ័យរយៈពេលខ្លីនិងរយៈពេលវែងពុកព្រោះតែសំណាត់និង្តាក្បួនដោះស្រាយ។ ឧទាហរណ៍ក្នុងអំឡុងពេលមានជំងឺគ្រុនផ្តាសាយជ្រូកនៅឆ្នាំ 2009 ជំងឺគ្រុនផ្តាសាយការផ្ទុះជំងឺនិន្នាការយ៉ាងខ្លាំងក្នុងរយៈ Google បានប៉ាន់ប្រមាណថាមានចំនួនទឹកប្រាក់នៃការ-ផ្តាសាយនេះប្រហែលជាដោយសារតែមនុស្សលំអៀងទៅរកការផ្លាស់ប្តូរឥរិយាបទរបស់ពួកគេនៅក្នុងការឆ្លើយតបការស្វែងរកខ្លាចរីករាលដាលនៃការឆ្លងរាតត្បាតជាសកល (Cook et al. 2011; Olson et al. 2013) ក្រៅពីបញ្ហារយៈពេលខ្លីទាំងនេះ, ការសម្តែង decayed បន្តិចម្តងលើពេលវេលា។ ការធ្វើរោគវិនិច្ឆ័យហេតុផលសម្រាប់ការពុករយៈពេលវែងនេះគឺមានការលំបាកដោយសារតែការស្វែងរករបស់ Google គឺជាក្បួនដោះស្រាយមានកម្មសិទ្ធិនោះទេប៉ុន្តែវាហាក់ដូចជាថាក្នុងឆ្នាំ 201​​1 ក្រុមហ៊ុន Google បានធ្វើការផ្លាស់ប្តូរមួយដែលនឹងស្នើពាក្យស្វែងរកទាក់ទងនឹងពេលមនុស្សស្វែងរកមានរោគសញ្ញាដូចជា "ជំងឺគ្រុន" និង "ការក្អក" (វាហាក់ដូចជា ថាលក្ខណៈពិសេសនេះមិនសកម្មទៀតទេ) ។ ការបន្ថែមលក្ខណៈពិសេសនេះគឺជារឿងសមហេតុផលទាំងស្រុងដើម្បីធ្វើការបានប្រសិនបើអ្នកកំពុងរត់ម៉ាស៊ីនស្វែងរកដែលមានអាជីវកម្មហើយវាមានប្រសិទ្ធិភាពនៃការបង្កើតការស្វែងរកទាក់ទងនឹងសុខភាពបន្ថែមទៀត។ នេះគឺប្រហែលជាទទួលបានជោគជ័យសម្រាប់អាជីវកម្មមួយ, ប៉ុន្តែវាបណ្តាលមកពីក្រុមហ៊ុន Google ដើម្បីអត្រាប្រេវ៉ាឡង់ជំងឺផ្តាសាយជំងឺផ្តាសាយនិន្នាការជាងការព្យាករ (Lazer et al. 2014)

ជាសំណាងល្អ, បញ្ហាទាំងនេះជាមួយនឹង Google Flu Trends មាន fixable ។ នៅក្នុងការពិត, ការប្រើវិធីសាស្រ្តប្រុងប្រយ័ត្នបន្ថែមទៀត, Lazer et al. (2014) និង Yang, Santillana, and Kou (2015) គេអាចទទួលបានលទ្ធផលល្អប្រសើរជាងមុន។ ធម្មយាត្រាទៅមុខ, ខ្ញុំរំពឹងថាការសិក្សា nowcasting ដែលរួមផ្តុំទិន្នន័យធំជាមួយអ្នកស្រាវជ្រាវបានប្រមូលទិន្នន័យដែលបានបញ្ចូលគ្នា Readymades Duchamp រចនាប័ទ្មបែបជាមួយ Michaelangelo នឹងអនុញ្ញាតឱ្យ Custommades អ្នកបង្កើតគោលនយោបាយក្នុងការផលិតការវាស់លឿនជាងមុននិងត្រឹមត្រូវបន្ថែមទៀតនៃការបច្ចុប្បន្ននិងការព្យាករនាពេលអនាគត។