2.4.2 ພະຢາກອນແລະ Nowcasting

ນາຍອະນາຄົດເປັນການຍາກ, ແຕ່ການຄາດປະຈຸບັນແມ່ນງ່າຍ.

ຄັ້ງທີສອງຄົ້ນຄ້ວາຍຸດທະສາດຕົ້ນຕໍສາມາດນໍາໃຊ້ກັບຂໍ້ມູນການສັງເກດການແມ່ນຄາດຄະເນວ່. ການຄາດເດົາກ່ຽວກັບອະນາຄົດແມ່ນມີຄວາມຫຍຸ້ງຍາກຢ່າງຫລວງຫລາຍ, ແລະບາງທີອາດມີເຫດຜົນທີ່ວ່າການຄາດເດົາບໍ່ແມ່ນປັດຈຸບັນສ່ວນໃຫຍ່ຂອງການຄົ້ນຄວ້າສັງຄົມ (ເຖິງແມ່ນວ່າມັນເປັນພາກສ່ວນຂະຫນາດນ້ອຍແລະສໍາຄັນຂອງປະຊາກອນ, ເສດຖະສາດ, ການລະບາດແລະວິທະຍາສາດທາງດ້ານການເມືອງ). ໃນທີ່ນີ້, ຂ້າພະເຈົ້າຢາກຈະສຸມໃສ່ການຄາດຄະເນພິເສດທີ່ເອີ້ນວ່າ nowcasting - ໄລຍະທີ່ມາຈາກການສົມທົບ "ໃນປັດຈຸບັນ" ແລະ "ການຄາດຄະເນ". ແທນທີ່ຈະຄາດຄະເນໃນອະນາຄົດ, ຄວາມພະຍາຍາມໃນປັດຈຸບັນຈະໃຊ້ແນວຄວາມຄິດຈາກການຄາດຄະເນເພື່ອວັດແທກລັດ ຂອງໂລກ ມັນພະຍາຍາມ "ຄາດຄະເນການປະຈຸບັນ" (Choi and Varian 2012) . Nowcasting ມີທ່າແຮງທີ່ຈະເປັນປະໂຫຍດໂດຍສະເພາະຕໍ່ລັດຖະບານແລະບໍລິສັດທີ່ຕ້ອງການມາດຕະການທີ່ທັນເວລາແລະຖືກຕ້ອງຂອງໂລກ.

ການຕັ້ງຄ່າຫນຶ່ງທີ່ຕ້ອງການການວັດແທກທີ່ທັນເວລາແລະຖືກຕ້ອງແມ່ນເຫັນໄດ້ຢ່າງຊັດເຈນ. ພິຈາລະນາກໍລະນີຂອງໄຂ້ຫວັດໃຫຍ່ ("ໄຂ້ຫວັດໃຫຍ່"). ໃນແຕ່ລະປີ, ການລະບາດຂອງເຊື້ອໄຂ້ຫວັດໃຫຍ່ຕາມລຶະເບິ່ງການເຮັດໃຫ້ເກີດການເຈັບປ່ວຍຫລາຍລ້ານຄົນແລະການຕາຍຫລາຍຮ້ອຍພັນຄົນໃນທົ່ວໂລກ. ນອກຈາກນັ້ນ, ໃນແຕ່ລະປີ, ມີຄວາມເປັນໄປໄດ້ວ່າແບບຟອມໄຂ້ຫວັດໃຫຍ່ໃຫມ່ອາດຈະເກີດຂື້ນທີ່ຈະຂ້າຄົນຫຼາຍລ້ານຄົນ. ຍົກຕົວຢ່າງເຊັ່ນການລະບາດຂອງໄຂ້ຫວັດສັດປີກ 1918 ຄາດວ່າຈະຖືກຂ້າຕາຍໃນລະຫວ່າງ 50 ຫາ 100 ລ້ານຄົນ (Morens and Fauci 2007) . ເນື່ອງຈາກວ່າຕ້ອງການຕິດຕາມແລະສາມາດຕອບສະຫນອງຕໍ່ການລະບາດຂອງໄຂ້ຫວັດໃຫຍ່, ລັດຖະບານທົ່ວໂລກກໍ່ສ້າງລະບົບການເຝົ້າລະວັງໄຂ້ຫວັດສັດປີກ. ຕົວຢ່າງເຊັ່ນສູນຄວບຄຸມແລະປ້ອງກັນພະຍາດ (CDC) ຂອງສະຫະລັດອາເມລິກາປົກກະຕິແລະເກັບລວບລວມຂໍ້ມູນຈາກແພດຫມໍຢ່າງລະມັດລະວັງທົ່ວປະເທດ. ເຖິງແມ່ນວ່າລະບົບນີ້ຜະລິດຂໍ້ມູນທີ່ມີຄຸນນະພາບສູງ, ມັນກໍ່ມີການລາຍງານຕ່ໍາ. ດັ່ງນັ້ນ, ເນື່ອງຈາກວ່າມັນໃຊ້ເວລາສໍາລັບຂໍ້ມູນທີ່ມາຈາກທ່ານຫມໍເພື່ອອະນາໄມ, ປຸງແຕ່ງແລະເຜີຍແຜ່, ລະບົບ CDC ເຜີຍແຜ່ການຄາດຄະເນວ່າມີໄຂ້ຫຼາຍປານໃດເມື່ອສອງອາທິດກ່ອນ. ແຕ່ໃນເວລາທີ່ຈັດການພະຍາດລະບາດທີ່ເກີດຂື້ນ, ເຈົ້າຫນ້າທີ່ສຸຂະພາບສາທາລະນະບໍ່ຕ້ອງການຮູ້ວ່າໄຂ້ຫວັດໃຫຍ່ມີສອງອາທິດກ່ອນ, ພວກເຂົາຕ້ອງການຮູ້ວ່າໄຂ້ຫວັດໃຫຍ່ມີພຽງແຕ່ໃນປັດຈຸບັນເທົ່ານັ້ນ.

ໃນເວລາດຽວກັນທີ່ CDC ກໍາລັງເກັບກໍາຂໍ້ມູນເພື່ອຕິດຕາມພະຍາດໄຂ້ຫວັດໃຫຍ່, Google ຍັງໄດ້ເກັບກໍາຂໍ້ມູນກ່ຽວກັບອັດຕາການຕິດເຊື້ອຂອງໄຂ້ຫວັດໃຫຍ່, ເຖິງແມ່ນວ່າຢູ່ໃນຮູບແບບທີ່ແຕກຕ່າງກັນ. ປະຊາຊົນທີ່ມາຈາກທົ່ວໂລກໄດ້ສົ່ງຂໍ້ຄວາມໄປຫາ Google ເລື້ອຍໆ, ແລະບາງຄໍາຖາມເຫຼົ່ານີ້ - ເຊັ່ນ "ການປິ່ນປົວໄຂ້ຫວັດໃຫຍ່" ແລະ "ອາການໄຂ້ຫວັດໃຫຍ່" - ອາດຈະຊີ້ໃຫ້ເຫັນວ່າຄົນທີ່ຊອກຫາມີໄຂ້ຫວັດໃຫຍ່. ແຕ່ການນໍາໃຊ້ຄໍາຖາມຄົ້ນຫາເຫຼົ່ານີ້ເພື່ອປະເມີນອັດຕາການຕິດເຊື້ອໄວຣັສແມ່ນມີຄວາມຫຍຸ້ງຍາກ: ບໍ່ແມ່ນທຸກຄົນທີ່ມີໄຂ້ຫວັດໃຫຍ່ເຮັດໃຫ້ມີການຄົ້ນຫາທີ່ກ່ຽວຂ້ອງກັບໄຂ້ຫວັດໃຫຍ່ແລະບໍ່ແມ່ນທຸກໆການຄົ້ນຄວ້າກ່ຽວກັບໄຂ້ຫວັດໃຫຍ່ແມ່ນມາຈາກຄົນທີ່ມີໄຂ້ຫວັດໃຫຍ່.

Jeremy Ginsberg ແລະທີມງານຂອງເພື່ອນຮ່ວມງານ (2009) , ບາງຄົນຢູ່ທີ່ກູໂກແລະບາງຄົນຢູ່ CDC, ມີຄວາມຄິດທີ່ສໍາຄັນແລະສະຫລາດທີ່ຈະສົມທົບສອງແຫຼ່ງຂໍ້ມູນເຫຼົ່ານີ້. ໂດຍປະມານ, ໂດຍຜ່ານການວິທະຍາສາດແບບວິທະຍາສາດ, ນັກຄົ້ນຄວ້າໄດ້ລວມຂໍ້ມູນການຄົ້ນຫາທີ່ລວດໄວແລະບໍ່ຖືກຕ້ອງກັບຂໍ້ມູນ CDC ທີ່ຊ້າແລະຖືກຕ້ອງເພື່ອຜະລິດການວັດແທກໄວແລະຄວາມຖືກຕ້ອງຂອງອັດຕາການຕິດເຊື້ອ. ອີກວິທີທີ່ຈະຄິດກ່ຽວກັບມັນແມ່ນວ່າພວກເຂົາໃຊ້ຂໍ້ມູນການຄົ້ນຫາເພື່ອເລັ່ງຂໍ້ມູນ CDC.

ໂດຍສະເພາະແມ່ນການນໍາໃຊ້ຂໍ້ມູນຈາກ 2003-2007, Ginsberg ແລະເພື່ອນຮ່ວມງານໄດ້ຄາດຄະເນການພົວພັນລະຫວ່າງອັດຕາການຕິດເຊື້ອໃນຂໍ້ມູນຂອງ CDC ແລະລະດັບຄົ້ນຫາສໍາລັບ 50 ລ້ານຄໍາທີ່ແຕກຕ່າງກັນ. ຈາກຂະບວນການນີ້, ເຊິ່ງແມ່ນຂໍ້ມູນທີ່ຖືກຕ້ອງແລະບໍ່ຈໍາເປັນຕ້ອງມີຄວາມຮູ້ທາງດ້ານການປິ່ນປົວພິເສດ, ນັກຄົ້ນຄວ້າໄດ້ພົບເຫັນແບບສອບຖາມທີ່ແຕກຕ່າງກັນ 45 ທີ່ເບິ່ງຄືວ່າເປັນຂໍ້ຄາດເດົາຫຼາຍທີ່ສຸດຂອງຂໍ້ມູນທີ່ຕິດເຊື້ອຂອງໂລກໄຂ້ຫວັດໃຫຍ່ CDC. ຫຼັງຈາກນັ້ນ, ການນໍາໃຊ້ຄວາມສໍາພັນທີ່ເຂົາເຈົ້າໄດ້ຮຽນຮູ້ຈາກຂໍ້ມູນ 2003-2007, Ginsberg ແລະເພື່ອນຮ່ວມງານໄດ້ທົດລອງຮູບແບບຂອງເຂົາເຈົ້າໃນລະຫວ່າງປີ 2007-2008. ພວກເຂົາເຈົ້າໄດ້ພົບເຫັນວ່າຂັ້ນຕອນຂອງພວກເຂົາສາມາດເຮັດໃຫ້ປະຈຸບັນມີປະໂຫຍດແລະຖືກຕ້ອງ (ຮູບທີ່ 2.6). ຜົນໄດ້ຮັບເຫຼົ່ານີ້ໄດ້ຖືກຈັດພີມມາຢູ່ໃນ ທໍາມະຊາດ ແລະໄດ້ຮັບການຄຸ້ມຄອງຫນັງສືພິມທີ່ຮັກ. ໂຄງການນີ້ເຊິ່ງເອີ້ນວ່າ Google Trends ຂອງໄຂ້ຫວັດໃຫຍ່ໄດ້ກາຍເປັນຄໍາອຸປະມາເລື້ອຍໆກ່ຽວກັບພະລັງງານຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ເພື່ອປ່ຽນແປງໂລກ.

ຮູບພາບ 2.6: Jeremy Ginsberg ແລະເພື່ອນຮ່ວມງານ (2009) ລວມຂໍ້ມູນການຄົ້ນຫາຂອງກູໂກທີ່ມີຂໍ້ມູນ CDC ເພື່ອສ້າງ Google Flu Trends, ເຊິ່ງສາມາດຫລຸດອັດຕາການຕິດເຊື້ອທີ່ຄ້າຍຄືໄຂ້ຫວັດໃຫຍ່ (ILI). ຜົນໄດ້ຮັບໃນຮູບນີ້ແມ່ນສໍາລັບເຂດພາກກາງ Atlantic ຂອງສະຫະລັດອາເມລິກາໃນປີ 2007-2008. ເຖິງຢ່າງໃດກໍ່ຕາມ, ໃນເບື້ອງຕົ້ນແມ່ນມີຄວາມຫວັງດີຫຼາຍ, ການປະຕິບັດຂອງແນວໂນ້ມຂອງພະຍາດໄຂ້ຫວັດສັດປີກ Google ໃນເວລາທໍາລາຍ (Cook et al., 2011 Olson et al., 2013 Lazer et al., 2014). ດັດແປງຈາກ Ginsberg et al. (2009), ຮູບທີ່ 3.

ຮູບພາບ 2.6: Jeremy Ginsberg ແລະເພື່ອນຮ່ວມງານ (2009) ລວມຂໍ້ມູນການຄົ້ນຫາຂອງກູໂກທີ່ມີຂໍ້ມູນ CDC ເພື່ອສ້າງ Google Flu Trends, ເຊິ່ງສາມາດຫລຸດອັດຕາການຕິດເຊື້ອທີ່ຄ້າຍຄືໄຂ້ຫວັດໃຫຍ່ (ILI). ຜົນໄດ້ຮັບໃນຮູບນີ້ແມ່ນສໍາລັບເຂດພາກກາງ Atlantic ຂອງສະຫະລັດອາເມລິກາໃນປີ 2007-2008. ເຖິງຢ່າງໃດກໍ່ຕາມ, ໃນເບື້ອງຕົ້ນແມ່ນມີຄວາມຫວັງດີຫຼາຍ, ການປະຕິບັດຂອງແນວໂນ້ມຂອງພະຍາດໄຂ້ຫວັດສັດປີກ Google ໃນເວລາທໍາລາຍ (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . ດັດແປງຈາກ Ginsberg et al. (2009) , ຮູບທີ່ 3.

ຢ່າງໃດກໍຕາມ, ເລື່ອງຄວາມສໍາເລັດນີ້ໄດ້ກາຍເປັນຄວາມອັບອາຍ. ໃນໄລຍະເວລາ, ນັກຄົ້ນຄວ້າໄດ້ຄົ້ນພົບສອງຂໍ້ຈໍາກັດທີ່ສໍາຄັນທີ່ເຮັດໃຫ້ Google Flu Trends ຫນ້ອຍຫນ້າປະທັບໃຈກວ່າມັນໃນເບື້ອງຕົ້ນ. ຫນ້າທໍາອິດ, ການປະຕິບັດຂອງ Google Flu Trends ແມ່ນຕົວຈິງບໍ່ດີກ່ວາຕົວແບບທີ່ງ່າຍດາຍທີ່ຄາດຄະເນຈໍານວນຂອງໄຂ້ຫວັດໃຫຍ່ໂດຍອີງໃສ່ການຄໍານວນໂດຍກົງຈາກການວັດແທກຫລ້າສຸດຂອງການຕິດເຊື້ອໄວຣັສ (Goel et al. 2010) . ແລະໃນໄລຍະເວລາໃດຫນຶ່ງ, Google Trends ຂອງໂລກໄຂ້ຫວັດໃຫຍ່ກໍ່ຮ້າຍແຮງຂຶ້ນກວ່ານີ້ (Lazer et al. 2014) . ໃນຄໍາສັບຕ່າງໆອື່ນໆ, Google Flu Trends ທີ່ມີຂໍ້ມູນທັງຫມົດ, ການຮຽນຮູ້ເຄື່ອງຄອມພິວເຕີແລະຄອມພິວເຕີ້ທີ່ມີປະສິດຕິພາບບໍ່ໄດ້ປະສົບຜົນສໍາເລັດຫຼາຍກວ່າທີ່ຈະເຮັດໃຫ້ມັນງ່າຍດາຍແລະງ່າຍຕໍ່ການເຂົ້າໃຈ. ນີ້ຊີ້ໃຫ້ເຫັນວ່າໃນເວລາທີ່ປະເມີນການຄາດຄະເນຫຼື nowcast, ມັນມີຄວາມສໍາຄັນທີ່ຈະປຽບທຽບກັບຈຸດເລີ່ມຕົ້ນ.

ການ caveat ສໍາຄັນທີ່ສອງກ່ຽວກັບກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່ແມ່ນວ່າຄວາມສາມາດຂອງຕົນໃນການຄາດຄະເນຂໍ້ມູນໄຂ້ຫວັດໃຫຍ່ CDC ແມ່ນມັກຈະລົ້ມເຫຼວໃນໄລຍະສັ້ນແລະລາຍໃນໄລຍະຍາວເນື່ອງຈາກວ່າພຽງການລອຍລົມແລະ confound ສູດການຄິດໄລ່. ຕົວຢ່າງເຊັ່ນໃນລະຫວ່າງປີ 2009 ການລະບາດຂອງໂຣກໄຂ້ຫວັດສັດປີກໃນປີ 2009 ພະຍາດໄຂ້ຫວັດໃຫຍ່ Google ໄດ້ລະລາຍອັດຕາໄຂ້ຫວັດໃຫຍ່ຢ່າງຫຼວງຫຼາຍ, ອາດຈະເປັນການປ່ຽນແປງພຶດຕິກໍາການຊອກຫາຂອງພວກເຂົາໃນການຕອບສະຫນອງຕໍ່ຄວາມຢ້ານກົວຂອງການແຜ່ລະບາດໂລກ (Cook et al. 2011; Olson et al. 2013) ທີ່ຢູ່ ນອກເຫນືອຈາກບັນຫາເຫຼົ່ານີ້ໃນໄລຍະສັ້ນ, ການປະຕິບັດງານໄດ້ຄ່ອຍໆຂື້ນໃນໄລຍະເວລາ. ການວິນິດໄສເຫດຜົນສໍາລັບຄວາມຂັດແຍ້ງໄລຍະຍາວນີ້ແມ່ນຍາກເພາະວ່າ Google Algorithms ຄົ້ນຫາແມ່ນເປັນເຈົ້າຂອງ, ແຕ່ວ່າໃນປີ 2011 Google ໄດ້ແນະນໍາຄໍາທີ່ກ່ຽວຂ້ອງໃນການຄົ້ນຫາເມື່ອຄົນຄົ້ນຫາອາການໄຂ້ຫວັດໃຫຍ່ເຊັ່ນ "ໄຂ້" ແລະ "ໄອ" (ເບິ່ງຄືວ່າ ຄຸນນະສົມບັດນີ້ແມ່ນບໍ່ມີຕໍ່ໄປອີກແລ້ວ). ການເພີ່ມຄຸນສົມບັດນີ້ແມ່ນສິ່ງທີ່ສົມເຫດສົມຜົນທັງຫມົດທີ່ຕ້ອງເຮັດຖ້າທ່ານກໍາລັງໃຊ້ເຄື່ອງຈັກຊອກຫາ, ແຕ່ການປ່ຽນແປງແບບ algorithmic ນີ້ມີຜົນກະທົບຂອງການສ້າງການຊອກຫາຕ່າງໆທີ່ກ່ຽວຂ້ອງກັບສຸຂະພາບທີ່ເຮັດໃຫ້ Google Flu Trends ມີຄວາມຫມັ້ນຄົງສູງກວ່າອັດຕາການຕິດເຊື້ອໄວຣັສ (Lazer et al. 2014) .

ທັງສອງຄໍາເຕືອນນີ້ເຮັດໃຫ້ຄວາມພະຍາຍາມໃນປັດຈຸບັນເຮັດໃຫ້ມີຄວາມຫຍຸ້ງຍາກ, ແຕ່ພວກມັນບໍ່ໄດ້ເຮັດໃຫ້ພວກມັນເສຍ. ໃນຄວາມເປັນຈິງ, ໂດຍການນໍາໃຊ້ວິທີການລະມັດລະວັງຫຼາຍ, Lazer et al. (2014) ແລະ Yang, Santillana, and Kou (2015) ສາມາດຫລີກລ້ຽງບັນຫາເຫຼົ່ານີ້ທັງສອງ. ຂ້ອຍຄິດວ່າການຄົ້ນຄວ້າ nowcasting ທີ່ລວມເອົາແຫຼ່ງຂໍ້ມູນທີ່ໃຫຍ່ທີ່ສຸດກັບຂໍ້ມູນທີ່ຄົ້ນຫາຈາກນັກຄົ້ນຄວ້າຈະຊ່ວຍໃຫ້ບໍລິສັດແລະລັດຖະບານສ້າງການຄາດຄະເນທີ່ຖືກຕ້ອງແລະຖືກຕ້ອງຫຼາຍຂຶ້ນໂດຍການເລັ່ງການວັດແທກທີ່ເກີດຂື້ນເລື້ອຍໆ. ໂຄງການ Nowcasting ເຊັ່ນ Google Flu Trends ຍັງສະແດງໃຫ້ເຫັນວ່າສິ່ງທີ່ເກີດຂຶ້ນຖ້າຫາກວ່າແຫຼ່ງຂໍ້ມູນໃຫຍ່ຖືກລວມກັບຂໍ້ມູນແບບດັ້ງເດີມທີ່ຖືກສ້າງຂື້ນເພື່ອຈຸດປະສົງຂອງການຄົ້ນຄວ້າ. ການຄິດກ່ຽວກັບການປຽບທຽບສິນລະປະຂອງບົດທີ 1, nowcasting ມີທ່າແຮງທີ່ຈະສົມທົບແບບບູຮານແບບດຶກດໍາບັນກັບ custommades ແບບ Michelangelo ເພື່ອໃຫ້ຜູ້ຕັດສິນໃຈມີການວັດແທກທີ່ທັນສະໄຫມແລະມີຄວາມຖືກຕ້ອງຂອງການປະຈຸບັນແລະການຄາດເດົາຂອງອະນາຄົດອັນໃກ້ນີ້.