2.4.2 പ്രവചനം ആൻഡ് nowcasting

ഭാവി ഷിതമായത് ബുദ്ധിമുട്ടാണ് എന്നാൽ ഇപ്പോൾ ഷിതമായത് എളുപ്പം.

ഗവേഷകർ നിരീക്ഷണ ഡാറ്റ ഉപയോഗിക്കാൻ കഴിയും രണ്ടാം പ്രധാന തന്ത്രം പ്രവചനം ആണ്. ഭാവിയെക്കുറിച്ച് ഊഹാപോഹങ്ങൾ വളരെ പ്രയാസകരമാണ്. ഒരുപക്ഷേ, സോഷ്യല് ഗവേഷണത്തിന്റെ ഒരു വലിയ ഭാഗമല്ല, അത് ജനസംഖ്യ, സാമ്പത്തികശാസ്ത്രം, എപ്പിഡെമിയോളജി, പൊളിറ്റിക്കൽ സയൻസിന്റെ വളരെ ചെറിയ ഭാഗമാണ്. എന്നാൽ ഇപ്പോൾ "ഇപ്പോൾ", "പ്രവചന" എന്നിവ കൂട്ടിച്ചേർത്തുനിൽക്കുന്ന "ഇപ്പോൾ", " ദീർഘവീക്ഷണമുള്ള" എന്ന പദത്തെ കുറിച്ച ഒരു പ്രത്യേക തരത്തിലുള്ള പ്രവചനത്തിൽ ഞാൻ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഭാവി പ്രവചിക്കുന്നതിനു പകരം, ലോകം; അത് ഇപ്പോഴത്തെ "പ്രവചിക്കാൻ ശ്രമിക്കുന്നു" (Choi and Varian 2012) . ലോകത്തിന്റെ സമയബന്ധിതവും കൃത്യതയുള്ളതുമായ നടപടികൾ ആവശ്യമുള്ള സർക്കാരുകൾക്കും കമ്പനികൾക്കും പ്രയോജനകരമാകാനുള്ള സാദ്ധ്യതകൾ ഇപ്പോഴിവാക്കിയിരിക്കുകയാണ്.

കൃത്യവും കൃത്യവുമായ അളവെടുപ്പ് ആവശ്യം വരുന്ന ഒരു സംവിധാനമാണ് പകർച്ചവ്യാധി. ഇൻഫ്ലുവൻസയുടെ കാര്യം പരിഗണിക്കുക ("പനി"). ഓരോ വർഷവും, കാലക്രമേണ ഇൻഫ്ലുവെൻസ പകർച്ചവ്യാധികൾ ദശലക്ഷക്കണക്കിന് രോഗങ്ങൾക്കും ലോകമെമ്പാടും ആയിരക്കണക്കിന് മരണങ്ങൾക്കും ഇടയാക്കുന്നു. കൂടാതെ, ഓരോ വർഷവും, ഇൻഫ്ലുവൻസയുടെ നോവൽ രൂപപ്പെടാൻ സാധ്യതയുള്ളത് ദശലക്ഷങ്ങളെ കൊല്ലും. ഉദാഹരണത്തിന്, 1918 ഇൻഫ്ലുവൻസ പൊട്ടിത്തെറികൾ 50 മുതൽ 100 ​​ദശലക്ഷം വരെ ആളുകൾ (Morens and Fauci 2007) കൊല്ലപ്പെട്ടതായി കണക്കാക്കപ്പെട്ടിരിക്കുന്നു. ഇൻഫ്ലുവൻസ പൊട്ടിത്തെറിക്കുന്നതിനും ട്രാക്കുചെയ്യേണ്ട ആവശ്യം മൂലം, ലോകമെമ്പാടുമുള്ള സർക്കാരുകൾ ഇൻഫ്ലുവൻസ നിരീക്ഷണ സംവിധാനങ്ങൾ ഉണ്ടാക്കിയിട്ടുണ്ട്. ഉദാഹരണത്തിന്, യുഎസ സെന്റർ ഫോർ ഡിസീസ് കൺട്രോൾ ആന്റ് പ്രിവെൻഷൻ (സി ഡി സി) രാജ്യമെമ്പാടുമുള്ള ശ്രദ്ധാപൂർവം തിരഞ്ഞെടുക്കപ്പെട്ട ഡോക്ടർമാരിൽ നിന്ന് പതിവായി വിവരങ്ങൾ ശേഖരിക്കുന്നു. ഈ സിസ്റ്റം ഉയർന്ന നിലവാരത്തിലുള്ള ഡാറ്റ നിർമ്മിക്കുന്നുണ്ടെങ്കിലും, അത് ഒരു റിപ്പോർട്ടിംഗ് ലാഗ് ഉണ്ട്. അതായത്, ഡോക്ടർമാരിൽനിന്ന് എത്തിക്കുന്ന വിവരങ്ങൾ ശുദ്ധീകരിക്കാനും സംസ്ക്കരിക്കാനും പ്രസിദ്ധീകരിക്കാനും എടുക്കുന്ന സമയം, CDOD സിസ്റ്റം രണ്ടാഴ്ച മുമ്പ് എത്രത്തോളം ഫ്ലൂ ഉണ്ടാകുമെന്ന് പ്രസിദ്ധീകരിക്കുന്നു. എന്നാൽ, ഉയർന്നുവരുന്ന ഒരു പകർച്ചവ്യാധി കൈകാര്യം ചെയ്യുമ്പോൾ, രണ്ടാഴ്ച മുമ്പ് മുൻപ് എത്ര പനി ഇൻഫ്ലുവൻസാ ഉണ്ടെന്ന് പൊതുജനാരോഗ്യ ഉദ്യോഗസ്ഥന്മാർ ആഗ്രഹിക്കുന്നില്ല. ഇപ്പോൾ എത്ര ഇൻഫ്ലുവൻസ ഉണ്ടെന്ന് അവർ അറിയണം.

ഇൻഫ്ലുവൻസയുടെ ട്രാക്കുചെയ്യാൻ സി ഡി സി ഡാറ്റ ശേഖരിക്കുന്ന അതേ സമയത്തുതന്നെ, ഇൻഫ്ലുവൻസ രോഗത്തെക്കുറിച്ചുള്ള ഡാറ്റ ശേഖരിക്കുന്നു, തികച്ചും വ്യത്യസ്തമായ രൂപത്തിൽ. ലോകമെമ്പാടുമുള്ള ആളുകൾ നിരന്തരം Google ന് അന്വേഷണങ്ങൾ അയയ്ക്കുന്നു. "ഫ്ലൂ റെസിഡീസ്", "ഫ്ലൂ ഡിസ്പ്ലേസ്" മുതലായവ പോലുള്ള ചില ചോദ്യങ്ങളാണ് സൂചിപ്പിക്കുന്നത്. എന്നാൽ, ഈ തിരയൽ ചോദ്യങ്ങൾ ഉപയോഗിച്ച് ഫ്ലൂ ബാധിക്കുന്നതായി കണക്കാക്കാൻ വിഷമമാണ്: ഫ്ലൂയിസുള്ള എല്ലാവരെയും ഫ്ലൂയിന് ബന്ധപ്പെട്ട തിരയലാക്കുന്നു, മാത്രമല്ല ഓരോ ഫ്ലൂ സംബന്ധിക്കുന്ന തിരച്ചിലിനും ഫ്ലൂ ഉള്ള ഒരാളിൽ നിന്നുള്ളതല്ല.

ജെറുമി ഗിൻസ്ബെർഗും സഹപ്രവർത്തകരുടെ സംഘവും (2009) , ഗൂഗിളിൽ ചിലരും സി.ഡി.സികളിൽ ചിലരും ഈ രണ്ടു വിവരശേഖരങ്ങളും സംയോജിപ്പിക്കാൻ സുപ്രധാനവും ബുദ്ധിപൂർവ്വവുമായ ആശയങ്ങളുണ്ടായിരുന്നു. ഒരു തരം സ്റ്റാറ്റിസ്റ്റിക്കൽ ആൽക്കെമിയിലൂടെ ഗവേഷണ ഗ്രൂപ്പുകൾ വേഗത്തിലും കൃത്യമല്ലാത്ത സി ഡി സി ഡാറ്റയിലും ഇൻഫ്ലുവൻസ പ്രബലതയുടെ വേഗതയും കൃത്യമായ അളവുകളും നിർമ്മിക്കുന്നതിനായി ചേർക്കുന്നു. അതിനെക്കുറിച്ച് ചിന്തിക്കാൻ മറ്റൊരു മാർഗ്ഗം CDC ഡാറ്റ വേഗത്തിലാക്കാൻ അവർ തിരയൽ ഡാറ്റ ഉപയോഗിച്ചു എന്നതാണ്.

കൂടുതൽ വ്യക്തമായി, 2003 മുതൽ 2007 വരെ ഡാറ്റ ഉപയോഗിച്ച്, സിൻസി ഡാറ്റയിൽ ഇൻഫ്ലുവൻസയുടെ സ്വാധീനവും 50 മില്ല്യൺ വ്യത്യാസമുള്ള തിരയൽ വോള്യവും തമ്മിലുള്ള ബന്ധത്തെ ഗിൻസ്ബെർഗും സഹപ്രവർത്തകരും വിലയിരുത്തി. ഈ പ്രക്രിയ മുതൽ, പൂർണ്ണമായും ഡാറ്റ നിർവ്വഹിക്കപ്പെടുകയും, പ്രത്യേക വൈദഗ്ദ്ധ്യം ആവശ്യമില്ലാത്തതും, സി ഡി സി പക്ഷിപ്പനി വ്യാപക ഡാറ്റയുടെ ഏറ്റവും മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുള്ള 45 വ്യത്യസ്ത അന്വേഷണങ്ങളടങ്ങിയ ഗവേഷകരുടെ കണ്ടെത്തൽ കണ്ടെത്തി. 2003-2007 മുതൽ അവർ പഠിച്ച ബന്ധങ്ങൾ ഉപയോഗിച്ച്, 2007-2008 ലെ ഇൻഫ്ലുവൻസ സീസണിൽ ഗിൻസ്ബെർഗും സഹപ്രവർത്തകരും തങ്ങളുടെ മാതൃക പരിശോധിച്ചു. അവരുടെ നടപടിക്രമങ്ങൾ തീർച്ചയായും പ്രയോജനകരവും കൃത്യതയുള്ളതുമായ ഇന്നത്തെ രൂപങ്ങളാക്കുമെന്ന് അവർ കണ്ടെത്തി (ചിത്രം 2.6). ഈ ഫലങ്ങൾ പ്രകൃതി പ്രസിദ്ധീകരിക്കും ആണിന്റെ അമർത്തുക ലഭിച്ച ചെയ്തു. Google ഫ്ലൂ ട്രെൻഡ്സ് എന്ന് വിളിക്കപ്പെടുന്ന ഈ പ്രോജക്റ്റ് ലോകത്തെ മാറ്റാൻ വലിയ ഡാറ്റയുടെ ശക്തിയെക്കുറിച്ച് പലപ്പോഴും ആവർത്തിക്കുകയാണ്.

ചിത്രം 2.6: Google Flu Trends സൃഷ്ടിക്കുന്നതിനായി CDC ഡാറ്റയോടുകൂടിയ ഗൂഗിൾ സെർച്ച് ഡേറ്റയെ ജെറമി ഗിൻസ്ബെർഗും (2009) സഹപ്രവർത്തകരും ചേർത്ത്, ഇൻഫ്ലുവൻസ പോലുള്ള അസുഖത്തിൻറെ (ഐഇലി) നിരക്കിനെ ഇത് ഇപ്പോൾ തരം തിരിക്കാം. 2007-2008 ലെ ഇൻഫ്ലുവൻസ സീസണിൽ അമേരിക്കയുടെ മധ്യ അറ്റ്ലാന്റിക് മേഖലയ്ക്കാണ് ഈ കണക്കുകൾ. ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡുകളുടെ പ്രകടനം കാലക്രമേണ കുറച്ചുകഴിഞ്ഞു (കുക്ക് et al, 2011, ഓൾസൺ, 2013, ലസ്സർ തുടങ്ങി, 2014). ഗിൻസ്ബെർഗ്, et al. (2009), ചിത്രം 3.

ചിത്രം 2.6: Google Flu Trends സൃഷ്ടിക്കുന്നതിനായി CDC ഡാറ്റയോടുകൂടിയ ഗൂഗിൾ സെർച്ച് ഡേറ്റയെ ജെറമി ഗിൻസ്ബെർഗും (2009) സഹപ്രവർത്തകരും ചേർത്ത്, ഇൻഫ്ലുവൻസ പോലുള്ള അസുഖത്തിൻറെ (ഐഇലി) നിരക്കിനെ ഇത് ഇപ്പോൾ തരം തിരിക്കാം. 2007-2008 ലെ ഇൻഫ്ലുവൻസ സീസണിൽ അമേരിക്കയുടെ മധ്യ അറ്റ്ലാന്റിക് മേഖലയ്ക്കാണ് ഈ കണക്കുകൾ. ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡുകളുടെ പ്രകടനം കാലക്രമേണ കുറച്ചുകഴിഞ്ഞു (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . Ginsberg et al. (2009) , ചിത്രം 3.

എന്നിരുന്നാലും, ഈ വ്യക്തമായ വിജയഗാഥ ഒടുവിൽ ഒരു നാശാവശിഷ്ടമായി മാറി. കാലക്രമേണ, Google ഫ്ലൂ ട്രെൻഡുകൾ ആദ്യം പ്രത്യക്ഷപ്പെട്ടതിനേക്കാൾ കുറച്ചധികം ആകർഷണീയമാക്കുന്ന രണ്ട് സുപ്രധാന പരിമിതികളെ ഗവേഷകർ കണ്ടെത്തുകയുണ്ടായി. ഒന്നാമതായി, ഫ്ലൂ ട്രെൻഡുകളുടെ പ്രകടനം വളരെ ലളിതമായിരുന്നില്ല, അത് പരുത്തിയുടെ ഏറ്റവും പുതിയ അളവുകളിൽ നിന്നുള്ള ദീർഘമായ അളവുകളിൽ (Goel et al. 2010) നിന്നുള്ള ഒരു ലീനിയർ എക്സ്പ്പ്രളേഷൻ അടിസ്ഥാനമാക്കി ഫ്ലൂവിൻറെ അളവ് കണക്കാക്കുന്നത് വളരെ ലളിതമാണ്. ചില സമയങ്ങളിൽ Google ഫ്ലൂ ട്രെൻഡുകൾ ഈ ലളിതമായ സമീപനത്തേക്കാൾ വളരെ മോശമായിരുന്നു (Lazer et al. 2014) . മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, Google Flu Trends അതിന്റെ എല്ലാ ഡാറ്റയും, മെഷീൻ ലേണിംഗും, ശക്തമായ കമ്പ്യൂട്ടിംഗും ഉപയോഗിച്ച് ലളിതവും എളുപ്പത്തിൽ മനസ്സിലാക്കാവുന്നതുമായ ഒരു അനുമാനത്തിന് അസാധാരണമായില്ല. ഇത് ഏതെങ്കിലും പ്രവചനമോ ഇപ്പോകാത്തതോ ആയ മൂല്യനിർണ്ണയം നടത്തുമ്പോൾ ഒരു അടിസ്ഥാന അടിസ്ഥാനത്തിൽ താരതമ്യം ചെയ്യുന്നത് പ്രധാനമാണ്.

ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡ് സംബന്ധിച്ച രണ്ടാമത്തെ സുപ്രധാന ഗുഹയിൽ, ചില്ലറയും അൽഗോരിഥ്മിക് ബോംബ് സ്ക്വാഡും കാരണം സി.ഡി.ജി. ഫ്ലൂ ഡാറ്റ പ്രവചിക്കുന്നതിനുള്ള കഴിവും ഹ്രസ്വകാല പരാജയങ്ങൾക്കും ദീർഘകാല ശോഷങ്ങൾക്കും കാരണമായി. ഉദാഹരണത്തിന്, 2009-ൽ ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡ്സ് ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡ്സ് പ്രഹരമായി കണക്കാക്കി ഇൻഫ്ലുവൻസയുടെ അളവുകോലാണ് കണക്കാക്കുന്നത്. കാരണം, ഒരു ആഗോള പാൻഡെമിക് (Cook et al. 2011; Olson et al. 2013) . ഈ ഹ്രസ്വകാല പ്രശ്നങ്ങൾക്ക് പുറമേ, പ്രകടനം ക്രമേണ കുറഞ്ഞുവന്നു. ഗൂഗിൾ സെർച്ച് അൽഗോരിതങ്ങൾ പ്രൊപ്രൈറ്ററി ആയതിനാൽ ഈ ദീർഘകാല ശോഷണത്തിന് കാരണമറിയാൻ ബുദ്ധിമുട്ടാണ്. പക്ഷേ, 2011 ൽ "പനി", "ചുമ" മുതലായ രോഗബാധയുള്ള ലക്ഷണങ്ങൾ കണ്ടെത്തുമ്പോൾ ഗൂഗിൾ ബന്ധപ്പെട്ട തിരയൽ പദങ്ങൾ നിർദ്ദേശിക്കുവാൻ തുടങ്ങി. ഈ സവിശേഷത മേലിൽ സജീവമല്ല). നിങ്ങൾ ഒരു തിരയൽ എഞ്ചിൻ പ്രവർത്തിപ്പിക്കുന്നുണ്ടെങ്കിൽ ഈ സവിശേഷത ചേർക്കുന്നത് തികച്ചും ന്യായമായ കാര്യമാണ്, എന്നാൽ ഈ അൽഗോരിതം മാറ്റുന്നത്, Google ഫ്ലൂ ട്രെൻഡുകൾ ഫ്ലൂ രോഗത്തെക്കുറിച്ച് അമിതവണ്ണമുണ്ടാക്കുന്നതിന് കൂടുതൽ ആരോഗ്യവുമായി ബന്ധപ്പെട്ട തിരയലുകൾ സൃഷ്ടിക്കുന്നതിന്റെ ഫലമാണ് (Lazer et al. 2014) .

ഈ രണ്ട് വിഭാഗങ്ങൾ ഭാവിയിലേക്കുള്ള പ്രയത്നഫലങ്ങൾ സങ്കീർണ്ണമാക്കുന്നു, പക്ഷെ അവർ അവരെ ശല്യപ്പെടുത്തരുത്. വാസ്തവത്തിൽ, കൂടുതൽ ശ്രദ്ധാലുപാത രീതികൾ ഉപയോഗിച്ചു കൊണ്ട്, Lazer et al. (2014) , Yang, Santillana, and Kou (2015) എന്നീ രണ്ടു പ്രശ്നങ്ങൾ ഒഴിവാക്കാൻ കഴിഞ്ഞു. ഗവേഷണ-ശേഖരിച്ച ഡാറ്റ ഉപയോഗിച്ച് വലിയ വിവര സ്രോതസ്സുകളെ ഒന്നിച്ച് കൂട്ടിച്ചേർക്കുന്ന പഠനങ്ങൾ, കൂടുതൽ സമയവും കൃത്യതയോടെയും കൃത്യമായ കണക്കുകൾ സൃഷ്ടിക്കുന്നതിന് കമ്പനിയേയും സർക്കാരുകളേയും പ്രാപ്തമാക്കും എന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു. ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡ്സ് പോലുള്ള നവീകൃത പ്രോജക്ടുകൾ ഗവേഷണാവശ്യങ്ങൾക്ക് വേണ്ടി സൃഷ്ടിച്ച കൂടുതൽ പരമ്പരാഗത ഡാറ്റയുമായി വലിയ ഡാറ്റ സ്രോതസ്സുകളും കൂടിച്ചേർന്നാൽ എന്ത് സംഭവിക്കും എന്ന് കാണിക്കുന്നു. അടുത്ത അധ്യായത്തിലെ ആർട്ടിക്കിൻറെ സമാനതകൾ പരിഗണിക്കുമ്പോൾ, ഡച്ചാം-സ്റ്റൈൽ റെഡിമെയ്ഡുകൾ മൈക്കലാങ്ങലോ ശൈലിയിൽ കൂട്ടിച്ചേർക്കാനുള്ള ശേഷിയുണ്ടായിരിക്കും, അത് സമീപഭാവിയിലെ ഇപ്പോഴത്തെ കാലഘട്ടത്തിന്റെ പ്രവചനങ്ങൾക്കും മുൻകാല പ്രവചനങ്ങൾക്കും കൂടുതൽ കൃത്യതയാർന്നതും കൂടുതൽ കൃത്യവുമായ അളവുകൾ നൽകിക്കൊണ്ടാണ്.