2.4.2 ප්රක්ශේපණය සහ nowcasting

අනාගතය ගැන අනාවැකි පල දුෂ්කර වේ, නමුත් වර්තමාන අනාවැකි පල පහසු ය.

දෙවන ප්රධාන මූලෝපායික පර්යේෂකයින් නිරීක්ෂණ දත්ත සමඟ අනාවැකි පල කිරීමට භාවිතා කළ හැකිය. අනාගතය පිළිබඳව අනුමාන කිරීම අපකීර්තිමත් ලෙස දුෂ්කර වන අතර, සමහර විට, එම නිසා, ප්රක්ෂේපනය සමාජ පර්යේෂණවල විශාල කොටසක් නොවේ (එය ජන සංයුතියේ, ආර්ථික විද්යාව, වසංගත විද්යාව සහ දේශපාලන විද්යාව වැනි කුඩා කොටසක් වුවද) නොවේ. කෙසේ වෙතත්, මම දැන් "දැන්" සහ "ප්රක්ශේපනය" සංයෝජනය කිරීමෙන් නිපදවා ඇති විශේෂිත වර්ගයේ ප්රක්ෂේපනයක් පිළිබඳව අවධානය යොමු කිරීමට මා කැමතිය. අනාගතය ගැන පුරෝකථනය කිරීම වෙනුවට වත්මන් තත්වය මැනීම සඳහා අනාවැකි පළ කිරීම ලෝකයේ; එය "වර්තමානය අනාවැකි කිරීමට" උත්සාහ කරයි (Choi and Varian 2012) . ලොව පුරා කාලෝචිත හා නිවැරදි මිනුම් අවශ්ය කරන ආන්ඩුවලට සහ සමාගම් වලට විශේෂයෙන්ම ප්රයෝජනවත් විය හැකිය.

කාලෝචිත හා නිවැරදිව මැනීම සඳහා ඇති අවශ්යතාව ඉතා පැහැදිලිය. ඉන්ෆ්ලුවෙන්සා ("උණ") ගැන සලකා බලන්න. සෑම වසරකම, වසංගත ඉන්ෆ්ලුවෙන්සා වසංගතය ලෝකය පුරා මිලියන ගණනක් රෝගාබාධ හා සිය ගණනක් මිය යනවා. තවද සෑම වසරකම, මිලියන ගනනක් මරනයට පත් වූ ඉන්ෆ්ලුවෙන්සා නව ස්වරූපය ඇතිවිය හැකි බවට ඇති හැකියාව. නිදසුනක් වශයෙන් 1918 ඉන්ෆ්ලුවෙන්සා ව්යසනය, මිලියන 50 ත් 100 ත් අතර පුද්ගලයින් (Morens and Fauci 2007) මිය ගොස් ඇති බවට ඇස්තමේන්තු කර තිබේ. ඉන්ෆ්ලුවෙන්සා පිපිරීම් වලට ප්රතිචාර දැක්වීම හා ප්රතිචාර දැක්වීමේ අවශ්යතාව නිසා ලොව පුරා ආන්ඩු විසින් ඉන්ෆ්ලුවන්සාව ආවරණ පද්ධති නිර්මාණය කර ඇත. නිදසුනක් වශයෙන්, එක්සත් ජනපදයේ රෝග පාලන හා වැළැක්වීමේ මධ්යස්ථාන (CDC) නිරන්තරව සහ ප්රවේශමෙන් තොරව ප්රවේශමෙන් තෝරා ගත් වෛද්යවරුන්ගෙන් තොරතුරු රැස්කරනු ලැබේ. මෙම පද්ධතිය උසස් තත්ත්වයේ දත්ත නිපදවා ඇතත් වාර්තාගත පසුබෑමක් ඇත. එනම්, වෛද්යවරුන්ගෙන් පැමිණෙන දත්තයන් පිරිසිදු කිරීම, සැකසීම හා ප්රකාශයට පත් කිරීම සඳහා ගතවන කාලය නිසා CDC පද්ධතිය සති දෙකකට පෙර ඇතිවූ උණ හෙවත් ඇස්තමේන්තු කර තිබේ. එහෙත්, නැගීඑන වසංගතයක් හැසිරවීමේදී, සෞඛ්ය බලධාරීන් සති දෙකකට පෙර කොතරම් බලපෑවා ද යන්න දැනගැනීමට අවශ්ය නැත. ඔවුන් දැන් කොපමණ ඉන් පිටව සිටිනවාදැයි දැන ගැනීමට අවශ්යයි.

CDC විසින් ඉන්ෆ්ලුවෙන්සා නිරීක්ෂණය කිරීමට දත්ත එකතු කරන අතරතුර, ගූගල් ෆ්ලෝරාසා පැතිරයාම පිළිබඳ දත්ත රැස්කරනු ලැබුවද, එය වෙනස් ආකාරයකටය. ලෝකය පුරා සිටින මිනිසුන් නිරන්තරයෙන් ගූගල් වෙත විමසීම් කරන අතර, සමහරක් විමසුම් කීපයක් - "උණ ප්රතිකර්ම" සහ "උණ රෝගී" යන රෝගීන්ගෙන් විමසනු ලැබේ. නමුත් මෙම සෙවුම් විමෝචන පරීක්ෂා කිරීම උගුලක් වන අතර, උණ ඇතිව සිටින සෑම දෙනෙක්ම උණට සම්බන්ධ සෙවීමක් සිදු නොවේ.

ජෙරමි ගින්ස්බර්ග් සහ සගයන්ගේ කණ්ඩායම (2009) , ගූගල් හි සමහරක් හා CDC හි සමහරක්, මෙම දත්ත මූලාශ්ර දෙක ඒකාබද්ධ කිරීමට වැදගත් සහ දක්ෂ අදහසක් විය. යම් ආකාරයක සංඛ්යානමය ඇල්කෙමි ක්රමයක් ඔස්සේ පර්යේෂකයන් විසින් ක්ෂණික සහ නිවැරදිත සීඩබ්ලිව්සී දත්ත සමඟ ක්ෂණික හා නිවැරදි නොවන සෙවුම් දත්ත ඒකාබද්ධ කළේ ඉන්ෆ්ලුවෙන්සා පැතිරයාමේ ක්ෂණික හා නිරවද්යතාව මැන බැලීම සඳහාය. CDC දත්ත වේගවත් කිරීම සඳහා ඔවුන් සෙවුම් දත්ත භාවිතා කළ බව තවත් සිතියමක්.

විශේෂයෙන් 2003 සිට 2007 දක්වා දත්ත භාවිතා කිරීම, ගින්ස්බර්ග් හා සගයන් විසින් CDC දත්ත වල ඇතිවූ ඉන්ෆ්ලුවෙන්සා පැතිරයා අතර සම්බන්ධය සහ විවිධාකාර අර්ථයන් මිලියන 50 සඳහා සෙවුම් ප්රමාණය ගණනය කරන ලදී. මෙම ක්රියාවලියෙන් සම්පූර්ණයෙන්ම දත්ත මත පදනම් වූ සහ විශේෂිත වෛද්ය දැනුම අවශ්ය නොවීය. පර්යේෂකයන් CDC උණ පැතිරීමේ දත්ත පිළිබඳ වඩාත්ම පුරෝකථනය කරන ලද විවිධාකාර වූ විමසුම් 45 ක් සොයා ගත්හ. ඉන්පසු, 2003-2007 දත්ත වලින් ඉගෙන ගත් සම්බන්ධතා භාවිතා කරමින්, ගින්ස්බර්ග් සහ සගයන් 2007-2008 ඉන්ෆ්ලුවෙන්සා සමය තුළ ඔවුන්ගේ ආකෘතිය පරීක්ෂා කළහ. ඔවුන්ගේ ක්රියාපටිපාටිය සැබවින්ම ප්රයෝජනවත් සහ නිවැරැදිව ඉදිරිපත් කළ හැකි බව සොයා ගත්හ. (රූපය 2.6). මෙම ප්රතිඵල ස්වභාව ධර්මයෙහි ප්රකාශයට පත් කරන ලද අතර මාධ්ය ආවරණ ආචාර පෙළපාළි ලැබීය. Google Flu Trends නම් වූ මෙම ව්යාපෘතිය ලෝකය වෙනස් කිරීම සඳහා විශාල දත්ත ශක්තිය පිලිබඳ නිතර නිතර නිතර උපමා උපමා වේ.

2.6: ජේම්මි ගින්ස්බර්ග් සහ සගයන් (2009), ගුප්ත වසංගත රෝගය (ILI) අනුපාතය දැන් ගූගල් ෆියුස් ට්රැවල්ස් සෑදීමට CDC දත්ත සමඟ ගූගල් සෙවුම් දත්ත සංයුක්ත කර ඇත. මෙම සංඛ්යාලේඛාවේ ප්රතිඵල 2007-2008 ඉන්ෆ්ලුවෙන්සා සමය තුළ ඇමරිකා එක්සත් ජනපදයේ මධ්ය අත්ලාන්තික් ප්රදේශය සඳහා වේ. මුලදී ඉතාමත්ම පොරොන්දු වූයේ වුවද, ගූගල් ෆ්ලඩු ටෙස්ට් වල කාර්යසාධනය කාලයත් සමග දිරාපත්විය (Cook et al., 2011, Olson et al. 2013, Lazer et al. 2014). අනුවර්තනය කරන ලද්දේ Ginsberg et al. (2009), රූපය 3.

2.6: ජේම්මි ගින්ස්බර්ග් සහ සගයන් (2009) , ගුප්ත වසංගත රෝගය (ILI) අනුපාතය දැන් ගූගල් ෆියුස් ට්රැවල්ස් සෑදීමට CDC දත්ත සමඟ ගූගල් සෙවුම් දත්ත සංයුක්ත කර ඇත. මෙම සංඛ්යාලේඛාවේ ප්රතිඵල 2007-2008 ඉන්ෆ්ලුවෙන්සා සමය තුළ ඇමරිකා එක්සත් ජනපදයේ මධ්ය අත්ලාන්තික් ප්රදේශය සඳහා වේ. මුලදී ඉතාමත්ම පොරොන්දු වූයේ වුවද, ගූගල් ෆ්ලඩු ටෙස්ට් වල කාර්යසාධනය කාලයත් සමග දිරාපත්විය (Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014) . අනුවර්තනය කරන ලද්දේ Ginsberg et al. (2009) , රූපය 3.

කෙසේවෙතත්, මෙම සාර්ථක සාර්ථකත්වයේ කතාව අවසානයේදී අපහසුතාවයක් බවට පත් විය. කාලයත් සමඟම පර්යේෂකයන් විසින් මුලින්ම පෙනී සිටියේ ගූගල් ෆ්ලඩු ටේරන්ට්ස් වඩා ප්රියජනකයි. පළමුවෙන්ම, ගූගල් ෆ්ලෝඩෝ ට්රැවල්ස් හි ක්රියාකාරිත්වය යනු හුදෙක් උණ පැතිරීම පිළිබඳ මෑත ම මිනුම් (Goel et al. 2010) රේඛීය නිස්සාරණය මත පදනම් වූ උණ ප්රමාණය ඇස්තමේන්තු කරන සරල ආකෘතියට වඩා හොඳ ය. සහ සමහර කාල පරිච්ඡේදයන් තුළ Google Flu Trends සැබැවින්ම මෙම සරල (Lazer et al. 2014) වඩා නරක ය (Lazer et al. 2014) . වෙනත් වචනවලින් කියතොත්, සියළුම දත්තයන්, යාන්ත්රික ඉගෙනුම් සහ බලගණ පරිඝනක සමග ගූගල් ෆ්ලූ ට්රැවල්ස් සමග නාට්යමය ලෙස සරල හා පහසු අවබෝධයක් ලැබුවා. මෙහි දී අදහස් කරන්නේ කිසියම් ප්රක්ශේපණයක හෝ වර්තමානයේ විශ්ලේෂණය කිරීමේදී මූලික පදයක් සමඟ සංසන්දනය කිරීම වැදගත් ය.

Google Flu Trends පිළිබඳ දෙවන වැදගත් විවරණය වන්නේ CDC උණ දත්ත අනාවැකි පළ කිරීමේ හැකියාව කෙටි කාලීනව අසාර්ථක වීම හා දිගු කාලීනව ක්ෂය වීම නිසා ඇතිවන ප්ලේට් සහ ඇල්ගොරිතමය ව්යාකූලත්වය නිසාය. නිදසුනක් වශයෙන්, 2009 ඌන උවදුරුවලට ගොදුරු වීමෙන් ගූගල් ෆුඩ් ට්රැවල්ස් (Gibraltar Flu Trends) ග්ලූටෙන්සා රෝගය පිලිබඳව නාටකාකාර ලෙස අධිප්රමාණය කරන ලදී, සමහර විට ගෝලීය වසංගතයක් පිලිබඳ පුලුල්ව පැතිරුනු භීතිකාවකට ප්රතිචාරයක් වශයෙන් මිනිසුන් තම සෙවුම් හැසිරීම් වෙනස් කිරීමට පෙලඹී ඇති නිසා (Cook et al. 2011; Olson et al. 2013) . මෙම කෙටි කාලීන ගැටළු වලට අමතරව, කාර්යසාධනය කාලයත් සමග ක්රමයෙන් දිරාපත් විය. ගූගල් සෙවුම් ඇල්ගොරිතම සෘජුවම මෙම දිගුකාලීන ක්ෂය වීම සඳහා හේතු සොයා ගැනීම අපහසු වේ. නමුත් 2011 දී ගූගල් විසින් "උණ හා කැස්ස" වැනි රෝග ලක්ෂණ සොයා ගන්නේ නම් ගූගල් විසින් අදාළ සෙවුම් වචන යෝජනා කරන ලදී. මෙම විශේෂාංගය තවදුරටත් ක්රියාකාරී නොවේ). මෙම විශේෂාංගය එකතු කිරීම ඔබ සෙවුම් එන්ජිමක් ධාවනය කරන්නේ නම්, සම්පූර්ණයෙන්ම සාධාරණ දෙයක් නම්, නමුත් මෙම ඇල්ගොරිතම වෙනස්වීම සෞඛ්යයට සම්බන්ධිත සෙවුම් ඇති කිරීමට හේතු වූ අතර, ගුඩ් ෆ්ලැග් ට්රේඩ්ස් (Lazer et al. 2014) Flu Trends) උණ පැතිරීම (Lazer et al. 2014) .

මෙම කැළඹීම් දෙක නිවේදනය කරනුයේ ඉදිරි දින කිහිපය තුළ සිදුකරන ප්රයත්නයන් සංකීර්ණ කිරීමයි. ඇත්ත වශයෙන්ම වඩාත් ප්රවේශම්කාරී ක්රම භාවිතා කරමින් Lazer et al. (2014) හා Yang, Santillana, and Kou (2015) මෙම ගැටලු මඟහරවා ගැනීමට සමත් විය. පර්යේෂකයින් විසින් රැස්කරගත් දත්ත සමගින් විශාල දත්ත මූලාශ්ර සමුදානු ලබන අධ්යයන කරන අධ්යයනවලින් බලාපොරොත්තු වනුයේ සමාගම් හා ආන්ඩු වඩාත් කාලෝචිත හා වඩාත් නිවැරදි ඇස්තමේන්තු සකස් කර ගැනීමට හැකිවන බවයි. ගූගල් ෆියුස් ප්රවණතා වැනි ගවේෂණ ව්යාපෘති ද පර්යේෂණයේ අරමුණු සඳහා නිර්මාණය කරන ලද වඩා සාම්ප්රදායික දත්ත සමග විශාල දත්ත මූලාශ්ර සංයුක්ත කර තිබේ නම් කුමක් සිදු විය හැකිය. 1 වන පරිච්ඡේදයේ කලාත්මක සංසන්දනය නැවත සිතා බැලීම, වර්තමානයේ වර්තමාන හා වර්තමාන අනාවැකි වඩාත් කාලෝචිත හා වඩාත් නිවැරදිව මැන බැලීම සඳහා තීරකයන් නිර්මාණය කිරීම සඳහා මිචලන්ගෙලෝ-විලාසිතා කුටි සමඟ ඩුචැම්ප් මාදිලියේ නිමි ඇඳුම් ඒකාබද්ධ කිරීමට හැකියාව ඇත.