2.4.2 ትንበያ እና nowcasting

ስለ ወደፊቱ ጊዜ መተንበይ ከባድ ነው, ነገር ግን አሁን መተንበይ ቀላል ነው.

ተጨባጭ መረጃ ጋር ተመራማሪዎች የሚጠቀሙበት ሁለተኛው ዋና ስትራቴጂ ሁኔታ ትንበያ ነው. ስለ ወደፊቱ ጊዜ መተንበይ በጭካኔያቸው አስቸጋሪ ነው, ነገር ግን እነዚህ ኩባንያዎች ወይም መንግሥታት ውስጥ የሚሰሩ እንደሆነ ነው, ውሳኔ ሰጪዎች ለ በሚገርም መልኩ በጣም አስፈላጊ ሊሆን ይችላል.

Kleinberg et al. (2015) የተወሰኑ ፖሊሲ ችግሮች ትንበያ አስፈላጊነት ማብራራት ሁለት ታሪኮችን ያቀርባል. አንድ መምሪያ ሰሪ እንበል: እኔ ድርቅ ትይዩ ነው, እና ዝናብ እድል ይጨምራል አንድ ዝናብ የዳንስ ለማድረግ አንድ ቃልቻ መቅጠር መወሰን አለበት የነበረችው አና, መደወል ይችላሉ. ሌላው መምሪያ ሠሪው, ቤት በመንገድ ላይ ካሉት E ርጥብ ይቻላቸው ዘንድ መሥራት ጃንጥላ መውሰድ መወሰን አለበት, ቦብ ይጠሩታል እንመለከታለን. እነርሱ የአየር ሁኔታ መረዳት ከሆነ አና እና ቦብ ሁለቱም የተሻለ ውሳኔ ለማድረግ ይችላሉ, ነገር ግን የተለያዩ ነገሮችን ማወቅ ያስፈልገናል. አና ዝናብ ዳንስ ዝናብ ያስከትላል እንደሆነ መረዳት ያስፈልገዋል. ቦብ, በሌላ በኩል ደግሞ, አንድ የሚፈጠር ምንም ነገር ለመረዳት አያስፈልገውም; እርሱ ብቻ ትክክለኛ ትንበያ ያስፈልገዋል. ማህበራዊ ተመራማሪዎች ብዙውን ጊዜ ምን ላይ ትኩረት Kleinberg et al. (2015) "ዝናብ ዲንስ-እንደ" የፖሊሲ ችግር-ሰዎች ላይ ትኩረት ዋናነት-እና ትንበያ ላይ ያተኮረ ናቸው "ጃንጥላ-እንደ" መመሪያ ችግሮች ችላ ብለው ይጠሩታል.

እኔ "አሁን" በማጣመር እና የመጣ ማለትም ቃል ትንበያ ተብሎ nowcasting ልዩ ዓይነት ላይ, ይሁን እንጂ, ማተኮር እፈልጋለሁ "ትንበያ." ከዚህ ይልቅ ስለ ወደፊቱ ጊዜ መተንበይ ይልቅ, አሁን መተንበይ ሙከራዎች nowcasting (Choi and Varian 2012) . በሌላ አባባል, nowcasting የመለኪያ ችግሮች ትንበያ ዘዴዎችን ይጠቀማል. እንደተጠቀሰው, ያላቸውን አገሮች በተመለከተ ወቅታዊ እና ትክክለኛ እርምጃዎች ሰዎች መንግሥታት በተለይ ጠቃሚ መሆን አለበት. Nowcasting በ Google የጉንፋን አዝማሚያዎች ምሳሌ ጋር በጣም ግልጽ እንደ ምሳሌ መውሰድ ይቻላል.

አንድ የፍለጋ ፕሮግራም ላይ "ፍሉ መፍትሄዎች" ሲተይቡ ስለዚህ የአየር በታች ትንሽ ስሜት ነው እንበል, ምላሽ ውስጥ አገናኞችን አንድ ገጽ ይቀበላል; ከዚያም አንድ ጠቃሚ ድረ-ገጽ ላይ ከእነርሱ አንዱ ተከተል. አሁን ይህን እንቅስቃሴ የፍለጋ ፕሮግራም አንፃር ውጭ እየተጫወቱ እንበል. እያንዳንዱ ቅጽበት, መጠይቆች በሚሊዮን የሚቆጠሩ በዓለም ዙሪያ የሚገኙ እንደደረሰ ነው, እና ጥያቄዎች-ምን ይህ ዥረት Battelle (2006) የ "በቅን ልቦና ተነሳስተው ጎታ" ተብሎ ነው - የ የጋራ አቀፍ ህሊና ወደ አንድ ዘወትር ዘምኗል መስኮት ይሰጣል. ይሁን እንጂ ፍሉ በመስፋፋቱ ምክንያት የመለኪያ ላይ መረጃ በዚህ ዥረት መመለስ አስቸጋሪ ነው. በቀላሉ "ፍሉ መፍትሄዎች" ለ መጠይቆች ቁጥር ከፍ በመቁጠር በደንብ ላይሰራ ይችላል. ጉንፋን መድኃኒቶች ፈላጊዎች የጉንፋን በሽታ ካለበት ሰው ጉንፋን ጉንፋን መድኃኒቶች ፍለጋዎች እና ሁሉም ሰው አይደለም ያለው ሁሉም ሰው አይደለም.

በ Google የጉንፋን አዝማሚያዎች በስተጀርባ ያለውን አስፈላጊ እና ብልህ ማታለያ አንድ ትንበያ ችግር ወደ መለካት ችግር ለመታጠፍ ነበር. የበሽታ መቆጣጠርያ እና መከላከያ ማዕከል (ሲዲሲ) በአገሪቱ ዙሪያ ዶክተሮች መረጃ የሚሰበስብ ንፍሉዌንዛ የክትትል ሥርዓት አለው. ይሁን እንጂ ይህ ሲዲሲ ሥርዓት ጋር አንድ ችግር ለሁለት ሳምንት ሪፖርት መዘግየት አለ ነው; ዶክተሮችና ከ የሚመጡ ውሂብ የሚወስደው ጊዜ, ማጽዳት ከተሰራ, እና ለመታተም. አንድ ብቅ ወረርሽኝ አያያዝ ጊዜ ግን, የሕዝብ ጤና ጽሕፈት ቤቶች ከሁለት ሳምንታት በፊት ነበር ምን ያህል ኢንፍሉዌንዛ ለማወቅ አልፈልግም; አሁን እዚያ ነው; ምን ያህል የኢንፍሉዌንዛ እነርሱ ማወቅ ይፈልጋሉ. እንዲያውም, ማህበራዊ ውሂብ በርካታ ሌሎች ባሕላዊ ምንጮች, የውሂብ ስብስብ ማዕበል እና ሪፖርት ባለመቅረት መካከል ክፍተት አለ. በጣም ትልቅ ውሂብ ምንጮች, በሌላ በኩል, ሁልጊዜ ላይ (ክፍል 2.3.1.2) ናቸው.

ስለዚህ, ጄረሚ Ginsberg እና ባልደረቦቻቸው (2009) የ Google ፍለጋ ውሂብ ከ CDC ጉንፋን ውሂብ ለመተንበይ ሞክሮ ነበር. ይህ ተመራማሪዎች አሁን በመለኪያ እንደሆነ ሲዲሲ, የወደፊት ውሂብ ወደፊት ውሂብ መተንበይ አሁን ነው ምን ያህል ጉንፋን ለመለካት እየሞከረ ነበር; ምክንያቱም "የአሁኑ መተንበይ" የሚለው ምሳሌ ነው. የማሽን መማሪያ በመጠቀም, እነርሱም ሲዲሲ ፍሉ ውሂብ በጣም እየገመተ እንደሆኑ ለማየት ወደ 50 ሚሊዮን የተለያዩ የፍለጋ ቃላትን በኩል ፈልገዋል. በመጨረሻም, እነርሱም በጣም እየገመተ ይመስል 45 የተለያዩ መጠይቆች ስብስብ አገኙ: ወደ ውጤት በጣም መልካም ነበሩ; እነርሱም CDC ውሂብ መተንበይ የፍለጋ ውሂብ መጠቀም ይችላል. በፍጥረት ላይ የታተመ ሲሆን በዚህ ወረቀት, ላይ መሰረት, የ Google Flu Trends ትልቅ ውሂብ ኃይል በተመለከተ ብዙውን ጊዜ ተደጋጋሚ የስኬት ታሪክ ሆነ.

ሁለት አስፈላጊ caveats ይሁን እንጂ ይህ ስኬት ነው, እና እነዚህ caveats መረዳት አንተ ለመገምገም ለመርዳት እና ትንበያ እና nowcasting ያደርጋል. በመጀመሪያ ደረጃ, የ Google Flu Trends አፈጻጸም በእርግጥ የጉንፋን የበሽታው ሁለት በጣም የቅርብ ጊዜ መለኪያዎችን ከ መስመራዊ extrapolation ላይ የተመሠረተ ፍሉ መጠን ገምቷል ቀላል ሞዴል በላይ ምንኛ የተሻለ ነበር (Goel et al. 2010) . እና, ጥቂት ጊዜያት ላይ የ Google የጉንፋን አዝማሚያዎች በዚህ ቀላል አቀራረብ ይልቅ እንዲያውም የባሰ ነበር (Lazer et al. 2014) . በሌላ አነጋገር, ሁሉንም ውሂብ, የማሽን መማር, እና ኃይለኛ የማስሊያ ጋር በ Google የጉንፋን አዝማሚያዎች በአስገራሚ የተመራማሪ ለመረዳት ቀላል እና ቀላል outperform ነበር. ይህ ማንኛውም ትንበያ መገምገም ወይም nowcast ጊዜ አንድ ከመነሻው ላይ ማወዳደር አስፈላጊ መሆኑን ይጠቁማል.

በ Google የጉንፋን አዝማሚያዎች ስለ ሁለተኛው ጠቃሚ caveat የ CDC ጉንፋን ውሂብ የመተንበይ ችሎታ የአጭር ጊዜ ውድቀት እንዲሁም ስለ ልንዋጋው እና ስልተ ያሳጣቸው የረጅም መበስበስ የተጋለጡ መሆኑን ነው. ለምሳሌ ያህል, 2009 ስዋይን ፍሉ ወረርሽኝ በ Google የጉንፋን አዝማሚያዎች ወቅት በከፍተኛ ሁኔታ ሰዎች ዓለም አቀፍ ወረርሽኝ በስፋት ፍርሃት ምላሽ ለመስጠት ያላቸውን የፍለጋ ባህሪ ለመለወጥ ይቀናቸዋል ምናልባት ምክንያት, የትክትክ መጠን በላይ ይገመታል (Cook et al. 2011; Olson et al. 2013) . እነዚህ የአጭር ጊዜ ችግሮች በተጨማሪ, አፈጻጸም ቀስ በቀስ ጊዜ በላይ የበሰበሱ. ይህን የረጅም ጊዜ መበስበስ ምክንያት ለመመርመር የ Google ፍለጋ ስልተ የባለቤትነት ናቸው; ምክንያቱም አስቸጋሪ ናቸው, ነገር ግን ይህ (ደግሞ ይመስላሉ ሰዎች "ትኩሳት" እና "ሳል" ያሉ ምልክቶች ሲፈልጉ በ 2011 የ Google ተዛማጅ የፍለጋ ቃላትን ሐሳብ ነበር ለውጥ አድርገዋል ይመስላል ይህን ባህሪ) ከአሁን በኋላ ገቢር ነው. ይህን ባህሪ ማከል የፍለጋ ፕሮግራም ድርጅት ማቋቋምን ከሆነ ማድረግ ፈጽሞ ምክንያታዊ ነገር ነው, እና ተጨማሪ ጤና ነክ ፍለጋዎችን ለማመንጨት ውጤት ነበር. ይህ ምናልባት ንግድ ስኬታማ ነበረ, ነገር ግን ላይ-ግምት ኢንፍሉዌንዛ የበሽታው ወደ Google የጉንፋን አዝማሚያዎች ምክንያት (Lazer et al. 2014) .

ደግነቱ, Google የጉንፋን አዝማሚያዎች አማካኝነት እነዚህን ችግሮች fixable ናቸው. እንዲያውም ይበልጥ ጠንቃቃ ዘዴዎች በመጠቀም Lazer et al. (2014) እና Yang, Santillana, and Kou (2015) የተሻለ ውጤት ማግኘት ይችሉ ነበር. ወደፊት, እኔ ተመራማሪ ጋር ትልቅ ውሂብ ማዋሃድ ዘንድ nowcasting ጥናቶች ውሂብ-ይህ Michaelangelo-ቅጥ ጋር Duchamp-ቅጥ Readymades ማዋሃድ Custommades-ይሆናል ይበልጥ ፈጣን እና ትክክለኛ በአሁኑ መካከል መለኪያዎች እና የወደፊት ትንቢቶች ምርት ፖሊሲ አውጪዎች ማንቃት የተሰበሰበ ብለው ነው የሚጠብቁት.