2.4.2 ఫోర్కాస్టింగ్ మరియు nowcasting

భవిష్యత్తులో ఊహించడం కష్టం, కానీ ప్రస్తుతం అంచనా సులభం.

పరిశీలన డేటా తో పరిశోధకులు ఉపయోగించిన రెండవ ప్రధాన వ్యూహం అంచనా. భవిష్యత్తులో ఊహించడం పోషకాల కష్టం, కానీ వారు కంపెనీలు లేదా ప్రభుత్వాలలో పని లేదో అది నిర్ణయం మేకర్స్ కల్గిస్తుందని ముఖ్యమైనది.

Kleinberg et al. (2015) కొన్ని విధాన సమస్యలకు అంచనా ప్రాముఖ్యత స్పష్టం రెండు కథలు అందిస్తుంది. ఒకటి విధాన నిర్ణాయక ఇమాజిన్, నేను కరువు ఎదుర్కొంటున్న మరియు వర్షం అవకాశాన్ని పెంచుతుంది వర్షం నృత్యం చేయాలని ఒక షమన్ తీసుకోవాలని లేదో నిర్ణయించుకోవాలి ఎవరు ఆమె అన్నా, పిలుస్తాను. మరో విధాన నిర్ణాయక, నేను అతనిని బాబ్, వే హోమ్ న తడి పొందడానికి నివారించేందుకు పని ఒక గొడుగు పడుతుంది లేదో నిర్ణయించుకోవాలి పిలుస్తాను. వారు వాతావరణ అర్థం ఉంటే అన్నా మరియు బాబ్ రెండు ఒక మంచి నిర్ణయం చేయవచ్చు, కాని అవి వివిధ విషయాలను తెలుసుకోవాలి. అన్నా వర్షం డ్యాన్స్ వర్షం కారణమవుతుంది లేదో అర్థం అవసరం. బాబ్, మరోవైపు, ఎటువంటి కారణాలు గురించి ఏదైనా బుద్ధి అవసరం లేదు; అతను కేవలం ఒక ఖచ్చితమైన సూచన కావాలి. సామాజిక పరిశోధకులు తరచూ దానిపై దృష్టి Kleinberg et al. (2015) "వర్షం నృత్యం వంటి" విధానాన్ని సమస్యలు-ఆ దృష్టి అనుకోకుండా-మరియు రానున్న కాలంలో అంచనా కేంద్రీకరించేలా "గొడుగు వంటి" విధానాన్ని సమస్యలు పట్టించుకోకుండా కాల్.

నేను ప్రస్తుతం అంచనా ప్రయత్నాలు nowcasting, అయితే భవిష్యత్తులో ఊహించడం కంటే "ఇప్పుడు" కలపడం మరియు నుండి ఉద్భవించింది -a పదం అంచనా అని nowcasting ఒక ప్రత్యేక రకమైన, అయితే, నిలపాలి ఇష్టం "అంచనా." (Choi and Varian 2012) . ఇతర మాటలలో, nowcasting కొలత సమస్యలకు అంచనా పద్ధతులను ఉపయోగిస్తుంది. అందుకని, అది వారి రాజధానులను కాలానుగుణమైన మరియు ఖచ్చితమైన చర్యలు అవసరం ప్రభుత్వాలు ముఖ్యంగా ఉపయోగకరంగా ఉండాలి. Nowcasting Google ఫ్లూ ధోరణులు ఉదాహరణకు తో చాలా స్పష్టంగా వివరించడానికి వీలు కలుగుతుంది.

కాబట్టి మీరు ఒక శోధన ఇంజిన్ టైప్ "ఫ్లూ మందులు" మీరు వాతావరణ కింద ఒక బిట్ ఫీలింగ్ ఆ ఇమాజిన్, ప్రతిస్పందనగా లింక్ల పేజీ అందుకుంటారు, మరియు అప్పుడు ఒక ఉపయోగపడిందా వెబ్పేజీల్లో వాటిని ఒకటి అనుసరించండి. ఇప్పుడు ఈ చర్య శోధన ఇంజిన్ యొక్క దృష్టికోణం నుంచి ఆడబడుతుంది కలెక్టరుకు. ప్రతి క్షణం, ప్రశ్నలు మిలియన్ల ప్రపంచవ్యాప్తంగా నుండి వస్తున్నా ఉంటాయి, మరియు ప్రశ్నలను అంటే ఈ స్ట్రీమ్ Battelle (2006) "ఉద్దేశాలను డేటాబేస్" పిలిచాడు - సామూహిక ప్రపంచ తెలివిలో నిరంతరం నవీకరించబడింది విండో అందిస్తుంది. ఏది ఏమైనప్పటికీ, ఫ్లూ ప్రాబల్యం కొలత సమాచారాన్ని ఈ స్ట్రీమ్ చెయ్యడానికి కష్టం. కేవలం "ఫ్లూ మందులు" విచారణలను సంఖ్య లెక్కింపు బాగా పని చేయకపోవచ్చు. ఫ్లూ మందులు కోసం వెదుకుతున్న ఫ్లూ ఉందో ఫ్లూ మందులు ఫ్లూ శోధనలు మరియు అందరూ ఉందో అందరికీ కాదు.

Google ఫ్లూ ట్రెండ్లులో వెనుక ముఖ్యమైన మరియు తెలివైన ట్రిక్ అంచనా సమస్య కొలత సమస్య తిరుగులేని ఉంది. వ్యాధి నియంత్రణ మరియు నివారణ సంయుక్త కేంద్రాలు (CDC) దేశవ్యాప్తంగా వైద్యులు నుండి సమాచారాన్ని సేకరిస్తుంది ఒక ఇన్ఫ్లుఎంజా పర్యవేక్షణ వ్యవస్థ ఉంది. అయితే, ఈ CDC వ్యవస్థ ఒక సమస్య రెండువారాల రిపోర్టింగ్ లాగ్ ఉంది; వైద్యులు నుండి వచ్చిన డేటా పట్టే సమయం, శుభ్రం వుంటుంది ప్రాసెస్, మరియు ప్రచురించింది. కానీ, ఒక అభివృద్ధి చెందుతున్న మహమ్మారి నిర్వహించడానికి ఉన్నప్పుడు, ప్రజారోగ్యం కార్యాలయాలు రెండు వారాల క్రితం ఉంది ఇన్ఫ్లుఎంజా ఎంత తెలుసుకోవాలంటే లేదు; వారు తెలుసుకోవాలంటే ప్రస్తుతం అక్కడ చాలా ఇన్ఫ్లుఎంజా ఎలా. నిజానికి, సామాజిక డేటా అనేక ఇతర సంప్రదాయ మూలాల, అక్కడ రిపోర్ట్ లాగ్స్ డేటా సేకరణ తరంగాలు మరియు మధ్య ఖాళీలు ఉన్నాయి. అత్యంత భారీ సమాచార వనరులను మరోవైపు, ఎప్పుడూ (విభాగం 2.3.1.2) ఉన్నాయి.

అందువలన, జెరెమీ గిన్స్బెర్గ్ మరియు సహచరులు (2009) Google శోధన డేటా నుండి CDC ఫ్లూ డేటా అంచనా ప్రయత్నించారు. ఈ "అంచనా ప్రస్తుతం" పరిశోధకులు CDC, భవిష్యత్తులో డేటా ప్రస్తుత కొలిచే అని నుండి భవిష్యత్తు డేటా అంచనా ద్వారా ఇప్పుడు ఉంది ఫ్లూ ఎంత కొలవటానికి ప్రయత్నిస్తున్న ఎందుకంటే ఒక ఉదాహరణ. యంత్ర అభ్యాస ఉపయోగించి, వారు CDC ఫ్లూ డేటా అత్యంత యొక్క ఊహాత్మక ఇవి చూడటానికి 50 మిలియన్ వివిధ శోధన పదాలు ద్వారా శోధించిన. చివరకు, వారు అత్యంత ఉండగలదని అనిపించింది 45 వివిధ ప్రశ్నలకు సమితి దొరకలేదు, మరియు ఫలితాలు చాలా బాగున్నాయి: వారు CDC డేటా అంచనా శోధన డేటా వాడవచ్చు. ప్రకృతి లో ప్రచురించబడింది ఇది ఈ కాగితం పై భాగం లో ఆధారంగా, Google ఫ్లూ ట్రెండ్లులో పెద్ద డేటా శక్తి గురించి ఒక తరచుగా పునరావృతం విజయం కథ మారింది.

అక్కడ, స్పష్టంగా కనిపిస్తున్న ఈ విజయానికి రెండు ముఖ్యమైన షరతులు అయితే, మరియు ఈ షరతులు అర్ధం చేసుకోవడం మూల్యాంకనం సహాయం మరియు రానున్న కాలంలో అంచనా మరియు nowcasting చేస్తాను. మొదటి, Google ఫ్లూ ధోరణులు ప్రదర్శన నిజానికి ఫ్లూ ప్రాబల్యం రెండు ఇటీవల కొలతలను ఒక సరళ బాహ్య గణనం నిక్షేపం ఆధారంగా ఫ్లూ మొత్తం అంచనా వేసింది సాధారణ మోడల్ కంటే మెరుగ్గా ఉంది (Goel et al. 2010) . మరియు, కొన్ని కాలాల్లో Google ఫ్లూ ట్రెండ్లులో ఈ సాధారణ విధానం కంటే వాస్తవానికి దారుణంగా ఉంది (Lazer et al. 2014) . ఇతర మాటలలో, దాని డేటా, యంత్ర అభ్యాస, మరియు శక్తివంతమైన కంప్యూటింగ్ తో Google ఫ్లూ ట్రెండ్లులో నాటకీయంగా పరిష్కార అర్థం చేసుకోవడానికి చాలా సులభం మరియు సులభంగా తలదన్నే లేదు. ఈ ఏ సూచన మూల్యాంకనం లేదా nowcast అది ఒక ప్రామాణికం వ్యతిరేకంగా సరిపోల్చండి ముఖ్యం అని సూచిస్తుంది.

Google ఫ్లూ ట్రెండ్లులో గురించి రెండవ ముఖ్యమైన మినహాయింపు CDC ఫ్లూ డేటా అంచనా దాని సామర్థ్యం స్వల్పకాలిక వైఫల్యం మరియు ఎందుకంటే డ్రిఫ్ట్ మరియు క్రమసూత్ర విచ్ఛిన్న దీర్ఘకాల క్షయం బానిసయ్యాడు ఉంది. ఉదాహరణకు 2009 స్వైన్ ఫ్లూ వ్యాప్తికి పూర్తిగా Google ఫ్లూ ట్రెండ్లులో సందర్భంగా నాటకీయంగా ఇన్ఫ్లుఎంజా మొత్తం, ఓవర్ అంచనా మంది ప్రపంచ పాండమిక్ విస్తృతమైన భయాన్ని తమ శోధన ప్రవర్తనను మార్చడానికి ఉంటాయి బహుశా ఎందుకంటే (Cook et al. 2011; Olson et al. 2013) . ఈ చిన్న-కాల సమస్యలు అదనంగా, పనితీరు క్రమంగా కాలక్రమేణా పుచ్చిన. Google శోధన అల్గోరిథంలు యాజమాన్య ఉన్నాయి ఎందుకంటే ఈ దీర్ఘకాలిక క్షయం కారణాలు నిర్ధారణ కష్టం, కానీ అది (అది కూడా కనిపించడం ప్రజలు "జ్వరము" మరియు "దగ్గు" వంటి లక్షణాలు కోసం శోధించినప్పుడు 2011 లో Google సంబంధిత శోధన పదాలు సూచించారు చేసే మార్పులు చేసిన కనిపిస్తుంది ఈ లక్షణం క్రియారహితం అని). ఈ ఫీచర్ జోడించడం మీరు ఒక శోధన ఇంజిన్ వ్యాపార నడుస్తున్న ఉంటే అలా ఒక పూర్తిగా సహేతుకమైన విషయం, మరియు అది మరింత ఆరోగ్య సంబంధిత శోధనలు ఉత్పత్తి పై ప్రభావం చూపాయి. ఈ బహుశా వ్యాపారం కోసం ఒక విజయం ఉంది, కానీ అది ఓవర్ అంచనా ఫ్లూ ప్రాబల్యం Google ఫ్లూ ట్రెండ్లులో కారణంగా (Lazer et al. 2014) .

అదృష్టవశాత్తూ, Google ఫ్లూ ట్రెండ్లతో ఈ సమస్యలు fixable ఉంటాయి. నిజానికి, మరింత జాగ్రత్తగా పద్ధతులను ఉపయోగించి, Lazer et al. (2014) మరియు Yang, Santillana, and Kou (2015) మంచి ఫలితాలను పొందుటకు పోయారు. ముందుకు వెళుతున్న, నేను పరిశోధకుడు తో పెద్ద డేటా కలుపును nowcasting అధ్యయనాలు డేటా-ఆ మైఖెల్యాంగెలో-శైలి డ్యూచాంప్ తరహా Readymades మిళితం Custommades-చేస్తుంది ప్రస్తుతం వేగంగా మరియు మరింత కచ్చితమైన కొలతలు మరియు భవిష్యత్ అంచనాలు ఉత్పత్తి విధాన నిర్ణేతలు ఎనేబుల్ సేకరించిన భావిస్తున్నారు.