2.3.2 ఎల్లప్పుడు

ఎప్పుడూ పెద్ద డేటా అనూహ్య సంఘటనలు మరియు వాస్తవ కాల లెక్కింపు అధ్యయనం అనుమతిస్తుంది.

అనేక పెద్ద డేటా సిస్టమ్స్ ఎప్పుడూ ఉంటాయి; వారు నిరంతరం డేటా సేకరిస్తున్నారు. ఈ ఎప్పుడూ లక్షణం రేఖీయ డేటా తో పరిశోధకులు అందిస్తుంది (అంటే, కాలక్రమేణా డేటా). ఎప్పుడూ ఉండటం పరిశోధనకు రెండు ముఖ్యమైన చిక్కులను కలిగి ఉంది.

మొదట, డేటా సేకరణలో ఎల్లప్పుడూ పరిశోధకులు ఊహించని సంఘటనలను సాధ్యం కాని మార్గాల్లో అధ్యయనం చేయడాన్ని అనుమతిస్తుంది. ఉదాహరణకు, 2013 వేసవికాలంలో టర్కీలో ఆక్రమణ గీజీ నిరసనలు చదివే ఆసక్తి ఉన్న పరిశోధకులు ఈ కార్యక్రమంలో నిరసనకారుల ప్రవర్తనపై దృష్టి సారిస్తారు. Ceren Budad మరియు డంకన్ వాట్స్ (2015) ఈవెంట్ ముందు, సమయంలో, మరియు తరువాత Twitter ఉపయోగించిన నిరసనకారులు అధ్యయనం Twitter యొక్క స్వభావం ఎల్లప్పుడూ-ఉపయోగించి ఉపయోగించి చేయగలిగారు. మరియు, వారు సంఘటన ముందు, సమయంలో, మరియు సంఘటన తర్వాత (పోలిక 2.2) పోలిక సమూహాన్ని సృష్టించగలిగారు. మొత్తంగా, వారి మాజీ పోస్ట్ ప్యానెల్ రెండు సంవత్సరాల్లో 30,000 మంది ట్వీట్లను కలిగి ఉంది. ఈ ఇతర సమాచారంతో నిరసనల నుండి సాధారణంగా ఉపయోగించిన డేటాను పెంచడం ద్వారా, బుడాక్ మరియు వాట్స్ మరింత నేర్చుకోగలిగారు: వారు జీజీ నిరసనలు పాల్గొనడానికి ఎంత ఎక్కువ మంది ప్రజలు ఉంటారో మరియు వైఖరులలో మార్పులను స్వల్పకాలంలో (గీజికి పూర్వ గీజిని పోల్చడం) మరియు దీర్ఘకాలంలో (పోస్ట్-గీజీని పూర్వ-జిజితో పోల్చడం) పాల్గొనేవారు మరియు పాల్గొనేవారు.

Figure 2.2: బుడక్ మరియు వాట్స్ (2015) ఉపయోగించిన డిజైన్ వేసవిలో టర్కీలో గీసీ నిరసనలను 2013 వేసవిలో అధ్యయనం చేయడానికి. ట్విట్టర్ యొక్క ఎల్లప్పుడూ-స్వభావం ఉపయోగించి, పరిశోధకులు వారు రెండు సంవత్సరాలలో 30,000 మంది ప్రజలు. నిరసనలు సమయంలో పాల్గొనేవారు దృష్టి సారించే ఒక విలక్షణమైన అధ్యయనానికి విరుద్ధంగా, మాజీ పోస్ట్ ప్యానెల్ ఈవెంట్కు ముందు మరియు తర్వాత మరియు పాల్గొన్నవారి నుండి డేటాను జతచేస్తుంది మరియు 2) కార్యక్రమం ముందు, సమయంలో, మరియు తరువాత పాల్గొనేవారి నుండి డేటా. ఈ సుసంపన్నమైన డేటా నిర్మాణం బుడిక్ మరియు వాట్ట్స్ ను ఏవిధంగా జజీ నిరసనాలలో పాల్గొనడానికి ఎక్కువ అవకాశాలు కల్పించాలో మరియు స్వల్పకాలంలో పాల్గొనేవారు మరియు పాల్గొనేవారి యొక్క వైఖరిలో మార్పులను అంచనా వేయడానికి ఎక్కువ అవకాశం ఉంది (గీజిలో పూర్వ గీజిని పోల్చడం ) మరియు దీర్ఘకాలంలో (పోస్ట్-జిజీని పూర్వ-జిజితో పోల్చడం).

మూర్తి 2.2: ఉపయోగించిన నమూనాపై Budak and Watts (2015) అధ్యయనం అసాధారణంగా ట్విటర్ ఎప్పుడూ స్వభావం ఉపయోగించి ద్వారా 2013. వేసవిలో టర్కీలో Gezi నిరసనలు ఆక్రమిస్తాయి, పరిశోధకులు వారు గురించి చేర్చారు ఒక మాజీ పోస్ట్ ప్యానెల్ అని పిలిచాడు రూపొందించినవారు రెండు సంవత్సరాలలో 30,000 మంది ప్రజలు. నిరసనలు సమయంలో పాల్గొనేవారు దృష్టి సారించే ఒక విలక్షణమైన అధ్యయనానికి విరుద్ధంగా, మాజీ పోస్ట్ ప్యానెల్ ఈవెంట్కు ముందు మరియు తర్వాత మరియు పాల్గొన్నవారి నుండి డేటాను జతచేస్తుంది మరియు 2) కార్యక్రమం ముందు, సమయంలో, మరియు తరువాత పాల్గొనేవారి నుండి డేటా. ఈ సుసంపన్నమైన డేటా నిర్మాణం బుడిక్ మరియు వాట్ట్స్ ను ఏవిధంగా జజీ నిరసనాలలో పాల్గొనడానికి ఎక్కువ అవకాశాలు కల్పించాలో మరియు స్వల్పకాలంలో పాల్గొనేవారు మరియు పాల్గొనేవారి యొక్క వైఖరిలో మార్పులను అంచనా వేయడానికి ఎక్కువ అవకాశం ఉంది (గీజిలో పూర్వ గీజిని పోల్చడం ) మరియు దీర్ఘకాలంలో (పోస్ట్-జిజీని పూర్వ-జిజితో పోల్చడం).

సమాచార సేకరణ సేకరణల (ఉదా. దీర్ఘకాలిక అంచనా వైఖరి మార్పు) లేకుండా ఈ అంచనాలు కొన్ని చేయబడవచ్చని ఒక సంశయవాదం సూచించవచ్చు, మరియు ఇది సరైనదే అయినప్పటికీ 30,000 మంది ప్రజల కోసం సేకరించిన డేటా ఖరీదైన. కూడా, ఒక అపరిమిత బడ్జెట్ ఇచ్చిన అయితే, నేను తప్పనిసరిగా పరిశోధకులు సమయంలో తిరిగి ప్రయాణం మరియు నేరుగా గతంలో పాల్గొనే 'తీరును పరిశీలించడానికి అనుమతించే ఏ ఇతర పద్ధతి భావిస్తారు కాదు. దగ్గరగా ప్రత్యామ్నాయ ప్రవర్తన యొక్క పునర్విమర్శ నివేదికలను సేకరించడానికి ఉంటుంది, కానీ ఈ నివేదికలు పరిమిత గ్రాన్యులారిటీ మరియు ప్రశ్నార్థకమైన ఖచ్చితత్వం ఉంటుంది. పట్టిక 2.1 ఊహించని సంఘటనను అధ్యయనం చేయడానికి ఎల్లప్పుడూ ఆన్-సోర్స్ డేటాను ఉపయోగించే అధ్యయనాల యొక్క ఇతర ఉదాహరణలు అందిస్తుంది.

టేబుల్ 2.1: ఊహించని సంఘటనల అధ్యయనాలు ఎల్లప్పుడూ పెద్ద డేటా మూలాల ద్వారా ఉపయోగించబడతాయి.
ఊహించని సంఘటన ఎల్లప్పుడూ డేటా మూలం citation
టర్కీలో గీజీ ఉద్యమాన్ని ఆక్రమిస్తాయి ట్విట్టర్ Budak and Watts (2015)
హాంగ్ కాంగ్ లో గొడుగు నిరసనలు Weibo Zhang (2016)
న్యూయార్క్ నగరంలోని పోలీసుల షూటింగ్ స్టాప్-అండ్-ఫ్రిస్క్ నివేదికలు Legewie (2016)
వ్యక్తి ISIS లో చేరడం ట్విట్టర్ Magdy, Darwish, and Weber (2016)
సెప్టెంబర్ 11, 2001 దాడి livejournal.com Cohn, Mehl, and Pennebaker (2004)
సెప్టెంబర్ 11, 2001 దాడి పేజర్ సందేశాలు Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

ఊహించని సంఘటనలను అధ్యయనం చేయడంతో పాటుగా, పెద్ద డేటా వ్యవస్థలలో ఎప్పుడూ పరిశోధకులు నిజమైన సమయం అంచనాలను ఉత్పత్తి చేయటానికి వీలు కల్పిస్తారు, ఇది పాలసీ మేకర్స్-ప్రభుత్వంలో లేదా పరిశ్రమలో-స్థాన అవగాహన ఆధారంగా స్పందిస్తారు. ఉదాహరణకు, ప్రకృతి వైపరీత్యాలకు (Castillo 2016) అత్యవసర ప్రతిస్పందనను మార్గనిర్దేశం చేసేందుకు సోషల్ మీడియా డేటాను ఉపయోగించుకోవచ్చు మరియు విభిన్న పెద్ద డేటా వనరులు ఆర్థిక కార్యకలాపాల యొక్క నిజ-సమయ అంచనాలను ఉత్పత్తి చేస్తాయి (Choi and Varian 2012) .

ముగింపులో, ఎప్పటికప్పుడు డేటా వ్యవస్థలు పరిశోధకులు ఊహించని సంఘటనలు అధ్యయనం మరియు విధాన నిర్ణేతలు నిజ సమయం సమాచారం అందించడానికి ఎనేబుల్. ఏమైనప్పటికీ, ఎప్పటికప్పుడు సమాచార వ్యవస్థలు చాలా కాలం పాటు ట్రాకింగ్ మార్పులకు బాగా సరిపోతున్నాయని నేను అనుకోను. ఎందుకంటే ఎన్నో పెద్ద సమాచార వ్యవస్థలు నిరంతరం మారుతున్నాయి-నేను ఆచరణలో తరువాత భాగంలో కాల్ చేస్తాను (సెక్షన్ 2.3.7).