2.2 బిగ్ డేటా

బిగ్ డేటా రూపొందించినవారు మరియు పరిశోధన కంటే ఇతర ప్రయోజనాల కోసం ప్రభుత్వాలు సేకరిస్తారు. పరిశోధన కోసం ఈ డేటాను ఉపయోగించి, అందువలన, repurposing అవసరం.

సామాజిక పరిశోధన యొక్క ఒక ఆదర్శప్రాయంగా దృశ్యం ఒక ఆలోచన కలిగి మరియు ఆ ఆలోచన పరీక్షించడానికి డేటా సేకరించడం ఒక శాస్త్రవేత్త ఊహించాడు. ఈ పరిశోధనా శైలిలో పరిశోధన ప్రశ్న మరియు సమాచారం మధ్య ఒక గట్టి సరిపోతుందని దారితీస్తుంది, కానీ ఒక వ్యక్తి పరిశోధకుడు తరచూ, పెద్ద రిచ్, మరియు దేశవ్యాప్త ప్రతినిధి డేటా వారు అవసరం డేటా సేకరించడానికి అవసరమైన వనరులను కలిగి లేదు ఎందుకంటే అది పరిమితమైంది. ఇటువంటి సాధారణ సామాజిక సర్వే (GSS), అమెరికన్ నేషనల్ ఎలక్షన్ స్టడీ (ANES), మరియు ఆదాయ డైనమిక్స్ ప్యానెల్ స్టడీ (PSID) వాడినట్లు గతంలో సామాజిక పరిశోధన చాలా ఉపయోగించింది పెద్ద ఎత్తున సామాజిక సర్వేలు. ఇవి పెద్ద ఎత్తున సర్వే సాధారణంగా పరిశోధకుల బృందం నిర్వహించబడుతున్నాయి మరియు వారు అనేక పరిశోధకులు ఉపయోగించవచ్చు డేటా సృష్టించడానికి రూపొందించబడ్డాయి. ఈ పెద్ద ఎత్తున సర్వేలు గోల్స్ ఎందుకంటే, గొప్ప సంరక్షణ డేటా సేకరణ రూపకల్పన మరియు పరిశోధకులు ఉపయోగం కోసం ఫలిత డేటా తయారు పెడతారు. ఈ డేటాను పరిశోధకులు పరిశోధకులకు ఉన్నాయి.

డిజిటల్ వయస్సు వనరుల ఉపయోగించి అనేక సామాజిక పరిశోధన, అయితే, తీరుకి భిన్నంగా ఉంటుంది. బదులుగా పరిశోధకులు పరిశోధకులకు సేకరించిన డేటా ఉపయోగించి సృష్టించబడిన వంటి, లాభాలను సేవను అందిస్తున్నారు, లేదా లా పాలనను తమ సొంత ప్రయోజనాల కోసం వ్యాపారాలు మరియు ప్రభుత్వాలు సేకరించబడ్డాయి డేటా మూలాల ఉపయోగిస్తుంది. ఈ వ్యాపార మరియు ప్రభుత్వ డేటా మూలాల పెద్ద డేటా అని సన్నద్ధమయ్యాయి. పెద్ద డేటా తో పరిశోధన చేస్తున్న నిజానికి పరిశోధన కోసం సృష్టించబడిన డేటా పరిశోధన చేయడం కంటే భిన్నంగా ఉంటుంది. ఉదాహరణకు, సరిపోల్చండి ఒక సోషల్ మీడియా వెబ్సైట్, ట్విట్టర్ వంటి, అటువంటి సాధారణ సామాజిక సర్వే (GSS) వంటి ఒక సంప్రదాయ ప్రజా అభిప్రాయ సేకరణ తో. ట్విటర్ యొక్క ప్రధాన లక్ష్యాలను దాని వినియోగదారులకు సేవలను అందించడానికి మరియు లాభం చేయడానికి ఉంటాయి. ఈ లక్ష్యాలను సాధించే ప్రక్రియలో, ట్విట్టర్ ప్రజా కొన్ని అంశాలను అధ్యయనం ఉపయోగకరంగా ఉండవచ్చని డేటా సృష్టిస్తుంది. కానీ, సాధారణ సామాజిక సర్వే (GSS) మాదిరిగా ట్విట్టర్ సామాజిక పరిశోధన ప్రధానంగా దృష్టి.

పదం పెద్ద డేటా frustratingly అస్పష్టమైన, మరియు ఇది అనేక విషయాలు కలిసి సమూహాలు. సామాజిక పరిశోధన ప్రయోజనాల కోసం, నేను పెద్ద డేటా మూలాల రెండు రకాల మధ్య విభజన ఉపయోగకరంగా ఉంటుంది అనుకుంటున్నాను. ప్రభుత్వం అధికారిక రికార్డులు మరియు వ్యాపార అధికారిక రికార్డులు ప్రభుత్వం అధికారిక రికార్డులు వారి దినచర్య చర్యలు భాగంగా ప్రభుత్వాలు సృష్టించబడతాయి డేటా ఉన్నాయి. రికార్డులు ఈ రకాల వంటి అటువంటి గత పుట్టిన, వివాహం, మరియు మరణ నమోదులు-కానీ ప్రభుత్వాలు పెరుగుతున్న సేకరించి analyzable రూపాల్లో వివరణాత్మక రికార్డులు విడుదల చేస్తారు అధ్యయనం demographers లో పరిశోధకులు ఉపయోగిస్తున్నారు. ఉదాహరణకు, న్యూయార్క్ ప్రభుత్వం నగరంలో ప్రతి టాక్సీ లోపల డిజిటల్ మీటర్లు అమర్చింది. ఈ మీటర్ల డ్రైవర్, ప్రారంభ సమయం మరియు నగర, స్టాప్ సమయం మరియు ప్రదేశం, ఛార్జీల సహా ప్రతి టాక్సీ రైడ్ గురించి సమాచారాన్ని అన్ని రకాల రికార్డ్. నేను ఈ అధ్యాయంలో తర్వాత చెబుతాడని ఒక అధ్యయనంలో, హెన్రీ ఐ (2015) గంట వేతనాలు మరియు పనిగంటల సంఖ్య మధ్య సంబంధం గురించి శ్రామిక అర్ధశాస్త్రం లో ఒక ప్రాథమిక చర్చ పరిష్కరించడానికి ఈ డేటా repurposed.

సామాజిక పరిశోధన కోసం పెద్ద డేటా రెండవ ప్రధాన రకం వ్యాపార అధికారిక రికార్డులు ఉంది. ఈ వ్యాపార సృష్టించడానికి మరియు వారి దినచర్య కార్యకలాపాల్లో భాగంగా సేకరించే డేటా ఉన్నాయి. ఈ వ్యాపార అధికారిక రికార్డులు తరచూ డిజిటల్ జాడలు అని పిలుస్తారు మరియు శోధన ఇంజిన్ ప్రశ్న దుంగలు సామాజిక మీడియా పోస్ట్లు వంటి విషయాలు ఉన్నాయి, మరియు మొబైల్ ఫోన్ల నుండి రికార్డులు కాల్. దూషిస్తూ ఈ వ్యాపార అధికారిక రికార్డులు కేవలం ఆన్లైన్ ప్రవర్తన గురించి కాదు. ఉదాహరణకు, వెళ్లేది స్కానర్లు ఉపయోగించే దుకాణాల్లో కార్మికుల ఉత్పాదకత వాస్తవ సమయాన్ని చర్యలు సృష్టిస్తున్నారు. నేను తరువాత ఈ అధ్యాయంలో గురించి మీరు చెప్పండి చేస్తాము ఒక అధ్యయనంలో, అలెగ్జాండర్ మాస్ మరియు ఎన్రికో Moretti (2009) కార్మికుల ఉత్పాదకత వారి సహచరుల ఉత్పాదకత ప్రభావం ఉంది ఎలా అధ్యయనం ఈ సూపర్ మార్కెట్ వెళ్లేది డేటా repurposed.

ఈ ఉదాహరణలు రెండు వర్ణించేందుకు నాటికి, repurposing ఆలోచన పెద్ద డేటా నేర్చుకోకుండా మూలాధారంగా ఉంటుంది. నా అనుభవం లో, సామాజిక శాస్త్రవేత్తలు మరియు డేటా శాస్త్రవేత్తలు ఈ చాలా భిన్నంగా repurposing సమీపింపకూడదు. పరిశోధన కోసం రూపొందించిన సమాచారంతో పనిచేసే అభిమానం సామాజిక శాస్త్రవేత్తలు, దాని బలాలు విస్మరించి repurposed డేటా సమస్యలను ఎత్తి చూపుతూ సత్వర ఉన్నాయి. మరోవైపు, డేటా శాస్త్రవేత్తలు దాని బలహీనతల విస్మరించి repurposed డేటా ప్రయోజనాలు అభిప్రాయపడుతున్నారు త్వరగా ఉంటాయి. సహజంగానే, ఉత్తమ విధానం హైబ్రిడ్ ఉంటుంది. పరిశోధకుల డేటా-మంచి మరియు చెడు రెండూ-ఆపై ఎలా వాటిని నుండి తెలుసుకోవడానికి దొరుకుతుందని ఈ కొత్త మూలాల లక్షణాలు అర్థం అవసరం. మరియు, ఈ అధ్యాయం యొక్క మిగిలిన కోసం పధకము. తరువాత, నేను వ్యాపార మరియు ప్రభుత్వ పరిపాలనా డేటా పది సాధారణ లక్షణాలు వర్ణించలేనిది. ఆ తరువాత, నేను ఈ డేటా, అలాగే ఈ సమాచారాన్ని లక్షణాలకు సరిపడే విధానాలపై ఉపయోగించవచ్చు మూడు పరిశీలన విధానాల్లో వర్ణించలేనిది.