2.5 తీర్మానం

పెద్ద డేటా వనరులు అన్నిచోట్లా ఉన్నాయి, కానీ సామాజిక పరిశోధన కోసం వాటిని ఉపయోగించడం గమ్మత్తైనది. నా అనుభవం లో, డేటా కోసం ఒక "ఉచిత భోజనం" పాలన వంటిది ఏదో ఉంది: ఇది మీరు సేకరించిన పనిలో చాలా చాలు లేకపోతే, మీరు బహుశా దాని గురించి చాలా ఆలోచించిన దాని గురించి ఆలోచిస్తారు మరియు విశ్లేషించడం.

నేటి పెద్ద డేటా మూలాలు-మరియు బహుశా రేపు-ఉంటాయి 10 లక్షణాలు కలిగి ఉంటాయి. వీటిలో మూడు సాధారణంగా ఉంటాయి (కానీ ఎల్లప్పుడూ కాదు) పరిశోధనకు ఉపయోగపడతాయి: పెద్దవి, ఎల్లప్పుడు మరియు నరహితమైనవి. ఏడు సాధారణంగా పరిశోధన కోసం సమస్యాత్మకమైనది (కానీ కాదు): అసంపూర్తిగా, అసాధ్యమైనవి, నిరాకరించలేనివి, డ్రిఫ్టింగ్, అల్గారిథమిక్ గందరగోళం, మురికి మరియు సున్నితమైనవి. సాంఘిక పరిశోధన యొక్క ప్రయోజనం కోసం పెద్ద సమాచార వనరులు సృష్టించబడటం లేనందున ఈ లక్షణాలు చాలావరకూ ఉత్పన్నమవుతాయి.

ఈ అధ్యాయంలోని ఆలోచనల ఆధారంగా, సామాజిక పరిశోధన కోసం పెద్ద డేటా మూలాల విలువైనదిగా మూడు ప్రధాన మార్గాలు ఉన్నాయి అని నేను భావిస్తున్నాను. మొదట, వారు పోటీ సిద్ధాంతపు అంచనాలకు మధ్య పరిశోధకులను నిర్ణయిస్తారు. ఈ రకమైన పని యొక్క ఉదాహరణలు Farber (2015) (న్యూయార్క్ టాక్సీ డ్రైవర్లు) మరియు King, Pan, and Roberts (2013) (చైనాలో సెన్సార్షిప్) ఉన్నాయి. రెండవది, ఇప్పుడు పెద్ద సమాచార వనరులు విధానం కోసం మెరుగైన కొలతను ఇప్పుడుకాస్ట్ ద్వారా చేయగలవు. ఈ రకమైన పనికి ఉదాహరణ Ginsberg et al. (2009) (గూగుల్ ఫ్లూ ట్రెండ్స్). చివరగా, పెద్ద సమాచార వనరులు పరిశోధకులు ప్రయోగాలను అమలు చేయకుండా కారకమైన అంచనాలను తయారు చేయటానికి సహాయపడుతుంది. ఈ రకమైన పనిని ఉదాహరణలు Mas and Moretti (2009) (ఉత్పాదకతపై పీర్ ఎఫెక్ట్స్) మరియు Einav et al. (2015) (eBay వద్ద వేలం ప్రారంభ ధర ప్రభావం). అయితే ఈ విధానాల్లో ప్రతి ఒక్కదానిని పరిశోధకులకు డేటాను చాలా వరకు తీసుకురావడానికి అవసరమవుతుంది, అంచనా వేయడానికి ముఖ్యమైనది లేదా పోటీ అంచనాలను తయారు చేసే రెండు సిద్ధాంతాల నిర్వచనం వంటివి. కాబట్టి, పెద్ద డేటా మూలాల ఏమి చేయాలనే దాని గురించి ఆలోచించడానికి ఉత్తమమైన మార్గం ఏమిటంటే ఆసక్తికరమైన మరియు ముఖ్యమైన ప్రశ్నలను అడగగలిగే పరిశోధకులకు సహాయపడుతుంది.

ముగింపుకు ముందు, డేటా మరియు సిద్ధాంతం మధ్య సంబంధంపై పెద్ద డేటా మూలాలపై ఒక ముఖ్యమైన ప్రభావాన్ని కలిగి ఉండవచ్చనే విషయాన్ని నేను భావిస్తున్నాను. ఇప్పటివరకు, ఈ అధ్యాయం సిద్ధాంతం-నడిచే అనుభావిక పరిశోధన యొక్క విధానం తీసుకుంది. కానీ పెద్ద సమాచార వనరులు కూడా పరిశోధకులను ఆమోదయోగ్యంగా సిద్ధాంతీకరించే సిద్ధాంతీకరణను చేస్తాయి . అంటే, అనుభావిక వాస్తవాలు, నమూనాలు మరియు పజిల్స్ యొక్క జాగ్రత్తగా చేరడం ద్వారా, పరిశోధకులు నూతన సిద్ధాంతాలను నిర్మించగలరు. సిద్ధాంతం అంటే ప్రత్యామ్నాయ, డేటా మొదటి పద్ధతి కొత్త కాదు, మరియు అది చాలా బలవంతంగా బార్నే గ్లేసెర్ మరియు యాన్సేల్మ్ స్ట్రాస్ వ్యక్తీకరించిన జరిగినది (1967) గ్రౌన్దేడ్ థియరీ కోసం వారి కాల్ తో. అయితే, డిజిటల్ డేటా (Anderson 2008) లో పరిశోధనకు సంబంధించిన కొన్ని జర్నలిజంలో పేర్కొన్నట్లు ఈ డేటా-మొదటి పద్ధతి, "సిద్ధాంతం యొక్క ముగింపు" కాదు. బదులుగా, డేటా పర్యావరణం మారినప్పుడు, మనము డేటా మరియు సిద్ధాంతం మధ్య సంబంధంలో పునర్సందర్శన చేయాలని ఆశించాలి. సమాచార సేకరణ ఖరీదైన ప్రపంచంలో, సిద్దాంతాలు అత్యంత ఉపయోగకరంగా ఉంటుందని సూచించే డేటాను మాత్రమే సేకరించేందుకు ఇది అర్ధమే. కానీ, ప్రపంచంలోని ఎన్నో రకాల డేటా ఇప్పటికే ఉచితంగా అందుబాటులో ఉన్న ప్రపంచంలో, అది ఒక డేటా-తొలి విధానం (Goldberg 2015) ను కూడా ప్రయత్నించండి.

నేను ఈ అధ్యాయంలో చూపించినట్లు, పరిశోధకులు ప్రజలను చూడటం ద్వారా చాలా నేర్చుకోవచ్చు. తర్వాతి మూడు అధ్యాయాల్లో, మేము మా డేటా సేకరణను సమీకరించి, వ్యక్తులతో నేరుగా ప్రశ్నలతో (అధ్యాయం 3), ప్రయోగాలు (అధ్యాయం 4), మరియు వాటిని పరిశోధన ప్రక్రియలో నేరుగా (అధ్యాయం 5).