2.2 பெரிய தரவு

பெரிய தரவு உருவாக்கப்பட்ட மற்றும் ஆராய்ச்சி தவிர, வேறு எந்த அரசாங்கங்கள் சேகரிக்கப்பட்டு. ஆராய்ச்சி இந்த தரவு பயன்படுத்தி, எனவே, repurposing தேவைப்படுகிறது.

சமூக ஆராய்ச்சி சிறந்ததாக பார்வையில் ஒரு விஞ்ஞானி பின்னர் ஒரு யோசனை மற்றும் என்று யோசனை சோதிக்க தரவு சேகரிக்கும் கற்பனை. ஆராய்ச்சி இந்த பாணி ஆராய்ச்சி கேள்வி மற்றும் தரவு இடையே ஒரு இறுக்கமான பொருத்தம் வழிவகுக்கிறது, ஆனால் ஒரு தனிப்பட்ட ஆராய்ச்சியாளர் அடிக்கடி, பெரிய பணக்கார, மற்றும் தேசிய அளவில் பிரதிநிதி தரவு போன்ற அவர்கள் தேவையான தரவுகளை சேகரிக்க தேவையான வளங்கள் இல்லை, ஏனெனில் அது குறைவாகவே உள்ளது. போன்ற பொது சமூக கணக்கெடுப்பு (GSS), அமெரிக்க தேசிய தேர்தல் ஆய்வு (Anes), மற்றும் வருமான டைனமிக்ஸ் குழு ஆய்வு (PSID) போன்ற எனவே, கடந்த காலத்தில் சமூக ஆராய்ச்சி நிறைய பயன்படுத்தப்படும் அளவிலான சமூக ஆய்வுகள்,. இந்த பெரிய அளவிலான ஆய்வு பொதுவாக ஒரு ஆராய்ச்சிக் குழுவினர் நடத்தப்படுகிறது, மற்றும் அவர்கள் பல ஆராய்ச்சியாளர்களால் பயன்படுத்த முடியும் என்று தரவு உருவாக்க வடிவமைக்கப்பட்டுள்ளது. இந்த பெரிய அளவிலான ஆய்வுகள் இலக்குகளை ஏனெனில், பெரும் பாதுகாப்பு தரவு சேகரிப்பு வடிவமைத்தல் மற்றும் ஆராய்ச்சியாளர்கள் பயன்படுத்த விளைவாக தரவு தயார் போடப்படுகிறது. இந்த தரவு ஆராய்ச்சியாளர்கள் மற்றும் ஆராய்ச்சியாளர்கள் உள்ளன.

டிஜிட்டல் வயது ஆதாரங்கள் பயன்படுத்தி பெரும்பாலான சமூக ஆராய்ச்சி, அடிப்படையில் வேறுபட்டது. மாறாக ஆராய்ச்சியாளர்கள் மற்றும் ஆராய்ச்சியாளர்கள் சேகரிக்கப்பட்டது பயன்படுத்தி இருந்தால், அது உருவாக்கப்பட்ட மற்றும் போன்ற, ஒரு இலாபம் ஒரு சேவையை வழங்கும், அல்லது ஒரு சட்டம் நிர்வகிப்பதற்கான தங்களது சொந்த நோக்கங்களுக்காக தொழில்கள் மற்றும் அரசாங்கங்கள் மூலம் சேகரிக்கப்பட்டு அவை என்று தரவு மூலங்கள் பயன்படுத்துகிறது. இந்த வணிக மற்றும் அரசாங்க தரவு மூலங்கள் பெரிய தரவு என்று சொல்லப்படுவதற்கு வந்திருக்கிறேன். பெரிய தரவு ஆராய்ச்சி செய்து முதலில் ஆராய்ச்சி உருவாக்கப்பட்டது என்று தரவு ஆராய்ச்சி செய்து விட வித்தியாசமாக இருக்கும். உதாரணமாக, ஒப்பிடு, ட்விட்டர் போன்ற ஒரு சமூக ஊடக இணையதளம், போன்ற பொது சமூக கணக்கெடுப்பு (GSS) ஒரு பாரம்பரிய பொது கருத்து கணக்கெடுப்புடன்,. ட்விட்டர் முக்கிய இலக்குகள் அதன் பயனர்களுக்கு ஒரு சேவையை வழங்க மற்றும் ஒரு இலாப செய்ய உள்ளன. இந்த இலக்குகளை எட்டுவதற்கு செயல்பாட்டில், ட்விட்டர், பொதுமக்கள் கருத்தை சில அம்சங்களை படிக்கும் பயனுள்ளதாக இருக்கும் என்று தரவு உருவாக்குகிறது. ஆனால், பொது சமூக கணக்கெடுப்பு (GSS) போலல்லாமல், ட்விட்டர் சமூக ஆராய்ச்சி முதன்மையாக கவனம் உள்ளது.

கால பெரிய தரவு frustratingly தெளிவற்ற உள்ளது, மற்றும் அதை குழுக்கள் ஒன்றாக பல விஷயங்களை. சமூக ஆராய்ச்சி நோக்கங்களுக்காக, நான் அதை பெரிய தரவு மூலங்கள் இரண்டு வகையான வேறுபடுத்தி உதவியாக இருக்கும் என்று நான் நினைக்கிறேன். அரசாங்கம் நிர்வாக பதிவுகள் மற்றும் வணிக நிர்வாக பதிவுகள் அரசு நிர்வாக பதிவுகளை தங்கள் வழக்கமான நடவடிக்கைகள் பகுதியாக அரசாங்கங்கள் செய்தது என்று தரவு உள்ளன. பதிவுகள் இந்த வகையான போன்ற-அதாவது கடந்த பிறப்பு, திருமணம், மற்றும் இறப்பு பதிவுகள்-ஆனால் அரசாங்கங்கள் அதிகளவில் சேகரித்து analyzable வடிவங்களில் விரிவான பதிவுகள் வெளியிட்டு படிக்கும் மக்கள்தொகை உள்ள ஆராய்ச்சியாளர்கள் பயன்படுத்தப்பட்டு வருகின்றன. உதாரணமாக, நியூ யார்க் நகர அரசு நகரில் ஒவ்வொரு டாக்சி உள்ளே டிஜிட்டல் மீட்டர் நிறுவப்படும். இந்த மீட்டர் இயக்கி, தொடக்க நேரம் மற்றும் இடம், ஸ்டாப் நேரம் மற்றும் இடம், மற்றும் கட்டணம் உட்பட ஒவ்வொரு டாக்சி பயணம் பற்றிய தரவு அனைத்து வகையான பதிவு. நான் இந்த அத்தியாயம் பிறகு சொல்கிறேன் என்று ஒரு ஆய்வில், ஹென்றி ஃபார்பர் (2015) ஊதியம் மற்றும் வேலை மணி எண்ணிக்கை இடையே உள்ள உறவு பற்றி தொழிலாளர் பொருளாதாரம் ஒரு அடிப்படை விவாதம் உரையாற்ற இந்த தரவு repurposed.

சமூக ஆராய்ச்சி பெரிய தரவு இரண்டாவது முக்கிய வகை வணிக நிர்வாக பதிவுகள் உள்ளது. இந்த வணிக தங்கள் வழக்கமான நடவடிக்கைகள் பகுதியாக உருவாக்கி சேகரிக்கும் என்று தரவு உள்ளன. இந்த வணிக நிர்வாக பதிவுகள் டிஜிடல் தடயங்கள் என்று அழைக்கப்படும், மற்றும் தேடல் பொறி கேள்வி பதிவுகள், சமூக ஊடக பதிவுகள் போன்ற விஷயங்களை சேர்க்க, மற்றும் மொபைல் போன்களில் இருந்து பதிவுகள் அழைக்க. விமர்சன ரீதியாக, இந்த வணிக நிர்வாக பதிவுகள் வெறும் ஆன்லைன் நடத்தை பற்றி இல்லை. உதாரணமாக, சோதனை வெளியே ஸ்கேனர்கள் பயன்படுத்தும் கடைகள் தொழிலாளி உற்பத்தி நிகழ் நேர நடவடிக்கைகளை உருவாக்கும். நான் பற்றி பின்னர் இந்த அதிகாரத்தில் உங்களுக்கு சொல்கிறேன் என்று ஒரு ஆய்வில், அலெக்சாண்டர் மாஸ் மற்றும் என்ரிகோ Moretti (2009) ஒரு தொழிலாளர் உற்பத்தித் தங்கள் சக உற்பத்தித் தாக்கப்பட்ட என்பதை ஆய்வு செய்ய இந்த பல்பொருள் அங்காடி-பாருங்கள் தரவு repurposed.

இந்த உதாரணங்கள் இருவரும் விளக்குகின்றன என, repurposing யோசனை பெரிய தரவு இருந்து கற்று அடிப்படை ஆகும். என் அனுபவத்தில், சமூக விஞ்ஞானிகள் மற்றும் தரவு விஞ்ஞானிகள் இந்த மிகவும் வித்தியாசமாக repurposing அணுகுவது. ஆராய்ச்சி வடிவமைக்கப்பட்டுள்ளது தரவு வேலை பழக்கமில்லை செய்யும் விஞ்ஞானிகள், அதன் பலம் புறக்கணிக்கும் போது repurposed ஆதாரங்களிலும் பிரச்சினைகள் சுட்டிக்காட்டுகின்றனர் விரைவு உள்ளன. மறுபுறம், தரவு விஞ்ஞானிகள் அதன் பலவீனங்களை புறக்கணிக்கும் போது repurposed தரவு நன்மைகள் சுட்டிக்காட்டுகின்றனர் விரைவு உள்ளன. இயற்கையாகவே, சிறந்த அணுகுமுறை ஒரு கலப்பு இருக்கும். என்று ஆராய்ச்சியாளர்கள் தரவு நல்ல மற்றும் மோசமான-பின்னர் அவர்களிடம் இருந்து கற்றுக்கொள்ள எப்படி கண்டுபிடிக்க இந்த புதிய ஆதாரங்கள் பண்புகள் புரிந்து கொள்ள வேண்டும், உள்ளது. மற்றும், என்று இந்த அத்தியாயத்தில் எஞ்சிய திட்டம். அடுத்து, நான் வர்த்தக மற்றும் அரசாங்க நிர்வாக தரவு பத்து பொதுவான பண்புகள் விவரிக்க முடியாது. பிறகு, நான் இந்த தரவு, இந்த தரவு பண்புகள் மிகவும் பொருத்தமானது என்று அணுகுமுறைகள் பயன்படுத்த முடியும் என்று மூன்று ஆராய்ச்சி அணுகுமுறைகள் விவரிக்கும்.