2.3.7 டிரிஃப்டிங்

மக்கள் நகர்வு, பயன்பாட்டு நகர்வு, மற்றும் கணினி சறுக்கல் நீண்டகால போக்குகளைப் படிக்க பெரிய தரவு ஆதாரங்களைப் பயன்படுத்துவது கடினமாக உள்ளது.

பல பெரிய தரவு ஆதாரங்களின் பெரும் நன்மைகளில் ஒன்றாகும், அவை காலப்போக்கில் தரவுகளை சேகரிக்கின்றன. சமூக விஞ்ஞானிகள் இத்தகைய கால அளவு தரவு நீளத் தரவுகளைக் கூறுகின்றனர் . இயற்கையாகவே, நீண்டகால தரவு மாற்றம் படிப்பிற்கு மிகவும் முக்கியமானது. இருப்பினும், நம்பகமான அளவை மாற்றுவதற்கு, அளவீட்டு அமைப்பு தன்னை நிலையானதாக இருக்க வேண்டும். சமூகவியலாளரான ஓடிஸ் டுட்லி டங்கானின் வார்த்தைகளில், "நீங்கள் மாற்றத்தை அளக்க விரும்பினால், நடவடிக்கைகளை மாற்ற வேண்டாம்" (Fischer 2011) .

துரதிருஷ்டவசமாக, பல பெரிய தரவு அமைப்புகள் குறிப்பாக வணிக முறைமைகளை-காலம் முழுவதும் மாறி, நான் சறுக்கல் அழைக்கிறேன் ஒரு செயல்முறை. குறிப்பாக, இந்த அமைப்புகள் மூன்று முக்கிய வழிகளில் மாறுகின்றன: மக்கள் நகர்வு (யார் பயன்படுத்துகிறார்களோ அதில் மாற்றம்), நடத்தை சறுக்கல் (மக்கள் எவ்வாறு பயன்படுத்துகிறார்கள் என்பதில் மாற்றம்), மற்றும் கணினி சறுக்கல் (அமைப்புக்குள் மாற்றம்). சாய்வு மூன்று ஆதாரங்கள் ஒரு பெரிய தரவு மூலத்தில் எந்த வடிவத்தில் உலகின் ஒரு முக்கியமான மாற்றம் ஏற்படும் என்று அர்த்தம், அல்லது அது சில வடிவத்தில் சறுக்கல் ஏற்படும்.

சாய்வு-மக்கள் நகர்வுகளின் முதல் ஆதாரம்-அமைப்புமுறையைப் பயன்படுத்துவதில் உள்ள மாற்றங்களால் ஏற்படுகிறது, இந்த மாற்றங்கள் குறுகிய மற்றும் நீண்ட கால இரு காலங்களிலும் நிகழ்கின்றன. உதாரணமாக, 2012 ஆம் ஆண்டின் அமெரிக்க ஜனாதிபதித் தேர்தலின் போது, ​​தினசரி தினம் (Diaz et al. 2016) பெண்களால் எழுதப்பட்ட அரசியலைப் பற்றிய ட்வீட்ஸின் விகிதம். இவ்வாறு, ட்விட்டர்-வசனம் மனநிலையில் ஒரு மாற்றமாக தோன்றும் உண்மையில் எந்த நேரத்திலும் யார் பேசுகிறார்களோ அதையே மாற்றலாம். இந்த குறுகிய கால ஏற்ற இறக்கங்கள் கூடுதலாக, ட்விட்டர் தத்தெடுப்பு மற்றும் கைவிட சில குறிப்பிட்ட மக்கள் குழுக்கள் ஒரு நீண்ட கால போக்கு உள்ளது.

ஒரு முறையை யார் பயன்படுத்துகிறார்களோ கூடுதலாக, கணினி எவ்வாறு பயன்படுத்தப்படுகிறது என்பதில் மாற்றங்கள் உள்ளன, இது நடத்தை சறுக்கல் என்று அழைக்கிறேன். உதாரணமாக, 2013 துருக்கியில் கீஜி போராட்டங்களை ஆக்கிரமித்து ஆர்ப்பாட்டக்காரர்கள் எதிர்ப்புத் தெரிவித்ததன் மூலம் ஹாஷ்டேட்களைப் பயன்படுத்துவதை எதிர்த்தனர். ஜியன்ப் டுஃபெக்ஸ்கி (2014) எவ்வாறு நடத்தை சறுக்கத்தை விவரித்தார் என்பதையும், அவர் ட்விட்டரில் நடத்தும் பழக்கத்தையும்,

"ஆர்ப்பாட்டமானது ஆதிக்கமிக்க கதையாக மாறியதுடன், ஒரு பெரிய நிகழ்வுக்கு கவனம் செலுத்துவதும் தவிர்த்து பெரிய எண்ணிக்கையிலான மக்கள் ... ஹேஸ்டேகைகளைப் பயன்படுத்துவதை நிறுத்தியது ... எதிர்ப்புக்கள் தொடர்ந்தும், தீவிரமடைந்தாலும், ஹாஷ்டேகுகள் இறந்துவிட்டன. இதற்காக இரண்டு காரணங்கள் வெளிப்படுத்தின. முதலாவதாக, அனைவருக்கும் தெரிந்த ஒரு முறை, ஹேஸ்டேக் ஒரு முறை மட்டுமல்லாமல், தன்னிச்சையான ட்வீட் மேடையில் ஒரு மிதமிஞ்சிய மற்றும் வீணானதாக இருந்தது. இரண்டாவது, ஹாஷ்டேகுகளை ஒரு குறிப்பிட்ட தலைப்பிற்கு கவனத்தை ஈர்ப்பதற்காக மட்டுமே பயன்படுத்தப்பட்டது, அதைப் பற்றி பேசுவதற்கு அல்ல. "

இவ்வாறு, எதிர்ப்பு தொடர்பான ஹேஷ்டேக்ஸ் ட்வீட் பகுப்பாய்வு மூலம் எதிர்ப்புக்கள் படிக்கும் யார் ஆராய்ச்சியாளர்கள் ஏனெனில் இந்த நடத்தை சறுக்கல் என்ன நடக்கிறது என்பது பற்றி ஒரு சிதைந்த உணர்வு வேண்டும். உதாரணமாக, அவர்கள் அதை உண்மையில் குறைந்துவிட்டது முன் எதிர்ப்பு விவாதம் நீண்ட குறைந்துவிட்டது என்று நம்ப வேண்டும்.

மூன்றாவது வகை சறுக்கல் என்பது அமைப்பு சறுக்கல். இந்த வழக்கில், இது மக்கள் மாறும் அல்லது அவர்களின் நடத்தை மாற்றமல்ல, ஆனால் அமைப்பு தன்னை மாற்றியமைக்கிறது. உதாரணமாக, காலப்போக்கில் பேஸ்புக் நிலை மேம்படுத்தல்கள் நீளத்தின் அளவை அதிகரித்துள்ளது. இவ்வாறு, நிலைமாற்றங்களைப் பற்றிய எந்த நீண்டகால ஆய்வு இந்த மாற்றத்தால் ஏற்படும் சிக்கல்களுக்கு பாதிக்கப்படும். சிஸ்டம் டிரிஃப்ட் என்பது அல்காரிதிமிக் கவுன்டிட்டிங் எனப்படும் பிரச்சனைக்கு மிகவும் நெருக்கமாக இருக்கிறது, இது பிரிவு 2.3.8 இல் மூடிவிடும்.

முடிவுக்கு வர, பல பெரிய தரவு ஆதாரங்கள், அவற்றைப் பயன்படுத்துகிறவர்கள், எப்படி பயன்படுத்துகிறார்கள் மற்றும் கணினிகளை எவ்வாறு பயன்படுத்துகிறார்கள் என்பதில் மாற்றங்கள் ஏற்படுகின்றன. மாற்றத்தின் இந்த ஆதாரங்கள் சில நேரங்களில் சுவாரஸ்யமான ஆராய்ச்சி கேள்விகளைக் கொண்டிருக்கின்றன, ஆனால் இந்த மாற்றங்கள் காலப்போக்கில் நீண்ட கால மாற்றங்களைக் கண்காணிக்கும் பெரிய தரவு ஆதாரங்களின் திறனை சிக்கலாக்கும்.