நடவடிக்கைகள்

  • சிரமம் பட்டம்: எளிது எளிதாக , நடுத்தர நடுத்தர , கடினமாக கடின , மிகவும் கடினமாக உள்ளது மிகவும் கடினமாக உள்ளது
  • கணிதம் தேவை கணிதம் தேவை )
  • குறியீட்டு தேவை ( குறியீட்டு தேவைப்படுகிறது )
  • தரவு சேகரிப்பு ( தரவு சேகரிப்பு )
  • எனக்கு பிடித்தவைகள் ( எனக்கு பிடித்தது )
  1. [ நடுத்தர , எனக்கு பிடித்தது ] அல்காரிதிக் குழப்பம் Google Flu Trends உடன் சிக்கல். Lazer et al. (2014) காகிதத்தை படிக்கவும் Lazer et al. (2014) , சிக்கலை விளக்கி, அதை எவ்வாறு சரிசெய்வது என்பது குறித்த யோசனை ஒன்றை Google இல் உள்ள ஒரு பொறியாளருக்கு ஒரு குறுகிய, தெளிவான மின்னஞ்சலை எழுதுங்கள்.

  2. [ நடுத்தர ] Bollen, Mao, and Zeng (2011) ஆகியோர் பங்குச் சந்தையை முன்னறிவிப்பதற்காக ட்விட்டர் தரவைப் பயன்படுத்தலாம் என்று கூறுகிறது. இந்த கண்டுபிடிப்பு ஹெட்ஜ் நிதி-டெர்ன்ட் கேப்பிட்டல் மார்க்கெட்ஸை உருவாக்குவதற்கு வழிவகுத்தது- பங்குச் சந்தையில் ட்விட்டர் (Jordan 2010) இருந்து சேகரிக்கப்பட்ட தரவுகளின் அடிப்படையில் முதலீடு செய்ய. அந்த பணத்தில் உங்கள் பணத்தை வைத்துக் கொள்வதற்கு முன்பு நீங்கள் என்ன சாட்சியம் பார்க்க வேண்டும்?

  3. [ எளிதாக சில பொது சுகாதார ஆலோசகர்கள் மின் சிகரெட்டுகளை புகைபிடிப்பதற்கான ஒரு சிறந்த உதவியைக் கருத்தில் கொண்டாலும், உயர்ந்த நிகோடின் போன்ற அபாயங்களைப் பற்றி மற்றவர்கள் எச்சரிக்கின்றனர். மின் சிகரெட்டுகள் தொடர்பான ட்விட்டர் இடுகைகள் சேகரித்து உணர்ச்சி பகுப்பாய்வு நடத்துவதன் மூலம் மின் சிகரெட்டிற்கு பொது கருத்துக்களை ஆராய ஒரு ஆராய்ச்சியாளர் முடிவு செய்தார்.

    1. இந்த ஆய்வில் நீங்கள் மிகவும் கவலைப்படுபவை மூன்று சாத்தியக்கூறுகள் என்ன?
    2. Clark et al. (2016) போன்ற ஒரு ஆய்வு நடத்தப்பட்டது. முதல், அவர்கள் ஜனவரி 2012 முதல் டிசம்பர் 2014 வரை மின் சிகரெட் தொடர்பான முக்கிய வார்த்தைகளை பயன்படுத்தி 850,000 ட்வீட்ஸ் சேகரிக்கப்பட்டனர். நெருக்கமான ஆய்வு மூலம், அவர்கள் இந்த ட்வீட் பல தானியங்கி (அதாவது, மனிதர்கள் உற்பத்தி இல்லை) மற்றும் இந்த தானியங்கி ட்வீட் அடிப்படையில் பல விளம்பரங்களில். கரிம ட்வீட்ஸிலிருந்து தானியக்க ட்வீட்களை பிரிக்க ஒரு மனித கண்டறிதல் படிமுறை உருவாக்கப்பட்டது. இந்த மனிதக் கண்டுபிடிப்பு வழிமுறையைப் பயன்படுத்தி, 80% ட்வீட் தானியக்கமானது என்று அவர்கள் கண்டனர். இந்த கண்டுபிடிப்பு பகுதியை (அ) உங்கள் பதில் மாற்ற?
    3. கரிம மற்றும் தானியக்க ட்வீட்ஸில் அவர்கள் உணர்வை ஒப்பிடும்போது, ​​தானியங்கு ட்வீட்கள் கரிம ட்வீட்களைக் காட்டிலும் நேர்மறையானவை என்று கண்டறிந்தனர் (6.17 எதிராக 5.17). இந்த கண்டுபிடிப்பை (b) உங்கள் பதில் மாற்றலாமா?
  4. [ எளிதாக ] நவம்பர் 2009 இல், ட்விட்டர் பெட்டியில் ட்விட்டர் பெட்டியில் "நீங்கள் என்ன செய்கிறீர்கள்?" என்பதில் "என்ன நடக்கிறது?" என்ற கேள்வியை மாற்றிவிட்டது. (Https://blog.twitter.com/2009/what-happening).

    1. நீங்கள் கேட்கும் மாற்றங்கள் ட்வீட் மற்றும் / அல்லது அவர்கள் ட்வீட் செய்தால் எப்படி பாதிக்கப்படும் என்று நீங்கள் நினைக்கிறீர்கள்?
    2. "நீங்கள் என்ன செய்கிறீர்கள்?" என்று கேட்கும் ஒரு ஆராய்ச்சி திட்டத்தின் பெயர் என்ன?
    3. நீங்கள் "என்ன நடக்கிறது?" என்று கேட்கும் ஒரு ஆராய்ச்சி திட்டத்தின் பெயர் என்ன?
  5. [ எளிதாக ] "Retweets" பெரும்பாலும் ட்விட்டரில் செல்வாக்கையும் செல்வாக்கையும் பரப்ப பயன்படுத்தப்படுகிறது. தொடக்கத்தில், பயனர் அவர்கள் விரும்பிய ட்வீட்டை நகலெடுத்து ஒட்ட வேண்டும், அசல் ஆசிரியர் அவரை / அவள் கைப்பிடியுடன் குறியிட வேண்டும், மேலும் ட்வீட் ட்வீட் செய்வதற்கு முன்னர் "ஆர்டி" என்று கைமுறையாக டைப் செய்ய வேண்டும். பின்னர், 2009 இல், ட்விட்டர் "மறு ட்வீட்" பொத்தானைச் சேர்த்தது. ஜூன் 2016 இல், ட்விட்டர் பயனர்கள் தங்களது சொந்த ட்வீட் ட்வீட் செய்வதை சாத்தியமாக்கியது (https://twitter.com/twitter/status/742749353689780224). இந்த மாற்றங்கள் உங்கள் ஆராய்ச்சியில் "retweets" ஐ பயன்படுத்துவது எவ்வாறு பாதிக்கப்படும் என்று நீங்கள் நினைக்கிறீர்களா? ஏன் அல்லது ஏன் இல்லை?

  6. [ மிகவும் கடினமாக உள்ளது , தரவு சேகரிப்பு , குறியீட்டு தேவைப்படுகிறது , எனக்கு பிடித்தது பரவலாக விவாதிக்கப்பட்ட காகிதத்தில், மைக்கேல் மற்றும் சக (2011) நீண்டகால கலாச்சார போக்குகளை அடையாளம் காணும் வகையில் 5 மில்லியன் டிஜிட்டல் புத்தகங்களை உள்ளடக்கியது. அவர்கள் பயன்படுத்தும் தரவு இப்போது Google NGrams தரவுத்தளமாக வெளியிடப்பட்டுவிட்டது, இதனால் தரவு சிலவற்றை நகலெடுத்து விரிவுபடுத்தவும் பயன்படுத்தலாம்.

    காகிதத்தில் பல முடிவுகளில் ஒன்று, மிஷேல் மற்றும் சகாக்கள் நாம் வேகமாகவும் வேகமாகவும் மறந்துவிட்டதாக வாதிட்டனர். ஒரு குறிப்பிட்ட வருடத்தில், 1883 மற்றும் 1975 ஆம் ஆண்டுகளில் "1883" என்று ஒவ்வொரு வருடமும் வெளியிடப்பட்ட 1 கிராம் விகிதத்தை "1883" என்று கணக்கிடுகின்றனர். இந்த விகிதாசாரம், அந்த ஆண்டில் நிகழ்ந்த சம்பவங்களின் வட்டிக்கு ஒரு காரணம் என்று அவர்கள் கருத்துத் தெரிவித்தனர். அவர்களின் எண்ணிக்கை 3a இல், 1883, 1910, மற்றும் 1950 ஆகிய மூன்று ஆண்டுகளுக்கு அவை பயன்பாட்டு வழிகாட்டிகளை திட்டமிட்டுள்ளன. இந்த மூன்று ஆண்டுகளுக்கு ஒரு பொதுவான முறையைப் பகிர்ந்துகொள்கிறோம்: அந்த ஆண்டிற்கு முன்னர் சிறிய பயன்பாடு, பின்னர் ஒரு ஸ்பைக், பின்னர் சிதைவு. ஒவ்வொரு வருடமும் சிதைவு விகிதத்தை கணக்கிடுவதற்கு, 1875 மற்றும் 1975 ஆம் ஆண்டுகளுக்கு இடையில் ஒவ்வொரு வருடமும் "அரை வாழ்வை" மைக்கேல் மற்றும் சகாக்கள் கணக்கிட்டுள்ளனர். அவர்களின் எண்ணிக்கை 3a (inset) இல், ஆண்டு குறைகிறது, மேலும் அவை கடந்த வேகமான மற்றும் விரைவானதை மறந்துவிட்டதாக அர்த்தம் என்று அவர்கள் வாதிட்டனர். அவர்கள் ஆங்கில மொழியின் பதிப்பு 1 ஐப் பயன்படுத்தினர், ஆனால் பின்னர் Google ஆனது கார்பனின் இரண்டாவது பதிப்பை வெளியிட்டது. நீங்கள் குறியீட்டு தொடங்கும் முன் கேள்வியின் அனைத்து பகுதிகளையும் படிக்கவும்.

    இந்த செயல்பாடு மீண்டும் பயன்படுத்தும் குறியீட்டை எழுதுதல், முடிவுகளைப் புரிந்துகொள்வதன் மற்றும் தரவு மோதல்கள் (மோசமான கோப்புகளுடன் பணிபுரிதல் மற்றும் காணாமல் போன தரவுகளை கையாளுதல் போன்றவை) உங்களுக்கு பயிற்சி அளிக்கிறது. இந்தச் செயல்பாடு, பணக்கார மற்றும் ஆர்வமுள்ள தரவுத்தளங்களைக் கொண்டு எழுந்து இயங்க உதவுகிறது.

    1. Google Books NGram Viewer வலைத்தளத்திலிருந்து மூல தரவைப் பெறுக. குறிப்பாக, ஜூலை 1, 2012 அன்று வெளியிடப்பட்ட ஆங்கில மொழி கார்ப்பரஸின் பதிப்பு 2 ஐப் பயன்படுத்த வேண்டும். ஒத்திவைக்கப்படாத இந்த கோப்பு 1.4 ஜிபி ஆகும்.

    2. Michel et al. (2011) figure 3a இன் முக்கிய பகுதியை மீண்டும் உருவாக்குக Michel et al. (2011) . இந்த உருவத்தை உருவாக்க, உங்களுக்கு இரண்டு கோப்புகள் தேவைப்படும்: நீங்கள் பகுதி (அ) மற்றும் "மொத்த எண்ணிக்கைகள்" கோப்பில் பதிவிறக்கம் செய்துள்ளீர்கள், நீங்கள் மூல எண்ணிக்கையை விகிதங்களாக மாற்றுவதற்குப் பயன்படுத்தலாம். மொத்த கணக்கின் கோப்பில் ஒரு படிவம் உள்ளது என்பதைக் கவனத்தில் கொள்ளவும். இது NGram தரவு பதிப்பு 2 இல் Michel et al. (2011) பலவற்றில் வழங்கப்பட்டதைப் போன்ற ஒத்த முடிவுகளை அளிக்கிறது Michel et al. (2011) , இது பதிப்பு 1 தரவை அடிப்படையாகக் கொண்டதா?

    3. இப்போது NGram பார்வையாளரால் உருவாக்கப்பட்ட வரைபடத்திற்கு எதிராக உங்கள் வரைபடத்தை சரிபார்க்கவும்.

    4. Figure 3a (முக்கிய உருவம்) ஐ உருவாக்கி, ஆனால் \(y\) -அமைப்புகளை மூல குறிப்பாய் எண்ணாக மாற்றுவோம் \(y\) மேற்கோள்களின் விகிதம் அல்ல).

    5. (B) மற்றும் (d) இடையிலான வித்தியாசம் மைக்ஹெல் மற்றும் பல முடிவுகளை மறுபரிசீலனை செய்ய வழிவகுக்கிறது. (2011). ஏன் அல்லது ஏன் இல்லை?

    6. இப்போது, ​​குறிப்பிடுதலின் விகிதத்தைப் பயன்படுத்தி, எண்ணிக்கை 3a இன் இன்ஸ்பெக்டை பிரதிபலிக்கின்றது. அதாவது, ஒவ்வொரு ஆண்டும் 1875 க்கும் 1975 க்கும் இடையில், அந்த ஆண்டின் அரை வாழ்வைக் கணக்கிடுங்கள். அரை வாழ்வு அரை அதன் உச்ச மதிப்பு அடையும் விகிதங்கள் விகிதம் முன் கடந்து ஆண்டுகள் எண்ணிக்கை வரையறுக்கப்பட்டுள்ளது. Michel et al. (2011) அரை-வாழ்க்கை-பார்க்க பார்க்கும் பிரிவு III.6-ல் துணைபுரிகிறது. ஆனால் இரு அணுகுமுறைகளும் இதே முடிவுகளை வெளியிடுகின்றன என்று அவர்கள் கூறுகின்றனர். NGram தரவு பதிப்பு 2 Michel et al. (2011) வழங்கப்பட்ட அந்த அதே முடிவுகளை வெளியிடுகிறதா? Michel et al. (2011) , இது பதிப்பு 1 தரவை அடிப்படையாகக் கொண்டதா? (குறிப்பு: அது இல்லை என்றால் ஆச்சரியப்பட வேண்டாம்.)

    7. குறிப்பாக ஆண்டுகளில் குறிப்பாக விரைவாகவோ அல்லது குறிப்பாக மெதுவாக மறந்துவிட்ட ஆண்டுகளாக இருந்தவர்கள் இருந்தார்களா? அந்த மாதிரிக்கான காரணங்களைப் பற்றி சுருக்கமாக ஊகிக்கவும், நீங்கள் எப்படி விற்கிறீர்கள் என்பதை விளக்கவும்.

    8. சீன, பிரெஞ்சு, ஜெர்மன், ஹீப்ரு, இத்தாலியன், ரஷியன் மற்றும் ஸ்பானிஷ் மொழிகளில் NGrams தரவின் பதிப்பு 2 க்கான இந்த முடிவு இப்போது பிரதிபலிக்கின்றது.

    9. அனைத்து மொழிகளிலும் ஒப்பிடுகையில், ஆண்டுகளுக்குப் பிறகும், குறிப்பாக விரைவாகவும், குறிப்பாக மெதுவாகவும் மறக்கப்பட்டவை, ஆண்டுகளாக இருந்தனவா? சுருக்கமாக அந்த மாதிரிக்கான காரணங்கள் பற்றி ஊகம்.

  7. [ மிகவும் கடினமாக உள்ளது , தரவு சேகரிப்பு , குறியீட்டு தேவைப்படுகிறது , எனக்கு பிடித்தது ] ஜூன் 2013 இல் NSA / PRISM கண்காணிப்பு (அதாவது, ஸ்னோவ்டென் வெளிப்பாடுகள்) பற்றிய பரவலான விளம்பரம், தனியுரிமைக் கவலையை உயர்த்தும் தலைப்புகளில் விக்கிப்பீடியா கட்டுரைகளுக்கு ஒரு கூர்மையான மற்றும் திடீரென குறைவு ஏற்பட்டுள்ளது என்பதைப் பற்றி Penney (2016) ஆய்வு செய்தார். அப்படியானால், இந்த நடத்தை மாற்றமானது வெகுஜன கண்காணிப்பின் விளைவாக ஒரு குளிர்விக்கும் விளைவைக் கொண்டிருக்கும். Penney (2016) அணுகுமுறை சில நேரங்களில் குறுக்கிடப்பட்ட நேர வரிசை வடிவமைப்பு என்று அழைக்கப்படுகிறது, இது பிரிவு 2.4.3 இல் விவரிக்கப்பட்ட அணுகுமுறைகளுடன் தொடர்புடையது.

    தலைப்பு முக்கிய வார்த்தைகளைத் தேர்வுசெய்ய, பென்னே சமூக ஊடக கண்காணிப்பு மற்றும் கண்காணிப்புக்கான அமெரிக்க உள்நாட்டுப் பாதுகாப்புத் துறையால் பயன்படுத்தப்படும் பட்டியலைக் குறிப்பிட்டுள்ளார். DHS பட்டியலில் சில தேடல் விதிகள் வகைப்படுத்தப்படுகின்றன, அதாவது "உடல்நலம் கவனிப்பு," "உள்கட்டமைப்பு பாதுகாப்பு", "பயங்கரவாதம்". ஆய்வகக் குழுவிற்கு பென்னே "பயங்கரவாதத்திற்கு" தொடர்புடைய 48 முக்கிய வார்த்தைகளை பயன்படுத்தினார் (இணைப்பு அட்டவணை 8 ஐப் பார்க்கவும்) ). பின்னர் அவர் விக்கிப்பீடியா கட்டுரைக் காட்சியை ஒருங்கிணைத்து, 48 விக்கிபீடியா கட்டுரைகளை ஒரு 32 மாத காலப்பகுதியில், ஜனவரி 2012 தொடக்கத்தில் இருந்து ஆகஸ்ட் 2014 வரை முடித்துக்கொண்டார். அவரது வாதத்தை வலுப்படுத்த அவர் பல ஒப்பீட்டு குழுக்களை உருவாக்கியுள்ளார் மற்ற தலைப்புகளில் கட்டுரை காட்சிகள்.

    இப்பொழுது, நீங்கள் Penney (2016) விரிவுபடுத்தப்பட்டு விரிவாக்கப் போகிறீர்கள். விக்கிபீடியாவில் இருந்து இந்த நடவடிக்கைக்கு தேவையான அனைத்து மூல தரவுகளும் கிடைக்கின்றன. அல்லது நீங்கள் அதை R-package wikipediatrend (Meissner and R Core Team 2016) இலிருந்து பெறலாம். உங்கள் பதில்களை எழுதுகையில், நீங்கள் பயன்படுத்தும் தரவு மூலத்தை கவனத்தில் கொள்ளவும். (அதே செயல்பாடு 6-ம் அதிகாரத்தில் தோன்றுகிறது என்பதை நினைவில் கொள்ளுங்கள்.) இந்த தரவு, தரவுத் தொல்லைகளில் நீங்கள் நடைமுறையில் ஈடுபடுவதோடு, பெரிய தரவு ஆதாரங்களில் உள்ள இயற்கை சோதனையைப் பற்றி சிந்திக்கும். எதிர்கால திட்டங்களுக்கான பயனுள்ள தகவல் ஆதாரத்துடன் இது உங்களைக் கொண்டு இயங்கும்.

    1. Penney (2016) படிக்கவும் மற்றும் ஸ்னோடென் வெளியீடுகளுக்கு முன்னும் பின்னும் "பயங்கரவாதத்திற்கு" பக்கங்களைக் காட்டும் பக்கங்களைக் காட்டும் அவரது எண்ணிக்கை 2 ஐ பிரதிபலிக்கும். கண்டுபிடிப்பை விளக்குங்கள்.
    2. அடுத்து, DHS பட்டியலில் இருந்து "DHS & பிற ஏஜென்சிகளால்" வகைப்படுத்தப்பட்டுள்ள முக்கிய சொல்லைப் பயன்படுத்தி ஒரு ஒப்பீட்டுக் குழுவுடன் ஒப்பிடும் குழு ("பயங்கரவாதம்" தொடர்பான கட்டுரைகளை ஒப்பிடுவதன் படி 4A ஐ பிரதி செய்கிறது) (துணை இணைப்பு அட்டவணை 10 மற்றும் அடிக்குறிப்பு 139 ஐப் பார்க்கவும்). கண்டுபிடிப்பை விளக்குங்கள்.
    3. பகுதி (ப) படிப்புக் குழுவை ஒரு ஒப்பீட்டு குழுவுடன் ஒப்பிடுகிறீர்கள். பென்னே இரண்டு மற்ற ஒப்பீட்டு குழுக்களுடன் ஒப்பிடுகிறார்: "உள்கட்டமைப்பு பாதுகாப்பு" தொடர்பான கட்டுரைகள் (இணைப்பு அட்டவணை 11) மற்றும் பிரபல விக்கிபீடியா பக்கங்கள் (இணைப்பு அட்டவணை 12). ஒரு மாற்று ஒப்பீட்டுக் குழுவுடன் வந்து, பகுதியிலிருந்து (பி) கண்டுபிடிப்புகள் ஒப்பீட்டாளர் குழுவைத் தேர்ந்தெடுப்பதற்கு உணர்திறன் உள்ளதா என்பதை சோதிக்கவும். எந்த தேர்வு மிகவும் அர்த்தமுள்ளதாக இருக்கிறது? ஏன்?
    4. "பயங்கரவாதத்திற்கு" தொடர்புடைய வார்த்தைகளை விக்கிபீடியா கட்டுரைகளை தேர்ந்தெடுப்பதாக பென்னே கூறினார், ஏனெனில் அமெரிக்க அரசாங்கம் பயங்கரவாதத்தை அதன் ஆன்லைன் கண்காணிப்பு நடைமுறைகளுக்கான ஒரு முக்கிய நியாயமாக சுட்டிக்காட்டியது. இந்த 48 "பயங்கரவாதத்தின்" முக்கிய வார்த்தைகளின் காசோலை என, Penney (2016) MTurk மீது ஒரு கணக்கெடுப்பு நடத்தியது, அரசாங்க சிக்கல், தனியுரிமை-உணர்திறன் மற்றும் தவிர்க்கப்படல் (இணைப்பு அட்டவணை 7 மற்றும் 8) ). MTurk இல் கணக்கெடுப்பைப் பிரதிபலிக்கவும் மற்றும் உங்கள் முடிவுகளை ஒப்பிடவும்.
    5. பகுப்பு (ஈ) மற்றும் உங்கள் கட்டுரை வாசிப்பு ஆகியவற்றின் முடிவுகளை அடிப்படையாகக் கொண்டது, ஆய்வு குழுவில் தலைப்பைப் பற்றிய பெயேனி தேர்வு பற்றி நீங்கள் உடன்படுகிறீர்களா? ஏன் அல்லது ஏன் இல்லை? இல்லையென்றால், அதற்கு பதிலாக என்ன பரிந்துரைக்க வேண்டும்?
  8. [ எளிதாக ] Efrati (2016) , இரகசிய தகவல்களின் அடிப்படையில், "மொத்த பகிர்வு" பேஸ்புக்கில் 5.5% வருடம் குறைந்துவிட்டது, அதே நேரத்தில் "அசல் ஒளிபரப்பு பகிர்வு" ஆண்டுக்கு 21% குறைக்கப்பட்டது. இந்த சரிவு 30 வயதிற்குட்பட்ட பேஸ்புக் பயனர்களுக்கு குறிப்பாக கடுமையாக இருந்தது. இந்த அறிக்கை இரண்டு காரணிகளின் வீழ்ச்சிக்கு காரணமானது. ஃபேஸ்புக்கில் "நண்பர்களாக" இருக்கும் மக்களின் எண்ணிக்கையில் ஒன்றுதான். மற்றொன்று சில பகிர்வு நடவடிக்கைகள் பரிமாற்றம் மற்றும் Snapchat போன்ற போட்டியாளர்களுக்கு மாற்றப்பட்டுள்ளது. இந்த அறிக்கையில் மேலும் பல தந்திரோபாயங்கள் பேஸ்புக் பகிர்வுகளை அதிகரிக்க முயன்றது, செய்தித் தொகுப்பிற்கான அசல் இடுகைகள் மேலும் முக்கியத்துவம் வாய்ந்ததாக, அதே போல் "இந்த நாளில்" இடம்பெற்ற அசல் இடுகைகளின் கால நினைவுச்சின்னங்களைக் கொண்டிருக்கும். எந்த தாக்கங்கள், ஏதாவது இருந்தால், இந்த கண்டுபிடிப்புகள் பேஸ்புக் ஒரு தரவு மூலமாக பயன்படுத்த விரும்பும் ஆய்வாளர்களிடம் உள்ளனவா?

  9. [ நடுத்தர ] ஒரு சமூகவியலாளர் மற்றும் வரலாற்றாளர் இடையேயான வித்தியாசம் என்ன? கோல்ட்ரார்ப் (1991) படி, முக்கிய வேறுபாடு தரவு சேகரிப்பு மீதான கட்டுப்பாடு ஆகும். வரலாற்றாசிரியர்கள் புனித நூல்களைப் பயன்படுத்த வேண்டிய கட்டாயத்தில் உள்ளனர், அதேசமயம் சமூகவியலாளர்கள் தங்கள் தரவு சேகரிப்பை குறிப்பிட்ட நோக்கங்களுக்குத் தக்கவைக்க முடியும். Goldthorpe (1991) படிக்கவும். சமுதாயவியல் மற்றும் வரலாற்றுக்குரிய பழக்கவழக்கங்கள் மற்றும் வாசிமாதங்கள் குறித்த கருத்து வேறுபாடு எப்படி இருக்கும்?

  10. [ கடின இது முந்தைய quesiton மீது உருவாக்குகிறது. Goldthorpe (1991) நிக்கி ஹார்ட்டில் (1994) இருந்து ஒரு உட்பட பல விமர்சன பதில்களை ஈர்த்தது. தையல் தயாரிக்கப்பட்ட தரவுகளின் சாத்தியமான வரம்புகளை தெளிவுபடுத்துவதற்கு, 1960 களின் நடுப்பகுதியில் கோல்ட்ரர்பே மற்றும் சக ஊழியர்கள் நடத்திய சமூக வர்க்கம் மற்றும் வாக்களிக்கும் இடையேயான உறவை அளவிடுவதற்கான ஒரு பெரிய சர்வேயில் பணியாற்றும் பணியாளர் திட்டம் பற்றி ஹார்ட் விவரித்தார். உயர்தர தரநிலைகளின் சகாப்தத்தில் சமூக வர்க்கத்தின் வருங்காலத்தைப் பற்றி சமீபத்தில் முன்மொழியப்பட்ட கோட்பாட்டை உரையாற்றுவதற்காக வடிவமைக்கப்பட்ட தரவரிசை சேகரிக்கப்பட்ட தரவரிசை சேகரிக்கப்பட்ட தரவரிசை மதிப்பீட்டாளர்களால் பெறப்பட்ட ஒரு அறிஞர் ஒருவர் எதிர்பார்க்கலாம். ஆனால், கோல்ட்ரார்ப் மற்றும் சக ஊழியர்கள் பெண்களின் வாக்களிக்கும் நடத்தையைப் பற்றிய தகவல்களை சேகரிக்க எப்படியோ "மறந்துவிட்டார்கள்". இங்கே நிக்கி ஹார்ட் (1994) முழு எபிசோடையும் சுருக்கமாக:

    "... இந்த 'தையல்காரர்' என்ற இலக்கைத் தவிர்த்து, பெண் அனுபவத்தை ஒதுக்கித்தள்ளும் ஒரு தர்க்கரீதியிலான தர்க்கத்தால் வரையறுக்கப்பட்டுள்ளது. வர்க்க நனவு மற்றும் செயல்களின் ஒரு கோட்பாட்டியல் பார்வை ஆண் ஆணாதிக்கம் எனக் கருதப்படுகிறது ..., கோல்ட்ரார்ப் மற்றும் அவருடைய சக ஊழியர்கள் ஒரு தத்துவார்த்த நிரூபணங்களைக் கட்டியெழுப்பினர், இது தங்களது சொந்த தத்துவார்த்த அனுமானங்களை வளர்த்து, அதற்கு பதிலாக ஒரு சரியான பரிசோதனையை வெளிப்படுத்துவதற்கு பதிலாக வளர்த்தனர். "

    ஹார்ட் தொடர்ந்தார்:

    "செல்வாக்குமிக்க தொழிலாளர் திட்டத்தின் அனுபவபூர்வமான கண்டுபிடிப்புகள் நூற்றாண்டின் மத்தியதர சமூகவியலின் நாகரிக மதிப்பீடுகளைப் பற்றி மேலும் கூறுகின்றன, அவை அடுக்குகள், அரசியல் மற்றும் பொருளாதாரம் ஆகியவற்றின் செயல்முறைகளுக்குத் தெரிவிக்கின்றன."

    தையல்காரர் தரவு சேகரிப்பு அதில் சேகரிக்கப்பட்ட தரவு சேகரிப்பாளரின் பாகங்களைக் கொண்டிருக்கும் மற்ற உதாரணங்களை நீங்கள் சிந்திக்கலாம். இது அல்காரிக்டிக் குழப்பத்தை எப்படி ஒப்பிடுகிறது? ஆராய்ச்சியாளர்கள் readymades பயன்படுத்த வேண்டும் மற்றும் அவர்கள் custommades பயன்படுத்த வேண்டும் போது இது என்ன தாக்கங்களை இருக்கலாம்?

  11. [ நடுத்தர ] இந்த அத்தியாயத்தில், நிறுவனங்கள் மற்றும் அரசாங்கங்களால் உருவாக்கப்பட்ட நிர்வாக பதிவுகள் கொண்ட ஆராய்ச்சியாளர்களுக்கான ஆராய்ச்சியாளர்களின் சேகரிப்பை நான் வேறுபடுத்தியிருக்கிறேன். சிலர் இந்த நிர்வாக பதிவுகள் "தரவுகளைக் கண்டுபிடி" என்று அழைக்கிறார்கள், "அவை வடிவமைக்கப்பட்ட தரவுடன்" வேறுபடுகின்றன. நிர்வாக பதிவுகள் ஆராய்ச்சியாளர்கள் கண்டுபிடித்தவை உண்மைதான், ஆனால் அவை மிகவும் வடிவமைக்கப்பட்டவை. உதாரணமாக, நவீன தொழில்நுட்ப நிறுவனங்கள் தங்கள் தரவு சேகரிக்க மற்றும் குணப்படுத்த மிகவும் கடினமாக உழைக்கின்றன. இவ்வாறு, இந்த நிர்வாக பதிவுகள் இருவரும் கண்டுபிடித்து வடிவமைக்கப்பட்டுவிட்டன, அது உங்கள் முன்னோக்கை சார்ந்தது (எண்ணிக்கை 2.12).

    படம் 2.12: படம் ஒரு வாத்து மற்றும் ஒரு முயல் ஆகும்; நீங்கள் பார்க்க என்ன உங்கள் முன்னோக்கு சார்ந்துள்ளது. பெரிய தரவு ஆதாரங்கள் இருவரும் கண்டுபிடித்து வடிவமைக்கப்பட்டுள்ளன; மீண்டும், நீங்கள் பார்க்க என்ன உங்கள் முன்னோக்கு சார்ந்துள்ளது. எடுத்துக்காட்டாக, ஒரு மொபைல் ஃபோன் நிறுவனத்தால் சேகரிக்கப்பட்ட அழைப்பு தரவுப் பதிவுகள் ஒரு ஆராய்ச்சியாளரின் கண்ணோட்டத்திலிருந்து தரவைக் காணலாம். ஆனால், இந்த துல்லியமான பதிவுகள் ஃபோன் நிறுவனத்தின் பில்லிங் திணைக்களத்தில் பணியாற்றும் ஒருவரின் முன்னோக்கிலிருந்து தரவு வடிவமைக்கப்பட்டுள்ளன. மூல: பிரபல அறிவியல் மாதாந்திர (1899) / விக்கிமீடியா காமன்ஸ்.

    படம் 2.12: படம் ஒரு வாத்து மற்றும் ஒரு முயல் ஆகும்; நீங்கள் பார்க்க என்ன உங்கள் முன்னோக்கு சார்ந்துள்ளது. பெரிய தரவு ஆதாரங்கள் இருவரும் கண்டுபிடித்து வடிவமைக்கப்பட்டுள்ளன; மீண்டும், நீங்கள் பார்க்க என்ன உங்கள் முன்னோக்கு சார்ந்துள்ளது. எடுத்துக்காட்டாக, ஒரு மொபைல் ஃபோன் நிறுவனத்தால் சேகரிக்கப்பட்ட அழைப்பு தரவுப் பதிவுகள் ஒரு ஆராய்ச்சியாளரின் கண்ணோட்டத்திலிருந்து தரவைக் காணலாம். ஆனால், இந்த துல்லியமான பதிவுகள் ஃபோன் நிறுவனத்தின் பில்லிங் திணைக்களத்தில் பணியாற்றும் ஒருவரின் முன்னோக்கிலிருந்து தரவு வடிவமைக்கப்பட்டுள்ளன. மூல: பிரபல அறிவியல் மாதாந்திர (1899) / விக்கிமீடியா காமன்ஸ் .

    தரவு ஆதாரத்தின் ஒரு எடுத்துக்காட்டு வழங்கவும், அதை இருவரும் கண்டுபிடித்து வடிவமைத்து, அந்த தரவு மூலத்தைப் பயன்படுத்தி ஆராய்ச்சி செய்ய உதவுகிறது.

  12. [ எளிதாக டிஜிட்டல் முறைமை ஒரு "கருவி" அல்லது "ஆய்வுக்கான பொருள்" என்பதைப் பொறுத்து இரண்டு பரந்த வகைகளாக டிஜிட்டல் ஆராய்ச்சியை பிளவுபடுத்தும் ஒரு சிந்தனையான கட்டுரையில் கிறிஸ்டியன் சாண்ட்விக் மற்றும் எஸ்செட்டர் ஹர்கிட்டா (2015) பிரித்தனர். 2010 ஆம் ஆண்டில் ஹைட்டியில் நிலநடுக்கம் ஏற்பட்ட பின்னர் இடம்பெயர்வுகளை கண்காணிப்பதற்காக மொபைல் ஃபோன் தரவைப் பயன்படுத்துவதன் மூலம் பெங்ச்சன் மற்றும் சகோ (2011) ஆகியவற்றின் ஆராய்ச்சி ஒரு கருவி ஆகும். இரண்டாம் வகையின் ஒரு உதாரணம் - இது ஒரு ஆய்வுப் பொருளாக இருப்பது-ஜென்சன் கேரளா முழுவதும் மொபைல் ஃபோன்கள் எப்படி அறிமுகப்படுத்தப்பட்டது என்பது குறித்து (2007) இந்திய மீனவர்களுக்கான சந்தை செயல்பாட்டை பாதித்தது. டிஜிட்டல் தரவு ஆதாரங்களைப் பயன்படுத்தி ஆய்வுகள், ஒரே வகையான தரவு மூலத்தைப் பயன்படுத்தினாலும் கூட வெவ்வேறு வேறுபாடுகளைக் கொண்டிருக்கும் என்று தெளிவுபடுத்துவதால், நான் இந்த வேறுபாட்டைப் பயன்படுத்துகிறேன். மேலும் இந்த வேறுபாட்டை தெளிவுபடுத்துவதற்காக, நீங்கள் பார்த்த நான்கு படிகளை விவரிக்கவும்: ஒரு டிஜிட்டல் முறைமையை ஒரு கருவியாகவும், ஒரு டிஜிட்டல் முறையை ஆய்வு செய்வதற்கான ஒரு கருவியாகவும் பயன்படுத்தும் இரண்டு டிஜிட்டல் முறைமையைப் பயன்படுத்துகின்ற இரண்டு. நீங்கள் விரும்பினால் இந்த அத்தியாயத்தில் இருந்து உதாரணங்கள் பயன்படுத்தலாம்.