చర్యలు

  • కష్టం డిగ్రీ: సులభం సులభంగా , మీడియం మీడియం , హార్డ్ హార్డ్ , చాలా కఠినం చాలా కఠినం
  • గణితం అవసరం గణిత అవసరం )
  • కోడింగ్ అవసరం ( కోడింగ్ అవసరం )
  • వివరాల సేకరణ ( వివరాల సేకరణ )
  • నాకు ఇష్టమైనవి ( నా అభిమాన )
  1. [ మీడియం , నా అభిమాన ] అల్గారిథమిక్ గందరగోళంగా Google ఫ్లూ ట్రెండ్స్తో సమస్య ఉంది. కాగితాన్ని Lazer et al. (2014) చదవండి Lazer et al. (2014) , మరియు సమస్యను వివరిస్తూ గూగుల్ వద్ద ఒక ఇంజనీర్కు ఒక చిన్న, స్పష్టమైన ఇమెయిల్ను వ్రాసి దాన్ని ఎలా పరిష్కరించాలో అనే ఆలోచనను అందించడం.

  2. [ మీడియం ] Bollen, Mao, and Zeng (2011) స్టాక్ మార్కెట్ను అంచనా వేయడానికి ట్విట్టర్ నుండి డేటాను ఉపయోగించవచ్చని వాదిస్తున్నారు. ఈ ఫైండ్ హెడ్జ్ ఫండ్-డెర్వెంట్ కాపిటల్ మార్కెట్స్ను సృష్టికి దారితీసింది - ట్విట్టర్ (Jordan 2010) నుండి సేకరించిన సమాచారం ఆధారంగా స్టాక్ మార్కెట్లో పెట్టుబడి పెట్టడానికి. ఆ ఫండ్ లో మీ డబ్బుని పెట్టడానికి ముందు మీరు ఏ సాక్ష్యాలను చూడాలనుకుంటున్నారు?

  3. [ సులభంగా [Citation needed] కొందరు ప్రజా ఆరోగ్యం న్యాయవాదులు ధూమపానం ఆపడానికి ఇ-సిగరెట్లు ప్రభావవంతమైన చికిత్సను పరిగణించినప్పటికీ, అధిక స్థాయిలో నికోటిన్ వంటి సంభావ్య ప్రమాదాల గురించి ఇతరులు హెచ్చరిస్తున్నారు. ఇ-సిగరెట్స్-సంబంధిత ట్విట్టర్ పోస్ట్లను సేకరించి, సెంటిమెంట్ విశ్లేషణను నిర్వహించడం ద్వారా ఇ-సిగరెట్లపై ప్రజల అభిప్రాయాన్ని అధ్యయనం చేయాలని ఒక పరిశోధకుడు నిర్ణయించుకుంటాడు.

    1. మీరు ఈ అధ్యయనంలో అత్యంత ఆందోళన కలిగించే మూడు పక్షపాతాలు ఏమిటి?
    2. Clark et al. (2016) కేవలం ఒక అధ్యయనం నడిచింది. మొదట, ఇ-సిగరెట్ సంబంధిత కీలక పదాలను జనవరి 2012 నుండి డిసెంబరు 2014 వరకు ఉపయోగించిన 850,000 ట్వీట్లు సేకరించబడ్డాయి. ఈ పర్యవేక్షణలో చాలామంది ఈ ట్వీట్లు ఆటోమేటెడ్ (అంటే మానవులు ఉత్పత్తి చేయలేదు) మరియు ఈ స్వయంచాలక ట్వీట్లు ప్రకటనలు. వారు సేంద్రీయ ట్వీట్ల నుండి స్వయంచాలక ట్వీట్లను వేరు చేయడానికి ఒక మానవ గుర్తింపు అల్గోరిథంను అభివృద్ధి చేశారు. ఈ మానవ గుర్తించే అల్గోరిథం ఉపయోగించి వారు 80% ట్వీట్లు ఆటోమేటెడ్ అని కనుగొన్నారు. ఈ విశ్లేషణ పార్ట్ (ఎ) కు మీ జవాబును మార్చుకుంటుంది?
    3. వారు సెంటిమెంట్ సేంద్రీయ మరియు ఆటోమేటెడ్ ట్వీట్లతో పోల్చితే, ఆటోమేటెడ్ ట్వీట్లు సేంద్రీయ ట్వీట్ల కంటే ఎక్కువ సానుకూలంగా ఉన్నాయని కనుగొన్నారు (6.17 వ్యతిరేకంగా 5.84). ఈ ఆవిష్కరణ (బి) కు మీ జవాబును మార్చాలా?
  4. [ సులభంగా ] నవంబరు 2009 లో, ట్వీట్ బాక్స్లో "ఏం చేస్తున్నావు?" నుండి "ఏమి జరుగుతోంది?" కు ట్విట్టర్ ఈ ప్రశ్నను మార్చింది (https://blog.twitter.com/2009/whats-happening).

    1. మీరు ప్రాంప్ట్ల మార్పు ట్వీట్లు మరియు / లేదా వారు ట్వీట్ చేస్తారనే విషయాన్ని ఎలా ప్రభావితం చేస్తారు?
    2. "మీరు ఏమి చేస్తున్నారు?" అనే ప్రాంప్ట్కు మీరు కోరుకున్న ఒక పరిశోధనా ప్రాజెక్ట్ పేరు. ఎందుకు వివరించండి.
    3. మీరు ప్రాంప్ట్ "ఏమవుతున్నారో?" అనే పేరు గల ఒక పరిశోధన ప్రాజెక్ట్ పేరు ఎందుకు వివరించండి.
  5. [ సులభంగా ] "Retweets" తరచూ ట్విట్టర్లో ప్రభావాన్ని మరియు ప్రభావాన్ని వ్యాప్తి చేయడానికి ఉపయోగిస్తారు. ప్రారంభంలో, వినియోగదారులు నచ్చిన ట్వీట్ను కాపీ చేసి పేస్ట్ చేసి, అతని / ఆమె హ్యాండిల్తో అసలు రచయితని ట్యాగ్ చేసి, ట్వీట్ చేసే ముందు ట్వీట్ చేస్తామని ముందుగానే "RT" టైప్ చేయండి. అప్పుడు, 2009 లో, ట్విటర్ ఒక "మళ్ళీ ట్వీట్" బటన్ జోడించారు. జూన్ 2016 లో, వినియోగదారులు వారి సొంత ట్వీట్లను ట్వీట్ చేయటానికి ట్విటర్ సాధ్యం చేసింది (https://twitter.com/twitter/status/742749353689780224). మీరు మీ పరిశోధనలో "retweets" ను ఎలా ఉపయోగించాలో ఈ మార్పులు ప్రభావితం కావాలని మీరు అనుకుంటున్నారు? ఎందుకు లేదా ఎందుకు కాదు?

  6. [ చాలా కఠినం , వివరాల సేకరణ , కోడింగ్ అవసరం , నా అభిమాన విస్తృతంగా చర్చించబడిన కాగితంలో, మిచెల్ మరియు సహచరులు (2011) దీర్ఘకాలిక సాంస్కృతిక పోకడలను గుర్తించే ప్రయత్నంలో ఐదు మిలియన్ల కంటే ఎక్కువ డిజిటైజు పుస్తకాలను విశ్లేషించారు. వారు ఉపయోగించిన డేటా ఇప్పుడు Google NGrams డేటాసమితిగా విడుదల చేయబడింది మరియు దీని వలన కొన్ని డేటాను ప్రతిబింబించడానికి మరియు విస్తరించడానికి డేటాను ఉపయోగించవచ్చు.

    కాగితంలో అనేక ఫలితాలలో ఒకటి, మిచెల్ మరియు సహచరులు మేము వేగవంతంగా మరియు వేగవంతంగా మర్చిపోతున్నామని వాదించారు. ఒక ప్రత్యేక సంవత్సరానికి "1883" అని చెప్పండి, వారు 1875 మరియు 1975 మధ్య "1883" అని పిలవబడే ప్రతి సంవత్సరం ప్రచురించబడిన 1-గ్రాముల నిష్పత్తి లెక్కించారు. ఈ నిష్పత్తి ఆ సంవత్సరంలో జరిగే సంఘటనల ఆసక్తి యొక్క కొలత అని వారు అభిప్రాయపడ్డారు. వారి సంఖ్య 3a లో, 1883, 1910 మరియు 1950: మూడు సంవత్సరాల వాడుక పథంలను వారు పన్నాగం చేశాయి. ఈ మూడు సంవత్సరములు ఒక సాధారణ విధానమును పంచుకుంటాయి: ఆ సంవత్సరం ముందు చిన్న ఉపయోగం, అప్పుడు స్పైక్, అప్పుడు క్షయం. తరువాత, ప్రతి సంవత్సరం క్షయం రేటును లెక్కించడానికి, మైకేల్ మరియు సహచరులు ప్రతి సంవత్సరం "సగం జీవితం" 1875 మరియు 1975 మధ్య అన్ని సంవత్సరాల్లో లెక్కించారు. వారి సంఖ్య 3a (ఇన్సెట్) లో, వారు ప్రతి సగం జీవితం సంవత్సరం తగ్గిపోతుంది, మరియు దీని అర్థం మేము గతంలో వేగంగా మరియు వేగవంతంగా మర్చిపోతున్నామని వాదించారు. వారు ఆంగ్ల భాషా కార్పస్ యొక్క సంస్కరణ 1 ను ఉపయోగించారు, కానీ తరువాత గూగుల్ కార్పస్ యొక్క రెండవ సంస్కరణను విడుదల చేసింది. దయచేసి మీరు కోడింగ్ను ప్రారంభించడానికి ముందు ప్రశ్నలోని అన్ని భాగాలను చదవండి.

    ఈ చర్య మీరు తిరిగి వాడుకోగలిగే కోడ్ను రాయడం, ఫలితాలను వివరించడం మరియు డేటాను వంచడం (ఇబ్బందికరమైన ఫైల్లతో పనిచేయడం మరియు తప్పిపోయిన డేటాను నిర్వహించడం వంటివి) మీకు అభ్యాసం ఇస్తాయి. ఈ సూచించే మీరు రిచ్ మరియు ఆసక్తికరమైన డేటాసెట్ తో అప్ మరియు నడుస్తున్న సహాయపడుతుంది.

    1. Google Books NGram Viewer వెబ్సైట్ నుండి ముడి సమాచారాన్ని పొందండి. ప్రత్యేకంగా, జూలై 1, 2012 న విడుదలైన ఆంగ్ల భాషా కార్పస్ యొక్క వర్షన్ 2 ను మీరు ఉపయోగించాలి. అన్ కంప్రెస్డ్, ఈ ఫైల్ 1.4GB.

    2. Michel et al. (2011) సంఖ్య 3a యొక్క ప్రధాన భాగాన్ని రిక్రీట్ చేయండి Michel et al. (2011) . ఈ సంఖ్యను పునఃపరిస్తే, మీకు రెండు ఫైల్స్ అవసరం: మీరు (a) మరియు "మొత్తం గణనలు" ఫైల్ లో డౌన్లోడ్ చేసుకున్న ఒక ఫైల్, మీరు ముడి గణనలు నిష్పత్తులలోకి మార్చడానికి ఉపయోగించవచ్చు. మొత్తం గణనలు ఫైలులో చదవటానికి ఒక బిట్ కష్టతరం చేసే నిర్మాణం ఉంది. NGram డేటా యొక్క వెర్షన్ 2 Michel et al. (2011) లో సమర్పించిన వాటికి సారూప్య ఫలితాలను అందిస్తుంది Michel et al. (2011) , ఇవి వెర్షన్ 1 డేటా ఆధారంగా ఉన్నాయి?

    3. ఇప్పుడు NGram వ్యూయర్ సృష్టించిన గ్రాఫ్కి వ్యతిరేకంగా మీ గ్రాఫ్ను తనిఖీ చేయండి.

    4. ఫిగర్ 3a (ప్రధాన వ్యక్తి) ను రీసైక్ట్ చేయండి, కాని \(y\) -axis ను ముడి ప్రస్తావన లెక్కింపుగా మార్చండి \(y\) సూచనల రేటు కాదు).

    5. (బి) మరియు (d) మధ్య వ్యత్యాసం మిచెల్ మరియు ఇతరుల ఫలితాల ఫలితాలను పునర్వ్యవస్థీకరించడానికి మిమ్మల్ని దారితీస్తుంది. (2011). ఎందుకు లేదా ఎందుకు కాదు?

    6. ఇప్పుడు, ప్రస్తావనలు నిష్పత్తి ఉపయోగించి, సంఖ్య 3a యొక్క ఇన్సెట్ ప్రతిబింబిస్తాయి. అంటే, ప్రతి సంవత్సరం 1875 మరియు 1975 మధ్య, ఆ సంవత్సరం సగం జీవితం లెక్కించేందుకు. సగం జీవితం సగం దాని శిఖరం విలువ చేరుకుంటుంది ముందు నిష్పత్తి పాస్ ముందు సంవత్సరాల సంఖ్యలో నిర్వచించారు. Michel et al. (2011) గమనించండి Michel et al. (2011) సహాయక ఆన్లైన్ సమాచారం యొక్క సగం-జీవితం-చూడు విభాగం III.6 ను అంచనా వేయడానికి మరింత క్లిష్టంగా ఏదో ఒకటి చేయండి-కానీ అవి రెండూ కూడా ఇదే ఫలితాలను ఉత్పత్తి చేశాయని వాదించారు. NGram డేటా యొక్క వెర్షన్ 2 Michel et al. (2011) లో సమర్పించబడిన వాటికి సమాన ఫలితాలను అందిస్తుంది Michel et al. (2011) , ఇవి వెర్షన్ 1 డేటా ఆధారంగా ఉన్నాయి? (సూచన: ఇది చేయకపోతే ఆశ్చర్యపడకండి.)

    7. ఏ సంవత్సరాల్లో, ప్రత్యేకించి, త్వరగా లేదా ముఖ్యంగా నెమ్మదిగా మర్చిపోయారు సంవత్సరాల వంటి దూరప్రాంతాల్లో? క్లుప్తంగా ఆ నమూనా కోసం సాధ్యమైన కారణాల గురించి ఊహిస్తూ, మీరు దూరప్రాంతాల్ని ఎలా గుర్తించాలో వివరించండి.

    8. ఇప్పుడు చైనీస్, ఫ్రెంచ్, జర్మన్, హిబ్రూ, ఇటాలియన్, రష్యన్ మరియు స్పానిష్ భాషల్లో NGrams డేటా యొక్క వెర్షన్ 2 కోసం ఈ ఫలితాన్ని ప్రతిబింబిస్తుంది.

    9. అన్ని భాషలను పోల్చి చూస్తే, ఏ సంవత్సరములు అంత త్వరగా, ముఖ్యంగా నెమ్మదిగా మరిచిపోయిన సంవత్సరాల వంటివి? క్లుప్తంగా ఆ నమూనా కోసం కారణాలు గురించి ఊహించు.

  7. [ చాలా కఠినం , వివరాల సేకరణ , కోడింగ్ అవసరం , నా అభిమాన ] జూన్ 2013 లో NSA / PRISM నిఘా (అనగా, స్నోడెన్ వెల్లడైన) గురించి విస్తృతమైన ప్రచారం గోప్యతా సమస్యలను పెంచే అంశాలపై వికీపీడియా వ్యాసాలకు ట్రాఫిక్లో ఒక పదునైన మరియు ఆకస్మిక తగ్గుదలతో సంబంధం కలిగివున్నాడా అనే దానిపై Penney (2016) అన్వేషించారు. అలా అయితే, ప్రవర్తనలో ఈ మార్పు సామూహిక పర్యవేక్షణ ఫలితంగా ఒక చిల్లింగ్ ప్రభావానికి అనుగుణంగా ఉంటుంది. Penney (2016) యొక్క విధానం కొన్నిసార్లు అంతరాయం కలిగించిన సమయ శ్రేణి రూపకల్పన అంటారు, మరియు అది సెక్షన్ 2.4.3 లో వివరించిన విధానాలకు సంబంధించినది.

    విషయం కీలక పదాలను ఎంచుకోవడానికి, సోనీ మీడియా పర్యవేక్షణ మరియు పర్యవేక్షణ కోసం US డిపార్ట్మెంట్ ఆఫ్ హోమ్ల్యాండ్ సెక్యూరిటీ ఉపయోగించిన జాబితాను పెన్నే సూచించాడు. DHS జాబితా నిర్దిష్ట శోధన పదాలు వర్గీకరిస్తుంది, అంటే "ఆరోగ్య ఆందోళన," "ఇన్ఫ్రాస్ట్రక్చర్ సెక్యూరిటీ," మరియు "టెర్రరిజం." అధ్యయనం సమూహం కోసం, పెన్నీ "టెర్రరిజం" కు సంబంధించి ఉన్న 48 కీలక పదాలు ఉపయోగించారు (అనుబంధం పట్టిక 8 చూడండి ). ఆ తరువాత అతను వికీపీడియా వ్యాసం యొక్క కాలానుగుణంగా 48-వికీపీడియా వ్యాసాల కొరకు నెలవారీ ప్రాతిపదికన 32-నెలల వ్యవధిలో, జనవరి 2012 ప్రారంభం నుండి ఆగస్టు 2014 వరకు నెలవారీ ప్రాతిపదికన లెక్కించారు. అతని వాదనను బలోపేతం చేసేందుకు అతను అనేక పోలిక సమూహాలను కూడా ట్రాక్ చేశాడు ఇతర అంశాలపై వ్యాసం వీక్షణలు.

    ఇప్పుడు, మీరు Penney (2016) ను ప్రతిబింబించడానికి మరియు విస్తరించడానికి వెళ్తున్నారు. ఈ కార్యకలాపాలకు అవసరమైన అన్ని ముడి సమాచారం వికీపీడియా నుండి అందుబాటులో ఉంది. లేదా మీరు R- ప్యాకేజీ వికీపెడిట్రెండ్ (Meissner and R Core Team 2016) . మీరు మీ ప్రతిస్పందనలను వ్రాసినప్పుడు, మీరు ఉపయోగించిన డేటా సోర్స్ను దయచేసి గమనించండి. (ఈ అదే సూచించే కూడా అధ్యాయం 6 లో కనిపిస్తుంది గమనించండి.) ఈ కార్యకలాపాలు మీరు డేటా వివాదంలో అభ్యాసం మరియు పెద్ద డేటా వనరుల సహజ ప్రయోగాలు గురించి ఆలోచిస్తూ ఉంటుంది. భవిష్యత్ ప్రాజెక్టుల కోసం ఇది ఆసక్తికరమైన డేటా మూలంతో మీరు నిలపడానికి మరియు నడుస్తుంది.

    1. Penney (2016) చదవండి మరియు స్నోడెన్ వెల్లడైన ముందు మరియు తరువాత "టెర్రరిజం" అనే పేజీల అభిప్రాయాలను చూపుతున్న అతని సంఖ్య 2 ను ప్రతిబింబిస్తుంది. కనుగొన్న వాటిని అర్థం చేసుకోండి.
    2. తరువాత, DHS జాబితా నుండి "DHS & ఇతర ఏజెన్సీల" కింద వర్గీకరించిన కీలక పదాలు ఉపయోగించి ఒక కంపేరిటర్ గ్రూప్తో ("టెర్రరిజం" -సంబంధిత వ్యాసాలను) పోల్చిన Figure 4A ప్రతిరూపం (Appendix పట్టిక 10 మరియు ఫుట్నోట్ 139 చూడండి). కనుగొన్న వాటిని అర్థం చేసుకోండి.
    3. భాగంగా (బి) మీరు ఒక పోలిక సమూహంతో అధ్యయన బృందాన్ని పోల్చారు. పెన్నీ రెండు ఇతర పోలిక సమూహాలతో పోల్చాడు: "ఇన్ఫ్రాస్ట్రక్చర్ సెక్యూరిటీ" సంబంధిత కథనాలు (అనుబంధ పట్టిక 11) మరియు ప్రసిద్ధ వికీపీడియా పేజీలు (అనుబంధం పట్టిక 12). ఒక ప్రత్యామ్నాయ పోలిక సమూహంతో పైకి రాండి మరియు పార్ట్ (బి) యొక్క ఫలితాలను మీ పోటీదారు సమూహం యొక్క ఎంపికకు సున్నితమైనవా అని పరీక్షించండి. వీటిలో ఏది ఎక్కువ అర్ధమే? ఎందుకు?
    4. "టెర్రరిజం" కి సంబంధించిన కీలక పదాలు వికీపీడియా వ్యాసాలను ఎన్నుకోవటానికి ఉపయోగించినట్లు పెన్నీ చెప్పారు, ఎందుకంటే US ప్రభుత్వం దాని యొక్క నిఘా అభ్యాసానికి కీలక సమర్థనగా టెర్రరిజంను పేర్కొంది. ఈ 48 "టెర్రరిజం" సంబందిత కీలక పదాల పరిశీలన ప్రకారం, పెని Penney (2016) కూడా ప్రభుత్వం ట్రబుల్, ప్రైమరీ-సెన్సిటివ్ మరియు అవాయిడెన్స్ (అనుబంధం పట్టిక 7, 8 ). MTurk లో సర్వే ప్రతిరూపం మరియు మీ ఫలితాలను పోల్చండి.
    5. భాగంగా (డి) మరియు వ్యాసం యొక్క మీ చదివిన ఫలితాల ఆధారంగా, అధ్యయన బృందంలో ముఖ్య పదాల పెన్సీ ఎంపికను మీరు అంగీకరిస్తారా? ఎందుకు లేదా ఎందుకు కాదు? లేకపోతే, బదులుగా మీరు ఏమి సూచిస్తారు?
  8. [ సులభంగా ] Efrati (2016) రహస్య సమాచారం ఆధారంగా, ఫేస్బుక్లో "మొత్తం భాగస్వామ్యం" సంవత్సరానికి 5.5 శాతం క్షీణించింది, "అసలైన ప్రసారం" సంవత్సరానికి 21% తగ్గింది. ఈ క్షీణత 30 సంవత్సరాలు కంటే తక్కువ వయస్సు గల ఫేస్బుక్ వినియోగదారులతో ముఖ్యంగా తీవ్రమైంది. నివేదిక రెండు కారణాల క్షీణతను పేర్కొంది. ఫేస్బుక్లో "ఫ్రెండ్స్" ప్రజల సంఖ్యలో ఒకటి పెరుగుతోంది. ఇంకొకటి, కొన్ని భాగస్వామ్య కార్యకలాపాలు సంచారం మరియు స్నాప్చాట్ వంటి పోటీదారులకు మారాయి. ఈ రిపోర్టు, ఫేస్బుక్ భాగస్వామ్యం పెంచడానికి ప్రయత్నించిన అనేక వ్యూహాలు వెల్లడించాయి, ఇందులో న్యూస్ ఫీడ్ అల్గోరిథం ట్వీక్స్ కూడా ఉన్నాయి, ఇవి అసలు పోస్ట్స్ మరింత ప్రముఖంగా ఉంటాయి, అలాగే "ఆన్ దిస్ డే" ఫీచర్తో అసలు పోస్ట్స్ యొక్క క్రమానుగత రిమైండర్లు కూడా ఉన్నాయి. ఎటువంటి హాని, ఏదైనా ఉంటే, ఫేస్బుక్ను డేటా సోర్స్గా ఉపయోగించాలనుకునే పరిశోధకుల కోసం ఈ ఫలితాలను కలిగి ఉన్నారా?

  9. [ మీడియం ] సోషియాలజిస్ట్ మరియు చరిత్రకారుడి మధ్య తేడా ఏమిటి? గోల్డ్థోర్పే (1991) ప్రకారం, ప్రధాన తేడా డేటా సేకరణ మీద నియంత్రణ. చరిత్రకారులు శేషాలను ఉపయోగించుకోవలసి వస్తుంది, అయితే సామాజిక శాస్త్రవేత్తలు తమ సమాచార సేకరణను నిర్దిష్ట ప్రయోజనాల కోసం ఉపయోగించవచ్చు. Goldthorpe (1991) చదవండి Goldthorpe (1991) . సాంఘిక శాస్త్రం మరియు చరిత్ర మధ్య సాంప్రదాయాలు మరియు readymades ఆలోచనకు సంబంధించిన తేడా ఏమిటి?

  10. [ హార్డ్ ] ఇది మునుపటి క్విసెటన్ మీద ఆధారపడుతుంది. Goldthorpe (1991) నిక్కీ హార్ట్ (1994) నుండి ఒకదానితో సహా అనేక క్లిష్టమైన ప్రతిస్పందనలను గీశాడు, తద్వారా గోల్డ్థోర్ప్ యొక్క భక్తిని తారాగణం చేసిన డేటాకు సవాలు చేసింది. తాయారు చేసిన డేటా యొక్క సంభావ్య పరిమితులను వివరించేందుకు, 1960 ల మధ్యకాలంలో గోల్డ్తోర్ మరియు సహచరులు నిర్వహించిన సాంఘిక వర్గం మరియు ఓటింగ్ మధ్య ఉన్న సంబంధాన్ని కొలిచే ఒక పెద్ద సర్వేలో ఉన్న ధనిక వర్కర్ ప్రాజెక్ట్ గురించి హార్ట్ వివరించాడు. దొరికిన సమాచారం ఆధారంగా రూపకల్పన చేసిన డేటాను అందించిన ఒక విద్వాంసుడు నుండి ఆశించినంతగా, ధనిక వర్కర్ పథకం సేకరించిన డేటా సేకరించింది, ఇది జీవన ప్రమాణాల పెరుగుదల యుగంలో సాంఘిక తరగతిని భవిష్యత్తు గురించి ఇటీవల ప్రతిపాదించిన సిద్ధాంతాన్ని పరిష్కరించడానికి ఉద్దేశించబడింది. కాని, గోల్డ్థోర్ప్ మరియు సహచరులు ఏదో ఒకవిధంగా "మర్చిపోయారు" మహిళల ఓటింగ్ ప్రవర్తన గురించి సమాచారాన్ని సేకరించడానికి. ఇక్కడ నిక్కీ హార్ట్ (1994) మొత్తం ఎపిసోడ్ను సంగ్రహించారు:

    "... ఈ 'దర్జీ చేసిన' కారణంగా, స్త్రీలు తప్పిపోయారనే ముగింపును నివారించడం కష్టంగా ఉంది. ఎందుకంటే, మహిళల అనుభవాన్ని మినహాయించి, ఒక పారాడిగ్మాటిక్ లాజిక్ ద్వారా డేటాసెట్ పరిమితమైంది. తరగతి స్పృహ మరియు చర్యల యొక్క మనోభావ సిద్ధాంతానికి సిద్ధాంతపరమైన దృష్టిని చేత నడిచింది ..., గోల్డోర్పెప్ మరియు అతని సహచరులు తమ అనుభవజ్ఞుడైన రుజువులను నిర్మించారు.

    హార్ట్ కొనసాగించాడు:

    "ధనిక వర్కర్ ప్రాజెక్ట్ యొక్క అనుభావిక అన్వేషణలు శతాబ్ది మధ్య తరగతి సామాజిక శాస్త్రాల విలువలను, స్తరీకరణ, రాజకీయాలు మరియు భౌతిక జీవన ప్రక్రియలకు తెలియజేయడం కంటే మనకు మరింత తెలియచేస్తాయి."

    మీరు రూపొందించిన సమాచార సేకరణలో దాని యొక్క కలయికతో రూపొందించిన సమాచార సేకరణను ఇతర ఉదాహరణల గురించి మీరు ఆలోచించగలరా? ఇది అల్గారిథమిక్ గందరగోళానికి ఎలా సరిపోతుంది? పరిశోధకులు readymades ఉపయోగించాలి మరియు వారు custommades ఉపయోగించాలి ఉన్నప్పుడు ఇది ఏ చిక్కులు ఉండవచ్చు?

  11. [ మీడియం ఈ అధ్యాయంలో, కంపెనీలు మరియు ప్రభుత్వాలచే సృష్టించబడిన పరిపాలనా రికార్డులతో పరిశోధకులు పరిశోధకులచే సేకరించబడిన డేటాను నేను విభేదించాను. కొంతమంది ఈ పరిపాలనా నివేదికలను "కనుగొన్న డేటా" అని పిలుస్తారు, వారు "రూపకల్పన చేసిన డేటా" తో విరుద్ధంగా ఉంటారు. పరిపాలనా నివేదికలు పరిశోధకులచే కనుగొనబడినవి నిజం, కానీ ఇవి బాగా రూపొందించబడ్డాయి. ఉదాహరణకు, ఆధునిక సాంకేతిక సంస్థలు తమ డేటాను సేకరించి, వాటి డేటాను కత్తిరించడానికి చాలా కష్టపడతాయి. అందువలన, ఈ పరిపాలనా రికార్డులు రెండింటినీ కనుగొనబడ్డాయి మరియు రూపకల్పన చేయబడ్డాయి, ఇది కేవలం మీ దృష్టికోణంపై ఆధారపడి ఉంటుంది (సంఖ్య 2.12).

    మూర్తి 2.12: చిత్రం ఒక బాతు మరియు ఒక కుందేలు; మీరు చూసేది మీ దృక్పథంపై ఆధారపడి ఉంటుంది. పెద్ద సమాచార వనరులు రెండింటినీ కనుగొని రూపకల్పన చేయబడ్డాయి; మళ్ళీ, మీరు చూసే మీ దృక్పథంపై ఆధారపడి ఉంటుంది. ఉదాహరణకు, ఒక మొబైల్ ఫోన్ కంపెనీచే సేకరించబడిన కాల్ డేటా రికార్డులు ఒక పరిశోధకుడి దృక్పథంలో ఉన్న సమాచారాన్ని కనుగొనవచ్చు. కానీ, ఈ ఖచ్చితమైన రికార్డులు ఫోన్ సంస్థ యొక్క బిల్లింగ్ విభాగంలో పనిచేస్తున్న ఒక వ్యక్తి యొక్క దృక్పథంలో డేటా రూపకల్పన చేయబడ్డాయి. మూలం: పాపులర్ సైన్స్ మంత్లీ (1899) / వికీమీడియా కామన్స్.

    మూర్తి 2.12: చిత్రం ఒక బాతు మరియు ఒక కుందేలు; మీరు చూసేది మీ దృక్పథంపై ఆధారపడి ఉంటుంది. పెద్ద సమాచార వనరులు రెండింటినీ కనుగొని రూపకల్పన చేయబడ్డాయి; మళ్ళీ, మీరు చూసే మీ దృక్పథంపై ఆధారపడి ఉంటుంది. ఉదాహరణకు, ఒక మొబైల్ ఫోన్ కంపెనీచే సేకరించబడిన కాల్ డేటా రికార్డులు ఒక పరిశోధకుడి దృక్పథంలో ఉన్న సమాచారాన్ని కనుగొనవచ్చు. కానీ, ఈ ఖచ్చితమైన రికార్డులు ఫోన్ సంస్థ యొక్క బిల్లింగ్ విభాగంలో పనిచేస్తున్న ఒక వ్యక్తి యొక్క దృక్పథంలో డేటా రూపకల్పన చేయబడ్డాయి. మూలం: పాపులర్ సైన్స్ మంత్లీ (1899) / వికీమీడియా కామన్స్ .

    పరిశోధన కోసం డేటా మూలాన్ని ఉపయోగిస్తున్నప్పుడు అది కనుగొనబడిన మరియు రూపకల్పన రెండింటిని చూసినప్పుడు డేటా మూలం యొక్క ఉదాహరణను అందించండి.

  12. [ సులభంగా ] డిజిటల్ వ్యవస్థ ఒక "వాయిద్యం" లేదా "అధ్యయన అంశంగా" అనేదాని మీద ఆధారపడిన ఒక విలక్షణ వ్యాసంలో, క్రిస్టియన్ సండ్విగ్ మరియు ఎస్జెర్ర్ హర్గిట్టై (2015) డిజిటల్ పరిశోధన రెండు విస్తృత వర్గాలలో విభజించబడింది. 2010 లో హెయిటిలో భూకంపం తరువాత వలస పోవడంపై మొబైల్ ఫోన్ డేటాను ఉపయోగించడం ద్వారా బెంగాల్సన్ మరియు సహచరులు (2011) పరిశోధన చేస్తారు. రెండవ రకమైన వ్యవస్థను అధ్యయనం చేసే ఒక ఉదాహరణ-జెన్సెన్ (2007) కేరళలో మొబైల్ ఫోన్ల పరిచయం ఎలా, భారతదేశం చేప మార్కెట్ కోసం పనితీరును ప్రభావితం చేసింది. డిజిటల్ డేటా మూలాల వాడకం అధ్యయనాలు ఒకే రకమైన డేటా సోర్స్ను ఉపయోగిస్తున్నప్పటికీ చాలా భిన్నమైన లక్ష్యాలను కలిగి ఉండవచ్చనే విషయాన్ని స్పష్టంగా వివరించడం ద్వారా ఈ వ్యత్యాసం ఉపయోగకరంగా ఉంటుంది. ఈ వ్యత్యాసాన్ని మరింత స్పష్టంగా వివరించడానికి, మీరు చూసిన నాలుగు అధ్యయనాలను వివరించండి: ఒక డిజిటల్ వ్యవస్థను ఒక పరికరం మరియు ఒక డిజిటల్ వ్యవస్థను అధ్యయనం యొక్క ఒక వస్తువుగా ఉపయోగించుకునే రెండింటిగా ఉపయోగించుకునే రెండు. మీరు కావాలనుకుంటే మీరు ఈ అధ్యాయం నుండి ఉదాహరణలు ఉపయోగించవచ్చు.