2.4.1 కౌంటింగ్ విషయాలు

మీరు మంచి సమాచారంతో ఒక మంచి ప్రశ్న మిళితం ఉంటే సాధారణ లెక్కింపు ఆసక్తికరమైన ఉంటుంది.

అధునాతన-ధ్వని భాషలో ఇది జతచేయబడినప్పటికీ, సామాజిక పరిశోధనలో చాలా విషయాలు నిజంగా లెక్కింపు ఉంది. పెద్ద డేటా వయస్సులో, పరిశోధకులు గతంలో కంటే ఎక్కువగా ఉంటారు, కానీ వారు కేవలం అడ్డదిడ్డంగా లెక్కింపు ప్రారంభించాలని అర్థం కాదు. బదులుగా, పరిశోధకులు ఇలా ప్రశ్నించాలి: లెక్కింపు విలువ ఏమిటి? ఇది పూర్తిగా ఆత్మాశ్రయ విషయంగా అనిపించవచ్చు, కానీ కొన్ని సాధారణ నమూనాలు ఉన్నాయి.

తరచూ విద్యార్థులు వారి లెక్కింపు పరిశోధనను ప్రోత్సహిస్తున్నారు: నేను ఎవ్వరూ ముందే లెక్కించలేదని నేను లెక్కించబోతున్నాను. ఉదాహరణకు, అనేకమంది ప్రజలు వలస వచ్చినవారిని అధ్యయనం చేశారని మరియు అనేకమంది ప్రజలు కవలలను అధ్యయనం చేశారని చెప్పవచ్చు, కానీ ఎవరూ వలస వచ్చిన కవలలను అధ్యయనం చేయలేదు. నా అనుభవం లో, నేను లేనప్పుడు ప్రేరణగా పిలువబడే ఈ వ్యూహం సాధారణంగా మంచి పరిశోధనలకు దారితీయదు. లేకపోవడంతో ప్రేరణ అక్కడ ఒక రంధ్రం ఉంది అక్కడ చెప్పడం వంటి రకమైన ఉంది, మరియు నేను దాన్ని పూరించడానికి చాలా హార్డ్ పని వెళుతున్న. కానీ ప్రతి రంధ్రం నింపవలసిన అవసరం లేదు.

బదులుగా లేకపోవడం ప్రేరేపించే, నేను ఒక మంచి వ్యూహం ముఖ్యమైన లేదా ఆసక్తికరమైన (లేదా ఆదర్శంగా రెండు) అని పరిశోధన ప్రశ్నలు చూడండి భావిస్తున్నాను. ఈ రెండు పదాలు నిర్వచించటానికి ఒక బిట్ కష్టంగా ఉంది, కానీ ముఖ్యమైన పరిశోధన గురించి ఆలోచించటానికి ఒక మార్గమేమిటంటే అది కొందరు కొద్దీ ప్రభావం చూపుతుంది లేదా పాలసీ మేకర్స్చే ఒక ముఖ్యమైన నిర్ణయానికి ఫీడ్ లు కలిగి ఉంటుంది. ఉదాహరణకి, నిరుద్యోగ రేటును కొలవడం ముఖ్యమైనది, ఎందుకంటే ఇది పాలసీ నిర్ణయాలు తీసుకునే ఆర్థిక వ్యవస్థ యొక్క సూచిక. సాధారణంగా, నేను పరిశోధకులు ఒక ముఖ్యమైన మంచి భావాన్ని కలిగి ఉంటారు. కాబట్టి, ఈ విభాగం యొక్క మిగిలిన భాగంలో, నేను ఇద్దరు ఉదాహరణలు ఇవ్వబోతున్నాను, లెక్కింపు ఆసక్తికరంగా ఉంది. ప్రతి సందర్భంలో, పరిశోధకులు అస్తవ్యస్తంగా లెక్కించలేదు; కాకుండా, వారు సామాజిక వ్యవస్థలు పని ఎలా సాధారణ ఆలోచనలు లోకి ముఖ్యమైన ఆలోచనలు వెల్లడి చాలా ప్రత్యేక అమరికలలో లెక్కింపు ఉన్నాయి. మరో మాటలో చెప్పాలంటే, ఈ ప్రత్యేక లెక్కింపు వ్యాయామాలను ఆసక్తికరంగా చేస్తుంది ఏమిటంటే దానికదే సమాచారం కాదు, ఈ సాధారణ ఆలోచనల నుండి వస్తుంది.

న్యూయార్క్ నగరం టాక్సీ డ్రైవర్ల యొక్క ప్రవర్తన గురించి హెన్రీ ఫార్బెర్ యొక్క (2015) అధ్యయనం నుండి లెక్కింపు యొక్క సాధారణ శక్తి యొక్క ఒక ఉదాహరణ వస్తుంది. ఈ సమూహం అంతర్గతంగా ఆసక్తికరంగా ఉండకపోయినా, శ్రామిక ఆర్థిక శాస్త్రంలో రెండు పోటీ సిద్ధాంతాలను పరీక్షించడం కోసం ఇది ఒక వ్యూహాత్మక పరిశోధన సైట్ . టాబర్ డ్రైవర్ల యొక్క పని వాతావరణం గురించి రెండు ముఖ్యమైన అంశాలు ఉన్నాయి: (1) వారి గంట వేతనం వాతావరణం వంటి కారకాలపై భాగంగా రోజుకు రోజుకి మారుతూ ఉంటుంది, మరియు (2) గంటల సంఖ్య వారు పని వారి నిర్ణయాలు ఆధారంగా ప్రతి రోజు మారటానికి చేయవచ్చు. ఈ లక్షణాలు గంట వేతనాలు మరియు గంటలు మధ్య సంబంధం గురించి ఆసక్తికరమైన సందేహానికి దారితీస్తుంది. ఆర్థికశాస్త్రంలో నియోక్లాసికల్ నమూనాలు టాక్సీ డ్రైవర్లు ఎక్కువ గంట వేళలు కలిగి ఉన్న రోజుల్లో మరింత పని చేస్తాయని అంచనా వేస్తున్నారు. ప్రత్యామ్నాయంగా, బిహేవియర్ ఎకనామిక్స్ నుండి నమూనాలు సరిగ్గా వ్యతిరేకతని అంచనా వేస్తాయి. డ్రైవర్లు నిర్దిష్ట ఆదాయం లక్ష్యాన్ని నిర్దేశిస్తే-రోజుకు $ 100 అని మరియు లక్ష్యాన్ని చేరుకోకపోవడమే వరకు పని చేస్తే, డ్రైవర్లు వారు మరింత సంపాదిస్తున్న రోజుల్లో తక్కువ గంటలు పని చేస్తారు. ఉదాహరణకు, మీరు లక్ష్య సంపాదన ఉంటే, మీరు ఒక మంచి రోజు (గంటకు $ 25) మరియు ఒక చెడ్డ రోజు (గంటకు $ 20) ఐదు గంటలు పనిచేయవచ్చు. అందువల్ల, తక్కువ గంట వేతనాలతో (ప్రవర్తనా ఆర్థిక నమూనాల ద్వారా అంచనా వేసిన రోజులు) రోజులలో అధిక గంట వేతనాలతో (నియోక్లాసికల్ నమూనాలు అంచనా వేసినట్లు) లేదా ఎక్కువ గంటలు రోజులు డ్రైవర్లకు ఎక్కువ గంటలు పని చేస్తారా?

ఈ ప్రశ్నకు సమాధానమిచ్చేందుకు 2009 నుండి 2013 వరకు న్యూయార్క్ నగర క్యాబ్లు తీసుకున్న ప్రతి టాక్సీ ట్రిప్పై ఫార్బెర్ పొందిన డేటాను ఇప్పుడు బహిరంగంగా అందుబాటులో ఉంచే డేటాకు సమాధానం ఇవ్వండి. ఈ డేటాను ఉపయోగించుకునే టాక్సీలు అవసరమయ్యే ఎలక్ట్రానిక్ మీటర్ల ద్వారా సేకరించబడ్డాయి-ప్రతి పర్యటన గురించి సమాచారం: ప్రారంభ సమయం, స్థానం ప్రారంభించడం, ముగింపు సమయం, ముగింపు స్థానం, ఛార్జీ మరియు చిట్కా (క్రెడిట్ కార్డుతో చిట్కా చెల్లించినట్లయితే) . ఈ టాక్సీ మీటర్ డేటాను ఉపయోగించడం ద్వారా, ఫోర్బర్ నెకోక్లాసిక్ సిద్ధాంతానికి అనుగుణంగా వేతనాలు ఎక్కువగా ఉన్న రోజుల్లో ఎక్కువమంది డ్రైవర్లు ఎక్కువ పని చేస్తున్నారని కనుగొన్నారు.

ఈ ప్రధాన అన్వేషణతో పాటు, ఫైబర్ వైవిధ్యత మరియు డైనమిక్స్ యొక్క మెరుగైన అవగాహన కోసం డేటా పరిమాణాన్ని ఉపయోగించుకోగలిగాడు. కాలక్రమేణా, కొత్త డ్రైవర్లు నెమ్మదిగా అధిక వేతనం రోజులలో (ఉదా., నియోక్లాసికల్ మోడల్ ఊహించినట్లుగా ప్రవర్తించేలా నేర్చుకుంటారు) ఎక్కువ గంటలు పనిచేయాలని నేర్చుకుంటారు. మరియు లక్ష్యంగా సంపాదించేవారి వలె ప్రవర్తించే కొత్త డ్రైవర్ లు టాక్సీ డ్రైవర్లను విడిచిపెట్టడానికి అవకాశం ఉంది. ప్రస్తుత చురుకుదనం యొక్క గమనించిన ప్రవర్తనను వివరించడానికి సహాయపడే మరింత సూక్ష్మమైన ఫలితాలను రెండింటినీ, డేటాసమితి యొక్క పరిమాణం కారణంగా మాత్రమే సాధ్యమయ్యాయి. కొంతకాలం (Camerer et al. 1997) కొద్ది సంఖ్యలో టాక్సీ డ్రైవర్ల నుండి పేపర్ ట్రిప్ షీట్లను ఉపయోగించిన మునుపటి అధ్యయనాల్లో వారు గుర్తించలేకపోయారు.

ఫార్బెర్ యొక్క అధ్యయనం ఒక పెద్ద డేటా మూలాన్ని ఉపయోగించి ఒక పరిశోధన కోసం ఒక ఉత్తమ దృష్టాంత దృష్టితో దగ్గరగా ఉంది, ఎందుకంటే నగరాన్ని సేకరించిన డేటా ఫెర్బెర్ సేకరించిన డేటాకు అందంగా దగ్గరగా ఉంది (ఒక వ్యత్యాసం ఫార్బెర్ వేతనాలు-చిట్కాలు ప్లస్ చిట్కాలు-కాని నగర డేటాలో మాత్రమే క్రెడిట్ కార్డు చెల్లించిన చిట్కాలు ఉన్నాయి). ఏదేమైనా, కేవలం డేటా సరిపోలేదు. ఫార్బెర్ యొక్క పరిశోధన కీ డేటా ఒక ఆసక్తికరమైన ప్రశ్న తీసుకురావడం, కేవలం ఈ నిర్దిష్ట సెట్టింగ్ మించి పెద్ద చిక్కులను కలిగి ఒక ప్రశ్న.

విషయాల లెక్కింపు యొక్క రెండవ ఉదాహరణగా చైనీస్ ప్రభుత్వంచే ఆన్లైన్ సెన్సార్షిప్పై గ్యారీ కింగ్, జెన్నిఫర్ పాన్ మరియు మోలీ రాబర్ట్స్ (2013) పరిశోధనల నుండి వచ్చాయి. అయితే ఈ విషయంలో, పరిశోధకులు వారి స్వంత పెద్ద డేటాను సేకరించాల్సి వచ్చింది మరియు వారి డేటా అసంపూర్తిగా ఉందని వారు ఎదుర్కోవలసి వచ్చింది.

చైనాలో సోషల్ మీడియా పోస్టులు వేలాది మంది ప్రజలను చేర్చాలని భావిస్తున్న ఒక భారీ రాష్ట్ర యంత్రాంగం ద్వారా సెన్సార్ చేయబడుతున్నాయనే వాస్తవంతో కింగ్ మరియు సహచరులు ప్రేరణ పొందారు. అయితే, ఏ సెన్సర్లు ఏ కంటెంట్ను తొలగించాలని నిర్ణయించుకుంటారనే దానిపై పరిశోధకులు మరియు పౌరులు తక్కువ అవగాహన కలిగి ఉన్నారు. చైనా యొక్క విద్వాంసులు వాస్తవానికి ఏ విధమైన పోస్ట్స్ తొలగించబడతాయో విరుద్ధమైన అంచనాలను కలిగి ఉంటారు. కొందరు సెన్సర్లు రాష్ట్రం గురించి విమర్శించే పోస్టులపై దృష్టి పెడుతున్నారని కొందరు అనుకుంటున్నారు, ఇతరులు నిరసనలు వంటి ఉమ్మడి ప్రవర్తనను ప్రోత్సహించే పోస్ట్లపై దృష్టి కేంద్రీకరిస్తారు. పరిశోధకులు చైనా మరియు సెన్సార్షిప్లో పాల్గొనే ఇతర అధికార ప్రభుత్వాలను ఎలా అర్థం చేసుకోవచ్చో అంచనా వేయడానికి ఈ అంచనాలకు సంబంధించిన ఖచ్చితమైన అంచనా ఉంది. అందువల్ల, ప్రచురించబడిన మరియు తొలగించబడని పోస్ట్లతో ప్రచురించబడిన మరియు తరువాత తొలగించబడిన పోస్ట్లను పోల్చడానికి రాజు మరియు సహచరులు కోరుకున్నారు.

ఈ పోస్టులకు సేకరణ వివిధ పేజీ ఇదే తరువాత తొలగించబడ్డాయి చూడండి ఈ పోస్ట్ మళ్లీ సంబంధిత పోస్ట్ లు వెల్లడించే, ఆపై కంటే ఎక్కువ 1,000 చైనీస్ సామాజిక మీడియా వెబ్సైట్లలో-ప్రతి క్రాల్ యొక్క అద్భుతమైన ఇంజనీరింగ్ ఫీట్ పాల్గొన్నారు. పెద్ద ఎత్తున వెబ్ లో ప్రాకటం సంబంధం సాధారణ ఇంజనీరింగ్ సమస్యలకు అదనంగా, ఈ ప్రాజెక్టు చాలా వేగంగా ఉండాలి అనేక సెన్సార్ పోస్ట్లు కంటే తక్కువ 24 గంటల్లో తీసివేయబడతాయి ఎందుకంటే ఆ సవాళ్ళతో కలిగి. ఇతర మాటలలో, నెమ్మదిగా క్రాలర్ సెన్సార్ చేశారు పోస్ట్లు మా కోల్పోతామని. ఇంకా, క్రాలర్ సామాజిక మీడియా వెబ్సైట్లలో ప్రాప్తిని నిరోధిస్తుంది లేదా లేకపోతే అధ్యయనం తమ విధానాలను మార్చుకోవాలని భయంవలన గుర్తింపును తిరస్కరించినందుకు అయితే అన్ని ఈ డేటా సేకరణ వచ్చింది.

ఈ భారీ ఇంజనీరింగ్ పనులు పూర్తి చేసిన సమయానికి, కింగ్ మరియు సహచరులు సుమారు 85 మిలియన్ల వివిధ రకాల వివరణాత్మక అంశాలపై 11 మిలియన్ పోస్టులను పొందారు, అవి ప్రతి ఒక్కరూ సున్నితత్వం కలిగిన స్థాయిని కలిగి ఉన్నాయి. ఉదాహరణకు, అధిక సున్నితత్వం యొక్క విషయం అసి వీయివీ, అసమ్మతి కళాకారుడు; మధ్య సున్నితత్వం యొక్క అంశం చైనీస్ కరెన్సీ ప్రశంసలు మరియు విలువ తగ్గింపు, మరియు తక్కువ సున్నితత్వం అంశం ప్రపంచ కప్. ఈ 11 మిలియన్ల పోస్టుల్లో 2 మిలియన్ల మంది తాము సెన్సార్ చేయబడ్డారు. కొంతమంది ఆశ్చర్యకరంగా, కింగ్ మరియు సహచరులు చాలా సున్నితమైన అంశాలపై పోస్ట్ మధ్యలో మరియు తక్కువ సున్నితత్వ అంశాలపై పోస్ట్లను కంటే కొంచం ఎక్కువసేపు సెన్సార్ చేయబడ్డాయి. మరో మాటలో చెప్పాలంటే, చైనీస్ సెన్సార్స్ Ai Weiwei ప్రపంచ కప్ గురించి ప్రస్తావించే పోస్ట్గా పేర్కొన్న పోస్ట్ను సెన్సార్ చేయడానికి అవకాశం ఉంది. సున్నితమైన అంశాలపై అన్ని పోస్ట్లను ప్రభుత్వం తాత్కాలికంగా నిర్దేశిస్తుందనే ఆలోచన ఈ ఫలితాలు వెల్లడించలేదు.

విషయం ద్వారా సెన్సార్షిప్ రేట్ ఈ సాధారణ గణన తప్పుదారి పట్టించేది కావచ్చు. ఉదాహరణకు, ప్రభుత్వం వీ వెయివీకి మద్దతిచ్చే పోస్టులను సెన్సార్ చేసి, అతనిని విమర్శించే పోస్ట్లను వదిలివేయవచ్చు. పోస్ట్లను మరింత జాగ్రత్తగా గుర్తించడానికి, పరిశోధకులు ప్రతి పోస్ట్ యొక్క సెంటిమెంట్ కొలిచేందుకు అవసరం. దురదృష్టవశాత్తు, ఎక్కువ పని ఉన్నప్పటికీ, ఇప్పటికే ఉన్న నిఘంటువులు ఉపయోగించి సెంటిమెంట్ గుర్తింపును పూర్తిగా ఆటోమేటెడ్ పద్ధతులు అనేక సందర్భాల్లో ఇప్పటికీ చాలా మంచివి కావు (సెక్షన్ 11.3.9 లో వివరించిన సెప్టెంబర్ 11, 2001 యొక్క ఒక భావోద్వేగ కాలక్రమం సృష్టించే సమస్యలకు తిరిగి ఆలోచించండి). అందువలన, కింగ్ మరియు సహచరులు తమ 11 మిలియన్ల సోషల్ మీడియా పోస్టులను రాష్ట్రంగా విమర్శించారు, (2) రాష్ట్ర సహాయకులు, లేదా (3) సంఘటనల గురించి అసంబద్ధమైన లేదా వాస్తవిక నివేదికలు లేదో అనేదానికి ఒక మార్గం అవసరమయ్యింది. ఇది ఒక భారీ ఉద్యోగం లాగా ఉంటుంది, కానీ అవి డేటా సైన్స్లో సాధారణం కాని సాంఘిక శాస్త్రంలో చాలా అరుదుగా ఉన్న శక్తివంతమైన ట్రిక్ ఉపయోగించి దాన్ని పరిష్కరించింది: పర్యవేక్షక అభ్యాసం ; సంఖ్య 2.5 చూడండి.

మొదట, ప్రీప్రాసెసింగ్ అని పిలవబడే ఒక అడుగులో, పరిశోధకులు సోషల్ మీడియా పోస్ట్లను డాక్యుమెంట్ టర్మ్ మ్యాట్రిక్స్గా మార్చారు, ప్రతి డాక్యుమెంట్కు ఒక వరుస మరియు ఒక నిర్దిష్ట పదం (ఉదా, నిరసన లేదా ట్రాఫిక్) . తరువాత, పరిశోధన సహాయకుల బృందం పోస్టుల మాదిరి యొక్క సెంటిమెంట్ను ముద్రించింది. అప్పుడు, వారు ఈ లక్షణాల ఆధారంగా పోస్ట్ యొక్క సెంటిమెంట్ను ఊహించగల యంత్ర అభ్యాస నమూనాను రూపొందించడానికి ఈ చేతి-లేబుల్ డేటాను ఉపయోగించారు. అంతిమంగా, 11 మిలియన్ పోస్టుల సెంటిమెంట్ను అంచనా వేయడానికి వారు ఈ నమూనాను ఉపయోగించారు.

అందువల్ల, 11 మిలియన్ పోస్టులు మాన్యువల్గా చదవడం మరియు లేబుల్ చేయడం కంటే ఇది లాజిస్టికల్గా అసాధ్యం అవుతుంది - కింగ్ మరియు సహచరులు మాన్యువల్గా తక్కువ సంఖ్యలో పోస్ట్లను లేబుల్ చేసి, అన్ని పోస్టుల సెంటిమెంట్ను అంచనా వేయడానికి పర్యవేక్షించబడే అభ్యాసాన్ని ఉపయోగించారు. ఈ విశ్లేషణ పూర్తయిన తర్వాత, వారు కొంతవరకు ఆశ్చర్యకరంగా, తొలగించబడుతున్న పోస్ట్ యొక్క సంభావ్యత, రాష్ట్రం యొక్క రాష్ట్ర లేదా సహాయక విమర్శలకు సంబంధించి సంబంధం లేదని అనుకోవచ్చు.

మూర్తి 2.5: కింగ్, పాన్ మరియు రాబర్ట్స్ (2013) ఉపయోగించిన విధానాన్ని సరళీకృతం చేయబడినవి, ఇది 11 మిలియన్ చైనీస్ సోషల్ మీడియా పోస్టుల సెంటిమెంట్ని అంచనా వేసింది. మొదట, ప్రప్రోసెసింగ్ దశలో, పరిశోధకులు సోషల్ మీడియా పోస్ట్లను డాక్యుమెంట్ టర్మ్ మ్యాట్రిక్స్గా మార్చారు (మరింత సమాచారం కోసం గ్రిమర్ మరియు స్టీవర్ట్ (2013) చూడండి). రెండవది, వారు పోస్టుల యొక్క చిన్న నమూనా యొక్క మనోభావాలను చేతితో కోడతారు. మూడవది, వారు పోస్ట్స్ యొక్క సెంటిమెంట్ని వర్గీకరించడానికి పర్యవేక్షించబడే అభ్యాస మోడల్ను శిక్షణ ఇచ్చారు. నాల్గవది, అన్ని పోస్టుల సెంటిమెంట్ని అంచనా వేయడానికి వారు పర్యవేక్షించే అభ్యాస మోడల్ను ఉపయోగించారు. కింగ్, పాన్ మరియు రాబర్ట్స్ చూడండి (2013), మరింత వివరణాత్మక వివరణ కోసం అనుబంధం B.

మూర్తి 2.5: King, Pan, and Roberts (2013) ఉపయోగించిన విధానాన్ని సరళీకృతం చేయబడినవి King, Pan, and Roberts (2013) ఇది 11 మిలియన్ చైనీస్ సోషల్ మీడియా పోస్టుల సెంటిమెంట్ని అంచనా వేసింది. మొదట, ప్రప్రోసెసింగ్ దశలో, పరిశోధకులు సోషల్ మీడియా పోస్ట్లను డాక్యుమెంట్ టర్మ్ మ్యాట్రిక్స్గా మార్చారు (మరింత సమాచారం కోసం Grimmer and Stewart (2013) చూడండి). రెండవది, వారు పోస్టుల యొక్క చిన్న నమూనా యొక్క మనోభావాలను చేతితో కోడతారు. మూడవది, వారు పోస్ట్స్ యొక్క సెంటిమెంట్ని వర్గీకరించడానికి పర్యవేక్షించబడే అభ్యాస మోడల్ను శిక్షణ ఇచ్చారు. నాల్గవది, అన్ని పోస్టుల సెంటిమెంట్ని అంచనా వేయడానికి వారు పర్యవేక్షించే అభ్యాస మోడల్ను ఉపయోగించారు. King, Pan, and Roberts (2013) , మరింత వివరణాత్మక వివరణ కోసం అనుబంధం B.

అంతిమంగా, కింగ్ మరియు సహచరులు మూడు రకాల పోస్ట్లను నిరంతరం సెన్సార్ చేయబడ్డారని తెలుసుకున్నారు: అశ్లీలత, సెన్సార్ల విమర్శలు మరియు సామూహిక చర్య సామర్థ్యం ఉన్నవారు (అనగా, పెద్ద ఎత్తున నిరసనలకు దారితీసే అవకాశం). తొలగించిన భారీ సంఖ్యలో పోస్టులు మరియు తొలగించబడని పోస్ట్లను గమనించి, కింగ్ మరియు సహచరులు సెన్సర్లు కేవలం చూడటం మరియు లెక్కించడం ద్వారా ఎలా పని చేస్తారో తెలుసుకోగలిగారు. అంతేకాకుండా, ఈ పుస్తకం అంతటా సంభవించే ఒక నేపథ్యాన్ని ముందుగానే జరపడం, పర్యవేక్షించబడిన అభ్యాస విధానం, వారు కొన్ని ఫలితాలను ఉపయోగించుకుని, డిజిటల్ యంత్రంలో సాంఘిక పరిశోధనలో మిగిలినవాటిని లేబుల్ చేయడానికి ఒక యంత్ర అభ్యాస నమూనాను రూపొందించారు. . 3 వ అధ్యాయాలలో 2.5 (ప్రశ్నలను అడగడం) మరియు 5 (సామూహిక సహకారం సృష్టించడం); ఇది బహుళ అధ్యాయాలు కనిపించే కొన్ని ఆలోచనలు ఒకటి.

ఈ ఉదాహరణలు-న్యూయార్క్లో టాక్సీ డ్రైవర్ల పని ప్రవర్తన మరియు చైనీస్ ప్రభుత్వం యొక్క సోషల్ మీడియా సెన్సార్షిప్ ప్రవర్తన-పెద్ద డేటా వనరుల సాపేక్షకంగా సరళమైన లెక్కింపు కొన్ని సందర్భాల్లో ఆసక్తికరమైన మరియు ముఖ్యమైన పరిశోధనకు దారితీస్తుంది. అయితే, రెండు సందర్భాల్లో, పరిశోధకులు పెద్ద డేటా సోర్స్కు ఆసక్తికరమైన ప్రశ్నలను తీసుకురావలసి వచ్చింది; దానికదే డేటా మాత్రం సరిపోలేదు.