2.3.2.3 కాని ప్రతినిధి

కాని representativeness రెండు ఆధారాలు వివిధ జనాభాలు మరియు వివిధ వాడుక నమూనాలను ఉన్నాయి.

బిగ్ డేటా క్రమపద్ధతిలో రెండు ప్రధాన మార్గాల్లో పక్షపాతంతో దర్శనమిస్తాయి. ఈ విశ్లేషణ అన్ని రకాల కోసం ఒక సమస్య కారణం లేదు, కానీ కొన్ని విశ్లేషణ కోసం విమర్శనాత్మకంగా దోషం ఉంటుంది.

క్రమమైన పక్షపాతాన్ని ఒక మొదటి మూలం స్వాధీనం వ్యక్తులు సాధారణంగా అన్ని ప్రజల ప్రాముఖ్యత పూర్తిగా విశ్వం లేదా ఏ నిర్దిష్ట జనాభా నుండి యాదృచ్చిక మాదిరి కావు అని. ఉదాహరణకు, ట్విట్టర్ లో అమెరికన్లు అమెరికన్ల యొక్క ఒక యాదృచ్చిక నమూనా (Hargittai 2015) . క్రమమైన పక్షపాతాన్ని యొక్క రెండవ మూల కొందరు ఇతరుల కంటే మరింత చర్యలు దోహదం అనేక పెద్ద డేటా సిస్టమ్స్ పట్టుకోవటం చర్యలే, మరియు. ఉదాహరణకు, ట్విట్టర్ లో కొన్ని ఇతరులు కంటే రెట్లు ఎక్కువ ట్వీట్లు వందల దోహదపడుతున్నాయి. అందువలన, ఒక నిర్దిష్ట వేదికపై ఈవెంట్స్ వేదిక కూడా కంటే కొన్ని ఉపవిభాగాలు యొక్క మరింత భారీగా ప్రతిబింబ ఉంటుంది.

సాధారణంగా పరిశోధకులు వారు కలిగి ఆ డేటా గురించి చాలా తెలుసుకోవాలంటే. కానీ, పెద్ద డేటా కాని ప్రతినిధి స్వభావం వలన, అది కూడా ఉపయోగపడిందా మీ ఆలోచన కుదుపు ఉంది. మీరు కూడా లేని డేటా గురించి చాలా తెలుసుకోవాలి. మీరు కలిగి లేదు ఆ డేటాను మీరు కలిగి లేని డేటా నుండి క్రమపద్ధతిలో భిన్నంగా ఉంటాయి ఈ ప్రత్యేకించి వర్తిస్తుంది. ఉదాహరణకు, మీరు ఒక అభివృద్ధి చెందుతున్న దేశాలలో ఒక మొబైల్ ఫోన్ కంపెనీ నుండి కాల్ రికార్డులు కలిగి ఉంటే, మీరు కేవలం మీ డేటాసెట్ ప్రజలు గురించి, కానీ కూడా ఒక మొబైల్ ఫోన్ స్వంతం బాగా తక్కువగా గల వ్యక్తుల గురించి భావించాలని. ఇంకా, 3 వ అధ్యాయంలో, మేము వైటింగ్ కాని ప్రతినిధి డేటా నుండి మంచి అంచనాలు తయారు పరిశోధకులు ప్రారంభించవచ్చు ఎలా తెలుసుకోవడానికి ఉంటాం.