2.3.2.3 غیر نمائندے

غیر نمائندگان کے دو ذرائع مختلف آبادیوں اور مختلف استعمال کے پیٹرن ہیں.

بگ ڈیٹا کو منظم طریقے سے دو اہم طریقوں میں جانبدار ہو جاتے ہیں. یہ تجزیہ کے تمام قسم کے لئے ایک مسئلہ کی وجہ سے نہیں کی ضرورت ہے، لیکن کچھ تجزیہ کے لئے یہ ایک اہم دوش ہو سکتا ہے.

منظم تعصب کا پہلا ذریعہ گرفتار کر لیا لوگ عام طور پر تمام لوگوں کا ایک مکمل کائنات یا کسی مخصوص آبادی سے ایک بے ترتیب نمونے نہ تو ہیں یہ ہے کہ. مثال کے طور پر، ٹویٹر پر امریکیوں امریکیوں کے بے ترتیب نمونے نہیں ہیں (Hargittai 2015) . منظم تعصب کی ایک دوسرا ذریعہ بہت بڑی ڈیٹا سسٹمز کے اعمال پر قبضہ کرتا ہے، اور کچھ لوگوں کو دوسروں کے مقابلے میں بہت زیادہ اعمال میں شراکت. مثال کے طور پر، ٹویٹر پر کچھ لوگوں کو دوسروں کے مقابلے میں گنا زیادہ ٹویٹس کے سینکڑوں میں شراکت. لہذا، ایک مخصوص پلیٹ فارم پر واقعات کے پلیٹ فارم خود سے بھی بعض subgroups کے کبھی زیادہ بھاری عکاس ہو سکتا ہے.

عام طور پر محققین وہ ہے کہ اعداد و شمار کے بارے میں بہت کچھ جانتے کرنا چاہتے ہیں. لیکن، بڑی ڈیٹا کی عدم نمائندے نوعیت دیا، یہ مددگار بھی اپنی سوچ کو بدل ہے. تم نے بھی اعداد و شمار آپ کی ضرورت نہیں ہے اس کے بارے میں ایک بہت کچھ جاننے کی ضرورت ہے. اعداد و شمار کو آپ کی ضرورت نہیں ہے کہ آپ کو کیا ضرورت ہے کہ اعداد و شمار سے منظم طریقے سے مختلف ہیں جب یہ خاص طور پر سچ ہے. مثال کے طور پر، آپ کو ایک ترقی پذیر ممالک میں ایک موبائل فون کمپنی سے کال ریکارڈ ہے تو، آپ کو صرف آپ کے ڈیٹا سیٹ میں لوگوں کے بارے میں، بلکہ لوگوں کو ایک موبائل فون کے مالک کے لئے بہت غریب ہو سکتا ہے اس بارے میں سوچنا چاہیے. اس کے علاوہ، باب 3 میں، ہم کس طرح weighting کے غیر نمائندے ڈیٹا سے بہتر اندازوں کے بنانے کے لئے محققین فعال کرسکتے ہیں کے بارے میں پتہ چل جائے گا.