2.3 بڑی ڈیٹا کی کامن خصوصیات

بڑے اعداد و شمار ذرائع دس خصوصیات کر دیتے ہیں؛ کچھ سماجی تحقیق کے لئے اچھے ہوتے ہیں اور کچھ برے ہیں.

محققین بڑی ڈیٹا سے سیکھنے کے لئے ہے کہ ان کے تخلیق یا جمع نہیں کیا جا رہے ہیں، تو وہ اس کے عام خصوصیات کو سمجھنا چاہیے. بلکہ پلیٹ فارم کے نقطہ نظر کی طرف سے ایک پلیٹ فارم لینے سے (مثلا، یہاں آپ ٹویٹر کے بارے میں جاننے کی ضرورت کیا ہے، یہاں آپ کو گوگل کے تلاش کے اعداد و شمار، وغیرہ کے بارے میں جاننے کی ضرورت ہے)، میں بڑے اعداد و شمار کے دس جنرل خصوصیات، پیدا ہوتی ہے کہ خصوصیات کی وضاحت کرنے جا رہا ہوں اعداد و شمار کے سماجی تحقیق کے مقصد کے لئے پیدا نہیں کیا گیا تھا کیونکہ. ہر خاص نظام کی تفصیلات سے واپس نکلنے اور ان عام خواص پر دیکھ کر، محققین فوری طور پر موجودہ اعداد و شمار ذرائع کے بارے میں مزید جاننے کے لئے اور مستقبل کے اعداد و شمار کے ذرائع پر لاگو کرنے کے خیالات کی ایک فرم سیٹ ہو سکتا ہے.

میں نے اس گروپ پر دو اقسام میں خصوصیات کے مددگار مل:

  • ہمیشہ پر، غیر رد عمل بڑا،: تحقیق کے لئے عام طور پر اچھا
  • عام طور پر برا تحقیق کے لئے: نامکمل، ناقابل رسائی، غیر نمائندے، بہتی، الگوردھمک، رسوا، ناقابل رسائی گندی، اور حساس

موٹے طور پر، حکومت انتظامی ریکارڈ بھی کم غیر نمائندے، کم الگوردھمک شرمندہ، اور کم بہتی ہیں. دوسری طرف، کاروبار انتظامی ریکارڈ ہمیشہ پر بڑے اور زیادہ ہو جاتے ہیں.