2.3 بڑے ڈیٹا کے دس عام خصوصیات

بڑے اعداد و شمار کا ذرائع عام طور پر مختلف خصوصیات میں ہوتا ہے؛ کچھ عام طور پر سماجی تحقیق کے لئے اچھے ہیں اور کچھ عام طور پر خراب ہیں.

اگرچہ ہر بڑے ڈیٹا کا ذریعہ مختلف ہے، یہ یہ محسوس کرنے میں مددگار ثابت ہوتا ہے کہ بعض خاص خصوصیات ہیں جو دوبارہ اور زیادہ ہوتے ہیں. لہذا، پلیٹ فارم کی طرف سے پلیٹ فارم کے نقطہ نظر لینے کے بجائے (مثال کے طور پر، آپ کو ٹویٹر کے بارے میں جاننے کی ضرورت ہے، یہاں وہ ہے جو آپ کو Google تلاش کے اعداد و شمار کے بارے میں جاننے کی ضرورت ہے)، میں بڑے کی دس عام خصوصیات کی وضاحت کرنے جا رہا ہوں اعداد و شمار ذرائع. ہر مخصوص نظام کی تفصیلات سے واپس چلنے اور ان عام خصوصیات کو دیکھ کر محققین کو قابل بناتا ہے کہ موجودہ اعداد و شمار کے ذرائع کے بارے میں تیزی سے سیکھیں اور مستقبل میں پیدا ہونے والے اعداد و شمار کے ذرائع پر لاگو کرنے کے لئے ایک فکس قائم کریں.

اگرچہ ایک ڈیٹا ذریعہ کی مطلوبہ خصوصیات تحقیقاتی مقصد پر منحصر ہے، میں اسے دو گروہوں کو دو وسیع اقسام میں زبردست طور پر گروہ گروپ بناتا ہوں.

  • عام طور پر تحقیق کے لئے مددگار: بڑا، ہمیشہ پر، اور غیر فعال
  • عام طور پر تحقیق کے لئے مشکلات: نامکمل، ناقابل قبول، غیر جانبدار، بہاؤ، الگورتھم کی طرف سے الجھن، گندا، اور حساس

جیسا کہ میں ان خصوصیات کو بیان کر رہا ہوں آپ کو یہ محسوس ہوتا ہے کہ وہ اکثر پیدا ہوتے ہیں کیونکہ تحقیق کے مقصد کے لئے بڑے اعداد و شمار کا ذریعہ نہیں بنایا گیا تھا.