2.3 ده ویژگی مشترک از داده های بزرگ

منابع داده بزرگ به نظر می رسد تعدادی از ویژگی های مشترک دارند؛ بعضی ها به طور کلی برای تحقیقات اجتماعی خوب هستند و بعضی دیگر به طور کلی بد هستند.

هرچند هر منبع داده بزرگ متمایز است، مفید است که متوجه شوید که خصوصیات خاصی وجود دارد که تمایل دارند دوباره و دوباره رخ دهند. بنابراین، به جای استفاده از رویکرد پلت فرم به وسیله پلت فرم (به عنوان مثال، در اینجا چیزی است که شما باید در مورد توییتر بدانید، در اینجا چیزی است که شما باید در مورد اطلاعات جستجوی Google بدانید و غیره)، من می خواهم به توصیف ده ویژگی کلی بزرگ منابع اطلاعات. از جزئیات هر یک از سیستم های خاص و به دنبال این ویژگی های عمومی می توانید محققان سریعا در مورد منابع داده موجود یاد بگیرند و مجموعه ای از ایده ها را برای استفاده از منابع داده ای که در آینده ایجاد می شود، به کار گیرند.

هرچند ویژگی های مورد نظر یک منبع داده به اهداف تحقیق بستگی دارد، به نظر می آید که ده ویژگی به طور دسته جمعی به دو دسته گسترده تقسیم می شود:

  • به طور کلی برای تحقیق مفید است: بزرگ، همیشه در و غیر فعال
  • به طور کلی برای تحقیقات مشکل ساز است: ناقص، غیرقابل دسترس، غیر نماینده، روان، الگوریتمی غلط، کثیف و حساس

همانطور که من این خصوصیات را توصیف می کنم متوجه می شوید که اغلب آنها بوجود می آیند چون منابع داده ای بزرگ برای تحقیق ایجاد نشده اند.