2.3 Büyük verinin on ortak özelliği

Büyük veri kaynakları, ortak birtakım özelliklere sahip olma eğilimindedir; Bazıları genellikle sosyal araştırmalar için iyidir ve bazıları genelde kötüdür.

Her büyük veri kaynağı farklı olsa da, tekrar tekrar oluşmaya eğilimli belirli özelliklerin olduğunu fark etmek yararlıdır. Bu nedenle, platform-platform yaklaşımı kullanmaktan ziyade (örneğin, Twitter hakkında bilmeniz gerekenler, Google arama verileri hakkında bilmeniz gerekenler, vb.), Büyük on genel özelliği açıklayacağım. veri kaynakları. Her bir sistemin detaylarından geri adım atmak ve bu genel özelliklere bakmak, araştırmacıların mevcut veri kaynakları hakkında hızlı bir şekilde bilgi edinmelerini ve gelecekte oluşturulacak veri kaynaklarına uygulanacak sağlam bir fikre sahip olmalarını sağlar.

Bir veri kaynağının istenen özellikleri araştırma amacına bağlı olsa da, on özelliği iki genel kategoriye ayırmak yararlıdır:

  • genellikle araştırma için yararlıdır: büyük, her zaman açık ve reaktif olmayan
  • genellikle araştırma için sorunludur: eksik, erişilemez, temsili olmayan, sürüklenen, algoritmik olarak karışık, kirli ve hassas

Bu özellikleri açıkladığımdan, genellikle ortaya çıktıklarını fark edeceksiniz, çünkü büyük veri kaynakları araştırma amacıyla yaratılmadı.