2.3.2.7 Hassas

Şirketler ve hükümetler olması bilgilerden bazıları duyarlıdır.

Sağlık sigortası şirketleri müşterileri tarafından alınan tıbbi bakım hakkında ayrıntılı bilgi var. This bilgi sağlığı hakkında önemli araştırmalar için kullanılan olabilir, ancak kamu oldu eğer potansiyel duygusal zarar (örneğin, utanç) ve ekonomik zararın (istihdam, örneğin kaybı) neden olabilir. Uzak farklı, çok büyük veri kaynaklarından duyarlı bilgiler var. Bu bilgilerin hassas doğası, büyük veri kaynakları (yukarıda anlatılan) genellikle erişilemez olduğunu nedenlerinden biri de budur.

Araştırmacılar bu durumla başa çıkmak için girişimi bir yolu hassas bilgilere sahip de-tespit gerçekleştirmede etmektir. Ama, ben Bölüm 6 (Etik) ciddi ölçüde sosyal bilimciler ve veri bilim adamları tarafından takdir edilmez şekillerde sınırlı bu yaklaşım ayrıntılı olarak göstereceğim gibi.

Sonuç olarak, bugün (ve yarının) büyük veri kaynakları genellikle on özelliklere sahiptir. iyi özellikleri-büyük, her zaman açık ve çoğu dijital çağda şirketlerin aslında reaktif olmayan-gel ve hükümetler daha önce mümkün olmayan bir ölçekte veri toplamak mümkün. Ve, kötü özellikleri-eksik, ulaşılmaz olmayan temsilcisinin çok, algoritmik, ulaşılmaz, kirli ve hassas-gel veri araştırmacılar için araştırmacılar tarafından toplanan olmadığı gerçeğinden, şaşırmış sürüklenen. Anlamak bu özellikler büyük verilerden öğrenme için gerekli bir ilk adımdır. Ve şimdi biz bu verilerle kullanabileceğiniz stratejileri araştırma açın.