2.3.10 Həssas

Şirkətlər və hökumətlər var ki, bəzi məlumatlar həssasdır.

Tibbi sığorta şirkətləri öz müştəriləri tərəfindən alınan tibbi müalicə haqqında ətraflı məlumat əldə edirlər. Bu məlumat sağlamlıqla bağlı əhəmiyyətli tədqiqatlar üçün istifadə edilə bilər, amma ictimaiyyətə çatdıqda potensial emosional zərər (məsələn, xəcalət) və ya iqtisadi zərər (məsələn, məşğulluq itkisi) ilə nəticələnə bilər. Bir çox digər böyük məlumat mənbəyində də həssas olan məlumatlar vardır ki, bu səbəbdən onlar tez-tez əlçatmaz olurlar.

Təəssüf ki, Netflix Mükafatı ilə təsvir olunduğu kimi, məlumatın həqiqətən həssas olduğuna qərar vermək olduqca çətin olur (Ohm 2015) . Mən 5-ci fəsildə təsvir edəcəyəm kimi, Netflix 2006-cı ildə təxminən 500.000 üzv tərəfindən 100 milyon film reytinqi yayımlayıb və bütün dünyada insanların Netflixin filmləri təklif edə biləcəyi alqoritmlər təqdim etdiyini açıq bir çağırış etdi. Məlumatları buraxmadan əvvəl, Netflix adlar kimi hər hansı bir şəxsin şəxsiyyətini müəyyən edən məlumatları qaldırdı. Arvind Narayanan və Vitaly Shmatikov (2008) məlumatların yayılmasından təxminən iki həftə keçdikdən sonra, 6-cı fəsildə sizə göstərəcəyəm ki, hiyləgər bir adamın film reytinqləri haqqında öyrənmək mümkün olduğunu göstərdi. Təcavüzkar bir Şəxsin film ratings, burada hələ bir şey həssas görünmür. Bu, ümumi olaraq doğru ola bilər, baxmayaraq ki, ən azı 500.000 nəfərdən ibarət olan məlumat qrupunda filmlərin reytinqi həssasdır. Əslində, məlumatların sərbəst buraxılmasına və yenidən təyin olunmasına cavab olaraq, bağlanmış bir lesbian qadın Netflixə qarşı bir sinif hərəkətli kostyumuna qatıldı. Problemin bu iddia üzrə necə göstərildiyi (Singel 2009) :

"[M] ovie və reytinq məlumatları ... yüksək şəxsi və həssas təbiət haqqında məlumatları ehtiva edir. Üzvünün film məlumatları, Netflix üzvünün fərdi maraqlarını və / və ya cinsəllik, ruhi xəstəlik, alkoqolizmdən qurtuluş və əngəldən, fiziki istismardan, ailədə zorakılıqdan, zinaçılıqdan və təcavüzdən qurban verən müxtəlif şəxsi məsələlərlə mübarizə edir. "

Bu nümunə göstərir ki, bəzi insanlar həssas məlumat bazası kimi görünən həssas hesab edirlər. Bundan əlavə, tədqiqatçıların həssas məlumatların qeydə alınmasını qorumaq üçün istifadə etdiyi əsas müdafiənin təəccüblü şəkildə uğursuz olacağını göstərir. Bu iki fikir fəsil 6-da daha ətraflı şəkildə işlənmişdir.

Həssas məlumatlar haqqında nəzərə alınmalı olan yekun bir şey, insanların razılığı olmadan toplanmasının heç bir spesifik zərər olmasa da etik məsələləri qaldırmasıdır. Onların razılığı olmadan duş alaraq birini seyr etmək, həssas məlumatların toplanması, həssas məlumatların toplanması kimi qəbul oluna bilər və həssaslığa qərar vermənin nə dərəcədə çətin olacağını xatırlayırsınız. 6-cı fəsildə gizlilik haqqında suallara qayıdacağam.

Nəticədə, hökumət və biznes inzibati qaydalar kimi böyük məlumat mənbələri ümumiyyətlə sosial tədqiqat məqsədi ilə yaradılmır. Bu günün böyük məlumat mənbələri və ehtimal ki, sabah 10 xüsusiyyətə malikdirlər. Ümumiyyətlə, tədqiqat üçün böyük hesab olunan xüsusiyyətlərdən bir çoxu, hər zaman və reaksiya göstərməmiş, rəqəmsal yaş şirkətlərindəki faktlardan irəli gəlir və hökumətlər əvvəllər mümkün olmadığı bir miqyasda məlumat toplaya bilirlər. Ümumiyyətlə, tədqiqat-natamam, əlçatmaz, qeyri-nümayəndəlik, sürüklənən, alqoritmik cəhətdən qarışıq, əlçatmaz, çirkli və həssas olan bir çox xüsusiyyətləri tədqiqatçılar üçün tədqiqatçılar tərəfindən toplanmırdı. İndiyə qədər hökumət və iş məlumatları haqqında danışdım, amma ikisi arasında fərq var. Təcrübəmdə, hökumət məlumatları daha az nümayəndə təqdim etməməyi, daha az alqoritmik şəkildə qarışdırılmasını və daha az sürüklənməsini təmin edir. Digər tərəfdən, biznes inzibati qeydlər daha daim olmağa meyllidir. Bu 10 ümumi xüsusiyyətləri başa düşmək böyük məlumat mənbələrindən öyrənməyə kömək edəcək ilk addır. İndi biz bu məlumatlarla istifadə edə biləcəyimiz tədqiqat strategiyalarına müraciət edirik.