6.6.2 Understanding жана башкаруу маалыматтык тобокелдик

Маалымат тобокелдик коомдук изилдөө көбүнчө тобокелдик болуп саналат; аны кескин көбөйдү; бул түшүнүү кыйын тобокелдик болуп саналат.

Санариптик-курактык изилдөө үчүн экинчи этикалык маселе маалыматтык тобокелдикти, маалыматты ачыкка чыгаруудан келип чыккан зыян үчүн мүмкүн эмес (National Research Council 2014) . жеке маалыматты ачыкка чыгаруудан келип чыккан маалымат зыян экономикалык (мисалы, жумушунан айрылып) болушу мүмкүн, коомдук (мисалы, уят), психологиялык (мисалы, депрессия), ал тургай кылмыштуу (мисалы, мыйзамсыз жүрүм-туруму үчүн камакка алуу). Тилекке каршы, маалымат тобокелдик санариптик жашы көбөйөт биздин жүрүм-туруму тууралуу гана көбүрөөк маалымат түп-тамыры менен жок болот. Жана маалыматтык коркунучту түшүнүү абдан кыйын далилденген жана физикалык тобокелдик катары аналог-курактык коомдук изилдөөлөр боюнча тынчсыздануу болгон тобокелдиктер менен салыштырганда башкаруу элек.

Коомдук изилдөөчүлөр маалыматтык тобокелдикти азайтуу бир жолу маалыматтар «жөнсүз» болуп саналат. «Жөнсүз» деген аталышы, дареги, алынган маалыматтардын телефон номери ачык жеке аныктагычтарды салуу жараяны болот. Бирок, бул ыкма көп адамдар ойлогондон алда канча аз натыйжалуу болуп саналат, ал эми иш жүзүндө бул болуп саналат, катуу жана негизинен чектелген. Ошол себептен, мен айтып сайын «жөнсүз,» мен бул жараян атын атагысы келбеген, бирок чыныгы анонимдүүлүк көрүнүшүн түзөт бербээрин эскерте тырмакчага колдонобуз.

"Жөнсүз" ийгиликсиз бир айкын мисал Массачусетстеги 1990-жылдардын аягында чыккан (Sweeney 2002) . Group камсыздандыруу комиссиясы (тегиялык) бардык мамлекеттик кызматкерлер үчүн ден-соолук камсыздандырууну сатып алуу үчүн жооптуу мамлекеттик орган болуп саналат. Бул иш аркылуу тегиялык мамлекеттик кызматкерлердин ми тууралуу толук соолугун чогултулган. изилдөө түрткү максатында тегиялык изилдөөчүлөр бул жазууларды бошотуу чечимин кабыл алды. Бирок, алар маалыматтардын баарын айтып берген эмес; тескерисинче, алар, мисалы, аталыштары жана даректери, ошондой маалыматтарды алып салуу менен бул маалыматтарды "атынан". Бирок, алар ушундай жүрүм-маалымат (Почта индекси, туулган датасын, улутуна, алар менен жыныстык мамиле) эле изилдөөчүлөр үчүн пайдалуу болушу мүмкүн жана медициналык маалымат (сапары маалыматтар, диагностикасы, жол-жобосу) (сүрөт 6.4) башка маалымат калтырган (Ohm 2010) . Тилекке каршы, бул "жөнсүз" маалыматты коргоо үчүн жетиштүү эмес.

Figure 6.4: жөнсүз, албетте, маалыматтарды аныктоо алып салуу жараяны болот. Мисалы, мамлекеттик кызматкерлердин медициналык камсыздандыруу жазууларды бошотуп жатканда, Массачусетс Group камсыздандыруу комиссиясы (тегиялык) көчүрүп алып, аты-жөнүн, дарегин алып. жараян атын атагысы келбеген көрүнүшүн камсыз кылат, бирок иш жүзүндө анонимдүү, анткени мен сөз жөнсүз тырмакчага колдонушат.

Figure 6.4: "жөнсүз", албетте, маалыматтарды аныктоо алып салуу жараяны болот. Мисалы, мамлекеттик кызматкерлердин медициналык камсыздандыруу жазууларды бошотуп жатканда, Массачусетс Group камсыздандыруу комиссиясы (тегиялык) көчүрүп алып, аты-жөнүн, дарегин алып. жараян атын атагысы келбеген көрүнүшүн камсыз кылат, бирок иш жүзүндө анонимдүү, анткени мен сөз "жөнсүз" тырмакчага колдонушат.

Тегиялык "жөнсүз" кемчиликтерин түшүнүү үчүн, ЛаТаня Суини-бир бүтүрүүчү 20 $ MIT төлөнүүчү студенттик Кембридж шаарында добуш берүү эсебин алууга, Массачусетс башкаруучусу William сенат киндик каны. Бул добуш берүү кагаздарын, мисалы, аты-жөнү, дареги, почталык индексин, туулган датасын, жана гендердик маалымат камтылган. медициналык маалымат билэ чындык экенин жана шайлоочуларды билэ талаалары-индекс коду бөлүштү, туулган датасы, секс-билдирген Суини байланыштырууга мүмкүн. Суини сенат туулган күнү 31-июлда экенин билгендиктен, 1945-жылы, ал эми добуш берүү кагаздарын ошол туулган менен Кембридж гана алты киши кирген. Андан тышкары, алты киши, үч гана эркек болгон. Ал эми, ошол үч киши келип, бир гана жалгыз анын индексти бөлүштү. Ошентип, добуш маалыматтар туулган датасын, гендердик жана индекс кодексинин сенат анын айкалышындагы медициналык маалыматтарды ким William сенат экенин көрсөттү. Кыскача айтканда, бул маалыматтар үч даана маалыматтарды ага өзгөчө манжа каралган. Бул чындыкты колдонуп, Суини анын и ага билдирүүгө, сенат анын медициналык эсебин таап, жана алган, ал ага жазуулардын көчүрмөсүн почтама келген (Ohm 2010) .

Сүрөт 6,5: анонимдүү маалыматтарды Re-idenification. ЛаТаня Суини атынан саламаттык сактоо эсепке алынып, шартка губернатору William сенат жана медициналык жазууларды таба үчүн добуш берүү кагаздары менен бирге Суини (2002) айкалыштырып, сүрөттө 1.

Сүрөт 6,5: Re-idenification "атынан" маалыматтарды. ЛаТаня Суини "атынан" саламаттык сактоо жазууларды губернатору William сенат алынып, шартка карата медициналык жазууларды таба үчүн добуш берүү кагаздарын менен бирге Sweeney (2002) , сүрөттө 1.

Суини иши компьютер коопсуздук коомуна чейинки мөөнөткө кабыл критерийлерине кайрадан аныктоо чабуулдардын негизги структурасын көрсөтүп турат. Бул кол салуулар, эки маалыматтар топтому, сезимтал маалыматтарды өзү ачып, алардын да тыгыз байланышта болуп, бул байланыштырбастан аркылуу, кылдат маалымат дуушар болуп турат.

Суини иши, жана аны менен байланышкан иштерди аткаруу үчүн, изилдөөчүлөр көбүнчө маалыматтык баары алда канча көп алып деп аталган "жеке аныктоочу маалыматты" (Pii) (Narayanan and Shmatikov 2010) жараянын -during "жөнсүз." Андан сырткары, көптөгөн изилдөөчүлөр азыр кээ бир маалыматтар, мисалы, мыйзамсыз тууралуу суроолор сурамжылоонун медициналык жазууларды, каржылык отчеттордун, жооп катары, балким, кийин да, бошотуп жиберүү да кылдат жүрүм-тукум экенин билишет ", жөнсүз." Бирок, коомдук изилдөөчүлөр Мен берип жатам мисалдар сунуш керек алардын ой жүгүртүүсүн өзгөртүү. Алгачкы кадам катары, ал бардык маалыматтарды мүмкүн аныктоочу болуп саналат жана бардык маалыматтар болушу мүмкүн деп болжолдоого акылдуулукка жатат. Башка сөз менен айтканда, тескерисинче, бул маалыматтык коркунучун ойлонуп отурбай долбоорлорду чакан топторду тиешелүү, биз кайсы бир баардыгы турган долбоорлордун даражасына чейин тиешелүү деп ойлойбуз керек.

Бул кайра эки аспектилери Netflix сыйлыгынын мисалында ачык көрүүгө болот. 5-бөлүмдө айтылгандай, Netflix дээрлик 500,000 мүчөлөрү тарабынан берилген 100 млн кино рейтингин чыгарды, бүт дүйнө жүзүндөгү адамдар тасмалар сунуш Netflix жөндөмүн жакшыртууга мүмкүн алгоритмдерди берилген ачык чалуу болгон. маалыматтарды жарыялаардан мурун, Netflix аттары, мисалы, кандайдыр бир айкын жеке аныктоо маалымат жок. Ошондой эле кошумча кадам барып жазылган кээ бир аз өзгөрүүлөрдү (мисалы, 3-жылдыз 4 жылдыздар айрым баалоо өзгөртүү) киргизилет. Алар жакында табылган, бирок, алардын күч-аракетине карабастан, маалымат жок тарабынан дагы эле жашыруун билдирет.

Маалыматтар бошотулгандан кийин, эки жума, Arvind Narayanan жана Сеок Shmatikov (2008) , ал белгилүү бир адамдардын кино артыкчылык жөнүндө билүүгө мүмкүн экенин көрсөттү. аларды кайра аныктоо кол куулук Суини окшош эле: эки маалымат булактарын, бир адамдардын аты жөнүн бар болушу мүмкүн болгон маалыматтарды, эч кандай ачык маалымат аныктоо жана бири менен бириктирилген. Бул маалымат булактарын ар бири өз-өзүнчө коопсуз болушу мүмкүн, бирок алар айкалышкан кийин, бириктирилген танышуусуна маалыматтык ыктымал. Netflix маалыматтар болгон учурда, бул жерде болушу мүмкүн экенин болот. Мен чогуу-кызматкерлери менен иш-аракет жана күлкүлүү тасмалар жөнүндө өз ойлорумду бөлүшүү үчүн тандап алган дейли, бирок диний жана саясий тасмалар жөнүндө өз оюмду айтып койсом, деп. Мени менен кызматташып, мен Netflix маалыматтар менин жазууларды таба алар менен бөлүшкөн маалыматты тийиши мүмкүн; Мен бөлүшө маалымат жөн гана William сенат туулган датасы сыяктуу өзгөчө манжа изи болушу мүмкүн, Почта индекси, алар менен жыныстык мамиле. Андан кийин, алар маалыматтарды менин өзгөчө манжа ашык болсо, анда мен алар менен бөлүшүү үчүн, тандап алган тасмалар, анын ичинде бардык кино, менин рейтинги үйрөнө алган жок. Бир адамга багытталган максаттуу кол Мындай тышкары, Narayanan жана Shmatikov Ошондой эле кээ бир адамдар тандап алган жеке жана рейтинг маалыматтар менен Netflix маалыматтарды бириктирип, көптөгөн адамдар менен байланыштуу кенен чабуул таптым кылууга мүмкүн экенин көрсөткөн Internet Movie Database (IMDb) жөнүндө пост жазуу үчүн. Жообу жөнөкөй эле, кино белгилүү бир адамга, атүгүл алардын топтому уникалдуу манжа кайсы бир маалымат рейтинги-алат, аларды аныктоо үчүн пайдаланылышы мүмкүн эмес.

Netflix маалыматтар максаттуу же жалпы кол да кайра-таанууга болот да, ал дагы эле аз тобокелдик болуп көрүнүшү мүмкүн. Анткени, кино рейтингдери өтө кылдат көрүнгөн жок. бул жалпы чындык болушу мүмкүн, ал эми танышуусуна-жылы 500,000 элден да бир нече адам үчүн, кино рейтингдери өтө сезимтал болушу мүмкүн. Чынында, кайра-аныктоо үчүн жооп, бир Жашырынган лесбиянка аял Netflix каршы класс-аракет доо кошулду. Бул жерде маселе аларды сотко билдирген кантип (Singel 2009) :

"[M] Ovie жана рейтинги маалыматтар ... жогорку жеке жана сезимтал мүнөздөгү маалыматтарды камтыйт. Колдонуучунун кино маалыматтар Netflix Колдонуучунун жеке кызыкчылыгын жана / же күрөш, анын ичинде жыныстык ар кандай жогорку жеке маселелер менен, психикалык оору, жакын чейин алкоголизмден казып алууга, ошондой эле жапа, зомбулук, үй-бүлөдөгү зордук-зомбулук, ойноштук, зордуктоо дуушар кылат. "

Netflix сыйлыгынын маалыматтарды кайрадан аныктоо бардык маалыматтар да турат мүмкүн аныкталуучу жана бардык маалыматтар болушу мүмкүн деп жатышат. Бул учурда, бул бир гана адамдар тууралуу болуп такыр укпаптырбыз, маалыматтар тиешелүү деп ойлошу мүмкүн. Кызыгы, бул туура эмес. Маалыматтык укук талабы менен эркин аткаруу үчүн, New York City Өкмөтү 2013-жылы New York ар бир такси алгачкысы жазып чыккан, кетүүгө, анын ичинде жана жолу жок түшүрүп, жерлерди жана 2-баптагы баасы сумманы (чакырыкты Farber (2015) колдонулган окшош маалыматтар эмгек экономика) маанилүү теорияларды сынаш үчүн. Алар адамдар тууралуу маалымат берүү үчүн эмес окшойт, себеби, каттамга билбегендер сезилиши мүмкүн жөнүндө маалыматтар, ал эми Энтони Tockar бул такси танышуусуна, чындыгында адамдар тууралуу болушу мүмкүн болгон маалыматтарды, өкчөмө таш бар экенин түшүндүм. Мисал үчүн, ал түн ортосунда Йорк-Эсте Устлер Club-бир чоң тилкеси клуб баштап бардык жол жүрүүдөгү карап жана 6 саат, анан таштап кетип жерлерди таап алышкан. Устлер Club көп кээ бир адамдардын даректерин Бул издөө негизи бир тизмесине-ачып берген (Tockar 2014) . Бул маалыматтарды бошотуп жатканда, шаардык бийлик эске бул бар экенин элестетүү кыйын. Чынында, бул бир эле ыкмасы шаар-бир медициналык клиника, өкмөт имаратынын, же диний уюмдун бир зыярат адамдардын үй дарегин табууга үчүн колдонулушу мүмкүн.

Бул эки Netflix сыйлыгы жана New York City такси салыштырмалуу жөндөмдүү адамдар турат маалыматтар иши туура, алар менен бошотуп Мындай учурларда эч кандай өзгөчө билдирет тарабынан маалыматтардын маалыматтык коркунучун баалоо калышы мүмкүн (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Андан сырткары, көптөгөн мындай учурларда, көйгөйлүү маалыматтар бир маалымат бошотуу жоюп татаалдыгын көрсөтүү онлайн дагы эркин жеткиликтүү. Жалпысынан бул мисалдар, ошондой эле өтө маанилүү бир жыйынтыкка купуялык-коргошундун компьютер илим изилдөө. Окумуштуулар бардык маалыматтарды мүмкүн аныктоочу болуп саналат жана бардык маалыматтар болушу мүмкүн деп ойлобошубуз керек.

Тилекке каршы, бардык маалыматтарды мүмкүн аныкталуучу жана бардык маалыматтар болушу мүмкүн экен чындыкты эч кандай жөнөкөй чечим жок. Бирок, маалыматтар менен иштеп жатат, ал эми маалыматтык рискин төмөндөтүү үчүн бир жолу түзүү жана маалыматтарды коргоо планын жолдоо. Бул план сиздин чыгышы жана агып кандайдыр бир жол менен пайда болгон болсо, зыян азаят турган мүмкүнчүлүгү азаят. Мындай эсе түрү пайдалануу сыяктуу маалыматтарды коргоо пландарынын өзгөчөлүгү, убакыттын өтүшү менен өзгөрүп турат, ал эми Улуу Британия маалыматтар Services тийген беш болунуп деп беш категорияга маалымат коргоо планынын элементтери уюштурат: коопсуз долбоорлорду, коопсуз адамдар коопсуз орнотуулары, коопсуз маалыматтарды, жана коопсуз жыйынтыктар (стол 6.2) (Desai, Ritchie, and Welpton 2016) . беш болунуп бири өз-өзүнчө толук коргоону камсыз кылат. Бирок, алар маалыматтык коркунучун азайтууга болот себептерден күчтүү топтомун түзөт.

Table 6.2: "Беш болунуп" долбоорлоонун негиздери жана аткаруучу бир маалыматтарды коргоо планы (Desai, Ritchie, and Welpton 2016)
аман-эсен Аракет
Коопсуз долбоорлор этикалык деп ошол маалыматтар менен долбоорлорду чектейт
Ишенимдүү адамдар Мүмкүндүк маалыматтар менен ишеничтүү адамдар менен чектелген (мисалы, этикалык даярдыктан өткөн адам)
Ишенимдүү маалымат Маалыматтар жана мүмкүн болушунча жалпыланган-аныкталган де жатат
Коопсуз орнотуулары Маалыматтар тиешелүү физикалык (мисалы, бекитип орун) менен эсептөө сакталат жана программалык (мисалы, Сырсөз менен коргоо, ИП) коргоо
Коопсуз чыгаруу Изилдөө чыгаруу кокусунан купуялык бузулган алдын алуу каралып жатат

сен аларды колдонуп жаткан учурда сиздин маалыматтарды коргоого Мындан тышкары, маалыматтык тобокелдик мүнөздүү коркутуулар болуп изилдөө бир кадам башка изилдөөчүлөр менен маалымат бөлүшүү болуп саналат. окумуштуулар арасында Маалымат алмашуу илимий ишмердүүлүгүнүн негизги мааниси, ал абдан билимдин ийгилик көмөктөшөт. Бул жерде жамааттар UK House кантип маалымат маанилүүлүгүн сүрөттөлгөн (Molloy 2011) :

"Изилдөөчүлөр, кайра текшерүү жана адабияты маселе боюнча жыйынтыгы боюнча кура турган болсо, маалыматтарга жетүү абдан маанилүү. жоромолу деп, башка бир күчтүү себеп болбосо, маалымат толугу менен ачылган жана зарыл жалпыга жеткиликтүү болушу керек. "

Бирок, дагы бир изилдөөчү менен маалыматтарды таратуу менен, сиз катышуучуларга маалымат тобокелдигин жогорулатуу мүмкүн. Демек, маалымат бөлүшүү катышуучуларынын маалыматтык коркунучун азайтуу үчүн башка окумуштуулар жана милдеттенмеси менен маалыматтарды бөлүшүү үчүн милдеттүү ортосундагы негизги талаш сезилиши мүмкүн. Бактыга жараша, бул жөн эле пайда оор эмес. Тескерисинче, ал катышуучуларга коом жана тобокелдиктин пайда болгон ар кандай аралашмасынан (сүрөт 6.6) камсыз кылуу үчүн үзгүлтүксүз боюнча ар бир көз караш менен үзгүлтүксүз, бирге кулап бөлүшүп маалыматтар жөнүндө ойлонуу жакшы.

бир өтө эле учурда, сиз катышуучуларга коркунучун азайтып, эч ким, менен бөлүшүшү мүмкүн, бирок, ошондой эле, коом үчүн кирешелерден тырат. Башка өтө эле учурда, сиз маалымат "атынан" жана ар бир жайгаштырылган кайда, бошотуп, унутушу мүмкүн. маалыматтарды бошотуу эмес, салыштырмалуу, бошотуу жана катышуучуларына коомдун жогорку пайда да сунуштарды жана жогорку коркунучу унутуп. Бул эки өзгөчө учурларда ортосунда Мен дубал менен курчалган бакча мамиле чалам кандай, анын ичинде, гибриддердин бир катар болуп саналат. Мындай мамиленин негизинде маалымат белгилүү бир эрежелерге (мисалы, бир Турнир жана маалыматтарды коргоо планынан көзөмөл) менен макул белгилүү бир критерийлерге жана жолуктурган адамдар менен бөлүшүлгөн. менен курчалган бакча мамиле чыгарууну пайданы көп берет жана азыраак тобокелдик унутпагыла. Албетте, мындай ыкма менен курчалган бакка сактоо жана ички иштер төлөөгө тийиш, жана башкалар, бирок бул опол тоодой эмес, көп мүмкүнчүлүгү болушу керек-суроолор, шарттары, жана канча убакытка чейин эмне астында, жараткан. Негизи, буга чейин окумуштуулар азыр, мисалы, Мичиган атындагы саясый жана коомдук изилдөөлөр боюнча эл аралык университет бирикмесинин маалыматтары чыкпаган катары колдоно аласыз жерде дубал менен курчалган бакчаларды иш бар.

Figure 6.6: Data релиз стратегиялары жүргүзүлүүчү үзгүлтүксүз өтүп кетиши ыктымал. Бул үзгүлтүксүз болушу керек кайда маалыматтардын атайын маалымат көз каранды, ошондой эле үчүнчү жактын карап чыгуу Сиз учурда тобокелдик жана пайда туура балансын чечүүгө жардам берет. Бул сызыгын так түрүндө маалымат берүү жана илимий-изилдөө максаттары өзгөчөлүгүнө (Goroff 2015) көз каранды.

Figure 6.6: Data релиз стратегиялары жүргүзүлүүчү үзгүлтүксүз өтүп кетиши ыктымал. Бул үзгүлтүксүз болушу керек кайда маалыматтардын атайын маалымат көз каранды, ошондой эле үчүнчү жактын карап чыгуу Сиз учурда тобокелдик жана пайда туура балансын чечүүгө жардам берет. Бул сызыгын так түрүндө маалымат берүү жана илимий-изилдөө максаттары өзгөчөлүгүнө көз каранды (Goroff 2015) .

Ошондуктан, бул жерде сиздин изилдөөнүн маалыматтары жок бөлүшүү, дубал менен курчалган бактын континуум болушу керек, жана бошотуу, ошондой эле унутуп? Бул маалыматтарды майда-каранды: изилдөөчүлөр адамдардын урмат баланс керек, кам көрүү, адилеттиги жана Мыйзам жана коомдун кызыкчылыгы үчүн урмат. Бул көз караштан алганда, маалымат бөлүшүү айырмалоочу этикалык жыла эмес; эле изилдөөчүлөр тиешелүү этикалык салмактуулукту табууга ээ болгон изилдөөлөргө көп нерселердин бири болуп саналат.

Айрым сынчылар жалпысынан менин көз карашымда, анткени маалымат каршы, алар анын тобокелдиктерге-, албетте, чыныгы жана болуп багытталган, анын пайда көрмөксөн болуп жатышат. Демек, экөө тең тобокелдиктерди жана пайданы басым кайраттандырыш үчүн, Мен бир мисал сунуш кылгым келет. Жыл сайын, унаалар каза ми үчүн жооп берет, бирок, биз айдоо тыюу аракет жок. Чынында, айдоо тыюу салууга чакырык айдап көптөгөн кереметтүү нерселерди берет, анткени акылсыздык болмок. Тескерисинче, коомдун кууп ким боюнча чектөөлөр (мисалы, зарыл бир жашы болуу жана айрым сыноолордон өткөн болушу керек), алар кууп кантип (мисалы, ылдамдыгы чегине ылайык) таратат. Коом, ошондой эле бул эрежелерди (мисалы, полиция) ишке ашыруу жүктөлгөн адамдар бар, биз аларды бузуп кармалган адамдарды жазалоо. коом айдоо жөнгө салуучу тиешелүү салмактуу ой Ошол эле түрү да маалыматтарды бөлүшүү үчүн колдонулушу мүмкүн. Бул, балким, же маалымат каршы абсолюттук далилдерди кабыл алуу эмес, мен биз тобокелдиктерди төмөндөтүүгө жана маалымат пайда көбөйтүү кантип басым жасоо менен көпчүлүк ийгилик жасоого болот деп ойлойм, болот.

Жыйынтыктасак, маалыматтык тобокелдик кескин көбөйгөн, ал алдын ала жана сандык баалоо үчүн абдан кыйын. Ошондуктан, бардык маалыматтарды мүмкүн аныкталуучу жана кычыктуу болушу мүмкүн деп болжолдоого жакшы. изилдөө жүргүзүп, ал эми маалыматтык тобокелдигин төмөндөтүү үчүн, изилдөөчүлөр түзүү жана маалыматтарды коргоо планына ылайык иш кыла алабыз. Андан тышкары, маалыматтык тобокелдиктин башка окумуштуулар менен маалыматтарды алмашуу келген изилдөөчүлөргө тоскоолдук кылбайт.