6.6.2 capisci soccu e gistioni risicu nfurmativu

Risummu informativu hè u riscu più cumuni in a ricerca suciale; hà cresciute drammaticamente; è hè u riscu più duru per capiscenu.

U sicuru risposta etica per a ricerca di l'età digitale hè u risultatu informativu , u puderevule per u danu da a divulgazione d'informazioni (National Research Council 2014) . Oghje infurmazione nantu à a divulgazione di l'infurmazione persunale puderia esse ecunomicu (per esempiu, perde un travagliu), suciali (per esempiu, vrollà), psicologicu (per esempiu, di depressioni), o ancu criminali (per esempiu, arrestu per u cumpurtamentu illegale). Sfurtunatamente, l'età di digitale aumenta u raportu informativamente dramàticamente-ci hè più assai più infurmazione nantu à u nostru travagliu. U risorsu informativu hè compruciutu assai difficiuli di cumprenderà è gestione cumparatu cù i risichi chì anu prublemi in a ricerca suciale di l'analogicu età, cum'è risicu fisicu.

Una manera chì circadori suciale favuritu risicu nfurmativu è "anonymization" di dati. "Anonymization" hè u prucessu di toglie còdici persunali, è turnà cum'è nome, indirizzu, è nùmeru liberta da i dati. A ogni modu, stu approcciu hè tantu menu vere cà assai ghjente s'ampara, è si pò, in fatti, assai attivu e funnamintarmenti limitata. Per chì mutivu, Oghji I discrìviri "anonymization," I Mulateri Di L'usu Obed quotation à rammintà, à voi chì stu prucessu, sciuri di l 'aspettu di anonimatu ma nun è veru anonimatu.

Un veru esempiu di a fallimentu di "anonymization" vene da a final anni 1990 in Massachusetts (Sweeney 2002) . A Cumpagnia di Assicuranza di u Gruppu (GIC) hè stata una agenza di u guvernu rispunsabule per a compra d'assicuranza di salute per tutti l'assicurati statali À traversu stu travagliu, a GIC recopilatate registri sanitari detallati di circa e militanti statali. In un sforzu di spur research, a GIC hà decisu di liberà queste riche à i furmeru. In ogni casu, ùn anu micca sparta tutti i so dati; Invece, anonimamente «anonimitatu» queste dati per l'eliminazione d'informazioni cum'è nomi è indirizzi. In ogni modu, abbandunonu una altra informazioni chì pensanu chì puderia esse utili per i riciclteri cum'è a informazione demografica (codice postale, data di nascita, etnicità è sessu) è infurmazione medica (visitate data, diagnosi, procedura) (figura 6.4) (Ohm 2010) . Sfortunatamente, sta "anonimatizzazzjoni" ùn era micca bè di prutezzione di dati.

Figura 6.4: L'anonimatu hè u prucessu di sguassà l'infurmazioni ovidiu. Per esempiu, quandu liberate i registri d'assicuranza medica di l'impiegati stati, a Cumpagnia di Assicuranza di u Gruppu di Massachusetts (GIC) eliminò i nomi è l'indirizzi di i schedari. Aghju aduprà e quaghjure chì tocca à a parola anonimizazione perchè u prucessu furnisce l'apparizione di l'anonimatu ma micca l'anonimatu propiu.

Figura 6.4: "Anonymizazione" hè u prucessu di sguassà l'infurmazioni ovulati. Per esempiu, quandu liberate i registri d'assicuranza medica di l'impiegati stati, a Cumpagnia di Assicuranza di u Gruppu di Massachusetts (GIC) eliminò i nomi è l'indirizzi di i schedari. Aghju aduprà e quaghji cumale à a parola "anonymization" perchè u prucessu furnisce l'apparizione di l'anonimatu ma micca l'anonimatu propiu.

Per illustrarie e difetti di a GIC "anonymization", Latanya Sweeney -duppone un studiente graduate in MIT-paid $ 20 per acquistà i scrittori di votu da a cità di Cambridge, a cità nativa di u guvernatore di u Massachusetts William Weld. Sti registri di votu inclusu l'infurmazione cumu u nome, l'indirizzu, u codice postale, a data di nascita è u genere. U fattu chì u schedariu medicale di u dati è u schedariu di u votu sò stati duminii chjucu, u ghjornu di nascita è u sessu, facia chì Sweeney puderia link them. Sweeney sapia chì u anniversariu di Weld fù u 31 di giugnettu di u 1945, è i scritti di votu inclusu unicamente sei persone in Cambridge cù quellu anniversariu. Avanza, di queste sei persone, solu trè eranu masci. E, di questi trè omi, solu un puddu u codice postale di Weld. Cusì, i dati di u votu dimustrò chì qualcunu di l'infurmazione medica cù a combinazione di Weld di data di nascita, generale è codice postale hè William Weld. In esencia, queste trè pezzi d'infurmazioni furnitulinu un impronta unicu in a dati. Usendu stu fattu, Sweeney hà capaci di circà i registri medichi di Weld, è, per informà di a so proeza, u mandò una copia di i so logichi (Ohm 2010) .

Figura 6.5: Ritalificazione di dati anonimati. Latagna Sweeney hà cumpurtatu i registri sanitarie anonimatu cù registri di votu per truvà i registri medichi di u guvernatore William Weld Adaptatu da Sweeney (2002), figura 1.

Figura 6.5: Ritalificazione di "anonimatu" di dati. Latagna Sweeney hà combina i repertorii di "anonimitatu" di u sanatoriu cù i discorsi in votu per truvà i registri medichi di u guvernatore William Weld Adaptatu da Sweeney (2002) , figura 1.

U travagliu di Sweeney illustra l'estructura basica di l' attritu di reidentificazione per adoptar un termini da a comunità di security di computer. In queste attaccu, duie sette di dati, nimu da chì in ellu stessu sviluppa a sughjetti sensibilizare, sò assuciati, è per mezu di stu ligame, a informazione sensibule hè svilicatu.

In risposta à u travagliu di Sweeney, è altri travaglii rilativi, i ricercati scentuleghjani in generale, assai più infurmazioni, tutti l'anch'elli "l'infurmazioni personali d'identità" (PII) (Narayanan and Shmatikov 2010) duranti u prucessu di "anonimatizzazione". In più, assai investigatori Avà dunque chì certe datu-cum'è registri medichi, registri finanziarii, risposte à i ragiunisti di equestri à u cumpurtamentu illegale-sò sensu troppu sensibilitatu à liberà ancu dopu "anonimatizzazione". In ogni casu, l'esempi chì t'aghju da puderà suggerisce ch'è i circunleri à cambià u so pensamentu. Cum'è un primu passu, ci hè accortu di pigghiarivi li chì tutti i dati sò Prepaid frontman è tutti i dati sò Prepaid fattivu. In altri termini, invece di pensà chì risoltu di infurmazioni s'applicà à un pezzu di prughjetti, avemu deveremu chì si applicà, à qualchì gradu, per tutti i prughjetti.

I dui aspetti di sta reurientazione sò illustrati da u Netflix Prize. Cumu nant'à u capitu 5, Netflix alluppauu 100 millioni di qualità di filmata da quasi 500.000 membri, è hà avutu una calla aperta da quale a ghjente di tutta u mondu sottumite algoritmi chì puderanu a capacità di Netflix per rimpriverà filmati. Prima di liberà a dati, Netflix hà eliminatu alcune d'infurmazione identica prugettu, cum'è nomi. Fùndinu ancu un passu extra è introduttu disturbia chjesa in parechji di i registri (per esempiu, cambià arcate qualificazioni di 4 stelle à 3 stelle). Avà hà scupertu bè chì, ancu e so sforzi, i dati ùn anu persu per senza altru anònimu.

Quistione dui settimani dopu chì a data era stata liberata, Arvind Narayanan è Vitaly Shmatikov (2008) amparonu chì era pussibule inscegliu nantu à i prublemu di cinéma specìprali di u cinema. U truccu à u so identità di reidentificazione era sìmuli à Sweeney: fusionate i dui fonti d'infurmazioni, una cun informazione sensibule è sensu micca infurmazioni identificanti è una chì cuntene l'identità di i populu. Ogni chjode d'aquestes funzioni di dati pò esse seguru individuali, ma quandu si sò cumminati, u settore fusionu pò creà risposta informativa. In u casu di e Netflix, quì hè cusì cumu puderebbenu. Puderanu ch'e aghju intesu per sparta i mio pensamentu nantu à azione è cummedia di u pelle cù i mei cumpagni, ma chì ùn avè preferitu cumprà l'altri opinione nantu à i pelle religiosi è pulitiche. I mi travagliatore puderanu aduprà l'infurmazioni chì aghju avutu cun elli à truvà i mio ricerchi in a data Netflix; L'infurmazioni ch'e aghju pussutu esse una stampetta unica cum'è a data di nascita di William Weld, u codice postale è u sessu. Allora, se truvà u mio impiccante unicu in i dati, puderanu sapè a me gradazioni nantu à tutti i film, cum'è i films ch'e aghju sceltu ùn sparte. In più di stu tipu d' attaccamentu focu focu annantu à una sola persona, Narayanan è Shmatikov anu dimustratu ancu chì era pussibule di fà un vastu attache -unificà parechje persone-fendu a data Netflix cù informazioni persunale è di qualchì data di cinese chì certi persone anu sceltu per pubblicà nantu à Internet Movie Database (IMDb). Quite semplice, qualsiasi informazioni chì hè un impronta uniche ùnicu à una persona specifica, anche u so settore di scrizzione di cinema, pò esse usatu per identificà.

Aduprate ancu chì i dati di Netflix ponu esse identificati in un attaccu miraculatu o largu, pò ancu esse risicate. Dopu tuttu, i qualificazioni di film ùn parevanu assai sensittivi. Mentri chì puderia esse veru in generale, per qualchissimi di i 500.000 pirsuni in u settore di u settore, a qualificazione di scummje pò esse assai sensible. In fattu, in risposta à a reidentificazione, una donna lesbica cunquette hà intruditu in un suit di class action contra Netflix. Eccu cumu si u prublema era esprittu in a so filata (Singel 2009) :

"[M] ovie è qualifiche qualchissia contene una infurmazione di una ... natura altamente persunale è sensibule. A ricerca di u membru di a movie demoniu un interessu persunale personali di u Netflix è / o pruteghja cù parechje persunale assai, cumu a sessualità, a malatia mentale, a recuperazione di l'alcoholismu è a vittimazione da incest, abusive fisicu, viulenza domestica, adulteriu è rapa ".

A reidentificazione di u Prix di Netflix data illustrà i dui chì tutti i dati sò attivati ​​d'identificazione è chì tutti i dati sò sensibule sensibule. À questu puntu, puderete pensate chì questu solu s'applicava à e dati chì volenu esse nantu à e persone. Harrigarria, chì ùn hè micca u male. In risposta à una dumanda di Libertà di l'infurmazioni infurmati, u Governu di a New York City libera registri di ogni taxi ride in New York in 2013, cumprese i reticule è di cullà i tempi, i locali è i cantieri di u prezzu (ricurdate da u capitu 2 chì Farber (2015) utilizate data simili per pruvà testi più importanti in economia di u travagliu). Ddi dati sur viaghju di taxi pò avè beninutu perchè ùn pare micca furniri infurmazioni nantu à e persone, ma Anthony Tockar hà de capiscu chì stu datu di taxi duie cuntenente di cuntenente di cuntenenu assai assai infurmazioni potenzalmenti sensittivi di e persone. Per esse illustrati, hà vedutu i viaghjatori chì avianu da u Hustler Club, un grande strappu di striscia in New York, trà a mezzanine è 6 ore dopu è trovu i so posti di vacanti. Sta ricerca divulgò in essenza-una lista di l'indirizzi di certi persone chì frecuentanu u Hustler Club (Tockar 2014) . Hè difficiulmente imaginate chì u guvernu di a cità hà avutu questu in mente quandu allacciò a dati. Infatti, sta stessa teknika puderia esse usata per truvà l'indirizzi di l'abitudini di e persone chì visitanu ogni locu in a cità: una clinica medica, un edificio di guvernu, o una istituzione religiosa.

Sti dui casi di u Netflix Prize è a distribuzione di taxi di New York City ponu dettu chì a persona relativamente qualificada ùn puderà rializzà bè rapreziu informativu in i dati chì publicheghji, è queste casi ùn sò micca unicu solu (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Cumplementu, in parechje casu di tali casu, i dati problematiques sò sempre liberamente dispunibili in linea, chì indicanu a diffiuli di sferisce a publicazione di dati. Cumminciamente, queste esempi, à a ricerca in a scienza di l'informatica nantu à a privacy, porta à una cuncertizazione impurtante. Circadori deve dinò chì tutti i dati sò Prepaid frontman è tutti i dati sò Prepaid fattivu.

Sfortunatamente, ùn hè micca solu solu pè i fatti chì tutti i dati sò attivati ​​d'identifiaziu è chì tutti i dati sò sensibilizà sensitivi. In ogni casu, una manera di reduces riscu informativu mentre viaghja cù data hè di creà è seguite un pianu di prutezzione di dati . Stu pianu reducià l'azzione chì i vostri dati saldenu è daveru u dannu se una fasgiga si spettaculu. L'infurmazioni di i piani di prutezzione di dati, cumu quella forma di cifru à utilizà, cambiassi cù u tempu, ma u UK Data Services organizza in forma di l'elementi di un pianu di prutezzione di dati in cinque categurie chì chjamanu i cinque boxesi : prughjetti seguri, populi sicuri , setturi sicuri, dati seguri è salute seguru (table 6.2) (Desai, Ritchie, and Welpton 2016) . Nisunu di e cinque pateoti individually furnisce una prutezzione perfetta. Ma sò formanu un settore potente di fatturi chì ponu diminuite risposta informativa.

Table 6.2: U "Five Safes" sò principizi per Disignà è Esercitu un Pianu di Proteczione di Data (Desai, Ritchie, and Welpton 2016)
Safe Azione
Prughjetti Salvatori Limiti prughjetti cù dati à quelli chì sò èichi
Persone salvaticu L'accessu hè ristretta per e persone chì pò esse fiduciarii cun dati (per esempiu, persone chì anu passatu a furmazione ètica)
Segura di dati I dati sò identifikati è aghjurnati à u puntu pussibuli
A configurazione sicura L'infurmazioni sò stati guasgi in l'ordinateur cù un spaziu fisicu (per esempiu, a sala bloccata) è software (per esempiu, a prutezzione di password, criptografata)
Prughjettu sanu A prucedura di ricerca hè stata rivisitata per prevene micca e brevi di privacidad

In più di a prutezzione di i vostri dati mentre chì l'anu utilizatu, un passu à u procoppenu di ricerca induve u risicu informativu hè particularmente salienti chì hè spartazione di dati cù altre investigadoru. A scuperta di dati entre i scientisti hè un valore chjamatu di u prucessu sciinziu, è facilite assai l'avance di u sapientu. Eccu cumu chì a Casa di Cunsigliu di u Regnu Unitu hà sprupusitatu l'impurtanza di sparta di dati (Molloy 2011) :

"L'accessu à i dati hè fundamentale se i ricerca sò ripruducere, verificate è cresce nantu à i risultati chì sò informati in a literatura. A presumizione deve esse chì, salvu chì ùn ci hè una ragiò ryinda altri, i dati anu bisognu sanu è publicati dispunibili.

In più, cumandendi i vostri dati cun un altru investigatore, pudete assicurà rischiu informativu à i vostri participanti. Cusì, pò avè chì l'accùsate di dati cumuni crea una tensione fundamentali trà l'obbligazione di cresce i dati cù altri scientifichi è l'obbligazione di minimizzà risorse informativu à i participanti. Fortunatamente, stu dilema ùn hè micca gravu quantu avà. Pudammu megliu di pensà à a crescita di dati per cume in un cuntinuu, cù ogni puntu nantu à quì continuu chì furnisce una diversità variata di prestazioni per a a sucità è risicu per i participanti (figura 6.6).

À un estremu, pudete sparghje i vostri dati senza nimu, chì minimizeghja u risicu per i participanti, ma dinò minimizeghja cumbatte à a sucità. À l'altru estremu, pudete liberà è scurdate , induve e dati sò "anonimati" è publicati per tutti. In quantu à sparghjere micca dati, allora è scurdate vi prupone un beneficu supiriore à a sociezione è più risichi per i participanti. In trà i dui casu estremi sò una varietà di ioghji, cumpresa quale chjamarè un approachu di giardino muri. Sottu st'andatura, i dati sò chjappi cù e persone chì meetenu certi criterii è chì accunsenu per esse ligati da certi reguli (per esempiu, cunversazione da un IRB è un pianu di prutezzione di dati). L'attruzzu di u giardinu porte furnisce assai di e beneficii di u liberu è si scurdate cun menu risicu. Di sicuru, un tali acchissu crea assai interrugazioni, quale avaristi bisognu di accessu, in quali cundizzioni, è di quantu tempu, chì deve pagà per mantene è pulizzia u giardinu muratu, etc., ma sò micca insurmountable. Infatti, ci sò digià travagliu i jardine muratu in u locu chì i circatori puderanu aduprà issa, cum'è l'archiviu di dati di u Consorzio Interuniversitari per a Ricerca Politique è Sociale à l'Università di Michigan.

Figura 6.6: L'estratee di liberazione di dati pò purtà à u cuntinuu. Induve chì deve esse nantu à issu cuntinuu dipende di i dati specifichi di i vostri dati, è a rivista di u terzu pudete aiutà à decisione u equilibriu di risicu è benefiziu in u vostru casu. A forma esatta di sta curva dipende da l'indeterminate di e mette di dati è di ricerca (Goroff 2015).

Figura 6.6: L'estratee di liberazione di dati pò purtà à u cuntinuu. Induve chì deve esse nantu à issu cuntinuu dipende di i dati specifichi di i vostri dati, è a rivista di u terzu pudete aiutà à decisione u equilibriu di risicu è benefiziu in u vostru casu. A forma esatta di sta curva dipende da l'indeterminate di e mette di dati è di ricerca (Goroff 2015) .

Cusì, induve esse a dati da u vostru studiu saranu in u cuntinuu di sparisce, giardino eddu è liberatu è si scurdate? Queste depenente di i vostri dati di i vostri dati: i circhuli anu u scrittu Respect for Persons, Beneficenza, Ghjustice è Rispittà per a Lege è Interessu Pubbliku. Vistutu da sta perspettiva, a partenza di dati ùn hè micca un cundinamentu eticu distintiu; hè solu unu di i parechji aspetti di a ricerca in quali i ricerchi anu da truvà un equilibru eticu appropritatu.

Certi critichi sò in ghjinirali contru à u partitu di dati perchè, in a mo scusa, sò corsi centri nantu à i so risichi-chì sò, sicuramente, reale è ignuranu i so prestazioni. Allora, per fassi invià tematiche nantu à i risichi è i prestazioni, vi aghju vulsutu offerta una analogia. Ogni annu, i veicchio sò rispunsevuli di millaie di morte, ma ùn pruvate micca di pruvucarià impresa. In fattu, un chjamu à scumpale viaghjà seria assurdu perchè u ghjacumu permette parechje cose maravigliose. Puderete, a società impone restrizioni à quale puderà manighjà (per esempiu, a necessità di esse una certa età è per passà certu teste) è cumu si pò manighjà (per esempiu, sottu u limitu di veloce). A società hà dinò u cumunu di cumpetenze e infurmazioni di sti règule (per esempiu, a polizia), è punisciemu e persone chì sò attravuti. U listessu modu di pensamentu equilibratu chì a sucità s'applicava à a regula reguladora pò esse applicata ancu à l'intelligenza di dati. Hè per ellu, invece di fà argumenti assulutista per oppressivi di u cumuni di dati, crede chì avemu da fà u più avanzatu cinghjeranu cumu puderemu diminuisce i risichi è crescenu e benefizii da l'intelligenza di dati.

Per cuncludi, risorse informativu anu aumentatu drammaticu, è hè assai difficiuli per pronostica è quantificà. Per quessa, hè megliu per presumintari chì tutti i dati sò attivati ​​identificanu è sensibilizà sensible. Per diminuisce u risultatu informativu mentre faci a ricerca, i ricerchi anu creatu è seguitate un pianu di prutezzione di dati. Rispondi, u risorsu informativu ùn impedisce e ricchieri di sparraru di dati cù altri scientifichi.