6.6.2 Fêmkirin û serî rîska lêgerok

Rîska Information rîska herî belave li lêkolîna civakî ye; ew çiqwas diçe zêde dibe; û ew li Ercîşê rîska fêm e.

Pirsiyara exlaqî duyemîn ji bo lêkolînan di serdema dîjîtal civakî rîska pêzanînê, nifte ji bo ziyanê ji wê eşkere yên agahî e (Council 2014) . Ziyanên Rageyandkar ji wê eşkere yên kesanî dikare bibe aborî (wek nimûne, winda karekî), civakî (wek nimûne, fihêtkar), derûnî (wek nimûne, depresyona), an jî cezayê de (wek nimûne, girtina ji bo şêlên neqanûnî). Mixabin, di temenê dîjîtal bilind dike rîska agahî dramatîk-li wir e, çawa ewqas agahî der barê helwesta me dike. Û, rîska lêgerok gelek zehmet fêm bikin û rêve, mor dike ev rêje bi rîskên ku fikarên di lêkolînên civakî temenê analog, wek rîskeke fizîkî bûn. Bo bînînî çawa di temenê dîjîtal rîska lêgerok zede, bala derbasbûna ji kaxezên ewraqên elektronîk. Her du cure yên records ava rîska, lê qeydên elektronîk ava rîskên gelek mezintir ji ber ku di pîvaneke mezin ew dikare ji bo ku partî bê ruxset de waxtekî an yek bi din records. lêkolînerên civakî ku di serdema dîjîtal niha ji nav tengahiyan bi rîska pêzanînê bi rê ve, di part ber ku ew bi temamî ne fêm bikin ka çawa ji bo bilêvkirin û nekevin. Loma, ez diçim ji bo ku bi awayekî baş li ser rîska lêgerok difikirin, û paşê ez diçim ji we re hinek şîret ji bo birêvebirina rîska pêzanînê di lêkolînên xwe û li ser belav daneyên din lêkolîneran bidin.

One bi awayekî ku lêkolînerên civakî kêm rîska lêgerok "anonymization" yên welat e. "Anonymization" pêvajoya rakirin identifiers şexsî zelal yên wek nav, navnîşan û hejmara telefona ji welat e. Lê belê, ev nêzîkatiya gelek kêm bi bandor ji gelek kesên nizanî e, û ev e, di rastiyê de, ji kûr ve û di bingeha xwe de bi sînor. Ji ber vê yekê, dema ku ez terîf "anonymization," ez ê deşîfre bi kar bînim bîra we ku vê pêvajoyê dîtinê yên bêy ku lê ne nenasiya rast diafirîne.

A nimûne, radigînin têkçûna "anonymization" ji dawiya salên 1990'î tê li Massachusetts (Sweeney 2002) . Komîsyona Insurance Group (Konseya) a ajansa hikûmetê berpirsyar ji bo kirîna sîgorteya tenduristiyê ji bo hemû karmendên dewletê bû. Bi saya vê xebatê, ji Konseya records tenduristiyê berfireh li ser bi hezaran karmendên dewletê hatin komkirin. Di hewlekê de ji bo dine lêkolîn li ser awayên çêtirkirina tendurustî, Konseya de biryar da ku ev belgeyan ji bo lêkolînerên. Lê wan ew bi xwe hemû daneyên xwe re ne; bêtir, ew bi rakirina agahî yên wekî nav û navnîşana "veşartî" jî. Lê belê, ew jî agahiyên ku ew difikirîn, nedikarî ji bo lêkolînerên kêrhatî be, wek agahî demografîk (zîp kod, date jidayikbûnê, etnîsîte, û sex) û nexweşiyê (Daneyên serdana, teşhîs, pźvajoya) (WÊNE 6.4) derket (Ohm 2010) . Mixabin, ev "anonymization" bû ji bo parastina welat têrê nake.

Figure 6.4: Anonymization pêvajoya şop eşkere agahiyên danasînê ye. Ji bo nimûne, di dema weşandina qeydên sîgorta nexweşiyê ya karmendên dewletê Koma Komîsyona Insurance Massachusetts (Konseya) Nav û navnîşana rakirin ji files. Ez bi kar quotes li dora anonymization peyv ji ber ku di pêvajoya de, nenasî rastî dide xuya nûçeyê de, di heman demê de ne.

Figure 6.4: "Anonymization" pêvajoya şop eşkere agahiyên danasînê ye. Ji bo nimûne, di dema weşandina qeydên sîgorta nexweşiyê ya karmendên dewletê Koma Komîsyona Insurance Massachusetts (Konseya) Nav û navnîşana rakirin ji files. Ez bi kar quotes li dora peyva "anonymization" ji ber ku di pêvajoya de, nenasî rastî dide xuya nûçeyê de, di heman demê de ne.

Biriyan li ser kêmasiyên Konseya "anonymization", Latanya Barber-paşê xwendekara masterê li MIT-pere $ 20 ji bo nasîna records dengdanê ya ji bajarê Cambridge, ji wî bajarê ku walî Massachusetts William Weld. Ev qeydên dengên xwe de agahî yên wekî nav, navnîşan, zîp kod, roja bûyînê, û zayenda civakî. Ji ber ku file tibî welat û pelê wext de parve code zeviyên-zip, roja bûyînê, û-sex wateyê ku Barber nikaribû ji wan re tên. Barber dizanibû ku birthday Weld ya July 31, 1945 bû, û records dengdanê ya bi ku birthday de tenê şeş ​​kes li Cambridge. Din, ji yên ku ji şeş kesan, tenê sê mêr bûn. Û, ji wan sê kesan, tenê yek zîp kod Weld ya parvekirin. Bi vî awayî, welat dengdanê de da xuyakirin, ku kesek li welat tibî bi kombînasyona Weld ji roja bûyînê, zayenda civakî, û zîp kod William Weld bû. Di rastiyę de, ev her sê parçeyên agahî a tilîka yekta ji wî re li daneyên. Bi bikaranîna vê rastiyê, Barber karibin cîwarkirina jûrnala nexweşiyê Weld da, û ji bo wî agahdar ji feat wê bû, wê wî bêt kopiyek ji qeydên xwe (Ohm 2010) .

Figure 6.5: Re-idenification ji agahiyên veşartî. Latanya Barber qeydên tenduristiyê veşartî bi records dengdanê de ji bo peydakirina li jûrnala nexweşiyê yên William Weld Waliyê (Barber 2002) tevî hev tên.

Figure 6.5: Re-idenification ên data "veşartî". Latanya Barber de "veşartî" records tenduristiyê bi records dengdanê de ji bo peydakirina li jûrnala nexweşiyê yên William Weld Waliyê bi hev re (Sweeney 2002) .

Kar Barber ya h'ejmara avahiya bingehîn ya êrîşan de-anonymization -to himbêz term ji civaka ewlekariyê dibe. Di van êrîşan de, du komên welat, û ne jî yên ku ji aliyê xwe diyar hesas, girêdayî bi, û bi saya vê çênekin, hesas eşkerekirin. Bi hinek awayan vê pêvajoyê de ji riya ku bîre soda û sihik, du maddeyên ku bi xwe ewle ne, dikarin li hev bikin ji bo hilberîna a encamên bi şeklekî ye.

Di bersiva xwe de kar Barber, û yên din kar de, lêkolînerên niha bi gelemperî jê hê çiqas zêdetir agahiyan-Hemû, da bi navê "Information eslê xwe Tesbîtkirina" (pii) (Narayanan and Shmatikov 2010) -during pêvajoya "anonymization." Ji bilî vê, gelek lêkolîner niha bizanin ku hin welat-wek jûrnala nexweşiyê, records aborî, bersivên bi rapirsiyekî pirsên li ser neqanûnî helwesta-e dibe pir hesas ji bo serbestberdana heta piştî "anonymization." Lê belê, wergerandî dawî de, ku zêdetir ez ê li jêrê salix didin nîşan ku lêkolînerên civakî, divê ji bo ramana xwe biguherînin. Weke gava pêşî, ev aqil e ku wisa hizir dikin ku hemû welat potansiyel a naskirî ye û hemû welat hesas e. Bi gotineke din, bêtir ji fikra ku rîska pêzanînê ji bo komekî biçûk ji projeyên, divê em wisa hizir dikin ku ev qanûn-heta radeyekê-ji bo hemû projeyan.

Her du alîyên vê re-orientation bi destê Xelata Netflix nimandin. Weke ku di Chapter 5 şirove, Netflix serbest 100 milyon ratings movie ji aliyê hema hema 500,000 endam, û hevkarîya Open Call ku mirovên ji hemû deverên cîhanê ji algorîtmayan re, ku bikaribe şiyana Netflix ji bo pêşniyar movies baştir pêşkêşî dadgehê kiribû. Berî weşandina van daneyên, Netflix ti agahiyên eşkere bi xwe-naskirin, wek navên rakirin. Netflix jî gavek zêde çûn û aloziyên sivik, li hin ji yên ku (wek nimûne, guhertina hin ratings ji 4 stars ji bo 3 stars) nasand. Netflix dît, lê belê, ku tevî hewildanên xwe, daneyên ji aliyê tu bûn tê wateya (neqeydkirî).

Tenê du hefteyan piştî ku welat serbest hatin berdan Narayanan and Shmatikov (2008) nîşan da ku ev gengaz bû ku li ser tercîhên movie gelê taybet ya hîn bibin. The trick ji bo êrîşeke nû nasnameya wan dişibe ya Barber bû: merge bi hev re du çavkaniyên agahî, yek bi agahî hesas û ti agahiyên eşkere nasname û yek e ku nasnameya wan kesên ku. Her yek ji van çavkaniyên daneyan Dibe ku serê xwe bi ewle, lê gava ew bi hev re bi ser dataset perexistinê dikarin rîska lêgerok biafirîne. Di doza ku dane Netflix, li vê derê ye, çawa dikare pêk were. Bifikirin ku ez hilbijêre ji bo parvekirina ramanên min li ser çalakî û movies comedy bi hevalkarên min, lê ji bo ku ez tercîh ji bo parvekirina nêrîna min li ser movies olî û siyasî ne. Hevalkarên min nikaribû agahiyên ku ez bi wan re parve kiriye bibînin records ku min li welat Netflix bi kar tînin; agahiyên ku ez parve bibin tilîka yekane mîna date William Weld ya zayînê, zîp kod, û sex. Hingê, eger ew tilîka yekane min nedît ku di welat, wan nikaribû ratings min li ser hemû movies, di nav wan de movies li cihê ku ez hilbijêre ji bo parvekirina ne hîn bibin. Li gel bi vî rengî êrîş anîn ser kesekî, Narayanan and Shmatikov (2008) jî nîşan da ku ev gengaz bû ji bo ku ez a çêkin, êrîşeke fereh, ku gelek mirov-by yedega daneyên Netflix bi daneya rating şexsî û movie ku hin kesên bijartî to post li ser Internet Movie Database (IMDb). Ku agahiyên ku tilîka yekane ji bo kesekî-hetta taybet set xwe ji movie ratings-dikarin bên bikaranîn ji wan re bide nasandin.

Tevî ku welat Netflix dikare ji nû ve tê diyarkirin di derbarê êrîşa hedef an jî fireh, lê hîn jî bibe xuya ye ku rîska nizm. Piştî ku hemû, ratings movie dikarim pir hesas xuya ne. Gava ku di giştî de rast be, ji bo hin ji yên ku 500,000 kes di dataset, ratings movie bibe pir hesas. Di rastiyê de, li bersiva vê de-anonymization jineke lesbian closeted taximeke class-çalakiyek li dijî Netflix bûn. Li vir, çawa ku pirsgirêka di doza xwe îfade kirin (Singel 2009) :

"[M] ovie û rating welat agahiyên ji xwezayê pir zêdetir şexsî û hesas [sic]. Daneyên movie endamê ya eşkere berjewendiyên şexsî endamê Netflix û / an jî têkoşîna bi mijarên cuda pir şexsî, di nav wan de cinsî, nexweşiya derûnî, başbûna ji alkolê kirin, û mexdûriyetê ji ensest, xerabkarîya fîzîkî, şîdeta nava malê, zînayê dike, û tecawizê. "

The de-anonymization ên data Xelata Netflix h'ejmara herdu ku hemû welat potansiyel a naskirî ye û ku hemû welat hesas e. Di vî warî de, hûn guman dikin, ku ev tenê ji bo welat, ku xwedêgiravî dixwaze li ser gelê bê derbas dibe. Matmayî, ev rewş, ne. Di bersiva Azadî ji request Law Information, Bajar û Hikûmeta New York records ji her ride taxi li New Yorkê di 2013 de serbest hatin berdan, di nav wan de pickup û bibine caran, cihên, û mîqdarên fare (recall ji Chapter 2 ku Farber (2015) bikaranîn, ev welat ji bo ceribandinê teoriyên girîng di aboriyê kar). Tevî ku ev welat li ser rêwîtiyên taxi bibe xuya enformasyonê ji ber ku ew xuya nakin ku agahiyên li ser gel, Anthony Tockar fêm kir ku ev dataset taxi rastiyê de gelek agahî hesas li ser gel. Biriyan, ew li hemû rêwîtiyên nêrî starting at The Hustler Club-klubeke strip mezin li New York-di navbera şevê û 6am û piştre dît cihên drop-off xwe. Ev lêgerîn eşkere-di encamê de-a list of navnîşanên ji hin kesên ku daîmî di The Hustler Club (Tockar 2014) . Ev zehmet e ku mirov lê bifikire ku hikûmeta bajêr ev di hişê dema serbest daneyên. Di rastiyê de, vê teknîkê heman dikare bê bikaranîn, ji bo dîtina navnîşanên malê kesên ku serdana her cihekî di bajêr de-nexweşxaneyê de, avahiya hikûmetê, yan jî saziyeke olî.

Van her du rewşan de-Xelata Netflix û li New York City taxi welat-show ku gelê nisbeten kalîfîye têk rîska lêgerok li daneyên ku ew serbest bi awayekî rast texmîn dikin, û van dozan bi tu awayî xweser (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Din, li gelek ji van rewşan de, welat bi pirsgirêk e hîn jî bi awayekî azad tune bike, û diyar dike ku zehmet e ji her xêra a serbestberdana welat. Komî van wergerandî-herweha lêkolîn li zanistê dibe barê nepeniya-rêça encama girîng e. Lêkolîner, divê wisa hizir dikin ku hemû welat potansiyel a naskirî ye û hemû welat hesas e.

Mixabin, ti çareseriyê hêsan, ji bo wê yekê ku hemû welat potansiyel a naskirî ye û hemû welat hesas e. Lê belê, yek rê ji bo kêmkirina rîska agahî dema ku hûn bi kar bi welat e ji bo avakirin û plana parastina welat li pey. Ev plana wê derfeta ku daneyên te daku, dê û wê ziyanê kêm eger muebetê û bi awayekî ecêb be kêmbe. Taybetmendîyên wê yên planên parastina welat, wek ku form of encryption bi kar bînin, li ser dem bê guhertin, lê Services Data UK alîkar organîze dike ku hêmanên ji plana parastina daneyên nav 5 categories ku ew bang li 5 dukanek: projeyên ewle, mirovên ewle , settings ewle, daneyên bi ewle, û derketeyan ewle (Table 6.2) (Desai, Ritchie, and Welpton 2016) . Ne yek ji pênc dukanek bi serê xwe parastina temam ne. Lê belê, bi hev re ew a set bi hêz ya faktorên ku nikare rîska lêgerok kêm avakirin.

Table 6.2: The 5 dukanek prensîbên bo dîzaynkirina û bicihanîna plana parastina welat in (Desai, Ritchie, and Welpton 2016) .
Emîn Çalakî
projeyên Safe digre projeyên bi welat ji bo wan ên ku ji exlaqî in
gelê Safe gihîştina ji bo kesên ku dikarin bên bi daneya me bawer sînorkirin (perwerdeya exlaqî wek nimûne, gel re derbaz bûne)
Daneyên Safe Daneyên de-diyarkirin û -şandîyên heta ku mumkun be
settings Safe Daneyên ku di komputer û bi fizîkî guncaw (wek nimûne, room [Girtî]) û software (wek nimûne, parastina şîfreya xwe, bi şîfre) protections profîlek
encam Safe encam lêkolînê de gotarek e ku rê bi şaşîtî kêmasiya di nepeniya

Ji bilî parastina daneyên te dema ku tu bi kar jî, yek gav di pêvajoya lêkolînê de, ku rîska pêzanînê bi taybetî pêşîyê, e parvekirina welat bi din lêkolîner e. parvekirina Data di nav zanyar nirxê bingehîn ên xebatên zanistî jî gelek derfetên pêşketina zanîna e, û. Li vir çawa House Brîtanyayê ya Commons ser girîngiya parvekirina welat danasîn:

"Access daneyên bingehîn e, eger ji lêkolîneran re ne ji bo zêdekirina, piştrast bike û ava bike li ser encamên ku di lîteratûrê de ragihand. Ew qiyafetê divê ku, eger e sedemeke xurt heye yan na, welat divê bi tevahî bê eşkerekirin û peyde eşkereyî. Li gorî vê prensîbê, ku mumkun be, daneya têkildar bi hemû lêkolînên dewletê fînanse dibe, divê bi berfirehî û bi awayekî azad tune kirin. " (Molloy 2011)

Lê dîsa jî, ji aliyê parvekirina agahiyên xwe bi lêkolîner din, hûn dikarin zêdetir rîska lêgerok beşdaran te. Bi vî awayî jî, ew dikare wisa xwiya bike ku lêkolînerên ku dixwazin ji bo parvekirina wan data-an bi pêwîst ji bo parvekirina wan data-bi gurbûna bingehîn re rûbirû. Li aliyekî, ku ew xwedî berpirsiyariyeke exlaqî ji bo parvekirina agahiyên xwe bi din zanyar, bi taybetî eger ew lêkolînên xwemal is dewletê fînanse dibe. Lê belê, di eynî demê de, lêkolînerên xwedî berpirsiyariyeke exlaqî, bi mebesta, qasî ku pêkan e, rîska agahî bi beşdaran wan.

Başe, ev dualîbûna e ku giran wek xuya ne. Ev girîng e ku ji welat û parvekirina li ser berdewamiya ji tune, parvekirina agahiyên ji bo serbestberdana û bîr, ku daneya "veşartî" û posted bo kesekî bo têketina (WÊNE 6.6) bifikirin. Hem ji van helwestên tûj heye rîsk û feydeyên. ew e ku, ev e xweber tiştekî exlaqî herî daneyên te ji bo parvekirina ne bi; wiha nêzîkatiya gelek fêdeyên potansiyela ji bo civakê diparêze. Em vegerin bo Taste, Ties, û Time, an nimûne berê li beşa nîqaşkirin, argumentên li dijî serbestberdana daneya ku bi tenê li ser Ziyanên muhtemel hûr û ku ji nedîtîve berjewendiyên gengaz biberfirehî vebêje yek-cûr'e, ev in; Ez ê pirsgirêkên bi vî yek-cûr'e, nêzîkatiya biberfirehî vebêje parastinê de bi berfirehî li jêr salix gava ku ez pêşkêşkirina şîretan li ser biryarên ku di rû de nezelaliyê de (Beþ 6.6.4).

Figure 6.6: stratejiyên serbestberdana Data dikarin li ser berdewamiya bikevin. Li ku derê ji te re pêwîst be, li vê berdewamiyê girêdayî li ser hûrguliyên taybetî yên daneyên te. Di vê rewşê de, review partiya sêyem dikarin alîkarîya we biryarê de balanseke minasiw ji rîsk û pereyên di doza we.

Figure 6.6: stratejiyên serbestberdana Data dikarin li ser berdewamiya bikevin. Li ku derê ji te re pêwîst be, li vê berdewamiyê girêdayî li ser hûrguliyên taybetî yên daneyên te. Di vê rewşê de, review partiya sêyem dikarin alîkarîya we biryarê de balanseke minasiw ji rîsk û pereyên di doza we.

Din de, di navbera van her du rewşan de extreme e çi ez ê nêzîkatiya baxçe, avahiyeke ku welat bi kesên ku krîterên hin û ku dîroknas ji bo ku ji aliyê hin qaîdeyan bê girêdan hevbeş bi navê (wek nimûne, bikev ji IRb û planên parastina welat) . Ev nêzîkatiya baxçe, avahiyeke gelek ji alîkarîyên sosyalê yên serbestberdana pêşkêş dike û ji bîr bi rîska kêmtir. Bê guman, nêzîkatiya baxçe, avahiyeke diafirîne gelek pirs-ku divê ji, di bin çi şert û mercên, ji bo çawa dirêj, ku divê bidin, ji bo parastin û polîsan baxçe derdikeve hwd-di heman demê de ev in Rûsuyayê ne. Di rastiyê de, li wê derê ji xwe re kar baxçeyan, avahiyeke li cihê ku lêkolîner dikarin a niha wek di arşîvê de welat ji Consortium Inter-zanîngehê ji bo Sîyasî û Civakî û Lêkolînê ya li zanîngeha Michigan kar tînin,.

Bi vî awayî, li cihê ku divê welat ji xebata we li ser berdewamiya yên tune, parvekirina, baxçe, avahiyeke be, û berde û ji bîr bike? Ev li ser hûrguliyên daneyên te girêdayî ye; lêkolîner, divê Giramî ji bo Persons, dilovan, Dadê, û rêza bo qanun û Interest Public fedakirin. Dema ku nirxandina balanseke minasiw ji bo biryarên din, lêkolînerên li şîret û erêkirina IRBs, û azadkirina welat dikarin bibin tenê beşeke din ya ku pêvajoyê. Bi gotineke din, tevî ku hin kes ji serbestberdana Daneyên wek çiravka exlaqî bêhêvî difikirin, em ji niha ve sîstemên di cihê xwe ji bo alîkariya lêkolînerên balance van dîlemayên exlaqî heye.

Yek way dawî li ser parvekirina welat guman e ji aliyê analogy. Her cars salê berpirsiyar bo bi hezaran mirinan in, di heman demê de em hewl ne ji bo qedexekirina ajotinê. Di rastiyê de, ev bang ji bo qedexekirina ajotinê dê bêmantiqî be ji ber ku ajotinê, derfetê dide gelek tiştên ecêb. Lê belê, civaka Cih sînordariyên li ser kî dikare hebe (wek nimûne, divê ku bibe temenê hin, divê testên hin derbas kirine) û ew çawa dikarin hebe (bo nimûne, di bin û bilez de). Civakê de jî heye, gel li Selahedînê bi Bicihanîna van rêzikên (wek nimûne, polîs), û em kesên ku bi binpêkirina wan girtin ceza bike. Ev heman ramana hevseng ku civakê ji bo biserûberkirina ajotinê derbas dibe jî dikarin ji bo parvekirina welat were ferzkirin. e ku, li şûna çêkirina argumanên absolutist ji bo an li dijî parvekirina welat, bi dîtina min ya herî mezin feydeyên wê ji pakêtan ka çawa em dikarin bi welat zêdetir bi ewlehî zêdetir parve were.

Bi kurtî, rîska lêgerok çiqwas diçe zêde dibe, û ev pir zehmet e mirov pêşbînî bike, û parêzwanên. Ji ber vê yekê, baş ew e ku wisa hizir dikin ku hemû welat potansiyel a naskirî û hesas e. To kêm rîska zanyarî di dema kirina lêkolîn, lêkolîner dikarin biafirînin û plana parastina welat li pey. Bêtir, rîska lêgerok nade lêkolînerên ji parvekirina welat bi din jî zanyarên pêşî ne.