6.6.2 Tuiscint agus riosca eolais bainistíochta

Is é riosca eolais an riosca is coitianta i dtaighde sóisialta; tá méadú mór tagtha air; agus is é an baol is deacra é a thuiscint.

Is é an dara dúshlán eiticiúil do thaighde digiteach ná riosca faisnéise , an poitéinseal chun dochar a dhéanamh ó nochtadh faisnéise (National Research Council 2014) . D'fhéadfadh dochar eolais ó nochtadh faisnéise pearsanta a bheith eacnamaíoch (m.sh., post a chailliúint), sóisialta (eg, náire), síceolaíoch (m.sh., dúlagar), nó fiú coiriúil (m.sh., gabháil le haghaidh iompar mídhleathach). Ar an drochuair, méadóidh an aois dhigiteach riosca eolais go mór-níl ach an oiread eolais ar fáil faoinár n-iompar. Agus tá an-deacair cruthaithe ag riosca eolais a thuiscint agus a bhainistiú i gcomparáid le rioscaí a raibh imní orthu i dtaighde sóisialta as-aoise, ar nós riosca fisiceach.

Is bealach amháin gur laghdú taighdeoirí sóisialta riosca eolais "anonymization" sonraí. Is "anonymization" an próiseas a bhaint aitheantóirí pearsanta soiléir ar nós ainm, seoladh, agus uimhir theileafóin ó na sonraí. Mar sin féin, tá an cur chuige i bhfad níos lú éifeachtaí ná a bhaint amach go leor daoine, agus tá sé, i ndáiríre, go domhain agus go bunúsach teoranta. Ar an ábhar sin, aon uair cur síos mé "anonymization," beidh mé úsáid comharthaí athfhriotail a chur i gcuimhne duit go gcruthaíonn an próiseas seo an chuma ar anaithnideacht ach ní anaithnideacht fíor.

Tagann sampla beoga den mhainneachtain "ainmniúchán" ó na 1990idí déanach i Massachusetts (Sweeney 2002) . Ba ghníomhaireacht rialtais é an Coimisiún Grúpa Árachais (GIC) atá freagrach as árachas sláinte a cheannach do gach fostaí stáit. Tríd an obair seo, bhailigh an GIC taifid shláinte mionsonraithe faoi na mílte fostaithe stáit. D'fhonn iarracht a dhéanamh taighde a dhéanamh, chinn an tIonad na taifid seo a scaoileadh chuig taighdeoirí. Mar sin féin, níor roinn siad a gcuid sonraí uile; in áit, tá siad "gan ainmniú" na sonraí seo trí fhaisnéis a dhíchur mar ainmneacha agus seoltaí. Mar sin féin, d'fhág siad faisnéis eile a d'fhéadfadh siad a bheith úsáideach do thaighdeoirí mar fhaisnéis dhéimeagrafach (cód zip, dáta breithe, eitneachas, agus gnéas) agus faisnéis mhíochaine (sonraí cuairt, diagnóis, nós imeachta) (figiúr 6.4) (Ohm 2010) . Ar an drochuair, ní raibh an "ainmniúchán" seo leordhóthanach chun na sonraí a chosaint.

Fíor 6.4: Is éard atá in ainmniú an próiseas a bhaineann le faisnéis a aithint go soiléir. Mar shampla, nuair a scaoiltear taifid árachais mhíochaine na bhfostaithe stáit, chuir Coimisiún Grúpa Árachais an Gharda Síochána (GIC) ainmneacha agus seoltaí as na comhaid as oifig. Bainim úsáid as na marcanna luachanna timpeall an fhocail gan ainmniú toisc go dtugann an próiseas an chuma ar ainm anaithnid ach ní ainmní iarbhír é.

Fíor 6.4: Is é "Anonymization" an próiseas a bhaineann le faisnéis a aithint go soiléir. Mar shampla, nuair a scaoiltear taifid árachais mhíochaine na bhfostaithe stáit, chuir Coimisiún Grúpa Árachais an Gharda Síochána (GIC) ainmneacha agus seoltaí as na comhaid as oifig. Bainim úsáid as na marcanna luachanna timpeall an fhocail "anaithniúcháin" toisc go dtugann an próiseas an chuma ar ainm anaithnid ach ní ainmní iarbhír é.

Le léiriú a dhéanamh ar na heasnaimh atá ag an "gan ainmniúchán" ag an nGníomhaireacht, Latanya Sweeney-ansin íoc mac léinn iarchéime ag MIT $ 20 chun na taifid vótála a fháil ó chathair Cambridge, baile dúchais gobharnóir Massachusetts William Weld. Áiríodh sna taifid vótála seo faisnéis mar ainm, seoladh, cód zip, dáta breithe, agus inscne. Ar an bhfíric go bhféadfadh Sweeney nasc a nascadh leis an gcomhad sonraí míochaine agus an comhad vótálaí a roinntear réimsí-zip, dáta breithe, agus gnéas. Bhí a fhios ag Sweeney go raibh lá breithe Weld an 31 Iúil, 1945, agus ní raibh ach sé dhuine i gCathair Cambridge leis an lá breithe sin sna taifid vótála. Ina theannta sin, de na sé dhuine sin, ní raibh ach triúr fireann ann. Agus, de na trí fhear sin, ní raibh ach zip zip amháin roinnte. Dá bhrí sin, léirigh na sonraí vótála gurb é William Weld aon duine sna sonraí leighis le teaglaim de dháta breithe, inscne agus cód zip Weld. Go bunúsach, thug na trí phíosa faisnéise méarloirg uathúil dó sna sonraí. Agus é ag baint úsáide as an bhfíric seo, bhí Sweeney in ann taifid leighis Weld a aimsiú, agus, le fios a thabhairt dó faoi a feabhas, chuir sí cóip dá thaifid (Ohm 2010) .

Fíor 6.5: Athshlánú sonraí gan ainm. Chomhcheangail Latanya Sweeney na taifid sláinte gan ainm le taifid vótála chun taifid leighis an Gobharnóra William Weld a Adaptted as Sweeney (2002), figiúr 1 a aimsiú.

Fíor 6.5: Athshlánú ar shonraí "gan ainm". Chomhcheangail Latanya Sweeney na taifid sláinte "gan ainm" le taifid vótála chun taifid leighis an Gobharnóra William Weld a Adaptted as Sweeney (2002) , figiúr 1 a aimsiú.

Léiríonn obair Sweeney bunstruchtúr na n-ionsaithe ath-aithint - téarma a ghlacadh ó phobal slándála an ríomhaire. Sna hionsaithe seo, déantar dhá shraith sonraí, nach bhfuil faisnéis íogair á nochtadh faoina féin, agus tríd an nasc seo, tá faisnéis íogair nochta.

Mar fhreagra ar obair Sweeney, agus obair ghaolmhar eile, is minic go mbainfeadh taighdeoirí i bhfad níos mó faisnéise - go léir "faisnéis aitheanta pearsanta" (PII) (Narayanan and Shmatikov 2010) gheall ar an bpróiseas "ainmnithe". Ina theannta sin, tá go leor taighdeoirí anois go bhfuil sonraí áirithe - amhail taifid leighis, taifid airgeadais, freagraí ar cheisteanna suirbhéanna faoi iompar mídhleathach - dócha go bhfuil siad ró-íogair a scaoileadh fiú tar éis "ainmniúchán". Mar sin féin, tá na samplaí atá le rá agam go bhfuil gá le taighdeoirí sóisialta a gcuid smaointeoireachta a athrú. Mar chéim thosaigh, tá sé ciallmhar a glacadh leis go bhfuil na sonraí go léir inaitheanta d'fhéadfadh agus tá na sonraí go léir ad'fhéadfadh a bheith íogair. I bhfocail eile, seachas ag smaoineamh go mbaineann riosca eolais le fo-thacar beag de thionscadail, ba cheart dúinn glacadh leis go mbaineann sé i bhfeidhm go mór le gach tionscadal.

Taispeánann an Duais Netflix an dá ghné den athchruthú seo. Mar a thuairiscítear i gcaibidil 5, scaoil Netflix 100 milliún rátálacha scannáin ar fáil ag beagnach 500,000 ball, agus bhí glao oscailte ann nuair a chuir daoine ó gach cearn den domhan halgartaim isteach a d'fhéadfadh feabhas a chur ar chumas Netflix scannáin a mholadh. Sula scaoiltear na sonraí, chuir Netflix aon fhaisnéis atá soiléir go pearsanta a aithint, mar ainmneacha. Chuaigh siad céim bhreise freisin agus thug siad beagán díobhála isteach i roinnt de na taifid (m.sh., ag athrú roinnt rátálacha ó 4 réaltaí go dtí 3 réaltaí). Fuair ​​siad amach go gairid, áfach, go raibh na sonraí fós gan ainm gan ainneoin a n-iarrachtaí.

Díreach dhá sheachtain tar éis na sonraí a scaoileadh, léirigh Arvind Narayanan agus Vitaly Shmatikov (2008) go raibh sé indéanta foghlaim faoi roghanna scannáin daoine sonracha. Bhí an cleas ar a n-ionsaí aitheantais cosúil le Sweeney: le chéile dhá fhoinse faisnéise le chéile, ceann le faisnéis a d'fhéadfadh a bheith íogair agus gan aon fhaisnéis a shainaithint go soiléir agus ceann a bhfuil idirdhealú daoine ann. Féadfaidh gach ceann de na foinsí sonraí seo a bheith sábháilte go neamhspleách, ach nuair a chuirtear le chéile iad, is féidir leis an tacar sonraí cumaisc riosca eolais a chruthú. I gcás na sonraí Netflix, is é seo conas a d'fhéadfadh sé tarlú. Samhlaigh gur roghnaíonn mé mo chuid smaointe a roinnt faoi scannáin gnímh agus grinn le mo chomhoibrithe, ach gur fearr liom gan mo thuairim a roinnt faoi scannáin reiligiúnacha agus polaitiúla. D'fhéadfadh mo chomhoibrithe an fhaisnéis a roinntear leo a úsáid chun mo thaifid a fháil i sonraí Netflix; d'fhéadfadh an fhaisnéis a scairim a bheith ina méarloirg uathúil, cosúil le dáta breith, zipchód agus gnéas William Weld. Ansin, dá bhfuair siad méarloirg uathúil sna sonraí, d'fhéadfadh siad mo rátálacha a fhoghlaim faoi gach scannán, lena n-áirítear scannáin a roghnaíonn mé gan a roinnt. Chomh maith leis an gcineál seo ionsaí spriocdhírithe dírithe ar dhuine amháin, léirigh Narayanan agus Shmatikov freisin gur féidir ionsaí leathan a dhéanamh - a bhfuil baint ag go leor daoine leis - trí shonraí Netflix a chumasc le sonraí pearsanta agus rátála scannáin a roghnaigh roinnt daoine a phostáil ar an Bunachar Sonraí Scannáin Idirlín (IMDb). Go simplí, is féidir aon fhaisnéis atá ina méarloirg uathúil le duine ar leith-fiú a sraith rátálacha scannáin-a úsáid chun iad a aithint.

Cé gur féidir na sonraí Netflix a aithint in ionsaí spriocdhírithe nó leathan, d'fhéadfadh sé go mbeadh sé ina mbaol íseal fós. Tar éis an tsaoil, ní cosúil go bhfuil rátálacha scannáin an-íogair. Cé go bhféadfadh sé sin a bheith fíor i gcoitinne, d'fhéadfadh cuid de na 500,000 duine sa tacar sonraí, d'fhéadfadh rátálacha scannáin a bheith íogair go leor. Go deimhin, mar fhreagra ar an ath-aithint, chuaigh bean lebaibe clóiteáilte isteach in aghaidh gníomh-ranga i gcoinne Netflix. Seo mar a léiríodh an fhadhb ina ndlí dlíthiúil (Singel 2009) :

"Tá sonraí [M] ovie agus rátála ar eolas faoi ... nádúr pearsanta agus íogair. Léiríonn sonraí scannáin an chomhalta leas pearsanta agus / nó streachailtí comhaltaí Netflix le saincheisteanna éagsúla pearsanta, lena n-áirítear gnéasacht, tinneas meabhrach, aisghabháil ó alcólacht, agus íospartaíocht ó chliabhra, mí-úsáid fhisiciúil, foréigean baile, adhaltranas agus éigniú. "

Léiríonn ath-aithint sonraí Duais Netflix go bhféadfadh na sonraí go léir a aithint agus go bhféadfadh na sonraí go léir a bheith íogair. Ag an bpointe seo, d'fhéadfá a cheapann nach mbaineann sé seo ach le sonraí a mheastar a bheith faoi dhaoine. Is ionadh é sin, ní amhlaidh. Mar fhreagairt ar iarratas ar Dhlí um Shaoráil Faisnéise, d'eisigh Rialtas Chathair Nua-Eabhrac taifid de gach turas taistil i Nua-Eabhrac in 2013, lena n-áirítear an t-amanna piocadh agus amanna titim amach, suimeanna agus méideanna táille (aisghabháil ó chaibidil 2 go bhfuil Farber (2015) úsáidtear sonraí den chineál céanna chun teoiricí tábhachtacha a thástáil san eacnamaíocht saothair). D'fhéadfadh sé go mbeadh na sonraí seo faoi thurais tacsaí neamhchinnte mar nach cosúil go gcuireann siad faisnéis ar fáil do dhaoine, ach thuig Anthony Tockar go raibh go leor eolais a d'fhéadfadh a bheith íogair maidir le daoine i ndáiríre. Le léiriú, d'fhéach sé ar na turais ar fad ag tosú ag Club Hustler - club stiall mór i Nua-Eabhrac - idir meán oíche agus 6 rn agus ansin fuair sé a n-ionad titim. Léirigh an cuardach seo-go bunúsach liosta de sheoltaí daoine a d'fhreastail ar Club Hustler (Tockar 2014) . Tá sé deacair a shamhlú go raibh sé seo i gcuimhne ag rialtas na cathrach nuair a scaoilfeadh sé na sonraí. Go deimhin, d'fhéadfaí an teicníocht céanna a úsáid chun seoltaí baile na ndaoine a thugann cuairt ar aon áit sa chathair - clinic leighis, foirgneamh rialtais nó institiúid reiligiúnach a aimsiú.

Léiríonn an dá chás seo de Dhuais Netflix agus sonraí tacsaí tacsaí Nua-Eabhrac gur féidir le daoine sách oilte a mheastachán i gceart an riosca eolais sna sonraí a scaoileann siad-agus níl aon chás ar leith ag na cásanna sin (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . Ina theannta sin, i go leor cásanna den sórt sin, tá na sonraí fadhbanna atá ar fáil go fóill ar líne, rud a léiríonn an deacracht a d'eisigh scaoileadh sonraí riamh. I dteannta a chéile, tá na samplaí seo, chomh maith le taighde san eolaíocht ríomhaireachta faoi phríobháideachas - mar thoradh ar chonclúid thábhachtach. Ba cheart do thaighdeoirí glacadh leis go bhfuil na sonraí go léir inaitheanta d'fhéadfadh agus tá na sonraí go léir ad'fhéadfadh a bheith íogair.

Ar an drochuair, níl aon réiteach simplí ann do na fíorais go bhféadfadh na sonraí go léir a aithint agus go bhféadfadh na sonraí go léir a bheith íogair. Is é bealach amháin chun riosca eolais a laghdú agus tú ag obair le sonraí ná plean cosanta sonraí a chruthú agus a leanúint. Laghdóidh an plean seo an deis go mbeidh do chuid sonraí sceitheadh ​​agus laghdóidh sé an dochar má tharlaíonn sceitheadh ​​ar bhealach éigin. Athróidh sainréimsí na bpleananna cosanta sonraí, mar shampla an cineál criptithe lena n-úsáid, le himeacht ama, ach déanann Seirbhísí Sonraí na Ríochta Aontaithe cuidiú le heilimintí an phlean um chosaint sonraí i gcúig chatagóir a thugann siad ar na cúig shaoráil : tionscadail shábháilte, daoine sábháilte , socruithe sábháilte, sonraí sábháilte, agus aschuir shábháilte (tábla 6.2) (Desai, Ritchie, and Welpton 2016) . Ní sholáthraíonn aon cheann de na cúig saothrú cosaint foirfe ina n-aonar. Ach le chéile tá siad ina sraith cumhachtach fachtóirí a d'fhéadfadh laghdú ar riosca eolais.

Tábla 6.2: Is iad na "Cúig Safers" Prionsabail maidir le Plean Cosanta Sonraí a Dhearadh (Desai, Ritchie, and Welpton 2016)
Sábháilte Gníomh
Tionscadail shábháilte Teorainneacha tionscadail le sonraí dóibh siúd atá eiticiúil
Daoine slán Tá rochtain ar fáil do dhaoine ar féidir leo a bheith i muinín sonraí (m.sh., daoine a bhfuil oiliúint eiticiúil orthu)
Sonraí slán Déantar na sonraí a shainaithint agus a chomhiomlánú a mhéid is féidir
Socruithe sábháilte Déantar sonraí a stóráil i ríomhairí le seomra fisiceacha cuí (m.sh., seomra faoi ghlas) agus bogearraí (eg cosaint phasfhocal, criptithe)
Aschur sábháilte Déantar athbhreithniú ar aschur taighde chun cosc ​​a chur ar sháruithe príobháideachta tionóiscí

Chomh maith le cosaint a dhéanamh ar do chuid sonraí agus tú á n-úsáid, céim amháin sa phróiseas taighde ina bhfuil riosca eolais ríthábhachtach go bhfuil roinnt sonraí le taighdeoirí eile. Is cuid lárnach de na hiarrachtaí eolaíocha é comhroinnt sonraí i measc eolaithe, agus éascaíonn sé go mór le cur chun cinn an eolais. Seo mar a thug Tí na dTíortha na Ríochta Aontaithe síos ar an tábhacht a bhaineann le sonraí a roinnt (Molloy 2011) :

"Tá sé ríthábhachtach rochtain a fháil ar shonraí má tá taighdeoirí chun na torthaí a thuairiscítear sa litríocht a atáirgeadh, a fhíorú agus a thógáil. Caithfidh an toimhde a bheith ann, mura bhfuil cúis láidir ar shlí eile, ba cheart sonraí a nochtadh go hiomlán agus a chur ar fáil go poiblí. "

Ach, trí do chuid sonraí a roinnt le taighdeoir eile, b'fhéidir go mbeadh riosca eolais ag méadú do do rannpháirtithe. Dá bhrí sin, d'fhéadfadh sé go gcruthóidh roinnt sonraí teannas bunúsach idir an oibleagáid sonraí a roinnt le heolaithe eile agus an oibleagáid riosca eolais a íoslaghdú do rannpháirtithe. Ar an drochuair, níl an t-aincheist seo chomh dian mar is dealraitheach. Ina ionad sin, is fearr smaoineamh ar roinnt sonraí mar atá ag titim ar feadh leanúnachas, agus gach pointe ar an bpróiseas sin ag soláthar meascán difriúil sochar don tsochaí agus riosca do rannpháirtithe (figiúr 6.6).

Ar cheann mhór, is féidir leat do chuid sonraí a roinnt gan aon duine, rud a laghdaíonn an baol do rannpháirtithe ach a íoslaghdaítear gnóthachain don tsochaí freisin. Ar an taobh eile, is féidir leat a scaoileadh agus a dearmad , i gcás ina bhfuil "sonraí gan ainm" agus a chuirtear ar fáil do gach duine. Maidir le sonraí a scaoileadh, tairiscintí a scaoileadh agus a chuardach déanann siad sochair níos airde don tsochaí agus do phriacal níos airde do rannpháirtithe. I measc an dá chás mhór seo tá raon hibridí, lena n-áirítear an méid a chuirfimid i gcur chuige gairdín ballaí . Faoin gcur chuige seo, roinntear sonraí le daoine a chomhlíonann critéir áirithe agus a n-aontaíonn a bheith faoi cheangal ag rialacha áirithe (m.sh. maoirseacht ó IRB agus plean cosanta sonraí). Soláthraíonn an cur chuige gairdín ballaí go leor de na buntáistí a bhaineann le scaoileadh agus déan dearmad ar a laghad. Ar ndóigh, cruthaíonn an cur chuige sin go leor ceisteanna - ba cheart go mbeadh rochtain acu, faoi na coinníollacha, agus ar feadh a fhad, ar chóir dóibh íoc as an ghairdín ballaí, etc., a choimeád agus a phóilíniú - ach ní féidir iad seo a dhéanamh. Go deimhin, tá gairdíní ballaí ag obair cheana féin ar féidir le taighdeoirí iad a úsáid anois, mar shampla cartlann sonraí Chuibhreannas Idir-ollscoile le haghaidh Taighde Polaitiúil agus Sóisialta in Ollscoil Michigan.

Fíor 6.6: Is féidir le straitéisí scaoilte sonraí titim ar feadh leanúnach. I gcás inar chóir duit a bheith ar an leanúnachas seo, braitheann sé ar shonraí sonracha do chuid sonraí, agus féadfaidh athbhreithniú tríú páirtí cabhrú leat an t-iarmhéid cuí riosca agus sochair a chinneadh i do chás. Braitheann cruth cruinn an chuar seo ar shonraí na sonraí agus na spriocanna taighde (Goroff 2015).

Fíor 6.6: Is féidir le straitéisí scaoilte sonraí titim ar feadh leanúnach. I gcás inar chóir duit a bheith ar an leanúnachas seo, braitheann sé ar shonraí sonracha do chuid sonraí, agus féadfaidh athbhreithniú tríú páirtí cabhrú leat an t-iarmhéid cuí riosca agus sochair a chinneadh i do chás. Braitheann cruth cruinn an chuar seo ar shonraí na sonraí agus na spriocanna taighde (Goroff 2015) .

Mar sin, cén áit ar chóir na sonraí ó do staidéar a bheith ar an leanúnachas gan aon ghhairdín ballaí a roinnt, agus a scaoileadh agus a dearmad? Braitheann sé seo ar shonraí do chuid sonraí: ní mór do thaighdeoirí Meas a chothromú do Dhaoine, Tairbhiú, Dlí agus Cirt, agus Meas ar Dhlí agus ar Leas an Phobail. Breathnaíodh ón bpeirspictíocht seo, nach bhfuil comhroinnt eiticiúil sainiúil ann; tá sé ar cheann de na gnéithe go leor den taighde ina bhfuil ar thaighdeoirí cothromaíocht eiticiúil cuí a aimsiú.

Go ginearálta, tá cuid de na criticeoirí i gcoinne na sonraí a roinnt, mar is dóigh liom go bhfuil siad dírithe ar a rioscaí - gan amhras go bhfuil siad fíor-agus gan neamhaird a dhéanamh ar a buntáistí. Mar sin, d'fhonn fócas a spreagadh ar rioscaí agus ar shochair araon, ba mhaith liom analaí a thairiscint. Gach bliain, tá gluaisteáin freagrach as na mílte básanna, ach ní dhéanaimid iarracht cosc ​​a chur ar thiomáint. Go deimhin, bheadh ​​glao chun cosc ​​a chur ar thiomáint absurdach toisc go gcuireann tiomáint ar chumas rudaí iontacha. Ina ionad sin, cuireann an tsochaí srianta ar féidir leo tiomáint (m.sh., an gá atá le haois áirithe agus trialacha áirithe a rith) agus conas is féidir leo tiomáint (m.sh., faoin luasteorainn). Tá sé i gceist ag an gcumann freisin na rialacha seo a fhorfheidhmiú (m.sh., póilíní), agus táimid ag pionósú ar dhaoine atá gafa ag sárú orthu. Is féidir an cineál céanna smaointeoireachta cothromaithe a bhaineann leis an tsochaí maidir le rialáil tiomána a chur i bhfeidhm chomh maith le roinnt sonraí. Is é sin, seachas argóintí iomlána a dhéanamh i gcomhair sonraí a roinnt nó a chomhroinn, is dóigh liom go ndéanfaimid an dul chun cinn is mó trí dhíriú ar conas is féidir linn na rioscaí a laghdú agus na buntáistí a bhaineann le sonraí a roinnt.

Le teacht i gcrích, tá méadú suntasach tagtha ar riosca eolais, agus tá sé an-deacair a thuar agus a chainníochtú. Dá bhrí sin, is fearr glacadh leis go bhféadfadh na sonraí go léir a aithint agus a d'fhéadfadh a bheith íogair. Chun riosca eolais a laghdú agus taighde á dhéanamh aige, is féidir le taighdeoirí plean cosanta sonraí a chruthú agus a leanúint. Thairis sin, ní chuireann riosca eolais cosc ​​ar thaighdeoirí as sonraí a roinnt le heolaithe eile.