6.6.2 સમજ અને મેનેજિંગ જાણકારીના જોખમ

આ અનુવાદ કમ્પ્યુટર દ્વારા બનાવવામાં આવી હતી. ×

6.6.2 સમજ અને મેનેજિંગ જાણકારીના જોખમ

સામાજિક સંશોધનમાં માહિતીપ્રદ જોખમ સૌથી સામાન્ય જોખમ છે; તે નાટ્યાત્મક વધારો થયો છે; અને તે સમજવા માટે ખૂબ સખત જોખમ છે.

ડિજિટલ-વય સંશોધન માટેનો બીજો નૈતિક પડકાર જાણકારીના જોખમ , માહિતીની જાહેરાત (National Research Council 2014) ના નુકસાન માટે સંભવિત છે. વ્યક્તિગત માહિતીના ખુલાસાથી માહિતીપ્રદ નુકસાન થાય છે આર્થિક (દા.ત. નોકરી ગુમાવવી), સામાજિક (દા.ત. શરમજનક), મનોવૈજ્ઞાનિક (દા.ત. ડિપ્રેસન), અથવા તો ફોજદારી (દા.ત., ગેરકાયદે વર્તન માટે ધરપકડ) હોઈ શકે છે. કમનસીબે, ડિજિટલ વયમાં જાણકારીના જોખમને નાટકીય ઢબે વધે છે-આપણી વર્તણૂક વિશે માત્ર એટલી વધુ માહિતી છે એનાલૉગ-વય સામાજિક સંશોધનમાં, જેમ કે ભૌતિક જોખમ જેવા જોખમોની સરખામણીએ, જાણકારીના જોખમને સમજવામાં અને મેનેજ કરવા માટે ખૂબ જ મુશ્કેલ સાબિત થયું છે.

એક રસ્તો છે કે સામાજિક સંશોધકો જાણકારીના જોખમ ઘટાડે માહિતી "anonymization" છે. "Anonymization" જેમ કે નામ, સરનામું, અને માહિતી ટેલિફોન નંબર તરીકે સ્પષ્ટ વ્યક્તિગત આઇડેન્ટીફાયર દૂર કરવાની પ્રક્રિયા છે. જો કે, આ અભિગમ ઊંડે અને મૂળભૂત મર્યાદિત ઘણી ઓછી અસરકારક કરતાં ઘણા લોકો ખ્યાલ છે, અને તે હકીકત છે. આ કારણોસર, જ્યારે હું વર્ણન "anonymization," હું અવતરણ ચિહ્નો તમને યાદ છે કે આ પ્રક્રિયા અનામી દેખાવ નથી, પરંતુ સાચી ગુમનામી બનાવે છે ઉપયોગ કરીશું.

"અનામીકરણ" ની નિષ્ફળતાનું આબેહૂબ ઉદાહરણ મેસ્સાચ્યુસેટ્સ (Sweeney 2002) માં 1990 ના દાયકાના અંતથી આવે છે. ગ્રૂપ વીમા કમિશન (જીઆઇસી) તમામ સરકારી કર્મચારીઓ માટે સ્વાસ્થ્ય વીમો ખરીદવા માટે જવાબદાર એક સરકારી એજન્સી હતી. આ કાર્ય દ્વારા, જીઆઇસીએ હજારો રાજ્ય કર્મચારીઓ વિશે વિગતવાર આરોગ્ય રેકોર્ડ્સ એકત્રિત કર્યા. સંશોધનને પ્રોત્સાહન આપવાના પ્રયાસરૂપે, જીઆઇસીએ આ રેકોર્ડ્સને સંશોધકોને છોડવાનો નિર્ણય કર્યો છે. જો કે, તેઓએ તેમના તમામ ડેટાને શેર કર્યા ન હતા; તેના બદલે, તેઓ આ માહિતીને "અનામિત" કરે છે જેમ કે નામ અને સરનામાંઓ દૂર કરીને. જો કે, તેમણે એવી માહિતી છોડી દીધી જે તેમને માનવામાં આવતી હતી કે સંશોધકો જેમ કે વસ્તીવિષયક માહિતી (પિન કોડ, જન્મ તારીખ, વંશીયતા, અને જાતિ) અને તબીબી માહિતી (માહિતી, નિદાન, કાર્યવાહીની મુલાકાત) (આંકડા 6.4) (Ohm 2010) માટે ઉપયોગી થઈ શકે છે. કમનસીબે, ડેટાને સુરક્ષિત કરવા માટે આ "અનામીકરણ" પૂરતું નથી.

આકૃતિ 6.4: અજ્ઞાત રૂપે ઓળખવાતી માહિતીને દૂર કરવાની પ્રક્રિયા છે. ઉદાહરણ તરીકે, રાજ્યના કર્મચારીઓના તબીબી વીમા રેકોર્ડ્સને રિલીઝ કરતી વખતે, મેસેચ્યુસેટ્સ ગ્રૂપ વીમા કમિશન (જીઆઇસી) એ ફાઇલોમાંથી નામો અને સરનામાં દૂર કર્યા. હું અનામીકરણની આસપાસના અવતરણ ચિહ્નોનો ઉપયોગ કરું છું કારણ કે આ પ્રક્રિયા અનામી ન હોવાનું દર્શાવતું નથી પરંતુ વાસ્તવિક અનામિત્વ નથી.

આકૃતિ 6.4: "અનામીકરણ" સ્પષ્ટપણે ઓળખવાતી માહિતીને દૂર કરવાની પ્રક્રિયા છે ઉદાહરણ તરીકે, રાજ્યના કર્મચારીઓના તબીબી વીમા રેકોર્ડ્સને રિલીઝ કરતી વખતે, મેસેચ્યુસેટ્સ ગ્રૂપ વીમા કમિશન (જીઆઇસી) એ ફાઇલોમાંથી નામો અને સરનામાં દૂર કર્યા. હું "અનામીકરણ" શબ્દના ઉદ્ઘાટનના ગુણનો ઉપયોગ કરું છું કારણ કે આ પ્રક્રિયા અનામી ન હોવાનું પ્રસ્તુત કરે છે પરંતુ વાસ્તવિક અનામિત્વ નથી.

જીઆઇસી "અનામીકરણ" ની ખામીઓને સમજાવવા માટે, લૅટાનિયા સ્વીની - પછી એમ.આઇ.ટી.ના ગ્રેજ્યુએટ વિદ્યાર્થીને કેમ્બ્રિજ શહેરના મતદાનના વિક્રમો પ્રાપ્ત કરવા માટે $ 20 ચૂકવ્યા હતા, જે મેસેચ્યુસેટ્સના ગવર્નર વિલિયમ વેલ્ડના વતન હતા. આ મતદાન રેકોર્ડમાં નામ, સરનામું, પિન કોડ, જન્મ તારીખ અને લિંગ જેવી માહિતી શામેલ છે. હકીકત એ છે કે તબીબી માહિતી ફાઇલ અને મતદાર ફાઇલ ક્ષેત્રો-ઝિપ કોડ, જન્મ તારીખ, અને જાતિને શેર કરે છે - તેનો અર્થ એ થયો કે સ્વીની તેમને લિંક કરી શકે છે. સ્વીની જાણતા હતા કે વેલ્ડનો જન્મદિવસ 31 જુલાઇ, 1945 ના રોજ હતો, અને મતદાનના રેકોર્ડમાં કેમ્બ્રિજમાં માત્ર છ લોકોનો જ જન્મદિવસ છે. વધુમાં, તે છ લોકોમાંથી, માત્ર ત્રણ પુરૂષ હતા. અને, તે ત્રણ માણસોમાંથી, ફક્ત એક જ વેલ્ડનું ઝિપ કોડ વહેંચ્યું હતું. આમ, મતદાનની માહિતી દર્શાવે છે કે વેલ્ડના જન્મ તારીખ, જાતિ અને પિન કોડના મિશ્રણ સાથેની તબીબી માહિતીમાંની કોઈપણ વ્યક્તિ વિલિયમ વેલ્ડ હતી. સારાંશમાં, માહિતીના આ ત્રણ ટુકડાઓએ તેમને માહિતીમાં એક અનન્ય ફિંગરપ્રિંટ પૂરું પાડ્યું હતું. આ હકીકતનો ઉપયોગ કરીને, સ્વીનીએ વેલ્ડના તબીબી રેકૉર્ડ્સને શોધી કાઢવા સક્ષમ હતા, અને, તેને તેના પરાક્રમની જાણ કરવા માટે, તેણીએ તેમના રેકોર્ડ્સની એક નકલ મોકલ્યા (Ohm 2010) .

આકૃતિ 6.5: અનામિક ડેટા પુનઃ નિર્માણ. લોટાનિયા સ્વીનીએ ગવર્નર વિલિયમ વેલ્ડના તબીબી રેકોર્ડ્સ સ્વીવિને (2002), 1 આકૃતિ 1 થી સ્વીકારવા માટેના મતદાન રેકોર્ડ સાથે અનામી આરોગ્ય વિક્રમને જોડ્યો.

આકૃતિ 6.5: "અનામિક" ડેટાને ફરી નિર્વિષ્ઠ કરવું. સ્વીત્ની Sweeney (2002) , આકૃતિ 1 થી સ્વીકારાયેલા ગવર્નર વિલિયમ વેલ્ડના મેડિકલ રેકોર્ડ્સ શોધવા માટે, લેટાનીની સ્વીનીએ "અનામી" આરોગ્ય વિક્રમ વિક્રમ સાથે રેકોર્ડ કર્યા હતા.

સ્વીનીના કાર્યમાં ફરીથી ઓળખ હુમલાઓના મૂળભૂત માળખાને સમજાવે છે- કમ્પ્યૂટર સુરક્ષા સમુદાયમાંથી શબ્દ સ્વીકારવા માટે. આ હુમલાઓમાં, બે ડેટા સમૂહો, જેમાંથી પોતે સંવેદનશીલ માહિતીને છતી કરે છે, કડી થાય છે, અને આ જોડાણ દ્વારા, સંવેદનશીલ માહિતી ખુલ્લી છે.

સ્વીનીના કાર્ય અને અન્ય સંબંધિત કાર્યના પ્રતિભાવમાં, સંશોધકો હવે સામાન્ય રીતે વધુ માહિતીને "સર્વસાધારણ રીતે ઓળખી શકાય તેવી માહિતી" (પીઆઈઆઈ) (Narayanan and Shmatikov 2010) - "અનામીકરણ" ની પ્રક્રિયા દરમિયાન-વધુ દૂર કરે છે. વધુમાં, ઘણા સંશોધકો હવે ખ્યાલ આવે છે કે અમુક માહિતી- જેમ કે મેડિકલ રેકોર્ડ્સ, નાણાકીય રેકોર્ડ, ગેરકાયદે વર્તણૂક વિશેના પ્રશ્નોનું સર્વેક્ષણ કરવું એ કદાચ "અનામીકરણ" પછી પણ મુક્ત થવાની સંવેદનશીલતા છે. તેમ છતાં, હું જે ઉદાહરણો આપવા જઈ રહ્યો છું તે સૂચવે છે કે સામાજિક સંશોધકોની જરૂર છે તેમની વિચારસરણી બદલવી પ્રથમ પગલું તરીકે, તે ધારેલું છે કે તમામ ડેટા સંભવિત રૂપે ઓળખી શકાય છે અને તમામ ડેટા સંભવિત રૂપે સંવેદનશીલ છે. બીજા શબ્દોમાં કહીએ તો, એવું લાગે છે કે માહિતીના જોખમો પ્રોજેક્ટના નાના સબસેટ પર લાગુ થાય છે, આપણે એવું ધારીએ છીએ કે તે લાગુ પડે છે- કેટલાક અંશે તમામ પ્રોજેક્ટ્સ માટે.

આ પુનર્નિર્માણના બંને પાસાંઓ Netflix પુરસ્કાર દ્વારા સચિત્ર છે. પ્રકરણ 5 માં વર્ણવ્યા મુજબ, નેટફ્લિક્સે લગભગ 500,000 સભ્યો દ્વારા પ્રદાન કરેલ 100 મિલિયન મૂવી રેટિંગ્સ રિલીઝ કર્યા હતા અને એક ખુલ્લો કૉલ કર્યો હતો જ્યાં સમગ્ર વિશ્વમાં લોકોએ આલ્ગોરિધમ્સ સુપરત કરી હતી જે ફિલ્મોની ભલામણ કરવા Netflix ની ક્ષમતાને વધુ સારી બનાવી શકે છે. ડેટા બહાર પાડતા પહેલા, નેટફ્લિક્સે કોઈ પણ સ્પષ્ટ રૂપે ઓળખી શકાય તેવી માહિતી, જેમ કે નામો દૂર કર્યા. તેઓ એક વધારાનું પગલા પણ લીધું અને કેટલાક રેકોર્ડમાં થોડો ગુંથાવવાની શરૂઆત કરી હતી (દા.ત., 4 સ્ટારથી 3 તારાઓ માટે કેટલીક રેટિંગ્સ બદલવી). તેઓ ટૂંક સમયમાં જ શોધ્યું, તેમ છતાં, તેમના પ્રયત્નો છતાં, માહિતી હજુ પણ અનામિક દ્વારા કોઈ જ રીતે નથી.

ડેટા પ્રકાશિત થયાના બે અઠવાડિયા પછી, અરવિંદ નારાયણન અને વિટ્ટા શમેટિકોવ (2008) દર્શાવે છે કે વિશિષ્ટ લોકોની મૂવી પસંદગીઓ વિશે શીખવું શક્ય છે. તેમના પુનઃ-ઓળખ હુમલાની યુક્તિ, સ્વીનીની સમાન હતી: સંભવિત સંવેદનશીલ માહિતી સાથે એક, અને માહિતીની સ્પષ્ટ ઓળખ કરતી માહિતી અને લોકોની ઓળખને સમાવતી એક, બે માહિતી સ્ત્રોતો એકસાથે મર્જ કરો. આ દરેક ડેટા સ્ત્રોતો વ્યક્તિગત રૂપે સલામત હોઈ શકે છે, પરંતુ જ્યારે તેઓ સંયુક્ત થઈ જાય છે, ત્યારે મર્જ કરેલા ડેટાસેટ માહિતીપ્રદ જોખમ બનાવી શકે છે. Netflix માહિતી કિસ્સામાં, અહીં તે કેવી રીતે થઇ શકે છે. કલ્પના કરો કે હું મારા સહકાર્યકરો સાથે ક્રિયા અને કોમેડી ફિલ્મો વિશે મારા વિચારો શેર કરવાનું પસંદ કર્યું છે, પરંતુ હું ધાર્મિક અને રાજકીય ફિલ્મો વિશે મારા અભિપ્રાય શેર ન કરવા માટે પસંદ કરે છે. મારા સહકાર્યકરો તે માહિતીનો ઉપયોગ કરી શકે છે જે મેં Netflix ડેટામાં મારા રેકોર્ડ્સને શોધવા માટે તેમની સાથે શેર કર્યું છે; હું જે માહિતી શેર કરું છું તે વિલિયમ વેલ્ડની જન્મ તારીખ, પિન કોડ, અને સેક્સ જેવી અનન્ય ફિંગરપ્રિન્ટ હોઈ શકે છે. પછી, જો તેઓ મારા અનન્ય ફિંગરપ્રિન્ટને ડેટામાં મળ્યાં હોય, તો તેઓ તમામ ફિલ્મો વિશેની મારી રેટિંગ્સ શીખશે, જેમાં મેં શેર ન કરવાનું પસંદ કર્યું હશે. એક જ વ્યક્તિ પર ધ્યાન કેન્દ્રિત કરેલા આ પ્રકારના લક્ષ્યાંક હુમલા ઉપરાંત, નારાયણન અને શ્માતિકોવએ પણ દર્શાવ્યું હતું કે મોટાભાગના લોકો સાથે સંકળાયેલા એક વ્યાપક હુમલાને શક્ય છે- Netflix ડેટાને વ્યક્તિગત અને મૂવી રેટિંગ ડેટા સાથે મર્જ કરીને કેટલાક લોકોએ પસંદ કર્યું છે ઇન્ટરનેટ મૂવી ડેટાબેઝ (આઇએમડીબી) પર પોસ્ટ કરવા માટે. તદ્દન સરળ, કોઈ ચોક્કસ માહિતી કે જે વિશિષ્ટ વ્યક્તિ માટે એક અનન્ય ફિંગરપ્રિંટ છે - પણ તેમના મૂવી રેટિંગ્સનો સેટ-તેમને ઓળખવા માટે ઉપયોગમાં લઈ શકાય છે.

જો કે લક્ષ્યાંકિત અથવા વ્યાપક હુમલામાં Netflix ડેટાને ફરી ઓળખી શકાય છે, તેમ છતાં, તે હજુ પણ ઓછી જોખમ તરીકે દેખાઈ શકે છે. છેવટે, મૂવી રેટિંગ્સ ખૂબ સંવેદનશીલ લાગતું નથી. જ્યારે કે સામાન્ય રીતે સાચી હોઇ શકે છે, ડેટાસેટમાંના કેટલાક 500,000 લોકો માટે, મૂવી રેટિંગ્સ કદાચ ખૂબ સંવેદનશીલ હોઇ શકે છે. વાસ્તવમાં, ફરી ઓળખના પ્રતિભાવમાં, એક કબાટ લેસ્બિયન મહિલા નેટફિલ્ક્સ સામે ક્લાસ-એક્શન સ્યુટમાં જોડાઈ. અહીં કેવી રીતે સમસ્યા તેમના (Singel 2009) :

"[એમ] ઓવી અને રેટિંગ ડેટામાં ... અત્યંત વ્યક્તિગત અને સંવેદનશીલ પ્રકૃતિની માહિતી છે. સદસ્યની મૂવી માહિતી Netflix સભ્યના વ્યક્તિગત હિત અને / અથવા જાતિયતા, માનસિક બીમારી, મદ્યપાનમાંથી પુનઃપ્રાપ્તિ, વ્યભિચાર, શારીરિક દુર્વ્યવહાર, ઘરેલું હિંસા, વ્યભિચાર, અને બળાત્કારનો ભોગ બનનાર સહિત અત્યંત મહત્વપૂર્ણ વ્યક્તિગત મુદ્દાઓ સાથે સંઘર્ષ કરે છે. "

નેટફ્લિક્સ પ્રાઇઝ ડેટાની પુનઃ-ઓળખ બંને સમજાવે છે કે તમામ ડેટા સંભવિત રૂપે ઓળખી શકાય છે અને તે તમામ ડેટા સંભવિત રૂપે સંવેદનશીલ છે. આ બિંદુએ, તમે વિચારી શકો છો કે આ માત્ર તે જ ડેટા પર લાગુ થાય છે જે લોકો વિશે હોવાનો ઉલ્લેખ કરે છે. આશ્ચર્યજનક રીતે, તે કિસ્સો નથી. ફ્રીડમ ઓફ ઇન્ફોર્મેશન લો વિનંતીના જવાબમાં, ન્યુ યોર્ક સિટી સરકારે 2013 માં ન્યૂ યોર્કમાં દરેક ટેક્સી સવારીના રેકોર્ડની રિલીઝ કરી હતી, જેમાં દુકાન, ડ્રોપ ડાઉન ટાઇમ્સ, લોકેશન અને ભાડા રકમ (પ્રકરણ 2 થી યાદ છે કે જે Farber (2015) શ્રમ અર્થશાસ્ત્રમાં મહત્વપૂર્ણ સિદ્ધાંતોનું પરીક્ષણ કરવા માટે સમાન માહિતીનો ઉપયોગ કર્યો હતો) ટેક્સી પ્રવાસો વિશે આ માહિતી સૌમ્ય લાગે શકે છે કારણ કે તે લોકો વિશેની માહિતી પૂરી પાડતી નથી, પરંતુ એન્થોની ટોકરે સમજ્યું હતું કે આ ટેક્સી ડેટાસેટમાં ખરેખર લોકો વિશે સંભવિત સંવેદનશીલ માહિતી છે. દાખલા તરીકે, તેમણે ન્યૂ હર્સ્ટલર ક્લબમાં શરૂ થયેલી તમામ પ્રવાસોમાં જોયું - મધ્યરાત્રિ વચ્ચે અને મધ્યરાત્રિ વચ્ચેના 6 વાગ્યે અને ત્યારબાદ તેમના ડ્રોપ-આઉટ સ્થાનો મળી. આ શોધ ખુલ્લી રીતે જાહેર થઈ - કેટલાક લોકોના સરનામાંની સૂચિ, જેમણે હસ્ટલર ક્લબ (Tockar 2014) વારંવાર મુલાકાત લીધી. તે કલ્પના કરવી મુશ્કેલ છે કે જ્યારે શહેરની સરકારે આને ધ્યાનમાં રાખ્યું ત્યારે તે ડેટા પ્રકાશિત કર્યો હકીકતમાં, આ જ તકનીકનો ઉપયોગ શહેરના કોઈ પણ સ્થળની મુલાકાત લેનારા લોકોના હોમ સરનામાંને શોધી શકે છે-એક તબીબી ક્લિનિક, સરકારી બિલ્ડિંગ અથવા ધાર્મિક સંસ્થા.

નેટફ્લિક્સ પ્રાઇઝ અને ન્યુ યોર્ક સિટી ટેક્સી ડેટાના આ બે કેસો દર્શાવે છે કે પ્રમાણમાં કુશળ લોકો માહિતીના જોખમને અંદાજીત રીતે યોગ્ય રીતે અંદાજવામાં નિષ્ફળ થઈ શકે છે, જે તેઓ મુક્ત કરે છે-અને આ કેસો કોઈ પણ રીતે અનન્ય નથી (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . વધુમાં, આવા ઘણા કિસ્સાઓમાં, સમસ્યારૂપ માહિતી હજી પણ ઓનલાઈન ઉપલબ્ધ છે, જે ડેટા રિલીઝને રદ કરવાની મુશ્કેલીને દર્શાવે છે. એકંદરે, આ ઉદાહરણો- તેમજ કોમ્પ્યુટર સાયન્સમાં ગુપ્તતા વિશે સંશોધન-મહત્વપૂર્ણ પરિષદ તરફ દોરી જાય છે. સંશોધકોએ ધારવું જોઈએ કે તમામ ડેટા સંભવિત રૂપે ઓળખી શકાય છે અને તમામ ડેટા સંભવિત રૂપે સંવેદનશીલ છે.

કમનસીબે, તથ્યોનો કોઈ સરળ ઉકેલ નથી કે તમામ ડેટા સંભવિત રૂપે ઓળખી શકાય છે અને તે તમામ ડેટા સંભવિત રૂપે સંવેદનશીલ છે. જો કે, માહિતીના જોખમને ઘટાડવાની એક રીત જ્યારે તમે ડેટા સાથે કામ કરી રહ્યા હોવ તો ડેટા પ્રોટેક્શન પ્લાન બનાવવા અને તેનું પાલન કરવું છે. આ યોજના તમારા ડેટાને લીક કરશે તેવી તકને ઘટાડે છે અને નુકસાનને ઘટાડે છે જો લીક કોઈક રીતે થાય છે. ડેટા પ્રોટેક્શન યોજનાઓના સ્પષ્ટીકરણો, જેમ કે કયા પ્રકારના એન્ક્રિપ્શનનો ઉપયોગ કરવો, સમય જતાં બદલાશે, પરંતુ યુકે ડેટા સર્વિસીસ ડેટા રિપોર્ટ પ્લાનના ઘટકોને પાંચ કેટેગરીમાં મદદરૂપ રીતે ગોઠવે છે કે તેઓ પાંચ સલામત ફોન કરે છેઃ સલામત યોજનાઓ, સલામત લોકો , સલામત સેટિંગ્સ, સલામત ડેટા અને સલામત આઉટપુટ (કોષ્ટક 6.2) (Desai, Ritchie, and Welpton 2016) . પાંચ સલાશેમાંથી કોઈ વ્યક્તિગત રીતે સંપૂર્ણ રક્ષણ પૂરું પાડતું નથી પરંતુ એકસાથે તેઓ પરિબળો એક શક્તિશાળી સમૂહ રચના કરી શકે છે જે માહિતીપ્રદ જોખમ ઘટાડી શકે છે.

કોષ્ટક 6.2: "ફાઇવ સેફેસ" ડેટા પ્રોટેક્શન પ્લાન (Desai, Ritchie, and Welpton 2016)
સલામત	ક્રિયા
સુરક્ષિત પ્રોજેક્ટ્સ	નૈતિકતાવાળા લોકોને માહિતી સાથેની મર્યાદાઓ
સુરક્ષિત લોકો	વપરાશ એવા લોકો માટે પ્રતિબંધિત છે જે માહિતી સાથે વિશ્વાસ કરી શકાય છે (દા.ત., જે લોકો નૈતિક તાલીમથી પસાર થયા છે)
સલામત ડેટા	શક્ય એટલી હદ સુધી ડેટાને ઓળખી કાઢવામાં આવે છે અને એકત્રિત કરવામાં આવે છે
સલામત સેટિંગ્સ	માહિતી યોગ્ય ભૌતિક (દા.ત. લૉક રૂમ) અને સૉફ્ટવેર (દા.ત. પાસવર્ડ સુરક્ષા, એન્ક્રિપ્ટેડ) સુરક્ષા સાથે કમ્પ્યુટર્સમાં સંગ્રહિત થાય છે
સેફ આઉટપુટ	આકસ્મિક ગોપનીયતાના ઉલ્લંઘનોને અટકાવવા સંશોધન ઉત્પાદનની સમીક્ષા કરવામાં આવે છે

જ્યારે તમે તેનો ઉપયોગ કરો છો ત્યારે તમારા ડેટાને સુરક્ષિત કરવા ઉપરાંત, સંશોધન પ્રક્રિયામાં એક પગલું છે કે જ્યાં માહિતીપ્રદ જોખમ ખાસ કરીને મુખ્ય છે અન્ય સંશોધકો સાથે ડેટા વહેંચણી છે. વિજ્ઞાનીઓ વચ્ચે ડેટા વહેંચણી એ વૈજ્ઞાનિક પ્રયાસનું મુખ્ય મૂલ્ય છે, અને તે જ્ઞાનની પ્રગતિને વ્યાપકપણે સુવિધા આપે છે. યુકે હાઉસ ઑફ કૉમન્સે માહિતી વહેંચણીના મહત્વનું વર્ણન કર્યું છે તે અહીં છે (Molloy 2011) :

"સંશોધકો સાહિત્યમાં પ્રસ્તુત થયેલા પરિણામો પર ફરી પ્રોડ્યૂસ કરવા, ચકાસવા અને બિલ્ડ કરવા માટે હોય તો માહિતીનો વપરાશ મૂળભૂત છે. ધારણા એવી હોવી જ જોઇએ કે, જ્યાં સુધી અન્ય કોઈ મજબૂત કારણ ન હોય ત્યાં સુધી, માહિતી સંપૂર્ણપણે પ્રગટ થવી જોઈએ અને જાહેરમાં ઉપલબ્ધ કરાવી લેવી જોઈએ. "

હજુ સુધી, તમારા ડેટાને બીજા સંશોધક સાથે શેર કરીને, તમે તમારા સહભાગીઓને માહિતીના જોખમમાં વધારો કરી રહ્યાં છો. આમ, એવું લાગે છે કે ડેટા શેરિંગ અન્ય વૈજ્ઞાનિકો સાથે ડેટા શેર કરવાની જવાબદારી અને સહભાગીઓને જાણકારીનું જોખમ ઘટાડવા માટેની જવાબદારી વચ્ચે મૂળભૂત તણાવનું સર્જન કરે છે. સદભાગ્યે, આ મૂંઝવણ તે દેખાય તેટલી ગંભીર નથી. ઊલટાનું, ડેટાન શેરિંગ વિશે સાતત્ય સાથે ઘટી જવાનું વિચારવું તે વધુ સારું છે, સમાજના લાભ માટે એક અલગ મિશ્રણ પૂરું પાડે છે અને સહભાગીઓને જોખમ છે (આંકડા 6.6).

એક આત્યંતિક સમયે, તમે કોઈની સાથે તમારો ડેટા શેર કરી શકો છો, જે સહભાગીઓને જોખમ ઘટાડે છે પરંતુ સમાજને લાભ પણ ઓછો કરે છે. અન્ય આત્યંતિક સમયે, તમે પ્રકાશિત અને ભૂલી શકો છો, જ્યાં ડેટા "અનામિક" છે અને દરેક માટે પોસ્ટ કરેલ છે. રિલીઝ થતી નથી, રિલીઝ અને ભૂલી જવાથી સમાજના ઊંચા લાભો અને સહભાગીઓને વધુ જોખમ આપે છે. આ બે આત્યંતિક કેસોમાં વચ્ચે હાઇબ્રીડ્સની શ્રેણી છે, જેમાં હું કોટવાળા બગીચાના અભિગમને કૉલ કરું છું. આ અભિગમ હેઠળ, માહિતી એવા લોકો સાથે વહેંચવામાં આવે છે જે ચોક્કસ માપદંડોને પૂરા કરે છે અને જે ચોક્કસ નિયમો દ્વારા બંધાયેલા છે (દા.ત., એક આઇઆરબી અને ડેટા પ્રોટેક્શન પ્લાનની દેખરેખ). દિવાલોથી બગીચો અભિગમ પ્રકાશનના ઘણા લાભો પૂરા પાડે છે અને ઓછા જોખમથી ભૂલી જાય છે. અલબત્ત, આવા અભિગમથી ઘણાં પ્રશ્નો ઊભા થાય છે - જેમને કઇ પરિસ્થિતિઓ હેઠળ, અને કેટલો સમય સુધી, કોટ બગીચાને જાળવી રાખવા અને પોલીસને રોકવા માટે કોણે ચૂકવણી કરવી જોઈએ, વગેરેનો ઉપયોગ કરવો જોઈએ- પણ તે અસ્પષ્ટ છે. વાસ્તવમાં, પહેલેથી જ કોટવાળા બગીચાઓ કાર્યરત છે જે સંશોધકો હમણાં ઉપયોગ કરી શકે છે, જેમ કે મિશિગન યુનિવર્સિટીમાં રાજકીય અને સામાજિક સંશોધન માટે ઇન્ટર-યુનિવર્સિટી કોન્સોર્ટિયમના ડેટા આર્કાઇવ.

આકૃતિ 6.6: ડેટા રિલીઝ વ્યૂહરચનાઓ અખંડ સાથે આવી શકે છે. જ્યાં તમે આ સાતત્ય પર હોવો જોઈએ તે તમારા ડેટાના ચોક્કસ વિગતો પર આધાર રાખે છે, અને તૃતીય-પક્ષની સમીક્ષા તમને જોખમની યોગ્ય સંતુલન અને તમારા કેસમાં ફાયદા માટે નક્કી કરવામાં મદદ કરી શકે છે. આ વળાંકની ચોક્કસ આકાર માહિતી અને સંશોધનના લક્ષ્યો (Goroff 2015) ના સ્પષ્ટીકરણો પર આધારિત છે.

તેથી, જ્યાં તમારા અભ્યાસના ડેટાને કોઈ વહેંચણી, દીવાલ બગીચા, અને રિલીઝ થવી જોઈએ અને ભૂલી જવું જોઈએ? આ તમારા ડેટાની વિગતો પર આધારિત છે: સંશોધકોએ લૉ અને જાહેર હિત માટે વ્યક્તિઓ, લાભો, ન્યાય અને આદર માટે માન આપવું જોઈએ. આ પરિપ્રેક્ષ્યથી જોવામાં આવે છે, ડેટા શેરિંગ એક વિશિષ્ટ નૈતિક ઉખાણું નથી; તે સંશોધકોને યોગ્ય નૈતિક સંતુલન શોધવાનું છે તે સંશોધનના ઘણા પાસાંમાંનું એક છે.

કેટલાક ટીકાકારોનો સામાન્ય રીતે ડેટા વહેંચણીનો વિરોધ કરવામાં આવે છે, કારણ કે મારા મતે, તેઓ તેના જોખમો પર ધ્યાન કેન્દ્રિત કરે છે - જે નિઃશંકપણે વાસ્તવિક છે - અને તેના ફાયદાઓનું અવગણવું છે તેથી, જોખમો અને લાભો પર ધ્યાન કેન્દ્રિત કરવા પ્રોત્સાહિત કરવા માટે, હું એક સાદ્રશ્ય પ્રસ્તુત કરવા માંગું છું. દર વર્ષે, કાર હજારો મૃત્યુ માટે જવાબદાર છે, પરંતુ અમે ડ્રાઇવિંગ પર પ્રતિબંધ મૂકવાનો પ્રયાસ કરતા નથી. હકીકતમાં, ડ્રાઈવિંગ પર પ્રતિબંધ મૂકવાનો કોલ અકસ્માત બનશે કારણ કે ડ્રાઇવિંગ ઘણા અદ્ભુત વસ્તુઓને સક્ષમ કરે છે. ઊલટાનું, સમાજ એ કોણ છે (જેમ કે ચોક્કસ વય અને ચોક્કસ પરીક્ષણો પસાર કરવાની જરૂર છે) અને તેઓ કેવી રીતે વાહન ચલાવી શકે છે (દા.ત., સ્પીડ સીમા હેઠળ) પર પ્રતિબંધ મૂકી શકે છે. સોસાયટી પાસે આ નિયમો અમલમાં મૂકવા લોકો પણ છે (દા.ત., પોલીસ), અને અમે એવા લોકોને શિક્ષા કરીએ છીએ કે જેઓ તેમને ભંગ કરે છે. આ જ પ્રકારની સંતુલિત વિચારસરણી કે જે સમાજને ડ્રાઇવિંગ નિયમન માટે લાગુ પડે છે તે પણ ડેટા શેરિંગ પર લાગુ કરી શકાય છે. એટલે કે, ડેટા શેરિંગ માટે અથવા વિરુદ્ધ નિર્દોષવાદી દલીલો કરવાને બદલે, મને લાગે છે કે અમે જોખમો ઘટાડવા અને માહિતી વહેંચણીના ફાયદામાં વધારો કેવી રીતે કરી શકીએ તેના પર ધ્યાન કેન્દ્રિત કરીને અમે સૌથી વધુ પ્રગતિ કરીશું.

નિષ્કર્ષ કરવા માટે, માહિતીના જોખમમાં નાટ્યાત્મક વધારો થયો છે, અને આગાહી કરવા માટે અને જથ્થાને ખૂબ જ મુશ્કેલ છે. તેથી, એ ધારવું શ્રેષ્ઠ છે કે તમામ ડેટા સંભવિત રૂપે ઓળખી શકાય છે અને સંભવિત રૂપે સંવેદનશીલ છે. સંશોધન કરતી વખતે જાણકારીના જોખમને ઘટાડવા માટે, સંશોધકો ડેટા પ્રોટેક્શન પ્લાન બનાવી અને તેનું પાલન કરી શકે છે. વધુમાં, જાણકારીના જોખમો સંશોધકોને અન્ય વૈજ્ઞાનિકો સાથે માહિતી વહેંચતા અટકાવતા નથી.