6.6.2 समजून घेणे, व्यवस्थापन माहिती धोका

हे भाषांतर संगणक तयार केले होते. ×

6.6.2 समजून घेणे, व्यवस्थापन माहिती धोका

सामाजिक संशोधनामध्ये माहितीचे धोका सर्वात सामान्य आहे; तो नाटकीय वाढ झाली आहे; आणि ते समजून घेणं अवघड आहे.

डिजीटल-एज रिसर्चसाठीचे दुसरे नैतिक आव्हान माहितीचे धोका आहे , माहिती उघड करण्यापासून (National Research Council 2014) हानीची क्षमता. वैयक्तिक माहिती उघड करण्यापासून माहितीची हानी आर्थिक असू शकते (उदा. नोकरी गमावणे), सामाजिक (उदा., शर्मिंदगी), मानसिक (उदा. नैराश्य), किंवा गुन्हेगारी (उदा. दुर्दैवाने, डिजिटल वय माहितीपूर्ण जोखीम नाटकीयपणे वाढवते-आमच्या वागणुकीबद्दल फक्त एवढी जास्त माहिती आहे एनालॉग एजज सोशल रिसर्चसारख्या शारीरिक धोक्यांशी संबंधित जोखमींच्या तुलनेत माहितीपूर्ण जोखमीमुळे समजावणे आणि व्यवस्थापन करणे फार कठीण झाले आहे.

सामाजिक संशोधक माहितीच्या धोका कमी एक मार्ग डेटा "anonymization" आहे. "Anonymization" जसे नाव, पत्ता, आणि डेटा दूरध्वनी क्रमांक स्पष्ट वैयक्तिक अभिज्ञापक काढून प्रक्रिया आहे. तथापि, हा दृष्टिकोन गंभीरपणे आणि मूलतः मर्यादित अनेक लोक लक्षात पेक्षा खूपच कमी प्रभावी आहे, आणि तो खरं तर, आहे. त्या कारणास्तव, मी वर्णन तेव्हा "anonymization," मी अवतरण चिन्ह तुम्हांला आठवण करुन द्यावीशी ही प्रक्रिया नाव गुप्त ठेवण्याच्या देखावा पण खरे नाव गुप्त ठेवण्याच्या निर्माण वापरू शकाल.

1 99 0 च्या दशकाच्या उत्तरार्धात "निनावीपणा" अयशस्वी होण्याचा एक स्पष्ट उदाहरण मॅसचुसेट्समध्ये (Sweeney 2002) . ग्रुप इन्शुरन्स कमिशन (जीआयसी) सर्व सरकारी कर्मचार्यांसाठी आरोग्य विमा खरेदी करण्यासाठी जबाबदार असलेली एक सरकारी संस्था होती. या कार्याद्वारे, GIC ने हजारो राज्य कर्मचा-यांसाठी तपशीलवार आरोग्य रेकॉर्डस संग्रहित केले. संशोधन वाढवण्यासाठी प्रयत्नात, जीआयसीने हे रेकॉर्ड संशोधकांना सोडण्याचे ठरविले. तथापि, त्यांनी त्यांचा सर्व डेटा सामायिक केला नाही; त्याऐवजी, त्यांनी नावे आणि पत्ते यासारखी माहिती काढून टाकून हे डेटा "निनावी" केले तथापि, त्यांनी इतर माहिती जसे की लोकसंख्याशास्त्रीय माहिती (झिप कोड, जन्म तारीख, जाती आणि लिंग) आणि वैद्यकीय माहिती (डेटा, निदान, प्रक्रिया) (आकृती 6.4) (Ohm 2010) यासारख्या संशोधकांसाठी उपयुक्त असू शकते. दुर्दैवाने, डेटाचे संरक्षण करण्यासाठी हे "निनावीकरण" पुरेसे नव्हते

आकृती 6.4: अनामिकरण हे स्पष्टपणे ओळखण्यायोग्य माहिती काढून टाकण्याची प्रक्रिया आहे. उदाहरणार्थ, राज्य कर्मचा-यांचे वैद्यकीय विमा रेकॉर्ड उघडताना, मॅसॅच्युसेट्स ग्रुप इन्शुरन्स कमिशन (जीआयसी) ने फाईल्सवरून नावे आणि पत्ते काढून टाकले मी अनामिकतेच्या शब्दाभोवती अवतरण चिन्ह वापरतो कारण ही प्रक्रिया अनामिकतेचे स्वरूप प्रदान करते परंतु प्रत्यक्ष अनामिकत्व नसून.

आकृती 6.4: "अनामिकरण" म्हणजे स्पष्टपणे ओळखणारी माहिती काढून टाकण्याची प्रक्रिया आहे. उदाहरणार्थ, राज्य कर्मचा-यांचे वैद्यकीय विमा रेकॉर्ड उघडताना, मॅसॅच्युसेट्स ग्रुप इन्शुरन्स कमिशन (जीआयसी) ने फाईल्सवरून नावे आणि पत्ते काढून टाकले मी "निनावीकरण" शब्दाभोवती अवतरण चिन्ह वापरतो कारण ही प्रक्रिया अनामिकता दर्शवते परंतु वास्तविक अनामिकत्व नाही.

जीआयसीच्या "निनावीपणा" ची उणीव स्पष्ट करण्यासाठी लॅटन्नी स्वीनी- नंतर एमआयटीतील एका पदवीधर विद्यार्थ्याने कॅम्ब्रिज शहरातील मॅटिच्यूसेट्सचे गव्हर्नर विल्यम वेल्ड यांच्या गावी शहरातील मतदानाच्या नोंदी प्राप्त करण्यासाठी $ 20 दिले. या मतदान अभिलेखांमध्ये नाव, पत्ता, झिप कोड, जन्मतारीख, आणि लिंग यासारखी माहिती समाविष्ट होती. वैद्यकीय डेटा फाईल आणि मतदारांनी फील्ड्स-झिप कोड, जन्मतारीख, आणि लैंगिक शेअर केल्याचा अर्थ स्वीनी त्यांना जोडता येऊ शकतो. स्वीनी यांना माहीत होते की वेल्डचा वाढदिवस जुलै 31, 1 9 45 होता आणि मतदानाच्या नोंदींमध्ये कॅंब्रिजमध्ये फक्त सहा जण त्या वाढदिवशी होते. पुढे त्या सहा लोकांचे तीन पुरुष होते. आणि, त्या तिन्ही पुरुषांपैकी फक्त एकाने वेल्डचे झिप कोड सामायिक केले. अशाप्रकारे, मतदानाच्या डेटाने हे सिद्ध केले की वेल्ड चे जन्म दिनांक, लिंग, आणि पिन कोडच्या वैद्यकीय डेटामधील कोणीही विल्यम वेल्ड थोडक्यात, माहितीच्या या तीन तुकड्या माहितीमध्ये एक अद्वितीय फिंगरप्रिंट प्रदान केली. हे सत्य वापरुन, स्वीलेने वेल्डचे वैद्यकीय रेकॉर्ड शोधून काढले आणि त्याच्या पराक्रमाने त्यांना माहिती दिली, तेव्हा त्यांनी आपल्या नोंदींची एक प्रत (Ohm 2010) पाठवून दिली.

आकृती 6.5: अनामित डेटाचे पुनर्विकालन. स्वीन्नी (2002), 1 आकृती 1 मधील राज्यपाल विलियम वेल्ड यांचे वैद्यकीय अहवाल शोधण्यासाठी लॅटिआनी स्वीनी यांनी नावनोंदणी केलेल्या आरोग्य नोंदींची नोंद केली.

आकृती 6.5: "अनामित" डेटाचे पुनर्विकालन. लॅटनी स्वीनी यांनी Sweeney (2002) , 1 आकृती 1 मधील राज्यपाल विल्यम वेल्ड यांचे वैद्यकीय रेकॉर्ड शोधण्यासाठी मतमोजणीच्या रेकॉर्डचे नाव "निनावी" केले.

स्वीनीचे काम पुन्हा ओळखल्या जाणार्या हल्ल्यांमधील मूलभूत संरचनेचे वर्णन करते- संगणक सुरक्षा समुदायातून एक पद स्वीकारण्यासाठी. या हल्ल्यांमध्ये, दोन डेटा संच, ज्यापैकी स्वतःस संवेदनशील माहिती मिळत नाही, जोडलेले आहेत आणि या लिंकेजद्वारे संवेदनशील माहिती उघड केली आहे.

स्वीनीच्या कामाचा आणि इतर संबंधित कामास प्रतिसाद म्हणून संशोधकांना आता "अनामिकरण" प्रक्रियेदरम्यान अधिक माहिती - सर्व "वैयक्तिकरित्या ओळखण्यायोग्य माहिती" (पीआयआय) (Narayanan and Shmatikov 2010) - अधिक माहिती काढून टाकते. पुढे, अनेक संशोधक आता लक्षात घ्या की विशिष्ट डेटा - जसे वैद्यकीय रेकॉर्ड, आर्थिक रेकॉर्ड, बेकायदा वागणुकीबद्दल प्रश्नांची उत्तरे देणे कदाचित "निनावीकरण" नंतरही रिलीज करण्याची अत्यंत संवेदनशील आहे. परंतु, ज्या उदाहरणे मी देत आहोत त्यास सूचित करते की सामाजिक संशोधकांना आवश्यक आहे त्यांचे विचार बदलण्यासाठी पहिले पाऊल म्हणून, असे गृहीत धरणे शहाणपणा आहे की सर्व डेटा संभाव्य ओळखले जाऊ शकतात आणि सर्व डेटा संभवतः संवेदनशील असतात. दुसऱ्या शब्दांत सांगायचे तर, माहितीपूर्ण जोखीम प्रोजेक्ट्सच्या लहान उपसंचावर लागू होते असे मानण्याऐवजी, आपण असे गृहीत धरले पाहिजे की ते काही प्रमाणात-सर्व प्रकल्पांसाठी लागू होते.

या पुनर्रचनाचे दोन्ही पैलू Netflix पारितोषिकाने स्पष्ट केले आहेत. अध्याय 5 मध्ये वर्णन केल्याप्रमाणे, Netflix ने जवळजवळ 500,000 सदस्यांनी प्रदान केलेली 100 मिलियन चित्रपट रेटिंग्स रिलीझ केले, आणि एक मुक्त कॉल केला होता जेथे संपूर्ण जगभरातील लोक अल्गोरिदम सबमिट केले जे चित्रपटांची शिफारस करण्याची Netflix च्या क्षमतेत सुधारणा करू शकतील. डेटा सोडण्यापूर्वी, Netflix कोणत्याही स्पष्टपणे ओळखली माहिती काढली, जसे नावे त्यांनी आणखी एक पाऊल पुढे टाकले आणि काही नोंदी मध्ये थोडीशी उलथापालथ केली (उदा., चार तार्यांकडून 3 तारांकडून काही रेटिंग बदलत) लवकरच त्यांनी हे शोधून काढले की, त्यांच्या प्रयत्नांना न जुमानता डेटा अद्याप अज्ञात आहे

माहिती प्रकाशित झाल्यानंतर दोन आठवड्यांनी अरविंद नारायणन आणि विटाली शॅटमॅटिकॉव्ह (2008) स्पष्ट केले की विशिष्ट लोकांच्या चित्रपटाच्या पसंतीबद्दल माहिती घेणे शक्य होते. त्यांच्या पुनर्निर्देशित आक्रमणांची युक्ती स्वीनीसारखीच होती: दोन माहिती स्रोत एकत्रित केली गेली, संभाव्य संवेदनशील माहितीसह एक आणि स्पष्टपणे ओळखणारी माहिती आणि ज्यामध्ये लोकांच्या ओळखी असणे समाविष्ट आहे. यातील प्रत्येक डेटा स्त्रोत वैयक्तिकरित्या सुरक्षित असू शकतात, परंतु जेव्हा ते एकत्र केले जातात तेव्हा विलीन डेटासेट माहितीपूर्ण जोखीम तयार करू शकतो. नेटफ्लिक्स डेटाच्या बाबतीत, हे कसे घडते ते येथे आहे. कल्पना करा की मी माझ्या सहकार्यांसह कृती आणि विनोदी चित्रपटांबद्दलचे माझे विचार सामायिक करणे पसंत केले आहे, परंतु मी धार्मिक आणि राजकीय चित्रपटांबद्दल माझे मत सामायिक करण्यास प्राधान्य देत नाही. Netflix डेटामध्ये माझे रेकॉर्ड शोधण्यासाठी माझी सहकारी त्यांना सामायिक केलेली माहिती वापरू शकतात; मी शेअर केलेली माहिती विल्यम वेल्डची जन्मतारीख, झिप कोड आणि सेक्स यासारखी एक अद्वितीय फिंगरप्रिंट असू शकते नंतर, मला माझ्या अद्वितीय फिंगरप्रिंटमध्ये डेटा आढळल्यास, ते सर्व मूव्हीबद्दल माझे रेटिंग जाणून घेऊ शकतील, ज्यामध्ये मी सामायिक न करण्याचे निवडले असतील. एकच व्यक्ती लक्ष केंद्रित लक्ष्य हल्ला या प्रकारची व्यतिरिक्त, नारायणन आणि Shmatikov देखील अनेक लोक-वैयक्तिक आणि चित्रपट रेटिंग डेटा Netflix डेटा काही लोक निवडले आहे की विलीन होत समावेश व्यापक हल्ला -one करावे शक्य होते की झाली इंटरनेट मूव्ही डेटाबेस (आयएमडीबी) वर पोस्ट करणे. अतिशय सहजपणे, एखाद्या विशिष्ट व्यक्तीसाठी एक अद्वितीय फिंगरप्रिंट आहे अशी कोणतीही माहिती-त्यांचा मूव्ही रेटिंग्जचा संच-त्यांना ओळखण्यासाठी वापरला जाऊ शकतो

Netflix डेटा लक्ष्यित किंवा व्यापक आक्रमण मध्ये पुन्हा ओळखला जाऊ शकतो, तरीही तो कमी जोखीम असल्याचे दिसून येऊ शकते. अखेरीस, चित्रपट रेटिंग खूप संवेदनशील दिसत नाही. सामान्यतः हे खरे असले तरीही, डेटासेट मधील 5,00,000 लोकांपैकी काही, मूव्ही रेटिंग्ज कदाचित संवेदनशील असू शकतात. खरं तर, पुन्हा ओळख प्रतिसादात, एक closeted लज्जत स्त्री Netflix विरुद्ध एक वर्ग-कारवाई खटला सामील झाले. त्यांच्या समस्येत समस्या कशी व्यक्त केली गेली ते येथे आहे (Singel 2009) :

"[एम] ओव्हि आणि रेटिंग डेटामध्ये ... अत्यंत वैयक्तिक आणि संवेदनशील निसर्गाची माहिती आहे. सदस्याच्या मूव्ही डेटामध्ये सेक्सफिक्स सदस्याच्या वैयक्तिक हितसंबंध आणि / किंवा लैंगिकता, मानसिक आजार, मद्यविक्रीपासून पुनर्प्राप्ति आणि कौटुंबिक व्याकूळ, शारीरिक शोषण, घरगुती हिंसा, व्यभिचार आणि बलात्कार यांसारख्या विविध अत्यंत वैयक्तिक विषयांशी संघर्ष आहे. "

Netflix पारितोषिक डेटाची पुन्हा ओळखणे हे स्पष्ट करते की सर्व डेटा संभाव्य ओळखले जाऊ शकतात आणि सर्व डेटा संभाव्य संवेदनशील असतात. या टप्प्यावर, आपण असे समजू शकतो की हे फक्त त्या लोकांवर अवलंबून असलेल्या डेटावर लागू होते. आश्चर्याची गोष्ट म्हणजे केस नाही. माहिती हक्क विनंती स्वातंत्र्य प्रतिसादात, न्यू यॉर्क शहर सरकारने न्यू यॉर्क मध्ये 2013 मध्ये प्रत्येक टॅक्सीच्या सॅकचे रेकॉर्डचे प्रकाशन केले, ज्यात पिकअप आणि ड्रॉप डाउन वेळा, स्थाने आणि भाड्याच्या रकमेचा समावेश आहे (फरवरी 2 ते 2 Farber (2015) श्रमिक अर्थव्यवस्थेतील महत्त्वाच्या सिद्धांतांचे परीक्षण करण्यासाठी समान डेटा वापरला आहे). टॅक्सी ट्रिप बद्दल हे डेटा सौजन्यपूर्ण वाटू शकते कारण ते लोकांबद्दल माहिती देण्यास दिसत नाही परंतु ऍन्थनी टॉकर यांना याची जाणीव झाली की या टॅक्सी डेटासेटमध्ये लोकांबद्दल संभाव्य संवेदनशील माहितीचा समावेश आहे. उदाहरण द्यायचो, त्यानं हस्तरर क्लबमध्ये सुरु होणाऱ्या सर्व ट्रिप पाहिली- न्यूयॉर्कमधील मध्य स्ट्रिप क्लबमध्ये - मध्यरात्री आणि सकाळी 6 वाजता - आणि नंतर त्यांना ड्रॉप-ऑफची जागा सापडली. हा शोध उघडकीस-अत्यावशक - काही (Tockar 2014) पत्त्यांची यादी ज्या हस्टलर क्लबला (Tockar 2014) . हे कल्पना करणे अवघड आहे की जेव्हा शहराची आकडेवारी जाहीर झाली तेव्हा शहराची ही आठवण होती. खरं तर, या तंत्रज्ञानाचा वापर शहरातील कोणत्याही ठिकाणी भेट देणा-या व्यक्तींचे घरगुती पत्ते शोधण्यासाठी होऊ शकते- एक वैद्यकीय क्लिनिक, सरकारी इमारत किंवा धार्मिक संस्था.

Netflix पारितोषिका आणि न्यूयॉर्क शहरातील टॅक्सी डेटाचे हे दोन प्रकरण दर्शवते की तुलनेने कुशल लोक ते सोडतात त्या डेटामधील माहितीपूर्ण जोखमीचे अचूक अंदाज घेण्यास अपयशी ठरू शकतात-आणि या प्रकरणांची काहीच अद्वितीय नाही (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . पुढे, अशा अनेक प्रकरणांमध्ये, समस्याप्रधान डेटा अद्यापही विनामूल्य उपलब्ध आहे, जेणेकरून डेटा रीलीझ हटविणे कधीही कठिण दर्शविते. एकंदर निष्कर्षापर्यंत एकत्रितपणे, या उदाहरणे-तसेच संगणक विज्ञानातील गोपनीयतेबद्दल संशोधन. संशोधकांनी असे गृहीत धरले पाहिजे की सर्व डेटा संभाव्य ओळखले जाऊ शकतात आणि सर्व डेटा संभवत: संवेदनशील असतात.

दुर्दैवाने, सर्व डेटा संभाव्य ओळखले जाऊ शकणार्या तथ्यांशी कोणतेही सोपे उत्तर नाही आणि सर्व डेटा संभाव्यतः संवेदनशील असतात. तथापि, आपण डेटासह कार्य करीत असताना माहितीपूर्ण जोखीम कमी करण्याचा एक मार्ग म्हणजे डेटा संरक्षण योजना तयार करणे आणि त्याचे पालन करणे . हा प्लॅन आपला डेटा लीक करेल आणि गळतीमुळे कसा तरी होऊ शकतो तो कमी करेल अशी शक्यता कमी करेल. डेटा संरक्षण योजनांचे तपशील, जसे कोणत्या प्रकारचे एन्क्रिप्शन वापरणे, वेळोवेळी बदलेल, परंतु यूके डेटा सर्व्हिसेसने डेटा संरक्षणाचे प्लॅनच्या घटकांना पाच श्रेण्यांमध्ये मदतपूर्वक आयोजन केले आहे ते पाच safes कॉल करतात: सुरक्षित प्रकल्प, सुरक्षित लोक , सुरक्षित सेटिंग्ज, सुरक्षित डेटा आणि सुरक्षित आउटपुट (टेबल 6.2) (Desai, Ritchie, and Welpton 2016) . पाचपैकी एकही तिजोरी वैयक्तिकरित्या परिपूर्ण संरक्षण देत नाहीत. परंतु एकत्रितपणे ते घटकांचा एक शक्तिशाली समूह तयार करतात ज्यामुळे माहितीचे धोका कमी होते.

तक्ता 6.2: डेटा सुरक्षितता योजना (Desai, Ritchie, and Welpton 2016) डिझाइन करण्यासाठी आणि कार्यान्वित करण्यासाठी "पाच Safes" हे तत्त्वे आहेत.
सुरक्षित	क्रिया
सुरक्षित प्रकल्प	जे नैतिक आहेत त्या डेटासह प्रोजेक्ट मर्यादित करते
सुरक्षित लोक	जे लोक डेटावर विश्वास ठेवू शकतात अशा लोकांसाठी प्रवेश मर्यादित आहे (उदा., जे लोक नैतिक प्रशिक्षित आहेत)
सुरक्षित डेटा	डेटा शक्य तितक्या मर्यादेपर्यंत ओळखला आणि एकत्रित केला जातो
सुरक्षित सेटिंग्ज	डेटा योग्य भौतिक (उदा. लॉक केलेला कक्ष) आणि सॉफ्टवेअर (उदा. पासवर्ड संरक्षण, एनक्रिप्टेड) संरक्षणासह संगणकांमध्ये साठवले जातात
सुरक्षित आउटपुट	आकस्मिक गोपनीयता उल्लंघनास प्रतिबंध करण्यासाठी संशोधनाचे पुनरावलोकन केले जाते

आपण वापरत असताना आपल्या डेटाचे संरक्षण करण्याव्यतिरिक्त, संशोधन प्रक्रियेत एक पाऊल ज्यामध्ये माहितीचा धोका विशेषतः ठळक असतो इतर संशोधकांबरोबर डेटा सामायिक करणे. शास्त्रज्ञांमधील डेटा सामायिकरण हे वैज्ञानिक प्रयत्नांचे एक मूलभूत मूल्य आहे आणि हे ज्ञानाच्या प्रगतीसाठी मोठ्या प्रमाणात सुविधा देते. यूके हाऊस ऑफ कॉमन्सने डेटा शेअरिंगचे महत्व (Molloy 2011) कसे वर्णन केले ते येथे आहे:

"संशोधनांनी साहित्यात नमूद केलेल्या परिणामांवर पुनरुत्पादन, सत्यापित करणे आणि तयार करणे असल्यास डेटावर प्रवेश मूलभूत आहे. अन्यथा मजबूत कारण नसल्यास, डेटा पूर्णतः उघड करावा आणि सार्वजनिकरित्या उपलब्ध केला जाणे अपेक्षित आहे. "

तरीही, आपला डेटा दुसर्या संशोधकासह सामायिक करून आपण आपल्या सहभागींना माहितीचे धोका वाढवू शकता. त्यामुळे असे दिसते की डेटा शेअरिंगमुळे इतर वैज्ञानिकांशी डेटा सामायिक करण्याचे बंधन आणि सहभागींना माहितीचे धोका कमी करण्याच्या बंधनामध्ये मूलभूत तणाव निर्माण होतो. सुदैवाने, ही दुविधा इतकी तीव्र दिसत नाही जितकी दिसते ऐवजी, सातत्यपूर्ण स्थितीत घसरण होत असताना डेटा शेअरिंगचा विचार करणे चांगले असते, त्या सत्तेतील प्रत्येक टप्प्यावर समाजाला फायद्यांचा एक भिन्न मिश्रण प्रदान करणे आणि सहभागींना धोका आहे (आकृती 6.6).

एक अत्यंत, आपण आपला डेटा एकासह सामायिक करू शकता, जे सहभागींना जोखीम कमी करते परंतु समाजाला मिळणारे फायदे देखील कमी करते. दुसरीकडे, आपण सोडू शकता आणि विसरू शकता, जेथे डेटा "अनामिक" आहे आणि प्रत्येकासाठी पोस्ट केला जातो. सामुदायिक डेटा सोडणे, सोडणे आणि विसरणे हे समाजासाठी उच्च फायदे आणि भागधारकांना उच्च जोखमीचे दोन्ही देते. या दोन अत्यंत प्रकरणांमध्ये दरम्यान हायब्रीडचा एक श्रेणी आहे, ज्यामध्ये मी भिंतीसारख्या बगीच्या दृष्टिकोणातून कॉल करणार आहे. या पध्दतीनुसार, डेटा काही विशिष्ट निकषांशी जुळणार्या लोकांशी सामायिक केला जातो आणि काही नियमांद्वारे बद्ध होण्यास सहमती देतात (उदा., आयआरबी आणि डेटा प्रोटेक्शन प्लॅन). दगडात बाग दृष्टीकोनातून बर्याचशा फायद्यांची उपलब्धता मिळते आणि कमी धोक्यात जाणे अर्थात, असा दृष्टिकोन अनेक प्रश्न निर्माण करतो- कोणकोणत्या परिस्थितीनुसार, कोणकोणत्या परिस्थितीनुसार, आणि कित्येक काळ, कोण संरक्षित करण्यासाठी आणि दांडी असलेली बाग इत्यादी पोलिसांना पैसे द्यावे लागतील - पण हे अमाऊ नाहीत. खरं तर, आधीच येथे संरक्षित बांधकाम उद्यान कार्यरत आहेत, जसे की मिशिगन विद्यापीठात राजकीय आणि सामाजिक संशोधनासाठी इंटर-युनिव्हर्सिटी कन्सोर्टियमचे डेटा संग्रहण.

आकृती 6.6: डेटा रीलीझ स्ट्रेटेजी एक सातत्य सह पडते. या सातत्यवर आपण कोठे रहावे हे आपल्या डेटाच्या विशिष्ट तपशीलावर अवलंबून आहे आणि तिस-या पक्षीय पुनरावलोकनामुळे तुम्हाला योग्य परिस्थितीतील जोखमीचे संतुलन आणि आपल्या बाबतीत फायदा होऊ शकतो. या वक्रचे अचूक आकार डेटा आणि संशोधन लक्ष्यांच्या (Goroff 2015) अवलंबून आहे (Goroff 2015) .

तर, आपल्या अभ्यासातून डेटा सामायिकरणापासून सातत्याने न राहता, दांडी असलेली बाग कुठे ठेवावी आणि सोडून द्यावी? हे आपल्या डेटाच्या तपशीलावर अवलंबून आहे: संशोधकांनी कायदा आणि सार्वजनिक व्याजांविषयी आदर, विनम्रता, न्याय आणि आदर यांचे संतुलन राखले पाहिजे. या दृष्टीकोनातून बघितले तर, डेटा सामायिक करणे विशिष्ट नैसर्गिक निराकरण नाही; संशोधकांना योग्य नैतिक संतुलन शोधणे ज्यात संशोधनाचे अनेक पैलू आहेत.

काही समीक्षक साधारणपणे डेटा सामायिकरण विरूद्ध असतात, कारण माझ्या मते, ते त्यांच्या जोखमींवर केंद्रित असतात - जे निःसंशयपणे वास्तविक आहेत-आणि त्याचे फायदे दुर्लक्ष करीत आहेत. म्हणूनच, जोखीम आणि फायद्यांचा दोन्हीवर फोकस वाढवण्यासाठी मी एक सादृश्य सादर करू इच्छितो. दरवर्षी, हजारो मृत्यूंसाठी कार जबाबदार असतात, परंतु आम्ही वाहन चालविण्यास बंदी करण्याचा प्रयत्न करत नाही. खरं तर, ड्रायव्हिंगवर बंदी घालण्याचा एक फोन बेफिकीर ठरेल कारण ड्रायव्हिंग अनेक अद्भुत गोष्टींना सक्षम करते त्याऐवजी समाजावर कोण पुढे जाऊ शकतो (उदा. विशिष्ट वय असणे आवश्यक आहे आणि काही चाचण्या पार पाडाव्या लागतात) आणि ते कसे चालवू शकतात त्यावर उदा. (वेगवान मर्यादेच्या अंतर्गत) मर्यादा घालतो. सोसायटीत लोकांना देखील हे नियम अंमलात आणण्याचे कार्य आहे (उदा. पोलिस), आणि आम्ही ज्या लोकांना त्यांच्या विरोधात पकडले आहे त्यांना शिक्षा करतो. समाजास वाहनचालकांचे नियमन करण्यालाही हे समान संतुलित विचार आहे जे डेटा शेअरिंगवर लागू होऊ शकते. म्हणजे, डेटा शेअरिंगसाठी किंवा विरुद्ध निरर्थक वादविवाद करण्याऐवजी, मला वाटते की आम्ही जोखमींना कमी कसे करू शकतो आणि डेटा शेअरिंगचा लाभ वाढवू शकतो यावर लक्ष केंद्रित करून आम्ही सर्वात प्रगती करू.

निष्कर्षाप्रत, माहितीचा धोका जो नाटकीयपणे वाढला आहे, आणि अंदाज लावण्यासाठी आणि त्याची परिमाण करणे कठीण आहे. म्हणूनच असे समजले जाते की सर्व डेटा संभवतः ओळखता येण्यासारखे आणि संभाव्य संवेदनशील आहेत. संशोधन करत असताना माहितीपूर्ण जोखीम कमी करण्यासाठी, संशोधक डेटा संरक्षण योजनेचे तयार आणि अनुसरण करू शकतात. पुढे, माहितीविषयक जोखीम संशोधकांना इतर वैज्ञानिकांशी डेटा सामायिक करण्यापासून रोखत नाही.