6.6.2 समझ र प्रबन्ध जानकारी जोखिम

यो अनुवाद एक कम्प्यूटर द्वारा सिर्जना गरिएको थियो। ×

6.6.2 समझ र प्रबन्ध जानकारी जोखिम

सामाजिक अनुसन्धानमा सूचना जोखिम सबैभन्दा अधिक जोखिम हो; यसले नाटकीय रूपमा वृद्धि गरेको छ; र यो बुझ्न सबै भन्दा कठिन जोखिम हो।

डिजिटल-उमेर अनुसन्धानको लागि दोस्रो नैतिक चुनौती सूचना जानकारी , सूचना प्रकटीकरण (National Research Council 2014) हानिकारक (National Research Council 2014) बाट हानिको सम्भावना हो। व्यक्तिगत सूचना को खुलासा देखि सूचनात्मक आर्थिक हुन सक्छ (उदाहरण को लागि, एक नौकरी खोने), सामाजिक (उदाहरणार्थ, शर्मिन्दा), मनोवैज्ञानिक (उदाहरणार्थ, अवसाद), वा यहाँ सम्म कि आपराधिक (जस्तै, अवैध व्यवहार को लागी गिरफ्तार)। दुर्भाग्यवश, डिजिटल युगले नाटकीय रूपमा नाटकीय जानकारी बढाउँछ - हाम्रो व्यवहारको बारेमा त्यहाँ धेरै अधिक जानकारी छ। अनि शारीरिक जोखिम जस्तै एनालग-उमेर सामाजिक अनुसन्धानमा चिन्ता भएका जोखिमहरूको तुलनामा बुझ्न र व्यवस्थापन गर्ने जानकारी जोखिम निकै गाह्रो साबित भएको छ।

सामाजिक अनुसन्धानकर्ताहरूले जानकारी जोखिम कम गर्ने एउटा तरिका डाटा को "anonymization" छ। "Anonymization" नाम, ठेगाना, र डाटा देखि टेलिफोन नम्बर रूपमा स्पष्ट व्यक्तिगत पहिचानकर्ताहरू हटाउने प्रक्रिया छ। तर, यो दृष्टिकोण गहिरो र मौलिक सीमित धेरै मान्छे महसुस भन्दा धेरै कम प्रभावकारी छ, र यो वास्तव मा, छ,। त्यसैकारण, जब म वर्णन "anonymization," म उद्धरण चिह्न सम्झाउने यो प्रक्रिया गुमनाम को उपस्थिति तर साँचो गुमनाम सिर्जना कि प्रयोग गर्नेछौं।

"अज्ञातकरण" को विफलता को एक ज्वलंत उदाहरण मैसाचुसेट्स (Sweeney 2002) 1990 के दशक देखि आउँछ। समूह बीमा आयोग (जीआईसी) एक सरकारी एजेन्सी थियो जो सबै सरकारी कर्मचारीहरु को लागि स्वास्थ्य बीमा खरिद को लागि जिम्मेदार छ। यस कार्यको माध्यमबाट जीआईसीले हजारौं राज्य कर्मचारीहरूको बारेमा विस्तृत स्वास्थ्य रेकर्ड संकलन गर्यो। शोषण गर्न प्रयासमा, जीआईसीले यी रेकर्डहरू शोधकर्ताहरूलाई रिहा गर्न निर्णय गरे। यद्यपि, उनीहरूले उनीहरूको सबै डेटा साझेदारी गरेनन्; बरु, तिनीहरू नाम र ठेगाना जस्ता जानकारी हटाउन यी डेटा "गुमनाम"। तथापि, उनीहरूले अन्य जानकारी छोडेका छन् कि उनी सोचेका छन् कि शोधकर्ताहरु जस्तै जनसांख्यिकीय जानकारी (जिप कोड, जन्म मिति, जातीय, र यौन) र चिकित्सा सूचना (डेटा, निदान, प्रक्रियामा जानुहोस्) (आंकडा 6.4) (Ohm 2010) । दुर्भाग्यवश, यो "गुप्तिकरण" डेटा को रक्षा गर्न पर्याप्त थिएन।

चितवन 6.4: अज्ञातकरण स्पष्ट रूपमा पहिचान गर्ने जानकारी हटाउने प्रक्रिया हो। उदाहरणका लागि, राज्य कर्मचारीहरूको मेडिकल बीमा रेकर्ड जारी गर्दा, म्यासाचुसेट्स समूह बीमा आयोग (जीआईसी) फाइलहरूबाट नाम र ठेगानाहरू हटाइयो। म शब्द अज्ञातकरणको वरिपरि उद्धरण चिन्हहरू प्रयोग गर्दछु किनभने प्रक्रियाले गुमनामताको उपस्थिति प्रदान गर्दछ तर वास्तविक गुप्तता होइन।

चितवन 6.4: "अज्ञातकरण" स्पष्ट रूपमा पहिचान गरिएको जानकारी हटाउने प्रक्रिया हो। उदाहरणका लागि, राज्य कर्मचारीहरूको मेडिकल बीमा रेकर्ड जारी गर्दा, म्यासाचुसेट्स समूह बीमा आयोग (जीआईसी) फाइलहरूबाट नाम र ठेगानाहरू हटाइयो। म शब्द "अज्ञातकरण" वरिपरि उद्धरण चिह्नहरू प्रयोग गर्दछ किनभने प्रक्रियाले अज्ञात रूपमा उपस्थिति प्रदान गर्दछ तर वास्तविक गुप्तता होइन।

जीआईसी "गुमनाम" को कमजोरी को वर्णन गर्न को लागी शहर मासाचुसेट्स राज्य विलियम वेल्ड को क्याम्ब्रिज शहर देखि मतदान को रेकर्ड प्राप्त गर्न एमआईटी -20 को एमआईटी-मा स्नातकोत्तर लेट्याट ले ल्याट्याण सुनेनी-तब स्नातकोत्तर विद्यार्थी को लागी। यी मतदानमा रेकर्ड समावेश जानकारी जस्तै नाम, ठेगाना, जिप कोड, जन्म मिति, र लिङ्ग। तथ्य यह है कि मेडिकल डाटा फाईल र मतदाता फाइल को फील्ड-जिप कोड, जन्म तिथि, र लिंग साझा को मतलब - Sweeney ले उनलाई लिंक गर्न सक्छ। सनीलाई थाहा थियो कि वेल्डको जन्मदिन जुलाई 31, 1 9 45 मा थियो, र मतदान रेकर्डमा क्याम्ब्रिजमा मात्र छ महिनामा यो जन्मदिन थियो। यसबाहेक, ती छजना मानिसहरू मध्ये मात्र तीनजना पुरुष थिए। र, ती तीन पुरुषहरु मध्ये, केवल एक वेल्ड को जिप कोड साझा गरे। यसकारण, मतदान डेटाले देखाएको छ कि वेडडको जन्म मिति, लिङ्ग, र जिप कोड विलियम वेल्डको संयोजन संग मेडिकल डेटामा। संक्षेपमा, जानकारीका यी तीनवटा टुक्राले डेटामा एक अनौठो फिंगरप्रिन्ट प्रदान गर्यो। यो तथ्य प्रयोग गरेर, सुनी वेल्डको मेडिकल रेकर्ड पत्ता लगाउन सक्षम थिए, र उनको उनको भित्ता को सूचित गर्न को लागी उनले उनको रेकर्ड (Ohm 2010) एक पत्र पठाए।

चित्र 6.5: गुमनाम डेटा को पुनः-निष्क्रियीकरण। ल्याटानिया सेन्नीले राज्यपाल विलियम वेल्ड को मेडिकल रिकार्ड पत्ता लगाउने मतदान रेकर्डको साथ अज्ञातकृत स्वास्थ्य रेकर्ड संयुक्त रूपमा सिनई (2002) बाट चित्रण गरेको छ।

चित्र 6.5: "गुप्तिकरण" डेटा को पुनः-निष्क्रियीकरण। Latanya Sweeney राज्यपाल विलियम वेल्ड को चिकित्सा रेकर्ड देखि छाँटकाँट पत्ता लगाएर मा "anonymized" स्वास्थ्य मतदान रेकर्ड संग रेकर्ड संयुक्त Sweeney (2002) , 1 आंकडा।

सोनीको कामले पुनः पहिचान पहिचानहरूको आधारभूत संरचनालाई चित्रण गर्दछ - कम्प्यूटर सुरक्षा समुदायबाट एक शब्द स्वीकार गर्नुहोस्। यी आक्रमणहरूमा, दुई डेटा सेट, न त आफ्नै द्वारा संवेदनशील जानकारी प्रकट गर्दछ, जोडिएका छन्, र यस लिङ्कबाट, संवेदनशील जानकारी प्रकट गरिएको छ।

सोनीको काम र अन्य सम्बन्धित कामको प्रतिक्रियामा, शोधकर्ताहरू अब सामान्यतया धेरै जानकारी हटाउँछन् - सबै तथाकथित "व्यक्तिगत रूपमा पहिचान गर्ने जानकारी" (PII) (Narayanan and Shmatikov 2010) - "अज्ञातकरण" प्रक्रियाको प्रक्रिया पनि। साथै, धेरै शोधकर्ताहरू अब यो थाहा छ कि केहि डेटा - जस्तै मेडिकल रेकर्ड, वित्तीय रेकर्ड, अवैध व्यवहारको बारेमा सर्वेक्षण प्रश्नहरूको जवाफ - शायद "गुमनाम" पछि रिलीज गर्न पनि धेरै संवेदनशील छ। तर, उदाहरणका लागि म सुझाव दिन्छु कि सोशल शोधकर्ताहरू चाहिन्छ तिनीहरूको सोच परिवर्तन गर्न। पहिलो चरणको रूपमा, यो मान्न बुद्धिमानी छ कि सबै डेटा सम्भावित पहिचान योग्य छन् र सबै डेटा सम्भावित संवेदनशील छन्। अर्को शब्दमा, कि सूचनात्मक जोखिम सोच गर्नुको साटो परियोजनाको सानो सबसेटमा लागू हुन्छ, हामीले मान्नुपर्दछ कि यो लागू हुन्छ - केही डिग्री सम्म सबै परियोजनाहरू।

यस पुनरावृत्ति को दुवै पहलुहरु Netflix पुरस्कार द्वारा दृष्ट छन्। अध्याय 5 मा वर्णन गरिएको, Netflix को लगभग 500,000 सदस्यहरु द्वारा प्रदान गरिएको 100 मिलियन चलचित्र मूल्याङ्कनहरू जारी गरियो, र एक खुला कल थियो जहाँ चलचित्रहरू सिफारिस गर्न Netflix को क्षमतालाई सुधार गर्न एल्गोरिदमहरू प्रस्तुत गरियो। डेटा रिलीज गर्नुअघि Netflix ले कुनै पनि स्पष्ट रूपमा व्यक्तिगत रूपमा पहिचान गर्ने जानकारीहरू हटाउछ, जस्तै नामहरू। तिनीहरू पनि एक अतिरिक्त कदम चलाए र केहि रेकर्ड मा मामूली perturbations को परिचय (उदाहरण को लागि, 4 सितारों देखि 3 सितारों सम्म केहि रेटिंग्स बदलन)। तथापि, ती चाँडै पत्ता लगाइयो, कि तिनीहरूको प्रयासको बावजूद, डेटा अझै पनि बेनामी द्वारा थिए।

डेटा रिलीज गरेपछि दुई हप्ता पछि, अरविन्द नारायणन र विटिली शटिकोकोव (2008) ले देखाएको छ कि यो विशिष्ट व्यक्तिको चलचित्र प्राथमिकताहरू बारे जान्न सम्भव थियो। उनीहरुको पुन: पहिचान आक्रमणको चाल सोनेको जस्तै थियो: एकसाथ दुईवटा जानकारी स्रोतहरू, सम्भावित संवेदनशील जानकारीको साथमा र कुनै स्पष्ट रूपमा पहिचान पहिचान र एक व्यक्तिको पहिचान समावेश गर्दछ। यी डेटा स्रोतहरु मध्ये प्रत्येक व्यक्तिगत रूपमा सुरक्षित हुन सक्छ, तर जब तिनीहरू संयुक्त हुन्छन्, मर्ज गरिएको डाटासेटले सूचनात्मक जोखिम सिर्जना गर्न सक्छ। Netflix डेटाको अवस्थामा, यहाँ यो कसरी हुन सक्छ। कल्पना गर्नुहोस् कि म क्रियाकलाप र कमेडी चलचित्रहरू मेरो सहकर्मीहरूको साथ मेरो विचार साझा गर्न चाहन्छु, तर म धार्मिक र राजनैतिक चलचित्रहरूका बारेमा मेरो विचार साझा गर्न चाहन्नँ। मेरो सहकर्मीहरूले मैले जानकारी दिए कि मैले नेटफ्लिक्स डाटामा मेरो रेकर्ड फेला पार्नको लागि जानकारी प्रयोग गर्न सक्छु; विलियम वेल्डको जन्म मिति, जिप कोड, र सेक्स जस्ता जस्ता म साझा जानकारी एक अद्वितीय औंठाछाप हुन सक्छ। त्यसपछि, यदि उनीहरूले मेरो अनौठो फिंगरप्रिन्टलाई डेटामा फेला पारे, उनीहरूले चलचित्रहरू सहित सबै चलचित्रहरूको बारेमा मेरो मूल्याङ्कनहरू सिक्न सक्थे जुन मैले साझा गर्न नचाहेर। यस प्रकारको लक्षित हमलाले एकल व्यक्तिमा ध्यान दिएर यसको अलावा, नारायणन र शमिटकोवले पनि व्यापक आक्रमण गर्न सम्भव थियो - धेरै व्यक्तिहरु लाई व्यक्तिगत र चलचित्र मूल्याङ्कन डाटा संग Netflix डाटा विलय गरेर धेरै मानिसहरूलाई समावेश गरेर केहि मान्छे छान्नु भएको छ इन्टरनेट मूवी डेटाबेस (आईएमडीबी) मा पोस्ट गर्न। बस बस, कुनै पनि व्यक्ति जो एक विशिष्ट व्यक्ति को लागि एक अद्वितीय फिंगरप्रिंट हो - पनि चलचित्र मूल्याङ्कन को उनको सेट - तिनीहरूलाई पहिचान गर्न को लागी प्रयोग गर्न सकिन्छ।

यद्यपि Netflix डेटा पनि लक्षित वा व्यापक आक्रमणमा पुनः पहिचान गर्न सकिन्छ, यो अझै पनि कम जोखिम हुन सक्छ। सबै पछि, चलचित्र मूल्याङ्कनहरू धेरै संवेदनशील लाग्दैन। हुनत त्यो सामान्यमा सच हुन सक्छ, डेटासेटमा 500,000 भन्दा कमका लागि, चलचित्र मूल्याङ्कनहरू धेरै संवेदनशील हुन सक्छ। वास्तवमा, पुन: पहिचानको प्रतिक्रियामा, एक समाप्ति समलैंगिक महिलाले Netflix को विरुद्ध क्लास-एक्शन सूटमा सामेल गर्यो। यहाँ उनीहरूको मुक्तिमा कस्तो समस्या व्यक्त गरिएको छ (Singel 2009) :

"[एम] ओभिय र रेटिङ डाटाले जानकारीको जानकारी समावेश गर्दछ ... अत्यधिक व्यक्तिगत र संवेदनशील प्रकृति। सदस्यको चलचित्र डेटा Netflix सदस्यको व्यक्तिगत रुचि र / वा यौन सम्बन्ध, मानसिक रोग, शराबदेखि पुनःप्राप्ति र ईश्वर, शारीरिक दुर्व्यवहार, घरेलु हिंसा, व्यभिचार, र बलात्कारबाट पीडित विभिन्न विभिन्न समस्याहरूसँग संघर्ष गर्दछ। "

नेटफिक्स प्रिक्स डाटाको पुन: पहिचानले दुवै डेटालाई संभावित रूपमा पहिचान गर्न योग्य बनाउँछ र सबै डेटा सम्भावित संवेदनशील छन्। यस बिन्दुमा तपाई यो सोच्न सक्नुहुनेछ कि यो केवल डेटा मा लागू हुन्छ जुन मानिसहरूको बारेमा बुझ्न सकिन्छ। आश्चर्यजनक कुरा, यो मामला होइन। स्वतन्त्रता सूचना कानून अनुरोधको प्रतिक्रियामा, न्यूयोर्क शहर सरकारले 2013 मा न्यूयर्कमा हरेक टैक्सी सवारीको रेकर्ड जारी गर्यो, पिकअप र समय, स्थान र भाडा घटाउन समेत समावेश गर्दछ (अध्याय 2 बाट Farber (2015) श्रम अर्थशास्त्रमा महत्त्वपूर्ण सिद्धान्तहरू परीक्षण गर्न समान डेटा प्रयोग गरिएको छ)। ट्याक्सी यात्राहरूको बारेमा यी डेटाहरूले बेन्जियम लाग्न सक्छ किनभने तिनीहरू मानिसहरूको बारेमा जानकारी प्रदान गर्दैनन्, तर अनन्थनी ताकरले यो एहसास गरे कि यो टैक्सी डाटासेटले वास्तवमा मानिसहरूको बारेमा धेरै सम्भावित संवेदनशील जानकारी समावेश गर्दछ। उदाहरणका लागि, उहाँले हस्टलर क्लबमा सुरु हुने सबै यात्राहरू - न्यू यर्कमा एक ठूला पट्टी क्लब-मध्यरात र 6 बजेको बीचमा र त्यसपछि उनीहरूको ड्रप अफ स्थानहरू भेट्टाउनुभयो। यो खोजी उल्लेखित-सारणीमा - केही व्यक्तिहरूको ठेगानाहरूको सूची जुन हस्टलर क्लब (Tockar 2014) आवृत्ति गरिन्छ। यो कल्पना गर्न गाह्रो छ कि शहरको सरकारले यो मनमा राख्यो जब यो डेटा रिहा गरियो। वास्तवमा, यो प्रविधिको शहरमा कुनै पनि ठाउँमा भ्रमण गर्ने मानिसहरूको ठेगाना पत्ता लगाउन प्रयोग गर्न सकिन्छ - एक मेडिकल क्लिनिक, एक सरकारी भवन, वा एक धार्मिक संस्था।

Netflix पुरस्कार र न्यूयर्क शहर ट्याक्सी डेटा को यी दुइटा घटनाहरूले देखाएको छ कि अपेक्षाकृत कुशल व्यक्तिहरूले उनीहरूलाई रिहाईएको डाटामा सूचनात्मक जोखिमको सही रूपमा अनुमान गर्न सक्दछन् र यी घटनाहरू कुनै पनि प्रकारको अनियमित छैनन् (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) । यसबाहेक, धेरै यस्तो अवस्थामा, समस्याग्रस्त डेटा अझै पनि अनलाइन रूपमा उपलब्ध छन्, डाटा रिलीज को अनडू अनगिन्ती को संकेत गर्दछ। सामूहिक रूपले, यी उदाहरणहरू-साथसाथै कम्प्युटर विज्ञानमा गोपनीयताको बारेमा अनुसन्धान-एक महत्त्वपूर्ण निष्कर्षमा लिनुहोस्। शोधकर्ताहरूले मान्नुपर्छ कि सबै डेटा सम्भवतः पहिचान गर्न योग्य छन् र सबै डेटा सम्भावित संवेदनशील छन्।

दुर्भाग्यवश, तथ्याङ्कहरूको कुनै सरल समाधान छैन जुन सबै डेटा सम्भाव्य रूपमा पहिचान योग्य छन् र सबै डेटा सम्भावित संवेदनशील छन्। तथापि, तपाईं डेटा संग काम गरिरहँदा सूचना जोखिम घटाउने एक तरिका डेटा सुरक्षा योजना सिर्जना र अनुगमन गर्न हो। यो प्लानले तपाईंको डेटा रिसाएर हुने संभावना कम गर्नेछ र लीकले कुनै पनि प्रकारको हुन्छ भने हानि घटाउनेछ। डेटा सुरक्षा योजनाहरू, जस्तै एन्क्रिप्शन प्रयोग गर्ने विवरणहरूको विवरणले समय समयमा परिवर्तन गर्नेछ, तर बेलायती डेटा सेवाले डेटा सुरक्षा योजनाका तत्वहरूलाई पाँच कोटिमा राख्दछ जसले उनीहरूलाई पाँच सुरक्षित गर्दछ : सुरक्षित परियोजनाहरू, सुरक्षित व्यक्तिहरू , सुरक्षित सेटिङ्हरू, सुरक्षित डेटा, र सुरक्षित आउटपुट (टेबल 6.2) (Desai, Ritchie, and Welpton 2016) । कुनै पनि पाँच सफाहरू व्यक्तिगत रूपमा पूर्ण सुरक्षा प्रदान गर्दैनन्। तर तिनीहरू सँगै कारकहरूको शक्तिशाली सेट बनाउँदछ जुन सूचनात्मक जोखिम घटाउन सक्छ।

तालिका 6.2: "पाँच सफा" (Desai, Ritchie, and Welpton 2016) प्लान डिजाइनिंग र कार्यान्वयनका लागि सिद्धान्त हुन् (Desai, Ritchie, and Welpton 2016)
सुरक्षित	कार्य
सुरक्षित परियोजनाहरू	नैतिक हो कि डेटा संग डाटा सीमित गर्दछ
सुरक्षित मान्छे	मानिसहरूको लागि पहुँच प्रतिबन्धित छ जुन डेटा संग भरोसा हुन सक्छ (उदाहरणार्थ, जो मान्छे नैतिक प्रशिक्षण आएको छ)
सुरक्षित डेटा	डेटा सम्भव छ र सम्भावित हदसम्म एकत्रित
सुरक्षित सेटिंग्स	डाटा कम्प्यूटरमा उपयुक्त भौतिक (उदाहरणार्थ, बन्द गरिएको कोठा) र सफ्टवेयर (जस्तै, पासवर्ड सुरक्षा, एन्क्रिप्टेड) सुरक्षासँग भण्डारण गरिएको छ
सुरक्षित आउटपुट	आकस्मिक गोपनीयता उल्लङ्घनहरू रोक्नको लागि अनुसन्धान आउटपुटको समीक्षा गरियो

तपाईंले प्रयोग गरिरहनु भएको बेला तपाईंको डाटाको सुरक्षा गर्नुको साथै, अनुसन्धान प्रक्रियामा एक कदम जहाँ सूचना सूचना विशेष गरी विशेषता हो अन्य शोधकर्ताहरु संग डाटा साझेदारी हो। वैज्ञानिकहरूको बीच डेटा साझेदारी वैज्ञानिक प्रयासको मुख्य मूल्य हो, र यसले ज्ञानको उन्नतिलाई धेरै सुविधा दिन्छ। यहाँ छ कसरी यू.एस. हाउस हाउस कम्युनिकेशन डेटा साझेदारी (Molloy 2011) को महत्व को वर्णन गर्दछ:

"डेटामा पहुँच आधारभूत छ यदि शोधकर्ताहरू पुन: पेश गर्न, प्रमाणित गर्न र साहित्यमा रिपोर्ट गरिएका नतिजाहरूमा निर्माण गर्नु हो। अनुमान लगाउनु पर्छ, जबसम्म कुनै बलियो कारण नभएसम्म, डाटा पूर्ण रूपमा खुलासा र सार्वजनिक रूपमा उपलब्ध गराइनेछ। "

यद्यपि, अर्को शोधकर्ताको साथ आफ्नो डेटा साझेदारी गरेर, तपाइँ आफ्नो सहभागीहरूलाई सूचनात्मक वृद्धि बढाउन सक्नुहुन्छ। यसैले, यो लग रहेको छ कि डेटा साझेदारी अन्य वैज्ञानिकों संग डेटा साझा गर्न को लागी दायित्व को बीच एक मौलिक तनाव पैदा गर्दछ र प्रतिभागिहरु लाई सूचना को जोखिम को कम गर्न दायित्व को बीच मा। सौभाग्य देखि, यो दुविधा प्रतीत जस्तो छैन जस्तो देखिन्छ। बरु, यो डेटा साझा गर्न को लागी एक सतम को रूप मा गिरने को बारे मा सोचने को लागि बेहतर छ, यस संग प्रत्येक बिंदु को निरंतर लाभ को विभिन्न मिश्रण प्रदान गर्दछ र प्रतिभागिहरु को लागि जोखिम (6.6 आंकडे)।

एक चरम मा, तपाईं कुनै पनि संग आफ्नो डेटा साझा गर्न सक्छन्, जसले प्रतिभागिहरु को जोखिम को कम गर्दछ तर समाज को लाभ पनि कम गर्न सक्छन्। अर्को चरममा, तपाईं रिलीज गर्न र बिर्सनु सक्नुहुन्छ, जहाँ डाटा "गुप्त नाम" हो र सबैलाई पोस्ट गरिएको छ। डेटा रिलीज गर्न सापेक्ष, रिलीज र बिर्सन प्रस्तावहरू समाजमा उच्च लाभहरू र सहभागीहरूलाई उच्च जोखिम। यी दुई चरम घटनाहरू बीच हाइब्रिडको एक दायरा हो, जसमा म एक पर्खाल बगैचाको दृष्टिकोणमा कल गर्दछु। यस दृष्टिकोण अन्तर्गत, डेटा निश्चित मापदण्डहरू पूरा गर्ने मानिसहरूसँग साझेदारी गरिएको छ र कसलाई निश्चित नियमहरूद्वारा बाँध्न सहमत हुन्छन् (जस्तै, आईआरबी र डेटा सुरक्षा योजनाबाट निरीक्षण)। भित्री बगैचा दृष्टिकोणले रिलीज को धेरै फायदे प्रदान गर्दछ र कम जोखिम संग बिर्सन्छ। यद्यपि, यो दृष्टिकोणले धेरै प्रश्नहरू सिर्जना गर्दछ - जसले कस्तो अवस्थामा पहुँच गर्नुपर्छ, कतिपय परिस्थितिहरू, र कति लामो समयसम्म, जसले कोयम राख्नु र पुलिसलाई भित्ता बगैचा, आदि। तर यी अपमानजनक छैन। वास्तवमा, त्यहाँ पहिले नै काम गरीएको बगैचा काम गर्दै छन् जुन शोधकर्ताहरुले अहिले प्रयोग गर्न सक्दछन्, जस्तै राजनीतिक र सोशल रिसर्चका लागि मिशिगन विश्वविद्यालयको इन्टरनेट-कन्सर्टसियमको डाटा सङ्ग्रह।

चितवन 6.6: डाटा रिलीज रणनीतिहरू निरन्तरतासँगै आउन सक्छ। तपाइँ यस निरन्तरतामा हुनु पर्छ तपाईको डेटाको विशिष्ट विवरणमा निर्भर गर्दछ, र तेस्रो-पक्षको समीक्षाले तपाइँलाई उपयुक्त सन्तुलन निर्णय गर्न र तपाईंको अवस्थामा फाइदा लिन मद्दत गर्न सक्दछ। यो वक्रको सही आकार डेटा र अनुसन्धान लक्ष्य (Goroff 2015) को विवरणमा निर्भर गर्दछ।

त्यसोभए, तपाईंको अध्ययनबाट डेटा कहाँ साझेदारी गर्न, भित्री बगैंचाको निरन्तरतामा रहनुपर्छ, र छोड्नुहोस् र बिर्सनु हुन्छ? यो तपाईंको डेटाको विवरणमा निर्भर छ: शोधकर्ताहरूले व्यक्तिहरूको लागि सम्मान, भत्ता, न्याय, र कानून र जनताको हितको लागि आदरको सन्तुलन गर्नु पर्छ। यस परिप्रेक्ष्यबाट हेरिएको, डेटा साझेदारी एक विशिष्ट नैतिक कन्न्डमम होइन; यो सिर्फ अनुसन्धान को धेरै पहलुहरु मध्ये एक हो जसमा शोधकर्ताहरूले उपयुक्त नैतिक सन्तुलन पाउँदछ।

केही आलोचकहरू सामान्यतया डेटा साझेदारीको विरोध गर्दै छन् किनभने, मेरो विचारमा, उनीहरू यसको खतरामा ध्यान केन्द्रित छन् - जुन निस्सन्देही देखि वास्तविक हो र यसको फाइदा बेवास्ता गरिन्छ। त्यसोभए, दुवै जोखिम र फाइदाहरूमा फोकस प्रोत्साहन गर्न, म एक अनुरूप प्रस्ताव गर्न चाहन्छु। हरेक वर्ष, कारहरु हजारौं मृत्युको लागी जिम्मेवार छन्, तर हामी ड्राइभिङ्लाई रोक्न प्रयास गर्दैनौँ। वास्तवमा, ड्राइभिङ् प्रतिबन्ध गर्न कल बेवास्ता हुनेछ किनभने ड्राइभिङ्ग धेरै अद्भुत चीजहरू सक्षम बनाउँछ। बरु, समाजले ड्राइभ गर्न सक्ने ठाउँहरूमा प्रतिबन्धहरू राख्दछ (उदाहरणार्थ, निश्चित उमेर हुनु आवश्यक छ र केहि परीक्षणहरू पारित गरीन्छ) र उनीहरूले कसरी ड्राइभ गर्न सक्दछन् (जस्तै, गति सीमा अन्तर्गत)। सोसाइटी पनि मानिसहरूसँग यी नियमहरू लागू गर्नका लागी कार्यरत छन् (उदाहरणार्थ, प्रहरी), र हामी मानिसहरूलाई दण्डित गर्दछौं जसले तिनीहरूलाई उल्लङ्घन गर्दछ। यो समान सन्तुलन हो जुन समाज ड्राइभिङ्ग नियन्त्रण गर्न लागू हुन्छ पनि डेटा साझेदारीमा लागू गर्न सकिन्छ। यो, निरपेक्षवादी तर्कहरू बनाउन वा डेटा साझेदारीको विरुद्धमा, म यो सोच्न सक्दछ कि हामी जोखिम घटाउन र डेटा साझेदारीबाट फाइदाहरू बढाउन कसरी ध्यान केन्द्रित गर्नेछौं।

समापन गर्न, सूचना जोखिम नाटकीय रूप देखि वृद्धि भएको छ, र यो भविष्यवाणी र मात्रा गर्न धेरै गाह्रो छ। यसैले, यो सबै भन्दा राम्रो हो भन्ने मानिन्छ कि सबै डेटा सम्भावित पहिचान योग्य र सम्भावित संवेदनशील छ। शोध गर्दा सूचनात्मक जोखिम घटाउन, शोधकर्ताहरू डेटा सुरक्षा योजना सिर्जना गर्न र अनुगमन गर्न सक्छन्। साथै, सूचना जोखिमले शोधकर्ताहरूलाई अन्य वैज्ञानिकहरूको साथ डेटा साझेदारी गर्नदेखि रोक्न सक्दैन।