6.6.2 বোঝা এবং ম্যানেজিং তথ্য ঝুঁকি

তথ্যসূত্র ঝুঁকি সামাজিক গবেষণা সবচেয়ে সাধারণ ঝুঁকি; এটি নাটকীয়ভাবে বৃদ্ধি পেয়েছে; এবং এটা বুঝতে খুব কঠিন ঝুঁকি।

ডিজিটাল বয়স গবেষণা জন্য দ্বিতীয় নৈতিক চ্যালেঞ্জ তথ্যগত ঝুঁকি , তথ্য প্রকাশ থেকে ক্ষতি জন্য সম্ভাব্য (National Research Council 2014) । ব্যক্তিগত তথ্য প্রকাশ থেকে তথ্যগত ক্ষতি হয় অর্থনৈতিক (যেমন, চাকরি হারানো), সামাজিক (যেমন, অস্বস্তিকর), মনস্তাত্ত্বিক (যেমন, বিষণ্নতা), এমনকি অপরাধী (যেমন, অবৈধ আচরণের জন্য গ্রেফতার)। দুর্ভাগ্যবশত, ডিজিটাল বয়স তথ্যগত ঝুঁকটি নাটকীয়ভাবে বৃদ্ধি পায় - আমাদের আচরণ সম্পর্কে আরও অনেক তথ্য আছে এবং ঝুঁকি তুলনায় তথ্য ঝুঁকি বোঝা কঠিন এবং প্রমাণ করা হয়েছে যে এনালগ বয়স সামাজিক গবেষণা উদ্বেগ ছিল, যেমন শারীরিক ঝুঁকি হিসাবে

ওয়ান ওয়ে যে সামাজিক গবেষকরা তথ্য ঝুঁকি হ্রাস তথ্য "anonymization" নির্দিষ্ট করে. "Anonymization" এই ধরনের নাম, ঠিকানা, এবং ডেটা থেকে টেলিফোন নম্বর হিসাবে সুস্পষ্ট ব্যক্তিগত শনাক্তকারী সরানোর প্রক্রিয়া. যাইহোক, এই পদ্ধতির গভীরভাবে এবং মৌলিকভাবে সীমিত অনেক কম কার্যকর চেয়ে অনেক মানুষ উপলব্ধি, এবং এটা আসলে, হয়. তজ্জন্য, যখনই আমি বর্ণনা "anonymization," আমি উদ্ধৃতি চিহ্ন আপনি মনে করিয়ে দেয় যে এই প্রক্রিয়া অপ্রকাশিতনামা চেহারা কিন্তু সত্য নয় অপ্রকাশিতনামা সৃষ্টি ব্যবহার করব.

"অনাবিষ্কৃতকরণ" ব্যর্থতার একটি স্পষ্ট উদাহরণ 1990 সালের শেষের দিকে ম্যাসাচুসেটস (Sweeney 2002) থেকে আসে। গ্রুপ ইন্স্যুরেন্স কমিশন (জিআইসি) ছিল একটি সরকারী সংস্থা যা সমস্ত রাষ্ট্রীয় কর্মীদের জন্য স্বাস্থ্য বীমা কেনার জন্য দায়ী। এই কাজের মাধ্যমে, জিআইসি হাজার হাজার রাষ্ট্রীয় কর্মচারী সম্পর্কে বিস্তারিত স্বাস্থ্য রেকর্ড সংগ্রহ করেছে। গবেষণা চালানোর একটি প্রচেষ্টায়, জিআইসি গবেষকদের কাছে এই রেকর্ডগুলি প্রকাশ করার সিদ্ধান্ত নিয়েছে। যাইহোক, তারা তাদের সব তথ্য ভাগ না; বরং তারা নাম এবং ঠিকানা হিসাবে তথ্য অপসারণ করে এই তথ্য "বেনামে" করে। যাইহোক, তারা অন্যান্য তথ্য যে তারা মনে করেন ডেমোগ্রাফিক তথ্য (জিপ কোড, জন্ম তারিখ, জাতিগত এবং লিঙ্গ) এবং চিকিৎসা সংক্রান্ত তথ্য (ডেটা, নির্ণয়ের, পদ্ধতির পরিদর্শন) (চিত্র 6.4) (Ohm 2010) হিসাবে গবেষকদের জন্য দরকারী হতে পারে। দুর্ভাগ্যবশত, এই "anonymization" তথ্য রক্ষা করতে যথেষ্ট ছিল না।

চিত্র 6.4: অ্যানোমাইমাইজেশন স্পষ্টভাবে সনাক্তকারী তথ্য সরানোর প্রক্রিয়া। উদাহরণস্বরূপ, রাষ্ট্র কর্মচারীদের মেডিকেল বীমা রেকর্ড মুক্তি যখন, ম্যাসাচুসেটস গ্রুপ বীমা কমিশন (GIC) ফাইল থেকে নাম এবং ঠিকানা মুছে ফেলা আমি আনন্দের নাম শব্দটির উদ্ধৃতি চিহ্নটি ব্যবহার করি কারণ প্রক্রিয়াটি গোপনীয়তার চেহারা কিন্তু আসলে প্রকৃত নামহীনতা নয়।

চিত্র 6.4: "অ্যানোমাইমাইজেশন" স্পষ্টভাবে সনাক্তকারী তথ্য সরানোর প্রক্রিয়া। উদাহরণস্বরূপ, রাষ্ট্র কর্মচারীদের মেডিকেল বীমা রেকর্ড মুক্তি যখন, ম্যাসাচুসেটস গ্রুপ বীমা কমিশন (GIC) ফাইল থেকে নাম এবং ঠিকানা মুছে ফেলা আমি শব্দটির "উদ্ধৃতি" শব্দটির উদ্ধৃতি চিহ্নটি ব্যবহার করি কারণ প্রক্রিয়াটি নামহীনতার উপস্থিতি উপলব্ধ করে কিন্তু প্রকৃত নামহীনতা নয়।

জিআইসি "অ্যানোমাইমাইজেশন" এর লক্ষণগুলি ব্যাখ্যা করার জন্য, এমটি-তে একটি স্নাতক ছাত্র-ছাত্রীকে ক্যাবব্রিজের শহর থেকে ম্যাসাচুসেটস গভর্নর উইলিয়াম উইলডের বাড়ি থেকে ভোটের রেকর্ড অর্জনের জন্য $ 20 দেওয়া হয়। এই ভোটের রেকর্ড যেমন নাম, ঠিকানা, জিপ কোড, জন্ম তারিখ, এবং লিঙ্গ হিসাবে তথ্য অন্তর্ভুক্ত। চিকিৎসা তথ্য ফাইল এবং ভোটার ফাইল fields-zip কোড, জন্ম তারিখ, এবং যৌন ভাগ যে সত্য - সুইনি তাদের লিঙ্ক করতে পারে যে বোঝানো। সুইনি জানতেন যে, জন্মদিনে জুলাই 31, 1 9 45 এবং ভোটের রেকর্ডগুলি কেবল ক্যামব্রিজে ছয়জনকেই জন্মদিনের জন্ম দিয়েছিল। উপরন্তু, যারা ছয় মানুষ, শুধুমাত্র তিন পুরুষ ছিল। এবং, সেই তিনজনের মধ্যে, শুধুমাত্র একটি উইডের জিপ কোড ভাগ করে নিয়েছে। এইভাবে, ভোটিং তথ্য দেখিয়েছে যে কোনও ব্যক্তির ডায়েলেডের জন্ম তারিখ, লিঙ্গ এবং জিপ কোডের সাথে উইলড উইল্ডের মেডিকেল তথ্য রয়েছে। বস্তুত, তথ্য এই তিনটি টুকরা তথ্য তার একটি অনন্য ফিঙ্গারপ্রিন্ট প্রদান। এই সত্যটি ব্যবহার করে, সেভেলের চিকিৎসা সংক্রান্ত রেকর্ডগুলি সনাক্ত করতে সক্ষম হন এবং তার কৃতিত্ব সম্পর্কে জানাতে তিনি তাকে তার রেকর্ডের একটি অনুলিপি (Ohm 2010)

চিত্র 6.5: গোপনীয় তথ্য পুনঃ-নিখুঁতকরণ। লাতিনা সুইচী গভর্নর উইলিয়াম উইল এর চিকিৎসা রেকর্ড খুঁজে বের করার জন্য স্বাক্ষরযুক্ত স্বাস্থ্য রেকর্ডের সাথে মিলিত হন।

চিত্র 6.5: "নামহীন" ডেটা পুনঃপ্রতিষ্ঠা Latanya এখনও বিক্রয়ের অর্ডার গভর্নর উইলিয়াম জোড় এর মেডিকেল রেকর্ড থেকে অভিযোজিত এটি ভোট রেকর্ড সঙ্গে "অনামী" স্বাস্থ্য রেকর্ড মিলিত Sweeney (2002) , চিত্র 1।

সুইনি এর কাজ পুনরায় সনাক্তকরণ আক্রমণের মৌলিক কাঠামোকে ব্যাখ্যা করে - কম্পিউটার নিরাপত্তা সম্প্রদায় থেকে একটি শব্দ গ্রহণ করার জন্য এই আক্রমণগুলিতে, দুইটি ডেটা সেট, কোনটি নিজের দ্বারা সংবেদনশীল তথ্য প্রকাশ করে, লিঙ্কযুক্ত হয় এবং এই সংযোগের মাধ্যমে সংবেদনশীল তথ্য প্রকাশ পায়।

স্নিয়ের কাজ এবং অন্যান্য সংশ্লিষ্ট কাজের প্রতিক্রিয়াতে, গবেষকরা এখন সাধারণত " (Narayanan and Shmatikov 2010) " প্রক্রিয়ার মাধ্যমে অনেক বেশি তথ্য-সমস্ত তথাকথিত "ব্যক্তিগতভাবে সনাক্তকারী তথ্য" (পিআইআই) (Narayanan and Shmatikov 2010) -কে সরিয়ে দেন। আরও অনেক গবেষক এখন বুঝতে পারি যে নির্দিষ্ট তথ্য যেমন- মেডিকেল রেকর্ড, আর্থিক রেকর্ড, অবৈধ আচরণ সম্পর্কিত প্রশ্নগুলি জরিপের উত্তর- সম্ভবত "অ্যানোমাইমাইজেশন" পরেও প্রকাশ করা খুবই সংবেদনশীল। তবে, যেসব উদাহরণ আমি দিতে যাচ্ছি তা হল সামাজিক গবেষকদের প্রয়োজন তাদের চিন্তা পরিবর্তন করতে প্রথম ধাপ হিসাবে, এটা ধারণা করা যে, সমস্ত ডেটা সম্ভাব্য সনাক্তকরণযোগ্য এবং সমস্ত ডেটা সম্ভাব্য সংবেদনশীল হয়। অন্য কথায়, চিন্তা করার পরিবর্তে যে তথ্যগত ঝুঁকি প্রকল্পগুলির একটি ছোট উপসেটে প্রযোজ্য, আমরা অনুমান করা উচিত যে এটি প্রযোজ্য - কিছু কিছু ডিগ্রী-সমস্ত প্রকল্পে

এই পুনর্বিবেচনা উভয় দিক Netflix পুরস্কার দ্বারা চিত্রিত হয়। 5 অধ্যায়ে বর্ণিত হিসাবে, Netflix প্রায় 500,000 সদস্যদের দ্বারা সরবরাহিত 100 মিলিয়ন চলচ্চিত্র রেটিং মুক্তি, এবং সারা বিশ্বের মানুষ বিশ্বব্যাপী যারা অ্যালগরিদম জমা দেওয়া চলচ্চিত্র সুপারিশ করতে Netflix এর ক্ষমতা উন্নত করতে পারে যেখানে একটি খোলা কল ছিল। তথ্য প্রকাশ করার আগে, Netflix নামক যেমন কোনো স্বতন্ত্র স্বতন্ত্র তথ্য, সরানো। তারা আরও একটি পদক্ষেপ গ্রহণ করে এবং কয়েকটি রেকর্ডে সামান্য বিপর্যয় ঘটায় (উদাহরণস্বরূপ, 4 টির থেকে 3 টি বড়ের কিছু রেটিং পরিবর্তন করা)। শীঘ্রই তারা আবিষ্কৃত, তবে, তাদের প্রচেষ্টার সত্ত্বেও, তথ্য বেনামী কোন উপায়ে এখনও ছিল।

তথ্য প্রকাশের মাত্র দুই সপ্তাহ পর, অরবিন্দ নারায়ণন এবং ভিটালি শমিতকোভ (2008) দেখিয়েছেন যে, নির্দিষ্ট লোকেদের চলচ্চিত্র পছন্দ সম্পর্কে শিখতে পারে। তাদের পুনরায় সনাক্তকরণ আক্রমণের কৌশলটি স্নিনের অনুরূপ ছিল: দুইটি তথ্য উৎস একত্রিত করে, সম্ভাব্য সংবেদনশীল তথ্য সহ এক এবং একথা স্পষ্টভাবে সনাক্তকারী তথ্য এবং এমন একটি ব্যক্তি যা জনগণের পরিচয় ধারণ করে। এই তথ্য সূত্র প্রতিটি পৃথকভাবে নিরাপদ হতে পারে, কিন্তু যখন তারা মিলিত হয়, সংযুক্ত ডেটাसेट তথ্যগত ঝুঁকি তৈরি করতে পারে। Netflix তথ্য ক্ষেত্রে, এটি কিভাবে ঘটতে পারে এখানে। কল্পনা করুন যে আমি আমার সহকর্মীদের সাথে কর্ম ও কৌতুক ছবি সম্পর্কে আমার চিন্তা শেয়ার করতে পছন্দ করি, কিন্তু আমি ধর্মীয় ও রাজনৈতিক চলচ্চিত্র সম্পর্কে আমার মতামত শেয়ার করতে পছন্দ করি না আমার সহকর্মীরা নেটফ্লিক্স ডেটাতে আমার রেকর্ডগুলি খুঁজে পেতে আমি তাদের সাথে ভাগ করা তথ্যগুলি ব্যবহার করতে পারি; আমি যে তথ্যটি ভাগ করি তা উইলিয়াম উইল্ডের জন্ম তারিখ, জিপ কোড এবং লিঙ্গের মত একটি অনন্য ফিঙ্গারপ্রিন্ট হতে পারে। তারপর, যদি তারা আমার অনন্য ফিঙ্গারপ্রিন্টটি ডেটাতে খুঁজে পায় তবে তারা সমস্ত চলচ্চিত্র সম্পর্কে আমার রেটিং শিখতে পারে, যেগুলি আমি শেয়ার করতে না পছন্দ করি এমন চলচ্চিত্র সহ। এই ধরনের একটি লক্ষ্যবস্তু হামলা ছাড়াও, একক ব্যক্তির উপর নজর রাখা নারায়ণন এবং শম্তটিকভও দেখিয়েছেন যে এটি একটি বিস্তৃত আক্রমণ করা সম্ভব - অনেক লোককে জড়িত করা হয়েছে- ব্যক্তিগত এবং চলচ্চিত্র রেটিং ডেটা দিয়ে নেটফ্লিক্স ডাটা মার্জ করে কিছু লোক বেছে নিয়েছে ইন্টারনেট মুভি ডেটাবেস (আইএমডিবি) এ পোস্ট করতে। মোটামুটিভাবে, কোনও তথ্য যা একটি নির্দিষ্ট ব্যক্তির জন্য একটি অনন্য ফিঙ্গারপ্রিন্ট-এমনকি তাদের চলচ্চিত্রের রেটিংগুলি-তাদের সনাক্ত করতে ব্যবহৃত হতে পারে।

যদিও Netflix তথ্যটি একটি লক্ষ্যযুক্ত বা বিস্তৃত আক্রমণে পুনরায় সনাক্ত করা যেতে পারে, এটি এখনও কম ঝুঁকি হতে পারে। সব পরে, সিনেমা রেটিং খুব সংবেদনশীল মনে হয় না। যদিও এটি সাধারণত সত্য হতে পারে, তবে ডেটাসেটের কিছু 500,000 লোকের জন্য, চলচ্চিত্রের রেটিংগুলি বেশ সংবেদনশীল হতে পারে। প্রকৃতপক্ষে, পুনঃ-সনাক্তকরণের প্রতিক্রিয়াতে, একটি ক্লিনিক্যাল সমকামী মহিলা Netflix বিরুদ্ধে একটি ক্লাস-অ্যাকশন স্যুয়েজ যোগদান। এখানে কিভাবে তাদের মামলা (Singel 2009) মধ্যে সমস্যা প্রকাশ করা হয়েছিল:

"[এম] ওভি এবং রেটিং তথ্য একটি অত্যন্ত ... ব্যক্তিগত ও সংবেদনশীল প্রকৃতির তথ্য। সদস্যের মুভি ডেটা একটি Netflix সদস্যের ব্যক্তিগত স্বার্থ এবং / বা যৌনতা, মানসিক অসুস্থতা, মদ্যাশক্তি থেকে পুনরুদ্ধার, ব্যভিচার, শারীরিক নির্যাতন, পারিবারিক সহিংসতা, ব্যভিচার, এবং ধর্ষণ সহ বিভিন্ন অত্যন্ত গুরুত্বপূর্ণ বিষয়গুলির সাথে সংগ্রাম করে। "

Netflix পুরস্কারের তথ্য পুনরায় সনাক্তকরণ উভয়ই ব্যাখ্যা করে যে সমস্ত তথ্য সম্ভাব্য সনাক্তকরণযোগ্য এবং সমস্ত ডেটা সম্ভাব্য সংবেদনশীল হয় এই মুহুর্তে, আপনি মনে করতে পারেন যে এটি শুধুমাত্র সেইসব তথ্যগুলিকে প্রযোজ্য যা জনসাধারণের কাছে থাকা উচিত। আশ্চর্যজনক, যে ক্ষেত্রে না হয়। ইনফরমেশন আইন অনুরোধের স্বাধীনতার প্রতিক্রিয়ায় নিউ ইয়র্ক সিটি সরকার ২013 সালে নিউ ইয়র্কের প্রতিটি ট্যাক্সি চালানোর রেকর্ড প্রকাশ করে, যার মধ্যে রয়েছে পিকআপ এবং ড্রপ ডাউন সময়, অবস্থান এবং ভাড়ার পরিমাণ (২ অধ্যায় থেকে প্রত্যাহার করা যা Farber (2015) শ্রম অর্থনীতিতে গুরুত্বপূর্ণ তত্ত্ব পরীক্ষা করার জন্য অনুরূপ তথ্য ব্যবহার) ট্যাক্সি ভ্রমণের বিষয়ে এই তথ্যগুলি সৌভাগ্যজনক বলে মনে হতে পারে কারণ তারা মানুষ সম্পর্কে তথ্য সরবরাহ করে না বলে মনে করে, তবে এন্থনি টোকার বুঝতে পেরেছিলেন যে এই ট্যাক্সি ডেটাসেটটি আসলে মানুষের সম্পর্কে সম্ভাব্য সংবেদনশীল তথ্য প্রচুর পরিমাণে রয়েছে। উদাহরণস্বরূপ, তিনি নিউ ইয়র্কের হস্টলার ক্লাব-এর একটি বড় স্ট্রিপ ক্লাব থেকে শুরু করে মধ্যরাতে এবং সকাল 6 টা পর্যন্ত সমস্ত ভ্রমণের দিকে তাকিয়ে থাকতেন এবং তারপর তাদের ড্রপ-অফ অবস্থানগুলি খুঁজে পান। এই অনুসন্ধানটি উদ্ভিন্ন-অবশেষে - (Tockar 2014) ক্লাব (Tockar 2014) ঘন ঘন ঘন ঘন ঘন ঘন ঘন লোকের ঠিকানাগুলির তালিকা। এটা কল্পনা করা কঠিন যে শহরের সরকার যখন এই তথ্য প্রকাশ করেছিল, তখন এটি মনে হয়েছিল। বস্তুত, এই একই কৌশলটি শহরের মধ্যে যে কোনও স্থান পরিদর্শন করে এমন একটি বাড়িওয়ালাগুলির ঠিকানা খুঁজে পেতে ব্যবহৃত হতে পারে- একটি মেডিকেল ক্লিনিক, একটি সরকারি ভবন, অথবা একটি ধর্মীয় প্রতিষ্ঠান।

Netflix পুরস্কার এবং নিউ ইয়র্ক সিটি ট্যাক্সি ডেটা এই দুটি ক্ষেত্রে দেখায় যে অপেক্ষাকৃত দক্ষ ব্যক্তিরা যে তথ্য প্রকাশ করে তাদের তথ্যগত ঝুঁকির সঠিকভাবে অনুমান করতে ব্যর্থ হতে পারে- এবং এই ক্ষেত্রে কোনও উপায় নেই (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) । উপরন্তু, অনেক ক্ষেত্রে, সমস্যাযুক্ত ডেটা এখনো অনলাইনে অবাধে পাওয়া যায়, যা কখনও কখনও একটি ডাটা রিলিজ নষ্ট করে। একসঙ্গে, এই উদাহরণ- পাশাপাশি গোপনীয়তা সম্পর্কে একটি গুরুত্বপূর্ণ উপসংহারে কম্পিউটার বিজ্ঞান বিষয়ে গবেষণা। গবেষকরা অবশ্যই অনুমান করা উচিত যে সমস্ত ডেটা সম্ভাব্য সনাক্তকরণযোগ্য এবং সমস্ত ডেটা সম্ভাব্য সংবেদনশীল।

দুর্ভাগ্যক্রমে, সমস্ত তথ্য সম্ভাব্য সনাক্তকরণযোগ্য এবং সমস্ত তথ্য সম্ভাব্য সংবেদনশীল হয় যে ঘটনা কোন সহজ সমাধান আছে যাইহোক, তথ্য সংক্রান্ত ঝুঁকির পরিমাণ কমিয়ে দেওয়ার সময় আপনি ডাটা ডেটা সুরক্ষার পরিকল্পনা তৈরি এবং অনুসরণ করতে পারেন। এই পরিকল্পনাটি আপনার ডেটা লিক করবে এমন সুযোগকে হ্রাস করবে এবং যদি কোনও লিক একরকম ঘটতে পারে তবে ক্ষতি কমে যাবে। ডেটা সুরক্ষা প্ল্যানগুলির স্পেসিফিকস, যেমন কোনও এনক্রিপশন ব্যবহার করার সময়, সময়ের সাথে পরিবর্তন ঘটবে, কিন্তু ইউকে ডেটা সার্ভিসেস একটি ডেটা সুরক্ষা প্ল্যানের উপাদানগুলিকে পাঁচটি শ্রেণিতে সহায়কভাবে সংগঠিত করে যা তারা পাঁচটি safes : নিরাপদ প্রকল্প, নিরাপদ মানুষ , নিরাপদ সেটিংস, নিরাপদ ডেটা এবং নিরাপদ আউটপুটগুলি (টেবিল 6.2) (Desai, Ritchie, and Welpton 2016) । পাঁচটি safes কেউ স্বতন্ত্রভাবে নিখুঁত সুরক্ষা প্রদান। কিন্তু একসঙ্গে তারা তথ্য শক্তিশালী ঝুঁকি হ্রাস করতে পারে এমন একটি শক্তিশালী সেট গঠন করে।

সারণি 6.2: "পাঁচটি সাফস" একটি ডেটা সুরক্ষা পরিকল্পনা ডিজাইনিং (Desai, Ritchie, and Welpton 2016) জন্য নীতিমালা (Desai, Ritchie, and Welpton 2016)
নিরাপদ কর্ম
নিরাপদ প্রকল্প ঐতিহ্যগত নথিতে যারা তথ্য তাদের সাথে সীমাবদ্ধ করে
নিরাপদ মানুষ অ্যাক্সেস এমন ব্যক্তিদের কাছে সীমাবদ্ধ যারা ডেটা নিয়ে বিশ্বস্ত হতে পারে (উদাহরণস্বরূপ, যারা নৈতিক প্রশিক্ষণ দিয়েছে)
নিরাপদ ডেটা তথ্য সম্ভাব্য পরিমাণে চিহ্নিত এবং সংহত করা হয়
নিরাপদ সেটিংস ডেটা যথাযথ শারীরিক (যেমন, লকড কক্ষ) এবং সফ্টওয়্যার (যেমন, পাসওয়ার্ড সুরক্ষা, এনক্রিপ্টেড) সুরক্ষার সাথে কম্পিউটারগুলিতে সংরক্ষিত হয়
নিরাপদ আউটপুট দুর্ঘটনামূলক গোপনীয়তা লঙ্ঘন প্রতিরোধ করার জন্য রিসার্চ আউটপুট পর্যালোচনা করা হয়

আপনার ডেটা সুরক্ষিত করার পাশাপাশি আপনি যখন তাদের ব্যবহার করছেন তখন গবেষণা প্রক্রিয়ার এক ধাপ যেখানে তথ্যগত ঝুঁকি বিশেষভাবে প্রধান হয় সেগুলি অন্য গবেষকদের সাথে ভাগ করে নেওয়া। বিজ্ঞানীদের মধ্যে তথ্য ভাগাভাগি বৈজ্ঞানিক প্রচেষ্টার মূল মান, এবং এটি ব্যাপকভাবে জ্ঞানের অগ্রগতিতে সহায়তা করে। এখানে কিভাবে ইউকে হাউস অফ কমন্স ডেটা ভাগাভাগির গুরুত্ব বর্ণনা করেছে (Molloy 2011) :

"তথ্য অ্যাক্সেস মৌলিক যদি গবেষকরা পুনরুত্পাদন, যাচাই এবং ফলাফল যে সাহিত্যে রিপোর্ট করা হয় নির্মাণ করা হয়। ধারণা করা উচিত যে, যদি না অন্য কোনো কারণে শক্তিশালী তথ্য থাকে তবে তথ্য সম্পূর্ণরূপে প্রকাশ করা উচিত এবং সর্বজনীনভাবে উপলব্ধ করা হবে। "

তবুও, অন্য গবেষকদের সাথে আপনার ডেটা ভাগ করে, আপনার অংশগ্রহণকারীদের তথ্যগত ঝুঁকি বাড়ানো হতে পারে। এইভাবে, মনে হতে পারে যে ডেটা ভাগ করা অন্যান্য বৈজ্ঞানিকদের সাথে ডেটা ভাগ করার বাধ্যবাধকতা এবং অংশগ্রহণকারীদের তথ্যগত ঝুঁকি হ্রাসের দায়িত্বের মধ্যে একটি মৌলিক চাপ সৃষ্টি করে। সৌভাগ্যবশত, এই দ্বিধা হিসাবে প্রদর্শিত হিসাবে হিসাবে তীব্র নয়। পরিবর্তে, একটি ধারাবাহিকতায় পতিত হিসাবে ডেটা ভাগাভাগি হিসাবে বিবেচনা করা ভাল, যে অংশে অংশীদারদের একটি পৃথক মিশ্রণ প্রদান এবং অংশগ্রহণকারীদের ঝুঁকি উপলব্ধ (সংখ্যা 6.6)।

এক চরম সময়ে, আপনি আপনার ডেটা কারো সাথে শেয়ার করতে পারবেন না, যা অংশগ্রহণকারীদের ঝুঁকি কমিয়ে দেয় কিন্তু সমাজের লাভও কম দেয়। অন্য চরমপথে, আপনি মুক্তি এবং ভুলে যেতে পারেন, যেখানে ডেটা "নামহীন" এবং প্রত্যেকের জন্য পোস্ট করা। তথ্য প্রকাশ না করে রিলিজ এবং ভুলে যাওয়া, অংশগ্রহণকারীদের উভয় উচ্চ বেনিফিট এবং উচ্চ ঝুঁকি প্রস্তাব। এই দুই চরম ক্ষেত্রে মধ্যে একটি হাইব্রিড একটি পরিসীমা হয়, আমি একটি walled বাগান পদ্ধতি কল করব যা সহ। এই পদ্ধতির অধীনে, তথ্য নির্দিষ্ট মানদণ্ড পূরণ করে এমন ব্যক্তিদের সাথে ভাগ করা হয় এবং নির্দিষ্ট নিয়ম দ্বারা আবদ্ধ হতে সম্মত হয় (উদাহরণস্বরূপ, IRB এবং একটি ডেটা সুরক্ষা প্ল্যান থেকে তত্ত্বাবধান)। প্রাচীরযুক্ত বাগান পদ্ধতিটি মুক্তির অনেক সুবিধা প্রদান করে এবং কম ঝুঁকি ভুলে যায়। অবশ্যই, এই ধরনের একটি পদ্ধতি অনেক প্রশ্ন তৈরি করে - যাদের কোন অবস্থার অধীনে, কতক্ষণে এবং কতদিন ধরে, যারা প্রাচীরযুক্ত বাগান ইত্যাদি বজায় রাখা এবং পুলিশে অর্থ প্রদান করতে হবে - কিন্তু এগুলি অসম্ভব নয়। প্রকৃতপক্ষে, ইতিমধ্যেই আশেপাশের বাগানগুলি কাজ করছে যেগুলি এখন গবেষকরা এখন ব্যবহার করতে পারবেন, যেমন মিশিগান ইউনিভার্সিটির রাজনৈতিক ও সামাজিক গবেষণার জন্য আন্তঃ বিশ্ববিদ্যালয় কনসোর্টিয়ামের তথ্য সংরক্ষণাগার।

চিত্র 6.6: ডেটা প্রকাশের কৌশলগুলি একটি ধারাবাহিকতায় পতিত হতে পারে। আপনি এই ধারাবাহিকতায় থাকা উচিত আপনার ডেটা বিশদ বিবরণ উপর নির্ভর করে, এবং তৃতীয় পক্ষের পর্যালোচনা আপনি ঝুঁকি সঠিক ভারসাম্য এবং আপনার ক্ষেত্রে উপকারিতা সিদ্ধান্ত নিতে সাহায্য করতে পারে। এই বক্ররেখা সঠিক আকার তথ্য এবং গবেষণা লক্ষ্যের সুনির্দিষ্ট উপর নির্ভর করে (Goroff 2015)।

চিত্র 6.6: ডেটা প্রকাশের কৌশলগুলি একটি ধারাবাহিকতায় পতিত হতে পারে। আপনি এই ধারাবাহিকতায় থাকা উচিত আপনার ডেটা বিশদ বিবরণ উপর নির্ভর করে, এবং তৃতীয় পক্ষের পর্যালোচনা আপনি ঝুঁকি সঠিক ভারসাম্য এবং আপনার ক্ষেত্রে উপকারিতা সিদ্ধান্ত নিতে সাহায্য করতে পারে। এই বক্ররেখা সঠিক আকার তথ্য এবং গবেষণা লক্ষ্যের সুনির্দিষ্ট উপর নির্ভর করে (Goroff 2015)

সুতরাং, যেখানে আপনার অধ্যয়ন থেকে তথ্য কোন শেয়ারিং, walled বাগান, এবং প্রকাশ এবং ভুলে যাওয়া অবশেষ অন করা উচিত? এটি আপনার ডেটা বিশদগুলির ওপর নির্ভর করে: গবেষকরা অবশ্যই আইন এবং জনস্বার্থের জন্য ব্যক্তি, সম্মান, ন্যায়বিচার এবং সম্মানের প্রতি সম্মান দেখাতে হবে। এই দৃষ্টিকোণ থেকে দেখেছি, ডেটা ভাগাভাগি একটি আলাদা নৈতিক ধাঁধা নয়; এটি গবেষণার বেশ কিছু দিক যা গবেষকদের একটি উপযুক্ত নৈতিক ভারসাম্য খুঁজে বের করতে হয়।

কিছু সমালোচক সাধারণত ডেটা ভাগাভাগির বিরোধিতা করে, কারণ আমার মতে, তারা তার ঝুঁকির উপর দৃষ্টি নিবদ্ধ করে - যা নিঃসন্দেহে বাস্তব-এবং তার সুফল উপেক্ষা করছে। সুতরাং, উভয় ঝুঁকি এবং বেনিফিট উপর ফোকাস উত্সাহিত করার জন্য, আমি একটি দৃষ্টান্ত অফার চাই প্রতি বছর, গাড়ি হাজার হাজার মৃত্যুর জন্য দায়ী, কিন্তু আমরা ড্রাইভিং নিষিদ্ধ করার চেষ্টা করি না। আসলে, ড্রাইভিং নিষিদ্ধ করার একটি কলটি অদ্ভুত হবে কারণ ড্রাইভিং অনেক বিস্ময়কর জিনিস সক্ষম করে। বরং, সমাজ যেগুলি চালাতে পারে (যেমন, নির্দিষ্ট বয়স হতে পারে এবং নির্দিষ্ট পরীক্ষাগুলি পাস করা) এবং কিভাবে তারা চালাতে পারে (যেমন, গতি সীমাবদ্ধতার অধীনে) উপর সীমাবদ্ধতা রয়েছে। সমাজের এই নিয়মগুলি (যেমন, পুলিশ) প্রয়োগ করার দায়িত্ব রয়েছে, এবং যারা তাদের লঙ্ঘন করে ধরা হয় তাদের আমরা শাস্তি দিই। এই একই ধরনের সামঞ্জস্যপূর্ণ চিন্তাশীল যে সমাজের ড্রাইভিং নিয়ন্ত্রণের ক্ষেত্রে প্রযোজ্য হয় তা ডেটা ভাগ করাতে প্রয়োগ করা যেতে পারে। এটা হচ্ছে, ডেটা ভাগাভাগির জন্য বা এর বিরুদ্ধে নিরপেক্ষ আর্গুমেন্ট তৈরির পরিবর্তে, আমি মনে করি আমরা কীভাবে ঝুঁকি হ্রাস করতে পারি এবং ডেটা ভাগাভাগি থেকে বেনিফিট বাড়ানোর উপর মনোযোগ কেন্দ্রীভূত করে সর্বাধিক উন্নতি করতে পারি।

উপসংহারে, তথ্যগত ঝুঁকি নাটকীয়ভাবে বৃদ্ধি পেয়েছে, এবং পূর্বাভাস এবং পরিমাপ করা খুব কঠিন। অতএব, অনুমান করা ভাল যে সমস্ত তথ্য সম্ভাব্য সনাক্তকরণযোগ্য এবং সম্ভাব্য সংবেদনশীল। গবেষণা করার সময় তথ্যগত ঝুঁকিকে হ্রাস করতে, গবেষকরা তথ্য সুরক্ষার পরিকল্পনা তৈরি এবং অনুসরণ করতে পারেন। উপরন্তু, তথ্যগত ঝুঁকি গবেষকদের অন্যান্য বিজ্ঞানীদের সঙ্গে ডেটা ভাগ থেকে প্রতিরোধ করে না।