6.6.2 مفاہمت اور منیجنگ معلوماتی خطرے

سماجی تحقیق میں معلوماتی خطرہ سب سے زیادہ عام خطرہ ہے. اس میں ڈرامائی طور پر اضافہ ہوا ہے؛ اور یہ سمجھنے کا سب سے بڑا خطرہ ہے.

ڈیجیٹل عمر کی تحقیق کے لئے دوسرا اخلاقی چیلنج معلوماتی خطرہ ہے ، معلومات کے افادیت سے متعلق نقصان (National Research Council 2014) . ذاتی معلومات کے افشاء سے اطلاعاتی نقص اقتصادی ہوسکتی ہے (مثال کے طور پر، ایک ملازمت کھونے)، سماجی (مثال کے طور پر، شرمندگی)، نفسیاتی (مثال کے طور پر، ڈپریشن)، یا یہاں تک کہ مجرمانہ (مثال کے طور پر، غیر قانونی سلوک کے لئے گرفتاری). بدقسمتی سے، ڈیجیٹل عمر کو معلوماتی خطرے میں ڈرامائی طور پر اضافہ ہوتا ہے - ہمارے رویے کے بارے میں صرف اتنا زیادہ معلومات ہے. اور انضمام عمر سماجی تحقیق، جیسے جسمانی خطرے میں خدشات کے خطرات کے ساتھ مقابلے میں سمجھنے اور انتظام کرنے کے لئے معلوماتی خطرہ ثابت ہوا ہے.

سماجی محققین معلوماتی خطرے کو کم ایک طریقہ یہ اعداد و شمار کے "anonymization" ہے. "Anonymization" جیسا کہ نام، پتہ، اور اعداد و شمار سے ٹیلی فون نمبر واضح ذاتی شناختی ہٹانے کے عمل ہے. تاہم، اس نقطہ نظر کے دل کی گہرائیوں سے اور بنیادی طور محدود بہت سے لوگوں کا احساس کے مقابلے میں بہت کم مؤثر ہے، اور یہ حقیقت میں ہے،. اس وجہ سے، میں جب بھی بیان کریں "anonymization،" میں واوین آپ کو یاد دلانے کے لیے اس کے عمل کو نام ظاہر نہ کرنے کی ظاہری شکل نہیں بلکہ سچا نام ظاہر نہ پیدا کرتا ہے کہ اسے استعمال کریں گے.

"نامناسب" کی ناکامی کا ایک وشد مثال مثال کے طور پر 1990 میساچیس میں ماسشوچیٹس (Sweeney 2002) سے آتا ہے. گروپ انشورنس کمیشن (جی آئی سی) ایک سرکاری ادارہ تھا جو تمام ریاستی ملازمین کے لئے صحت کی انشورینس کی خریداری کے لئے ذمہ دار تھی. اس کام کے ذریعے، جی آئی سی نے ہزاروں سرکاری ملازمتوں کے بارے میں تفصیلی صحت کا ریکارڈ جمع کیا. تحقیقات کرنے کی کوشش میں، جی آئی سی نے یہ ریکارڈ محققین کو جاری کرنے کا فیصلہ کیا. تاہم، انہوں نے اپنے تمام اعداد و شمار کا اشتراک نہیں کیا؛ بلکہ، وہ نام اور پتے جیسے معلومات کو ہٹانے سے ان اعداد و شمار کو "نام نہاد" قرار دیتے ہیں. تاہم، انہوں نے دیگر معلومات کو چھوڑ دیا ہے کہ انھوں نے سوچا کہ ڈیموگرافک معلومات (زپ کوڈ، پیدائش کی تاریخ، قومیت اور جنسی) اور طبی معلومات (اعداد و شمار، تشخیص، طریقہ کار کا دورہ کریں) (اعداد و شمار 6.4) (Ohm 2010) کے طور پر محققین کے لئے مفید ثابت ہوسکتا ہے. بدقسمتی سے، اعداد و شمار کی حفاظت کے لئے یہ "نام نہاد" کافی نہیں تھا.

شناخت 6.4: نامکمل طور پر شناختی معلومات کو ہٹانے کا عمل ہے. مثال کے طور پر، ریاستی ملازمین کے میڈیکل انشورنس ریکارڈز کو جاری کرتے وقت، میساچیٹس گروپ انشورنس کمیشن (جی آئی سی) نے فائلوں سے نام اور پتے کو ہٹا دیا. میں لفظ کے نام کے ارد گرد کوٹیشن کے نشان استعمال کرتا ہوں کیونکہ اس عمل کو نام نہاد کا ظہور فراہم ہوتا ہے بلکہ اصل نام نہاد.

شکل 6.4: "نام نہاد" واضح طور پر شناختی معلومات کو ہٹانے کے عمل ہے. مثال کے طور پر، ریاستی ملازمین کے میڈیکل انشورنس ریکارڈز کو جاری کرتے وقت، میساچیٹس گروپ انشورنس کمیشن (جی آئی سی) نے فائلوں سے نام اور پتے کو ہٹا دیا. میں لفظ "ناممکن" کے ارد گرد کوٹیشن کے نشان استعمال کرتا ہوں کیونکہ اس عمل کو نام نہاد کی ظاہری شکل فراہم ہوتی ہے بلکہ اصل نام نہاد.

میسیچیسٹس کے گورنر ولیم ویلڈ کے آبائی شہر، کیمبرج شہر سے ووٹنگ کے ریکارڈ حاصل کرنے کے لئے، ایم آئی ٹی کے ایک گریجویٹ طالب علم لطیان سوینئی - پھر جی آئی سی "نام نہاد" کی کمی کی وضاحت کرنے کے لئے. ان ووٹنگ کے ریکارڈ میں معلومات شامل ہیں جیسے نام، ایڈریس، زپ کوڈ، پیدائش کی تاریخ، اور جنس. حقیقت یہ ہے کہ طبی ڈیٹا فائل اور ووٹر فائل نے فیلڈ زپ کوڈ، پیدائش کی تاریخ، اور جنسی کا مطلب یہ ہے کہ سوینکی ان سے رابطہ کرسکتے ہیں. سوین کو معلوم تھا کہ ویلڈ کی سالگرہ 31 جولائی، 1 9 45 تھی، اور ووٹنگ ریکارڈوں میں صرف چھ افراد کیمبرج میں اس سالگرہ کے ساتھ شامل تھے. اس کے علاوہ، ان چھ افراد میں سے صرف تین مرد تھے. اور، ان تین مردوں میں سے، صرف ایک ہی ویلڈ کے زپ کوڈ کا اشتراک کیا. اس طرح، ووٹ کے اعداد و شمار سے پتہ چلتا ہے کہ والدہ کے پیدائش کی تاریخ، جنس، اور زپ کوڈ ولیم ویلڈ کے ساتھ میڈیکل ڈیٹا میں کوئی بھی پتہ چلا تھا. جوہر میں، معلومات کے ان تین ٹکڑے ٹکڑے نے ان اعداد و شمار میں ایک منفرد انگلی کا نشان فراہم کیا. اس حقیقت کا استعمال کرتے ہوئے، سوین ویلڈ کے میڈیکل ریکارڈز کا پتہ لگانے میں کامیاب تھا، اور، ان کے نام کے بارے میں مطلع کرنے کے لئے، انہوں نے انہیں اپنے ریکارڈ (Ohm 2010) ایک نقل بھیجا.

شناخت 6.5: گمنام کردہ اعداد و شمار کے دوبارہ شناخت. لطیان سوائن نے گورنر ولیم ویلڈ کے میڈیکل ریکارڈز کو تلاش کرنے کے لۓ ووٹ ریکارڈوں کے ساتھ نام نہاد صحت کے ریکارڈوں کو مل کر ایک نمبر سو (2002) سے عدد کیا.

شناخت 6.5: "نام نہاد" کے اعداد و شمار کا دوبارہ بتانا. لطیان سوائن نے گورنر ولیم ویلڈ کے میڈیکل ریکارڈز کو تلاش کرنے کے لۓ ووٹ ریکارڈوں کے ساتھ "نام نہاد" صحت کے ریکارڈ کو مل کر Sweeney (2002) اعداد و شمار سے لیا.

سوین کے کام نے دوبارہ شناختی حملوں کی بنیادی ساخت کی وضاحت کی ہے- کمپیوٹر سیکورٹی برادری سے ایک اصطلاح کو اپنایا. ان حملوں میں، دو اعداد و شمار کا تعین، نہ ہی خود کو حساس معلومات سے پتہ چلتا ہے، منسلک ہوتے ہیں، اور اس سلسلے میں، حساس معلومات سامنے آتی ہیں.

سوین کے کام اور دیگر متعلقہ کاموں کے جواب میں، محققین اب عام طور پر زیادہ معلومات کو ہٹاتے ہیں - انھیں نام نہاد "ذاتی طور پر شناختی معلومات" (PII) (Narayanan and Shmatikov 2010) شمٹیکوف (Narayanan and Shmatikov 2010) نامزد کرتے ہیں- "نامناسب" عمل کے عمل میں. مزید کے علاوہ، بہت سے محققین اب احساس ہے کہ بعض اعداد و شمار جیسے طبی ریکارڈ، مالی ریکارڈ، غیر قانونی سلوک کے بارے میں سروے کے سوالات کے جوابات - نام نہاد کے بعد بھی جاری ہونے کے لئے شاید بھی حساس ہے. تاہم، مثالیں جن میں میں ہوں اس کے بارے میں مشورہ دیتے ہیں کہ سماجی محققین کی ضرورت ہے ان کی سوچ کو تبدیل کرنے کے لئے. پہلے مرحلے کے طور پر، یہ سمجھنے کا عقل ہے کہ تمام اعداد و شمار ممکنہ طور پر شناختی قابل ہیں اور تمام اعداد و شمار ممکنہ طور پر حساس ہیں. دوسرے الفاظ میں، بجائے معلوماتی خطرہ سوچنے کے بجائے منصوبوں کے چھوٹے حصوں پر لاگو ہوتا ہے، ہمیں یہ سمجھنا چاہئے کہ یہ کچھ ڈگری سے تمام منصوبوں تک ہوتا ہے.

اس reorientation کے دونوں پہلوؤں Netflix انعام کی طرف سے واضح کیا جاتا ہے. جیسا کہ باب 5 میں بیان کیا گیا ہے، Netflix نے تقریبا 500،000 فلموں کی طرف سے فراہم کردہ 100 ملین فلم کی درجہ بندی جاری کی، اور یہ ایک کھلا کال تھا جہاں دنیا بھر میں لوگوں نے الگورتھم کو پیش کیا جو فلموں کی سفارش کرنے کے لئے Netflix کی صلاحیت کو بہتر بنا سکتی ہے. اعداد و شمار کو جاری کرنے سے پہلے، Netflix کسی بھی واضح طور پر ذاتی طور پر شناخت کی معلومات، جیسے ناموں کو ہٹا دیا. انہوں نے ایک اضافی قدم بھی چلایا اور کچھ ریکارڈوں میں تھوڑا سا اثرات متعارف کرایا (مثال کے طور پر، 4 ستارے سے 3 ستاروں سے کچھ درجہ بندی میں تبدیلی). تاہم، انھوں نے جلد ہی دریافت کیا، کہ ان کی کوششوں کے باوجود، اعداد و شمار اب بھی کوئی نام نہاد کی طرف سے تھے.

اعداد و شمار جاری کر کے صرف دو ہفتوں بعد، اروند ناراینان اور وٹیی شمٹیکوف (2008) نے ظاہر کیا کہ یہ خاص لوگوں کی فلم کی ترجیحات کے بارے میں جاننا ممکن تھا. ان کے دوبارہ شناختی حملے کے لئے چیلنج سوینی کی طرح تھا: ایک ساتھ دو معلومات کے ذریعہ مل کر مل کر، ایک ممکنہ حساس معلومات کے ساتھ اور کوئی واضح طور پر شناختی معلومات اور کسی شخص کی شناختوں میں شامل نہیں. ان اعداد و شمار کے ذرائع میں سے ہر ایک انفرادی طور پر محفوظ ہوسکتا ہے، لیکن جب وہ مشترکہ ہوتے ہیں تو ضم مل جاتا ہے ڈیٹا بیس خطرہ پیدا کرسکتا ہے. Netflix کے اعداد و شمار کے معاملے میں، یہ کیسے ہو سکتا ہے. تصور کریں کہ میں نے اپنے شریک کارکنوں کے ساتھ کارروائی اور مزاحیہ فلموں کے بارے میں اپنے خیالات کا اشتراک کرنے کا انتخاب کیا ہے، لیکن میں یہ پسند نہیں کرتا کہ مذہبی اور سیاسی فلموں کے متعلق اپنی رائے کا اشتراک کرنا. میرے شریک کارکن معلومات کو استعمال کرسکتے ہیں جنہوں نے میں نے ان کے ساتھ نیٹ ورکس ڈیٹا میں اپنے ریکارڈ تلاش کرنے کے لئے اشتراک کیا ہے؛ ولیم ویلڈ کی پیدائش کی تاریخ، زپ کوڈ، اور جنسی کی حیثیت سے میں شریک ہوں جس کی معلومات میں ایک منفرد فنگر پرنٹ ہوسکتا ہے. پھر، اگر انہوں نے اپنے منفرد انگلی کا نشان ڈیٹا میں پایا، تو وہ ان تمام فلموں کے بارے میں اپنی درجہ بندی سیکھ سکتے ہیں، بشمول ان فلموں سمیت، جس میں میں نے حصہ لینے کا انتخاب نہیں کیا. اس قسم کے ھدفانہ حملے کے علاوہ ایک ہی شخص پر توجہ مرکوز، ناراینان اور شمٹیکوف نے بھی ظاہر کیا کہ وسیع پیمانے پر حملے کرنے کے لئے ممکن تھا، جس میں ذاتی اور فلم کی درجہ بندی کے اعداد و شمار کے ساتھ Netflix کے اعداد و شمار کو ضم کرنے کے ذریعہ بہت سے لوگوں کو شامل کیا گیا ہے. انٹرنیٹ مووی ڈیٹا بیس (IMDb) پر پوسٹ کرنے کے لئے. بالکل آسان، کسی خاص معلومات جو ایک منفرد شخص کو ایک منفرد انگلی کا نشان ہے- یہاں تک کہ ان کی شناخت کرنے کے لئے بھی ان کی فلم کی درجہ بندی کا استعمال ہوتا ہے.

اگرچہ Netflix ڈیٹا کسی بھی ھدف یا وسیع حملے میں دوبارہ نشاندہی کی جا سکتی ہے، اگرچہ یہ اب بھی کم خطرہ ہوسکتا ہے. سب کے بعد، فلم کی درجہ بندی بہت حساس نہیں لگتی ہیں. جبکہ یہ عام طور پر درست ہوسکتا ہے، ڈیٹا بیس میں 500000 سے زائد لوگوں کے لئے، فلم کی درجہ بندی بہت حساس ہوتی ہے. حقیقت میں، دوبارہ شناخت کے جواب میں، ایک الماری ہم جنس پرست خاتون Netflix کے خلاف ایک کلاس کے عمل سوٹ میں شامل ہو گئے. یہاں ہے کہ کس طرح ان کے مقدمے میں مسئلہ اظہار کیا گیا تھا (Singel 2009) :

"[ایم] ovie اور درجہ بندی کے اعداد و شمار پر مشتمل ہے ... انتہائی ذاتی اور حساس فطرت. رکن کی فلم کے اعداد و شمار Netflix کے رکن کی ذاتی دلچسپی اور / یا مختلف انتہائی ذاتی مسائل، جنسی، دماغی بیماری، شراب سے بازیابی، اور incest، جسمانی بدعنوانی، گھریلو تشدد، زنا، اور عصمت دری کی طرف سے پریشان ہونے کے ساتھ جدوجہد کرتا ہے، کے ساتھ جدوجہد. "

Netflix انعام کے اعداد و شمار کی دوبارہ شناخت دونوں کو واضح کرتی ہے کہ تمام اعداد و شمار ممکنہ طور پر شناختی قابل ہیں اور تمام اعداد و شمار ممکنہ طور پر حساس ہیں. اس موقع پر، آپ یہ سوچ سکتے ہیں کہ یہ صرف اعداد و شمار پر لاگو ہوتا ہے جو لوگوں کے بارے میں ہونے والا ہے. حیرت کی بات، یہ معاملہ نہیں ہے. انفارمیشن آف قانون کی درخواست کی آزادی کے جواب میں نیویارک سٹی حکومت نیویارک میں 2013 میں نیویارک میں ہر ایک ٹیکسی کی سواری کا ریکارڈ جاری کرتا ہے، بشمول اٹھاو اور وقت، مقامات، اور کرایہ بھی شامل ہے (باب نمبر 2 سے Farber (2015) لیبر کی معیشت میں اہم نظریات کی جانچ پڑتال کے لئے اسی طرح کا ڈیٹا استعمال کیا جاتا ہے). ٹیکسی کے دورے کے بارے میں یہ اعداد و شمار شاید بھنگ لگ رہے ہو کیونکہ وہ لوگوں کے بارے میں معلومات فراہم نہیں کرتے ہیں، لیکن انتھونی ٹاکر نے محسوس کیا کہ یہ ٹیکسی ڈیٹا بیس اصل میں لوگوں کے بارے میں بہت زیادہ حساس معلومات پر مشتمل ہے. واضح کرنے کے لئے، انہوں نے ہسٹر کلب میں شروع ہونے والے تمام سفروں کو دیکھا - نیویارک میں ایک بڑی پٹی کلب - آدھی رات اور 6 بجے کے بعد اور پھر ان کے ڈراپ آف مقامات پایا. اس تلاش میں نازل ہوا - اس سلسلے میں - بعض لوگوں کے پتوں کی ایک فہرست جس نے ہٹلر کلب (Tockar 2014) کو بار بار دیکھا. یہ تصور کرنا مشکل ہے کہ شہر کی حکومت اس کو ذہن میں رکھے جب اس نے اعداد و شمار جاری کیے. دراصل، اس ٹیکنالوجی کا استعمال لوگوں کے گھر کے پتے کو تلاش کرنے کے لئے استعمال کیا جاسکتا ہے جو شہر میں کسی جگہ پر ایک طبی کلینک، سرکاری عمارت، یا مذہبی ادارہ ہے.

Netflix انعام اور نیویارک سٹی ٹیکسی کے اعداد و شمار کے دو دو واقعات ظاہر کرتی ہیں کہ نسبتا ماہر افراد کو وہ معلومات فراہم کرنے میں خطرے کا درست طریقے سے اندازہ کرنے میں ناکام ہوسکتا ہے اور ان مقدمات کا کوئی منفرد ذریعہ نہیں ہے (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . اس کے علاوہ، بہت سے ایسے معاملات میں، دشواری اعداد و شمار اب بھی آزادانہ طور پر آن لائن دستیاب ہیں، جو اعداد و شمار کی رہائی کو کبھی غیر مستحکم کرنے میں دشواری کا اظہار کرتے ہیں. مجموعی طور پر، یہ مثال کے طور پر اور کمپیوٹر سائنس میں رازداری کے بارے میں تحقیق - ایک اہم نتیجے میں قیادت. محققین کو یہ سمجھنا چاہئے کہ تمام اعداد و شمار ممکنہ طور پر شناختی قابل ہیں اور تمام اعداد و شمار ممکنہ طور پر حساس ہیں.

بدقسمتی سے، حقائق کے لئے کوئی آسان حل نہیں ہے کہ تمام اعداد و شمار ممکنہ طور پر شناخت قابل ہو اور تمام اعداد و شمار ممکنہ طور پر حساس ہیں. تاہم، اعداد و شمار کے ساتھ کام کر رہے ہیں جبکہ اطلاعاتی خطرے کو کم کرنے کا ایک طریقہ ڈیٹا بیس کی حفاظت کے منصوبے کی تشکیل اور پیروی کرنا ہے . یہ منصوبہ اس موقع کو کم کرے گا کہ آپ کا ڈیٹا لیک لے جائے گا اور اگر کسی لیک میں کسی طرح سے واقع ہو تو نقصان پہنچ جائے گا. اعداد و شمار کے تحفظ کے منصوبوں کی تفصیلات، جیسے کہ خفیہ کاری کا استعمال کیا جائے گا، وقت کے ساتھ تبدیل ہوجائے گا، لیکن برطانیہ ڈیٹا سروسز کو ڈیٹا بیس کے تحفظ کے منصوبوں کو مؤثر طریقے سے پانچ اقسام میں شامل کرتا ہے جس میں وہ پانچ سارے محفوظ ہیں: محفوظ منصوبوں، محفوظ افراد ، محفوظ ترتیبات، محفوظ ڈیٹا، اور محفوظ آؤٹ پٹ (ٹیبل 6.2) (Desai, Ritchie, and Welpton 2016) . پانچ محفوظوں میں سے کوئی بھی انفرادی طور پر کامل تحفظ فراہم کرتا ہے. لیکن ایک دوسرے کے ساتھ وہ عوامل کی ایک طاقتور سیٹ تشکیل دیتے ہیں جو معلوماتی خطرے کو کم کرسکتے ہیں.

جدول 6.2: "پانچ صفات" ڈیٹا (Desai, Ritchie, and Welpton 2016) منصوبہ بندی کو ڈیزائن کرنے اور عمل کرنے کے اصول ہیں (Desai, Ritchie, and Welpton 2016)
محفوظ عمل
محفوظ منصوبوں اعداد و شمار کے ساتھ حدود ان لوگوں کے لئے جو اخلاقی ہیں
محفوظ لوگ رسائی ان لوگوں سے محدود ہے جو اعداد و شمار پر اعتماد رکھ سکتے ہیں (مثال کے طور پر، جو لوگ اخلاقی تربیت سے گزر چکے ہیں)
محفوظ ڈیٹا ممکنہ حد تک ڈیٹا کی شناخت اور مجموعی طور پر جمع ہوسکتی ہے
محفوظ ترتیبات اعداد و شمار مناسب جسمانی (مثال کے طور پر، بند کر دیا گیا کمرے) اور سافٹ ویئر (مثال کے طور پر، پاسورڈ حفاظت، خفیہ کاری) تحفظ کے ساتھ کمپیوٹر میں محفوظ کیا جاتا ہے
محفوظ پیداوار حادثاتی رازداری کے خلاف ورزیوں کو روکنے کے لئے ریسرچ کی پیداوار کا جائزہ لیا جاتا ہے

جب آپ ان کا استعمال کر رہے ہیں تو آپ کے ڈیٹا کی حفاظت کے علاوہ، تحقیق کے عمل میں ایک قدم ہے جہاں معلوماتی خطرہ خاص طور پر خاص ہے دیگر محققین کے ساتھ ڈیٹا شیئرنگ. سائنسدانوں کے درمیان ڈیٹا شیئر سائنسی کوشش کا بنیادی قدر ہے، اور یہ علم کی ترقی کو بہت آسان بناتا ہے. یہاں یہ ہے کہ برطانیہ ہاؤس آف کامن نے ڈیٹا شیئرنگ کی اہمیت کا ذکر کیا (Molloy 2011) :

"اعداد و شمار تک رسائی بنیادی ہے اگر محققین کو دوبارہ نتائج، تصدیق اور تعمیر کرنے کے نتائج ہیں جو ادب میں درج کی جاتی ہیں. اندازہ یہ ہے کہ، جب تک کوئی مضبوط وجہ نہیں ہے، ڈیٹا کو مکمل طور پر افشا اور عوامی طور پر دستیاب ہونا چاہئے. "

اس کے باوجود، کسی دوسرے محقق کے ساتھ آپ کے ڈیٹا کو اشتراک کرکے، آپ اپنے شرکاء کو معلوماتی خطرے میں اضافہ کر سکتے ہیں. اس طرح، ایسا لگتا ہے کہ ڈیٹا شیئرنگ دوسرے سائنسدانوں کے ساتھ اعداد و شمار کو اشتراک کرنے اور مباحثے کو معلوماتی خطرے کو کم کرنے کے عزم کے درمیان ایک بنیادی کشیدگی پیدا کرتا ہے. خوش قسمتی سے، یہ دشمنی جتنی جلدی دکھائی نہیں ہے. بلکہ، بہتر ہے کہ اعداد و شمار کے حصول کے بارے میں سوچنے کے بارے میں سوچنے کے بارے میں سوچنا ہے، اس سلسلے میں ہر نقطہ پر معاشرے کو فائدہ اٹھانا اور شرکاء کو خطرہ (6.6 نمبر) فراہم کرنا.

ایک انتہائی حد تک، آپ اپنے ڈیٹا کو کسی کے ساتھ اشتراک نہیں کر سکتے ہیں، جو شرکاء کو خطرہ کم کرتی ہے بلکہ معاشرے کو بھی کم سے کم کرتا ہے. دوسرے انتہائی پر، آپ رہائی اور بھول سکتے ہیں، جہاں اعداد و شمار "نام نہاد" ہیں اور سب کے لئے پوسٹ کیا گیا ہے. اعداد و شمار جاری نہیں کرنے کے لئے رشتہ دار، معاشرے کو اور اعلی خطرہ دونوں شرکاء کے لئے اعلی فوائد دونوں پیشکشوں کو آزاد کریں. ان دو انتہائی متعدد مقدمات کے درمیان ہائبرڈ کی ایک حد ہوتی ہے، بشمول میں دیوار باغ باغ کے نقطہ نظر کو بلاؤں گا. اس نقطہ نظر کے تحت، اعداد و شمار لوگوں کے ساتھ مشترکہ ہیں جو مخصوص معیار کو پورا کرتے ہیں اور جو کچھ مخصوص قوانین کی طرف سے پابند ہیں (مثال کے طور پر، ایک آئی آر بی سے نگرانی اور ایک ڈیٹا تحفظ منصوبہ). دیواروں کے باغ کے نقطۂ نظر میں رہائی کے بہت سے فوائد فراہم کیے جاتے ہیں اور کم خطرے سے بھول جاتے ہیں. یقینا، اس طرح کا ایک نقطۂ نظر بہت سے سوالات پیدا کرتا ہے- جو کونسی شرطوں کے تحت، اس کے حالات کے تحت، اور کتنا عرصہ تک، اس کو دیوار باغ، وغیرہ کو برقرار رکھنے اور پولیس کو برقرار رکھنے کے لئے ادا کرنا چاہئے. لیکن یہ ناقابل اعتماد نہیں ہیں. دراصل، پہلے سے ہی دیوار باغی کام کر رہے ہیں جس میں محققین یونیورسٹی آف Michigan یونیورسٹی میں انٹر اور یونیورسٹی کنسورشیم کے ڈیٹا آرکائیو کے طور پر استعمال کر سکتے ہیں.

اعداد و شمار 6.6: ڈیٹا کی رہائی کی حکمت عملی ایک مسلسل کے ساتھ گر کر سکتے ہیں. جہاں آپ کو اس تسلسل پر ہونا چاہئے آپ کے ڈیٹا کی مخصوص تفصیلات پر منحصر ہے، اور تیسرے فریق کا جائزہ لینے میں آپ کو اپنے کیس میں خطرہ اور فائدہ کے مناسب توازن کا فیصلہ کرنے میں مدد مل سکتی ہے. اس وکر کی صحیح شکل پر اعداد و شمار اور تحقیق کے مقاصد (Goroff 2015) کی تفصیلات پر منحصر ہے.

اعداد و شمار 6.6: ڈیٹا کی رہائی کی حکمت عملی ایک مسلسل کے ساتھ گر کر سکتے ہیں. جہاں آپ کو اس تسلسل پر ہونا چاہئے آپ کے ڈیٹا کی مخصوص تفصیلات پر منحصر ہے، اور تیسرے فریق کا جائزہ لینے میں آپ کو اپنے کیس میں خطرہ اور فائدہ کے مناسب توازن کا فیصلہ کرنے میں مدد مل سکتی ہے. اس وکر کی صحیح شکل پر اعداد و شمار اور تحقیق کے مقاصد (Goroff 2015) کی تفصیلات پر منحصر ہے.

لہذا، آپ کے مطالعہ کے اعداد و شمار کو کسی بھی اشتراک، دیواروں سے بھرا ہوا باغ، اور رہائی اور بھول جانے کے لۓ کہاں ہونا چاہئے؟ یہ آپ کے اعداد و شمار کی تفصیلات پر منحصر ہے: محققین کو افراد، بیداری، جسٹس، اور قانون اور عوامی دلچسپی کے لئے احترام کا احترام کرنا ضروری ہے. اس نقطہ نظر سے دیکھا گیا ہے، ڈیٹا اشتراک ایک مخصوص اخلاقی سنگین نہیں ہے؛ یہ صرف تحقیق کے بہت سے پہلوؤں میں سے ایک ہے جس میں محققین کو مناسب اخلاقی توازن تلاش کرنا پڑتا ہے.

کچھ ناقدین عام طور پر ڈیٹا اشتراک کرنے کے مخالف ہیں کیونکہ، میری رائے میں، وہ اپنے خطرات پر توجہ مرکوز کر رہے ہیں - جو بلاشبہ حقیقی طور پر ہیں اور اس کے فوائد کو نظر انداز کر رہے ہیں. لہذا، دونوں خطرات اور فوائد پر توجہ مرکوز کی حوصلہ افزائی کرنے کے لئے، میں ایک تعارف پیش کرنا چاہتا ہوں. ہر سال، ہزاروں افراد کی موت کے لئے کاریں ذمہ دار ہیں، لیکن ہم ڈرائیونگ کو روکنے کی کوشش نہیں کرتے. دراصل ڈرائیونگ پر پابندی عائد کرنے کا مطالبہ غیر معمولی ہوگا کیونکہ ڈرائیور بہت سارے حیرت انگیز چیزوں کو قابل بناتا ہے. بلکہ، سماج معاشرے پر پابندیاں رکھتا ہے جنہوں نے ڈرائیور کر سکتے ہیں (مثال کے طور پر، ایک مخصوص عمر کی ضرورت ہے اور بعض امتحان پاس کرنے کی ضرورت ہے) اور وہ کیسے چل سکتے ہیں (مثال کے طور پر، رفتار کی حد کے تحت). سوسائٹی بھی ان قوانین کو نافذ کرنے کے لۓ کام کرتا ہے (مثال کے طور پر، پولیس)، اور ہم لوگوں کو سزا دیتے ہیں جو ان کی خلاف ورزی کرتے ہیں. اسی قسم کی متوازن سوچ یہ ہے کہ معاشرہ ڈرائیونگ کو ریگولیٹ کرنے پر لاگو ہوتا ہے، ڈیٹا بیس کے اشتراک میں بھی لاگو کیا جا سکتا ہے. یہ ڈیٹا بیس اشتراک کے لئے یا اس کے خلاف مطلق استدلال کرنے کے بجائے، میرا خیال ہے کہ ہم اس پر توجہ مرکوز کرتے ہیں کہ ہم خطرے کو کم کر سکتے ہیں اور ڈیٹا شیئرنگ کے فوائد کو کیسے بڑھا سکتے ہیں.

نتیجے میں، معلوماتی خطرے میں ڈرامائی طور پر اضافہ ہوا ہے، اور یہ پیشن گوئی اور مقدار میں بہت مشکل ہے. لہذا، سب سے بہتر یہ فرض ہے کہ تمام اعداد و شمار ممکنہ طور پر شناختی اور ممکنہ طور پر حساس ہیں. تحقیق کرتے وقت معلوماتی خطرے کو کم کرنے کے لئے، محققین کو اعداد و شمار کی تحفظ کے منصوبے کی تشکیل اور پیروی کر سکتے ہیں. اس کے علاوہ، معلوماتی خطرے میں محققین کو دوسرے سائنسدانوں کے ساتھ ڈیٹا کا اشتراک کرنے سے روکنے کی اجازت نہیں ہے.