6.6.2 గ్రహించుట మరియు మేనేజింగ్ సమాచార ప్రమాదం

సాంఘిక పరిశోధనలో సమాచార ప్రమాదం అత్యంత సాధారణ ప్రమాదం; ఇది నాటకీయంగా పెరిగింది; మరియు అర్థం చేసుకోవడానికి కష్టతరమైన ప్రమాదం.

డిజిటల్-వయస్సు పరిశోధనకు రెండవ నైతిక సవాలు సమాచార హాని , సమాచార బహిర్గతం నుండి హాని సంభావ్యత (National Research Council 2014) . వ్యక్తిగత సమాచారం బహిర్గతం నుండి సమాచారం హానికలు ఆర్థిక (ఉదా., ఉద్యోగం కోల్పోవటం), సామాజిక (ఉదా., ఇబ్బంది), మానసిక (ఉదా., నిరాశ) లేదా నేరస్థుడైన (ఉదా. దురదృష్టవశాత్తు, డిజిటల్ యుగం నాటకీయంగా సమాచార ప్రమాదాన్ని పెంచుతుంది-మా ప్రవర్తన గురించి చాలా ఎక్కువ సమాచారం ఉంది. మరియు అనలాగ్-వయస్సు సాంఘిక పరిశోధనలో భౌతికమైన నష్టాలు వంటి ఆందోళనలతో పోలిస్తే, సమాచార రిస్క్ అర్థం చేసుకోవడానికి మరియు నిర్వహించడానికి చాలా కష్టమని నిరూపించబడింది.

సామాజిక పరిశోధకులు సమాచార ప్రమాదం తగ్గుతుంది ఒక మార్గంలో డేటా "anonymization" ఉంది. "Anonymization" పేరు, చిరునామా, మరియు డేటా నుండి టెలిఫోన్ నంబర్ వంటి స్పష్టమైన వ్యక్తిగత ఐడెంటిఫైయర్లు తొలగించే ప్రక్రియ. అయితే, ఈ విధానం లోతుగా మరియు ప్రాధమికంగా పరిమిత అనేక మంది తెలుసుకుంటారు కంటే చాలా తక్కువ సమర్ధవంతమైనది, అది, నిజానికి, ఉంది. ఆ కారణంగా, నేను వివరించడానికి చేసినప్పుడు "anonymization," నేను కొటేషన్ మార్కులు గుర్తు ఈ ప్రక్రియ నిజమైన రహస్య గోపనం కాదు యొక్క రూపాన్ని కానీ సృష్టిస్తుంది ఉపయోగిస్తాము.

"అనామలైజేషన్" యొక్క వైఫల్యం యొక్క స్పష్టమైన ఉదాహరణ 1990 ల మసాచుసెట్స్ (Sweeney 2002) . గ్రూప్ ఇన్సూరెన్స్ కమిషన్ (జిఐసి) అన్ని ప్రభుత్వ ఉద్యోగులకు ఆరోగ్య భీమా కొనుగోలు కోసం ప్రభుత్వ సంస్థ. ఈ పని ద్వారా, GIC వేలాది రాష్ట్ర ఉద్యోగుల గురించి వివరణాత్మక ఆరోగ్య నివేదికలను సేకరించింది. పరిశోధనను పెంచటానికి ప్రయత్నంలో, GIC ఈ నివేదికలను పరిశోధకులకు విడుదల చేయాలని నిర్ణయించుకుంది. అయితే, వారు వారి మొత్తం డేటాను పంచుకోలేదు; కాకుండా, వారు పేర్లు మరియు చిరునామాల వంటి సమాచారాన్ని తీసివేయడం ద్వారా ఈ డేటాను "అనామకంగా" పిలుస్తారు. అయినప్పటికీ, జనాభా సమాచారం (జిప్ కోడ్, పుట్టిన తేదీ, జాతి మరియు సెక్స్) మరియు వైద్య సమాచారం (సందర్శన సమాచారం, రోగ నిర్ధారణ, ప్రక్రియ) (ఫిగర్ 6.4) (Ohm 2010) వంటి పరిశోధకులకు ఉపయోగకరంగా ఉండవచ్చని వారు భావించిన ఇతర సమాచారాన్ని వదిలివేశారు. దురదృష్టవశాత్తు, డేటాను రక్షించడానికి ఈ "అనామలైజేషన్" సరిపోదు.

మూర్తి 6.4: అనామకీకరణ స్పష్టంగా గుర్తించదగిన సమాచారాన్ని తీసివేసే ప్రక్రియ. ఉదాహరణకు, రాష్ట్ర ఉద్యోగుల వైద్య బీమా రికార్డులను విడుదల చేసినప్పుడు, మసాచుసెట్స్ గ్రూప్ ఇన్సూరెన్స్ కమిషన్ (జిఐసి) ఫైళ్ళ నుండి పేర్లు మరియు చిరునామాలను తొలగించింది. ఈ పదం అనామలైజేషన్ చుట్టూ ఉల్లేఖన చిహ్నాలను నేను ఉపయోగిస్తున్నాను, ఎందుకంటే ఈ ప్రక్రియ యొక్క అంశంగా కాని అసలు పేరు కాదు.

మూర్తి 6.4: "అనామలైజేషన్" అనేది స్పష్టంగా గుర్తించే సమాచారాన్ని తీసివేసే ప్రక్రియ. ఉదాహరణకు, రాష్ట్ర ఉద్యోగుల వైద్య బీమా రికార్డులను విడుదల చేసినప్పుడు, మసాచుసెట్స్ గ్రూప్ ఇన్సూరెన్స్ కమిషన్ (జిఐసి) ఫైళ్ళ నుండి పేర్లు మరియు చిరునామాలను తొలగించింది. నేను "అనామైజేషన్" అనే పదం చుట్టూ కొటేషన్ గుర్తులను వాడతాను, ఎందుకంటే ఈ విధానం యొక్క అంశంగా కాని అసలు పేరు కాదు.

GIC "అనామలైజేషన్" యొక్క లోపాలను వర్ణించేందుకు, లాసాన్నీ స్వీనీ-అప్పుడు MIT- లో పట్టభద్రుడయిన విద్యార్థి $ 20 చొప్పున, మసాచుసెట్స్ గవర్నర్ విలియం వెల్డ్ యొక్క స్వస్థలమైన కేంబ్రిడ్జ్ నుండి ఓటింగ్ రికార్డులను పొందేందుకు $ 20 చెల్లించాడు. ఈ ఓటింగ్ రికార్డులలో పేరు, చిరునామా, జిప్ కోడ్, పుట్టిన తేదీ మరియు లింగం వంటి సమాచారం ఉంది. వైద్య సమాచార ఫైల్ మరియు ఓటరు ఫైల్ ఫీల్డ్-జిప్ కోడ్, పుట్టిన తేదీ మరియు సెక్స్ను భాగస్వామ్యం చేసిన వాస్తవం స్వీనీ వారిని లింక్ చేయగలదని అర్థం. స్వీనీ యొక్క పుట్టినరోజు జూలై 31, 1945 గా ఉందని తెలుసు, మరియు ఓటింగ్ రికార్డుల్లో పుట్టినరోజు కేంబ్రిడ్జ్లో కేవలం ఆరు మంది మాత్రమే ఉన్నారు. అంతేకాదు, ఆ ఆరుగురులో కేవలం ముగ్గురు పురుషులు. మరియు, ఆ ముగ్గురు వ్యక్తులలో కేవలం ఒకరు వెల్డ్ యొక్క జిప్ కోడ్ను మాత్రమే పంచుకున్నారు. అందువల్ల, ఓటింగ్ డేటా వెల్లడి యొక్క పుట్టిన తేదీ, లింగం మరియు జిప్ కోడ్తో ఉన్న వైద్య సమాచారం లో ఎవరైనా విలియం వెల్డ్ అని చూపించారు. సారాంశం, ఈ మూడు భాగాలు సమాచారం అతనికి ఒక ప్రత్యేక వేలిముద్ర అందించింది. ఈ వాస్తవాన్ని ఉపయోగించి, స్వీనీ వెల్డ్ యొక్క మెడికల్ రికార్డులను గుర్తించగలిగారు, మరియు ఆమె తన అనుభవాన్ని గురించి తెలియజేయడానికి ఆమె తన రికార్డుల కాపీని మెయిల్ చేశాడు (Ohm 2010) .

మూర్తి 6.5: అనామక డేటా యొక్క పునఃప్రారంభం. స్వీయనీ (2002), ఫిగర్ 1 నుండి స్వీకరించబడిన గవర్నర్ విలియం వెల్డ్ యొక్క మెడికల్ రికార్డులను గుర్తించడానికి ఓటింగ్ రికార్డులతో అనామక ఆరోగ్య రికార్డులను లాటాన్ స్వీనీ కలుపుతాడు.

మూర్తి 6.5: "అనామకంగా" డేటా యొక్క పునఃప్రారంభం. స్వీయనీ Sweeney (2002) , చిత్రీకరించిన గవర్నర్ విలియం వెల్డ్ యొక్క వైద్య రికార్డులను కనుగొనడానికి, ఓటింగ్ రికార్డులతో "అనామక" ఆరోగ్య రికార్డులను లాటాన్ స్వీనీ కలుపుతాడు.

స్వీనీ గుర్తింపు పనితీరును ప్రాథమిక భద్రత సమాజాన్ని వర్గీకరించడానికి - కంప్యూటర్ భద్రతా సమాజం నుండి ఒక పదం దత్తత తీసుకుంటుంది. ఈ దాడులలో, రెండు డేటా సమితులు, వీటిలో ఏవీ కూడా సున్నితమైన సమాచారాన్ని వెల్లడించవు, అవి అనుసంధానించబడి ఉంటాయి, మరియు ఈ అనుసంధానం ద్వారా సున్నితమైన సమాచారం బహిర్గతమవుతుంది.

స్వీనీ యొక్క పని, మరియు ఇతర సంబంధిత పనులకు ప్రతిస్పందనగా, పరిశోధకులు ఇప్పుడు సాధారణంగా "వ్యక్తిగతంగా గుర్తించే సమాచారం" (పిఐఐ) (Narayanan and Shmatikov 2010) అని పిలవబడే మరింత సమాచారాన్ని తొలగించారు - "అనామలైజేషన్" ప్రక్రియలో. వైద్య రికార్డులు, ఆర్ధిక రికార్డులు, చట్టవిరుద్ధ ప్రవర్తన గురించి ప్రశ్నలకు సమాధానాలు వంటి కొన్ని డేటా "అనామలైజేషన్" తర్వాత కూడా విడుదల కావచ్చని తెలుసుకుంటారు. అయితే, నేను ఇచ్చే ఉదాహరణలు, సామాజిక పరిశోధకులు వారి ఆలోచనను మార్చడానికి. మొదటి దశగా, అన్ని డేటా సమర్థవంతంగా గుర్తించదగినదని మరియు మొత్తం డేటా సంభావ్యంగా సున్నితమైనది అని భావించడం మంచిది. ఇతర మాటలలో, సమాచార రిస్క్ ఒక చిన్న చిన్న ఉపవిభాగాలకు వర్తిస్తుంది అని ఆలోచిస్తూ కాకుండా, అన్ని రకాల ప్రాజెక్టులకు కొంత మేరకు వర్తిస్తుంది.

ఈ పునర్విమర్శ యొక్క రెండు అంశాలు నెట్ఫ్లిక్స్ ప్రైజ్ ద్వారా వివరించబడ్డాయి. 5 వ అధ్యాయంలో వివరించినట్లు నెట్ఫ్లిక్స్ దాదాపు 500,000 మంది సభ్యులు అందించిన 100 మిలియన్ చిత్ర రేటింగ్లను విడుదల చేసింది మరియు ప్రపంచవ్యాప్తంగా ఉన్న ప్రజలు చలన చిత్రాలని సిఫార్సు చేసే నెట్ఫ్లిక్స్ సామర్థ్యాన్ని మెరుగుపర్చగల అల్గారిథమ్లను సమర్పించిన బహిరంగ కాల్. డేటాను విడుదల చేయడానికి ముందు, నెట్ఫ్లిక్స్ పేర్లు వంటి స్పష్టమైన వ్యక్తిగతంగా గుర్తించే సమాచారాన్ని తొలగించింది. వారు కూడా అదనపు దశను చేరుకున్నారు మరియు కొన్ని రికార్డుల్లో కొంచెం పర్ఫ్యూరేషన్లను ప్రవేశపెట్టారు (ఉదా., 4 నక్షత్రాల నుండి 3 నక్షత్రాలకు కొన్ని రేటింగ్లను మార్చడం). ఏదేమైనప్పటికీ, వారి ప్రయత్నాలు ఉన్నప్పటికీ, ఈ సమాచారం అనామకంగా ఉండదు.

డేటా విడుదలైన రెండు వారాల తర్వాత, అరవిన్ నారాయణన్ మరియు విటాలీ షమాటికోవ్ (2008) నిర్దిష్ట ప్రజల చలనచిత్ర ప్రాధాన్యతలను గురించి తెలుసుకునే అవకాశం ఉందని చూపించారు. వారి తిరిగి-గుర్తింపు దాడికి ట్రిక్ స్వీనీ యొక్క సారూప్యతను కలిగి ఉంది: రెండు సమాచార వనరులను కలిపి, సంభావ్యంగా సున్నితమైన సమాచారాన్ని కలిగి ఉండటం మరియు స్పష్టంగా గుర్తించలేని సమాచారం మరియు ప్రజల గుర్తింపులను కలిగి ఉన్న ఒకటి. ఈ సమాచార వనరుల ప్రతి ఒక్కటీ వ్యక్తిగతంగా సురక్షితంగా ఉండవచ్చు, కానీ అవి మిళితమైనప్పుడు, విలీన డేటాసెట్ సమాచార ఇన్ఫినిటీని సృష్టించవచ్చు. నెట్ఫ్లిక్స్ డేటా విషయంలో, ఇది ఎలా జరిగేదో ఇక్కడ ఉంది. నా సహోద్యోగులతో యాక్షన్ మరియు కామెడీ సినిమాల గురించి నా ఆలోచనలను పంచుకునేందుకు నేను ఎంచుకున్నట్లు ఆలోచించండి, కానీ మత, రాజకీయ చిత్రాల గురించి నా అభిప్రాయాన్ని పంచుకోవద్దు. నా సహోద్యోగులు నెట్ఫ్లిక్స్ డేటాలో నా రికార్డులను కనుగొనడానికి నేను వారితో పంచుకున్న సమాచారాన్ని ఉపయోగించవచ్చు. నేను వివరిస్తున్న సమాచారం విలియం వెల్డ్ పుట్టిన తేదీ, జిప్ కోడ్ మరియు సెక్స్ వంటి ప్రత్యేకమైన వేలిముద్రగా ఉంటుంది. అప్పుడు, వారు డేటాలో నా ప్రత్యేక వేలిముద్రలను గుర్తించినట్లయితే, వారు అన్ని సినిమాల గురించి నా రేటింగ్లను నేర్చుకోగలరు, నేను భాగస్వామ్యం చేయకూడదని ఎంచుకునే చిత్రాలతో సహా. ఈ రకమైన లక్ష్య దాడికి అదనంగా, ఒకే వ్యక్తిపై దృష్టి సారించిన నారాయణన్ మరియు షమాటికోవ్ పలువురు వ్యక్తులను కలిగి ఉన్న వ్యక్తుల-వ్యక్తిగత రేటింగ్ మరియు చిత్ర రేటింగ్ డేటాను విలీనం చేయడం ద్వారా విస్తృత దాడిని చేయగలరని కూడా చూపించారు. ఇంటర్నెట్ మూవీ డేటాబేస్ (IMDb) లో పోస్ట్ చేయడానికి. సరళమైనది, ఒక నిర్దిష్ట వ్యక్తికి ప్రత్యేకమైన వేలిముద్రగా ఉన్న ఏదైనా సమాచారం-వారి రేటింగ్ రేటింగ్ల సమితిని-వాటిని గుర్తించడానికి ఉపయోగించబడుతుంది.

నెట్ఫ్లిక్స్ డేటా లక్ష్యంగా లేదా విస్తృత దాడిలో తిరిగి గుర్తించినప్పటికీ, ఇది ఇప్పటికీ తక్కువ ప్రమాదానికి గురి కావచ్చు. అన్ని తరువాత, చిత్రం రేటింగ్స్ చాలా సున్నితమైన కనిపించడం లేదు. సాధారణంగా ఇది నిజం కావచ్చు, డేటాసెట్లోని 500,000 మందిలో కొంత మందికి, సినిమా రేటింగ్స్ చాలా సున్నితంగా ఉండవచ్చు. నిజానికి, పునః గుర్తింపుకు ప్రతిస్పందనగా, ఒక గదిలో ఉన్న లెస్బియన్ స్త్రీ నెట్ఫ్లిక్స్కు వ్యతిరేకంగా ఒక తరగతి-చర్య దావాలో చేరింది. ఈ సమస్య వారి దావాలో ఎలా వ్యక్తీకరించబడింది (Singel 2009) :

"[M] ఓవి మరియు రేటింగు డేటా ఒక ... అత్యంత వ్యక్తిగత మరియు సున్నితమైన స్వభావం యొక్క సమాచారాన్ని కలిగి ఉంది. లైంగికత, మానసిక అనారోగ్యం, మద్య వ్యసనం నుండి రికవరీ, మరియు వాగ్దానం, శారీరక దుర్వినియోగం, గృహ హింస, వ్యభిచారం మరియు అత్యాచారం వంటి అనేక వ్యక్తిగత సమస్యలతో నెట్ఫ్లిక్స్ సభ్యుని యొక్క వ్యక్తిగత ఆసక్తి మరియు / లేదా పోరాటాలు సభ్యుని యొక్క చిత్రం డేటా బహిర్గతం చేస్తుంది. "

నెట్ఫ్లిక్స్ ప్రైజ్ డేటా యొక్క పునః గుర్తింపును అన్ని డేటా సమర్థవంతంగా గుర్తించగలదని మరియు మొత్తం డేటా సంభావ్యంగా సున్నితంగా ఉంటుంది. ఈ సమయంలో, ఇది ప్రజల గురించి ఆలోచించే డేటాకు మాత్రమే వర్తిస్తుంది అని మీరు అనుకోవచ్చు. ఆశ్చర్యకరంగా, అది కేసు కాదు. న్యూయార్క్ నగర ప్రభుత్వం 2013 లో న్యూయార్క్లో ప్రతి టాక్సీ రైడ్ యొక్క రికార్డులను విడుదల చేసింది, వీటిలో పికప్ మరియు టైమ్స్, స్థానాలు మరియు ఛార్జీల మొత్తాలను ( Farber (2015) శ్రామిక అర్థశాస్త్రంలో ముఖ్యమైన సిద్ధాంతాలను పరీక్షించడానికి ఇలాంటి సమాచారాన్ని ఉపయోగించారు). టాక్సీ ట్రిప్పుల గురించి ఈ సమాచారం నిరుపయోగంగా ఉన్నట్లు అనిపించవచ్చు ఎందుకంటే వారు ప్రజల గురించి సమాచారాన్ని అందించడం లేదని, కానీ ఈ టాక్సీ డేటాసెట్లో వాస్తవానికి ప్రజల గురించి సంభావ్యంగా సున్నితమైన సమాచారం ఉందని గ్రహించారు. ఉదహరి 0 చడానికి, అతను న్యూయార్క్లోని ఒక పెద్ద స్ట్రిప్ క్లబ్ అయిన హస్ట్లెర్ క్లబ్లో ఆర 0 భి 0 చి, అర్ధరాత్రి ను 0 డి ఉదయ 0 ను 0 డి 6 గ 0 టల మధ్య మొదలుపెట్టి, వారి డ్రాప్-ఆఫ్ స్థానాలను కనుగొన్నాడు. ఈ సెర్చ్ వెల్లడైంది-సారాంశం-హస్ట్లర్ క్లబ్ (Tockar 2014) ను తరచుగా (Tockar 2014) కొన్ని చిరునామాల జాబితా. ఇది డేటా విడుదల చేసినప్పుడు నగరం ప్రభుత్వం ఈ విషయంలో ఊహించిన కష్టం. వాస్తవానికి, ఈ నగరంలో ఏదైనా స్థలాన్ని సందర్శించే ప్రజల ఇంటి చిరునామాలను కనుగొనడానికి ఒక ఇదే పద్ధతిని వాడవచ్చు-వైద్య వైద్యశాల, ప్రభుత్వ భవనం లేదా ఒక మతపరమైన సంస్థ.

నెట్ఫ్లిక్స్ ప్రైజ్ మరియు న్యూయార్క్ నగర టాక్సీల యొక్క ఈ రెండు కేసులు సాపేక్షంగా నైపుణ్యం ఉన్న ప్రజలు, వారు విడుదల చేసే సమాచారంలో సమాచార రిస్కును సరిగ్గా అంచనా వేయడంలో విఫలమవుతుందని మరియు ఈ కేసులు ప్రత్యేకంగా ఉండవు (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . అంతేకాకుండా, ఇలాంటి అనేక సందర్భాల్లో, సమస్యాత్మక డేటా ఇప్పటికీ ఆన్లైన్లో స్వేచ్ఛగా లభ్యమవుతుంది, ఇది డేటా రిలీజ్ను ఎప్పటికప్పుడు తొలగిస్తుంది. సమిష్టిగా, ఈ ఉదాహరణలు-అదే విధంగా కంప్యూటర్ సైన్స్లో గోప్యతా-ప్రధానతకు సంబంధించిన పరిశోధన ఒక ముఖ్యమైన నిర్ధారణకు దారితీస్తుంది. పరిశోధకులు అన్ని డేటా సమర్థవంతంగా గుర్తించదగిన మరియు అన్ని డేటా సంభావ్యంగా సున్నితమైన అని భావించాలి.

దురదృష్టవశాత్తూ, అన్ని డేటా సమర్థవంతంగా గుర్తించదగినది మరియు అన్ని డేటా సమర్థవంతంగా సున్నితంగా ఉంటుందనే వాస్తవానికి సాధారణ పరిష్కారం లేదు. అయితే, డేటాతో పని చేస్తున్నప్పుడు సమాచార రిస్క్ను తగ్గించడానికి ఒక మార్గం ఒక డేటా రక్షణ ప్రణాళికను సృష్టించడం మరియు అనుసరించడం. ఈ ప్రణాళిక మీ డేటాను లీక్ చేస్తుంది మరియు ఒక లీక్ ఏదో సంభవించినట్లయితే హాని తగ్గిపోతుంది. ఉపయోగించడానికి ఎన్క్రిప్షన్ రూపంలో వంటి డేటా రక్షణ ప్రణాళికలు ప్రత్యేకతలు, కాలక్రమేణా మారుతుంది, కానీ UK డేటా సర్వీసెస్ సహాయకంగా వారు ఐదు ఇనప్పెట్టెలు కాల్ ఐదు వర్గాల్లో ఒక డేటా రక్షణ పథకం యొక్క అంశాలు నిర్వహిస్తుంది: సురక్షితంగా ప్రాజెక్టులు, సురక్షితంగా ప్రజలు , సురక్షిత అమర్పులు, సురక్షిత డేటా మరియు సురక్షితమైన ప్రతిఫలాలు (పట్టిక 6.2) (Desai, Ritchie, and Welpton 2016) . ఐదు ఇనప్పెట్టెలు ఏదీ ఒక్కొక్కటిగా సంపూర్ణ రక్షణను అందిస్తాయి. కానీ కలిసి సమాచార రిస్క్ను తగ్గించగల శక్తివంతమైన కారకాలు ఏర్పడతాయి.

టేబుల్ 6.2: "ఫైవ్ సప్సెస్" అనేది ఒక సమాచార రక్షణ ప్రణాళిక (Desai, Ritchie, and Welpton 2016) రూపకల్పన మరియు అమలు చేయడానికి సూత్రాలు.
సేఫ్ యాక్షన్
సేఫ్ ప్రాజెక్టులు నైతికంగా ఉన్నవారికి డేటాతో పరిమితులు ఉంటాయి
సురక్షిత వ్యక్తులు డేటాతో విశ్వసనీయమైన వ్యక్తులకు యాక్సెస్ పరిమితం చేయబడింది (ఉదా., నైతిక శిక్షణ పొందిన వ్యక్తులు)
సురక్షిత డేటా డేటా గుర్తించబడి మరియు సాధ్యమైనంత వరకు సంకలనం చేయబడుతుంది
సురక్షిత సెట్టింగులు డేటా తగిన భౌతిక (ఉదా, లాక్ గది) మరియు సాఫ్ట్వేర్ (ఉదా, పాస్వర్డ్ రక్షణ, ఎన్క్రిప్టెడ్) రక్షణతో కంప్యూటర్లు నిల్వ చేయబడతాయి
సురక్షిత అవుట్పుట్ ప్రమాదకరమైన గోప్యతా ఉల్లంఘనలను నివారించడానికి రీసెర్చ్ అవుట్పుట్ సమీక్షించబడుతుంది

మీరు వాటిని ఉపయోగిస్తున్నప్పుడు మీ డేటాను కాపాడుకుంటూ అదనంగా, సమాచార రిస్క్ ప్రత్యేకంగా గుర్తించే పరిశోధనా ప్రక్రియలో ఒక దశ ఇతర పరిశోధకులతో డేటాను భాగస్వామ్యం చేస్తుంది. శాస్త్రవేత్తల మధ్య డేటా భాగస్వామ్యం అనేది శాస్త్రీయ ప్రయత్నాలకు ప్రధాన విలువ, మరియు ఇది విజ్ఞాన పురోగతిని బాగా పెంచుతుంది. ఇక్కడ UK హౌస్ ఆఫ్ కామన్స్ డేటా షేరింగ్ (Molloy 2011) యొక్క ప్రాముఖ్యతను వివరించింది:

"సాహిత్యంలో నివేదించిన ఫలితాలపై పరిశోధకులు పునరుత్పత్తి, ధృవీకరించడం మరియు నిర్మించడం అనేవి డేటాకు ప్రాప్యత. లేకపోతే బలమైన కారణం లేకపోతే తప్ప, డేటా పూర్తిగా బహిర్గతం మరియు బహిరంగంగా అందుబాటులో ఉండాలి, అని ఉండాలి. "

అయినా, మీ డేటాను మరొక పరిశోధకుడితో పంచుకోవడం ద్వారా, మీరు మీ భాగస్వాములకు సమాచార ప్రమాదం పెరుగుతుంది. అందువల్ల, డేటా షేరింగ్ ఇతర శాస్త్రవేత్తలతో సమాచారాన్ని పంచుకునే బాధ్యత మరియు పాల్గొనేవారికి సమాచార రిస్క్ను తగ్గించడానికి బాధ్యత మధ్య ఒక ప్రాథమిక ఉద్రిక్తతను సృష్టిస్తుంది. అదృష్టవశాత్తూ, ఈ గందరగోళాన్ని అది కనపడేంత తీవ్రంగా లేదు. బదులుగా, డేటాను పంచుకోవడం అనేది ఒక నిరంతరాయంగా పడిపోతున్నట్లుగా ఆలోచించటం మంచిది, ఆ నిరంతరాయంపై ఉన్న ప్రతి అంశము సమాజమునకు వేరొక ప్రయోజనకరమైన మిశ్రమాన్ని మరియు పాల్గొనే వారికి నష్టము కలిగించేది (ఫిగర్ 6.6).

ఒక తీవ్రంగా, మీరు ఎవరూ లేకుండా మీ డేటాను పంచుకోవచ్చు, ఇది పాల్గొనేవారికి హానిని తగ్గిస్తుంది, కానీ సమాజానికి లాభాలను కూడా తగ్గిస్తుంది. ఇతర తీవ్రమైన, మీరు విడుదల మరియు మర్చిపోతే , డేటా "అనామక" మరియు ప్రతి ఒక్కరి కోసం పోస్ట్ ఎక్కడ. సమాచార విడుదల చేయకపోవటానికి సంబంధించి, విడుదల మరియు మర్చిపోవటానికి సమాజంలో అధిక లాభాలు మరియు పాల్గొనే వారికి ఎక్కువ అవకాశాలు. ఈ రెండు తీవ్రమైన సందర్భాల్లో మధ్యభాగం హైబ్రిడ్ల శ్రేణిని కలిగి ఉంటుంది, వాటిలో నేను ఒక గోడల తోట విధానాన్ని పిలుస్తాను. ఈ విధానం ప్రకారం, నిర్దిష్ట ప్రమాణాలను కలిగి ఉన్న వ్యక్తులతో మరియు నిర్దిష్ట నిబంధనల ద్వారా కట్టుబడి ఉన్న వ్యక్తులతో డేటాను భాగస్వామ్యం చేస్తారు (ఉదా., ఒక IRB నుండి ఒక పర్యవేక్షణ మరియు డేటా రక్షణ పథకం). గోడల తోట విధానం విడుదల యొక్క ప్రయోజనాలు అనేక అందిస్తుంది మరియు తక్కువ ప్రమాదం మర్చిపోతే. వాస్తవానికి, అట్లాంటి విధానం అనేక ప్రశ్నలను రూపొందించింది-ఏ పరిస్థితులలో, ఎటువంటి పరిస్థితులలో, మరియు ఎంతకాలం, వీరు గోడల తోటని నిర్వహించటానికి మరియు పోలీసులకు చెల్లించవలసి చెల్లించవలసి వుంటుంది-కాని ఇవి అధిగమించలేనివి కావు. వాస్తవానికి, ఇప్పటికే ఉన్న గోడల తోటలు పరిశోధకులు ప్రస్తుతం మిచిగాన్ విశ్వవిద్యాలయంలో రాజకీయ మరియు సాంఘిక పరిశోధన కోసం ఇంటర్-యునివర్సిటీ కన్సార్టియం యొక్క డేటా ఆర్కైవ్ వంటి వాడవచ్చు.

మూర్తి 6.6: డేటా విడుదల వ్యూహాలు ఒక నిరంతర వెంట వస్తాయి. మీరు ఈ కాంటినమ్లో ఎక్కడ ఉండాలి అనేది మీ డేటా యొక్క నిర్దిష్ట వివరాలపై ఆధారపడి ఉంటుంది మరియు మూడవ పక్ష సమీక్ష మీ ప్రమాదానికి తగిన ప్రమాదం మరియు ప్రయోజనం నిర్ణయించడంలో మీకు సహాయపడవచ్చు. ఈ వక్రరేఖ యొక్క ఖచ్చితమైన ఆకృతి డేటా మరియు పరిశోధన లక్ష్యతలపై ఆధారపడి ఉంటుంది (గోరోఫ్ 2015).

మూర్తి 6.6: డేటా విడుదల వ్యూహాలు ఒక నిరంతర వెంట వస్తాయి. మీరు ఈ కాంటినమ్లో ఎక్కడ ఉండాలి అనేది మీ డేటా యొక్క నిర్దిష్ట వివరాలపై ఆధారపడి ఉంటుంది మరియు మూడవ పక్ష సమీక్ష మీ ప్రమాదానికి తగిన ప్రమాదం మరియు ప్రయోజనం నిర్ణయించడంలో మీకు సహాయపడవచ్చు. ఈ వక్రరేఖ యొక్క ఖచ్చితమైన ఆకృతి డేటా మరియు పరిశోధన (Goroff 2015) ఆధారపడి ఉంటుంది (Goroff 2015) .

సో, మీ అధ్యయనం నుండి డేటా ఎటువంటి షేరింగ్, గోడల తోట, మరియు విడుదల మరియు మర్చిపోతే యొక్క కొనసాగింపు ఉండాలి? ఇది మీ డేటా వివరాలపై ఆధారపడి ఉంటుంది: పరిశోధకులు చట్టం మరియు పబ్లిక్ ఇంట్రెస్ట్ కోసం పర్సన్స్, బెనిసిజెన్స్, జస్టిస్ మరియు గౌరవం కోసం గౌరవంను సమతుల్యం చేయాలి. ఈ దృక్పథం నుండి చూస్తే, డేటా భాగస్వామ్యము విలక్షణమైన నైతిక తికమక కాదు; పరిశోధకులు సరైన నైతిక బ్యాలెన్స్ను కనుగొనే పరిశోధనలో అనేక అంశాలలో ఇది ఒకటి.

కొందరు విమర్శకులు సాధారణంగా డేటా భాగస్వామ్యాన్ని వ్యతిరేకిస్తారు, ఎందుకంటే నా అభిప్రాయం ప్రకారం, వారు దాని ప్రమాదాలపై నిశితంగా ఉంటారు-ఇది నిస్సందేహంగా వాస్తవమైనది- దాని ప్రయోజనాలను విస్మరిస్తుంది. కాబట్టి, నష్టాలు మరియు ప్రయోజనాలు రెండింటిపై దృష్టి కేంద్రీకరించడానికి, నేను ఒక సారూప్యతను అందించాలనుకుంటున్నాను. ప్రతి సంవత్సరం, కార్లు వేల మరణాలు బాధ్యత, కానీ మేము డ్రైవింగ్ నిషేధించడానికి ప్రయత్నం లేదు. వాస్తవానికి, డ్రైవింగ్ నిషేధించడానికి పిలుపు అసంబద్ధంగా ఉంటుంది ఎందుకంటే డ్రైవింగ్ అనేక అద్భుతమైన విషయాలను అందిస్తుంది. బదులుగా, ఎవరు డ్రైవ్ చేయవచ్చనే దానిపై సమాజం పరిమితులను ఉంచుతుంది (ఉదా., ఒక నిర్దిష్ట వయస్సు అవసరం మరియు కొన్ని పరీక్షలను ఉత్తీర్ణులవ్వడం) మరియు ఎలా వారు (ఉదా., వేగ పరిమితిలో). ఈ నియమాలను (ఉదా., పోలీసు) అమలు చేయడంతో ప్రజలకు సొసైటీకి బాధ్యతలు నిర్వహిస్తారు, మరియు వారిని ఉల్లంఘించినవారిని మేము శిక్షించాము. డ్రైవింగ్ను నియంత్రించడానికి సమాజాన్ని వర్తింపచేసే ఈ రకమైన సమతుల్య ఆలోచన కూడా డేటా భాగస్వామ్యానికి కూడా వర్తిస్తుంది. అంటే, డేటా షేరింగ్ కోసం లేదా నిరంకువాద వాదనలు చేయడం కంటే, మనం ప్రమాదాలు తగ్గించడానికి మరియు డేటా భాగస్వామ్యం నుండి ప్రయోజనాలు పెంచడానికి ఎలా దృష్టి సారించడం ద్వారా చాలా పురోగతి చేస్తుంది అనుకుంటున్నాను.

ముగియడానికి, సమాచార అపాయం నాటకీయంగా పెరిగింది మరియు అంచనా వేయడం మరియు గణించడం చాలా కష్టం. అందువల్ల, అన్ని డేటా సమర్థవంతంగా గుర్తించదగినదిగా మరియు సంభావ్యంగా సున్నితమైనదిగా భావించడం ఉత్తమం. పరిశోధన చేస్తున్నప్పుడు సమాచార రిస్క్ను తగ్గించడానికి పరిశోధకులు ఒక డేటా రక్షణ ప్రణాళికను సృష్టించవచ్చు మరియు అనుసరించవచ్చు. ఇంకా, సమాచార శాస్త్రం ఇతర శాస్త్రవేత్తలతో డేటాను పంచుకోవడానికి పరిశోధకులు నిరోధించదు.