6.6.2 മനസിലാക്കുന്നു വിജ്ഞാനദായകവുമായ റിസ്ക് മാനേജിങ്

ഈ പരിഭാഷയെ ഒരു കമ്പ്യൂട്ടർ സൃഷ്ടിച്ചത്. ×

6.6.2 മനസിലാക്കുന്നു വിജ്ഞാനദായകവുമായ റിസ്ക് മാനേജിങ്

സോഷ്യൽ ഗവേഷണത്തിൽ ഏറ്റവും അപകടസാധ്യതയുള്ളത് അപകടസാധ്യതയാണ്. അത് നാടകീയമായി വർദ്ധിച്ചു; അത് മനസ്സിലാക്കാനുള്ള ഏറ്റവും ഭീഷണിയാണ്.

ഡിജിറ്റൽ വയസ് ഗവേഷണത്തിനുള്ള രണ്ടാമത്തെ സദാചാര വെല്ലുവിളി, വിവര വെളിപ്പെടുത്തൽ (National Research Council 2014) മുതൽ ദോഷം ചെയ്യുന്നതിനുള്ള സാധ്യതകൾ എന്നിവയാണ്. വ്യക്തിഗത വിവരങ്ങളുടെ വെളിപ്പെടുത്തലിൽ നിന്നുള്ള വിവരവിനിമയം സാമ്പത്തിക (ഉദാഹരണത്തിന്, ജോലി നഷ്ടപ്പെടുന്നത്), സാമൂഹിക (ഉദാഹരണം, നാണംകെട്ട), മാനസിക (ഉദാ: വിഷാദരോഗം), അല്ലെങ്കിൽ ക്രിമിനൽ പോലും (ഉദാ: നിയമവിരുദ്ധമായ പെരുമാറ്റത്തിന് അറസ്റ്റ്). നിർഭാഗ്യവശാൽ, ഡിജിറ്റൽ പ്രായം നാടകീയമായി അപകടസാധ്യത വർദ്ധിപ്പിക്കുന്നു-നമ്മുടെ സ്വഭാവത്തെക്കുറിച്ച് വളരെയധികം വിവരങ്ങൾ മാത്രമാണ്. അനലോഗ്-വാർഷിക സാമൂഹ്യ ഗവേഷണത്തിലെ ശാരീരിക റിസ്ക് പോലെയുള്ള അപകടങ്ങളുമായി താരതമ്യം ചെയ്യുമ്പോൾ വിവര അറിവും അപകടസാധ്യത മനസിലാക്കാൻ വളരെ ബുദ്ധിമുട്ടാണ്.

സോഷ്യൽ ഗവേഷകർ വിജ്ഞാനദായകവുമായ സാധ്യത കുറയ്ക്കുകയും ഒരു വഴി ഡാറ്റ "anonymization" ആണ്. "Anonymization" ഡാറ്റ നിന്ന് പേര്, വിലാസം, ടെലിഫോൺ നമ്പർ വ്യക്തമായ സ്വകാര്യ ഐഡന്റിഫയറുകൾ നീക്കംചെയ്യുന്ന പ്രക്രിയയാണ്. എന്നിരുന്നാലും, ഈ സമീപനം പലരും ഗ്രഹിക്കാൻ കുറവാണ് പ്രാബല്യത്തിലാകും, അതു വാസ്തവത്തിൽ, ആഴത്തിൽ ഒപ്പം അടിസ്ഥാനപരമായി പരിമിതമായ ആണ്. അതുകൊണ്ടാണ് ഞാൻ വിവരിക്കുക എപ്പോഴൊക്കെ "anonymization," ഞാൻ ഉദ്ധരണി ചിഹ്നങ്ങൾ ഈ പ്രക്രിയ നിലനി എന്നാൽ യഥാർഥ കാലനാണെന്നു രൂപം സൃഷ്ടിക്കുന്നു കാര്യം ഓർമിപ്പിക്കാൻ ഉപയോഗിക്കും.

1990 കളിൽ മസാച്യുസെറ്റ്സ് (Sweeney 2002) നിന്ന് "അജ്ഞാത" എന്നതിന്റെ പരാജയത്തിന്റെ ഒരു വ്യക്തമായ ഉദാഹരണം. എല്ലാ സർക്കാർ ജീവനക്കാർക്കും ഹെൽത്ത് ഇൻഷ്വറൻസ് വാങ്ങുന്നതിനുള്ള സർക്കാർ ഏജൻസിയാണ് ഗ്രൂപ്പ് ഇൻഷുറൻസ് കമ്മീഷൻ (ജി.ഐ.സി.). ഈ ജോലിയിലൂടെ ആയിരക്കണക്കിന് സ്റ്റേറ്റ് ജീവനക്കാരെക്കുറിച്ച് വിശദമായ ആരോഗ്യ രേഖകൾ ജി.ഐ.സി. ശേഖരിച്ചു. ഗവേഷകരെ ഉത്കണ്ഠിക്കുന്നതിനായി ഗവേഷകർ ഈ രേഖകൾ ഗവേഷകർക്ക് കൈമാറാൻ തീരുമാനിച്ചു. എന്നിരുന്നാലും, അവർ അവരുടെ എല്ലാ വിവരങ്ങളും പങ്കിട്ടിട്ടില്ല; പകരം, പേരുകളും വിലാസങ്ങളും പോലുള്ള വിവരങ്ങൾ നീക്കംചെയ്തുകൊണ്ട് അവർ ഈ ഡാറ്റയെ "അജ്ഞാതമാക്കുന്നു". എന്നിരുന്നാലും, ഡെമോഗ്രാഫിക് വിവരങ്ങൾ (സിപ്പ് കോഡ്, ജനന തീയതി, വംശീയത, ലൈംഗികത), മെഡിക്കൽ വിവരങ്ങൾ (സന്ദർശന ഡാറ്റ, രോഗനിർണയം, നടപടിക്രമം) (ചിത്രം 6.4) (Ohm 2010) തുടങ്ങിയ ഗവേഷകർക്ക് ഇത് പ്രയോജനകരമാണെന്ന് അവർ കരുതി. ദൗർഭാഗ്യവശാൽ, ഡാറ്റയെ സംരക്ഷിക്കാൻ ഈ "അജ്ഞാതമാറ്റം" പര്യാപ്തമല്ല.

ചിത്രം 6.4: വ്യക്തമായി തിരിച്ചറിയാവുന്ന വിവരങ്ങൾ നീക്കം ചെയ്യുന്നതിനുള്ള പ്രക്രിയയാണ് അജ്ഞാതമാക്കൽ. ഉദാഹരണത്തിന്, സ്റ്റേറ്റ് ജീവനക്കാരുടെ മെഡിക്കൽ ഇൻഷുറൻസ് റെക്കോർഡുകൾ പുറത്തുവിടുമ്പോൾ, മസാച്യുസെറ്റ്സ് ഗ്രൂപ്പ് ഇൻഷ്വറൻസ് കമ്മീഷൻ (ജി.ഐ.സി.) ഫയലുകളിൽ നിന്നും പേരുകളും വിലാസവും നീക്കം ചെയ്തു. ഞാൻ അജ്ഞാത പദത്തിനു ചുറ്റും ഉദ്ധരണി ചിഹ്നങ്ങൾ ഉപയോഗിക്കുന്നു, കാരണം പ്രോസസ്സ് അജ്ഞാതത്വം പ്രത്യക്ഷപ്പെടാറുണ്ട്, പക്ഷേ യഥാർത്ഥ യഥാർത്ഥനാമം അല്ല.

ചിത്രം 6.4: വ്യക്തമായി തിരിച്ചറിയുന്ന വിവരങ്ങൾ നീക്കം ചെയ്യുന്നതിനുള്ള പ്രക്രിയയാണ് "അജ്ഞാതമാക്കൽ". ഉദാഹരണത്തിന്, സ്റ്റേറ്റ് ജീവനക്കാരുടെ മെഡിക്കൽ ഇൻഷുറൻസ് റെക്കോർഡുകൾ പുറത്തുവിടുമ്പോൾ, മസാച്യുസെറ്റ്സ് ഗ്രൂപ്പ് ഇൻഷ്വറൻസ് കമ്മീഷൻ (ജി.ഐ.സി.) ഫയലുകളിൽ നിന്നും പേരുകളും വിലാസവും നീക്കം ചെയ്തു. ഞാൻ "അജ്ഞാതമാക്കൽ" എന്ന പദത്തിനു ചുറ്റും ഉദ്ധരണി ചിഹ്നങ്ങൾ ഉപയോഗിക്കുന്നു, കാരണം പ്രോസസ്സ് അജ്ഞാതത്വം പ്രത്യക്ഷപ്പെടാറുണ്ട്, എന്നാൽ യഥാർത്ഥ അജ്ഞാതമല്ല.

ജിഐസി "അജ്ഞാതമാറ്റം" എന്നതിന്റെ കുറവുകൾ വിശദീകരിക്കാൻ, ലാറ്റിന്യ സ്വീനി-പിന്നീട് എം.ഐ.ടി-ൽ ബിരുദം നേടിയ വിദ്യാർത്ഥി കേംബ്രിഡ്ജ് സ്വദേശി കേംബ്രിഡ്ജിൽ നിന്നുള്ള വോട്ടിംഗ് രേഖകൾ സ്വന്തമാക്കുന്നതിനായി $ 20 ഡോളർ നൽകി. ഈ വോട്ടിംഗ് രേഖയിൽ പേര്, വിലാസം, പിൻകോഡ്, ജനനതീയതി, ലിംഗഭേദം മുതലായവ ഉൾപ്പെടുന്നു. മെഡിക്കൽ ഡാറ്റ ഫയലും വോട്ടർഫയൽ ഫീൽഡും-സിപ്പ് കോഡ്, ജനന തീയതി, ലൈംഗികത എന്നിവ പങ്കിടുന്ന സ്വാനി അവരെ ബന്ധിപ്പിക്കാൻ കഴിയുമെന്നതാണ്. വെൽഡിൻറെ ജന്മദിനം ജൂലൈ 31, 1945 ആണെന്ന് സ്വാനീക്ക് അറിയാമായിരുന്നു. കേംബ്രിഡ്ജിൽ ആറ് ജനങ്ങൾ മാത്രമാണ് വോട്ടെടുപ്പ് രേഖപ്പെടുത്തിയത്. ആറ് ആളുകളിൽ മൂന്നെണ്ണം പുരുഷന്മാരാണ്. കൂടാതെ, ആ മൂന്നുപേരിൽ വെൽഡിൻറെ സിപ്പ് കോഡും പങ്കിട്ടു. വോൽഡിംഗ് ഡാറ്റ പ്രകാരം വെൽഡിൻറെ ജനന തീയതി, ലിംഗവിവേചനം, സോപ്പ് കോഡ് എന്നിവയുടെ സംയുക്ത രേഖകൾ വില്യം വെൽഡ് ആയിരുന്നു. സാരസന്ധ്യയിൽ, ഈ മൂന്നു വിവരവും ഡാറ്റയിൽ തനതായ വിരലടയാളങ്ങൾ നൽകി. ഈ വസ്തുത ഉപയോഗിച്ചുകൊണ്ട്, വെൽഡിൻറെ മെഡിക്കൽ രേഖകളെ സ്വെയ്നിക്ക് കണ്ടെത്താൻ സാധിച്ചു. കൂടാതെ, അയാൾക്ക് തന്റെ നേട്ടത്തെക്കുറിച്ച് അറിയിക്കാനായി തന്റെ കുറിപ്പുകളുടെ ഒരു പകർപ്പ് അവൻ അയച്ചു (Ohm 2010) .

ചിത്രം 6.5: അജ്ഞാത ഡാറ്റ പുനർനിർണ്ണയം ചെയ്യുക. സ്വേനി (2002), ഗവർണർ വില്യം വെൽഡിൻറെ മെഡിക്കൽ റെക്കോഡുകൾ കണ്ടെത്തുന്നതിനായി അനന്യ ആരോഗ്യ രേഖകൾ വോട്ടിംഗ് റെക്കോർഡുകളോടെ പങ്കുവച്ചു.

ചിത്രം 6.5: "അജ്ഞാതമായ" ഡാറ്റയുടെ പുനർവിപരീകരണം. Sweeney (2002) ഗവർണർ വില്യം വെൽഡിൻറെ മെഡിക്കൽ റെക്കോർഡുകൾ കണ്ടെത്തുന്നതിനായി "അജ്ഞാത" ആരോഗ്യ രേഖകൾ ലത്താനിയ സ്വീനി കൂട്ടിച്ചേർത്തു.

കമ്പ്യൂട്ടർ സെക്യൂരിറ്റി കമ്മ്യൂണിറ്റിയിൽ നിന്നും ഒരു പദം സ്വീകരിക്കുന്നതിന് പുനർനിർണയിക്കുന്നതിന്റെ അടിസ്ഥാന ഘടനയെ സ്വീനി സൃഷ്ടിക്കുന്നു. ഈ ആക്രമണങ്ങളിൽ, രണ്ട് വിവരശേഖരങ്ങൾ, അതിലൊന്നുമില്ലാതെ സെൻസിറ്റീവ് വിവരങ്ങൾ വെളിപ്പെടുത്തുന്നു, അവയുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, ഒപ്പം ഈ ബന്ധം വഴി സെൻസിറ്റീവ് വിവരങ്ങൾ വെളിപ്പെടുത്തുന്നു.

സ്വീണിയുടെ സൃഷ്ടികളോടുള്ള പ്രതികരണവും മറ്റ് ബന്ധപ്പെട്ട പ്രവർത്തനങ്ങളും, ഗവേഷകർ ഇപ്പോൾ കൂടുതൽ വിവരങ്ങൾ നീക്കം ചെയ്യുന്നു - "വ്യക്തിപരമായി തിരിച്ചറിയാൻ കഴിയുന്ന വിവരങ്ങൾ" (പി ഐ ഐ) (Narayanan and Shmatikov 2010) - "അജ്ഞാതവൽക്കരണ" പ്രക്രിയയിൽ. മെഡിക്കൽ റെക്കോർഡുകൾ, സാമ്പത്തിക രേഖകൾ, നിയമവിരുദ്ധമായ പെരുമാറ്റത്തെക്കുറിച്ചുള്ള ചോദ്യങ്ങൾ സർവ്വേ ചെയ്യൽ തുടങ്ങിയ ചില ഡാറ്റകൾ "അജ്ഞാതമാക്കലിനു ശേഷവും" റിലീസ് ചെയ്യാൻ സാധ്യതയുണ്ട്. എന്നിരുന്നാലും, ഞാൻ നൽകാൻ പോകുന്ന ഉദാഹരണങ്ങൾ സാമൂഹ്യ ഗവേഷകർക്ക് അവരുടെ ചിന്തകൾ മാറ്റാൻ. ആദ്യ ഘട്ടമെന്ന നിലയിൽ, അത് എല്ലാ ഡാറ്റയും സാധ്യതയുള്ള തിരിച്ചറിയാനാകുന്നെങ്കിൽ എല്ലാ ഡാറ്റയും രഹസ്യസ്വഭാവമുള്ളവ കരുതുന്നതിനായി ബുദ്ധി. മറ്റു വാക്കുകളിൽ പറഞ്ഞാൽ, വിവരസാങ്കേതിക പരിപാടികൾ ഒരു ചെറിയ ഉപഗണ പരിപാടിക്ക് ബാധകമാവുന്നതിനുപകരം, അത് ചില നിബന്ധനകൾക്ക് വിധേയമായി-എല്ലാ പദ്ധതികൾക്കും ബാധകമാണെന്ന് ഞങ്ങൾ അനുമാനിക്കേണ്ടതാണ്.

ഈ പുനക്രമീകരണത്തിന്റെ രണ്ട് വശങ്ങളും നെറ്റ്ഫിക്സ് സമ്മാനം ചിത്രീകരിച്ചിരിക്കുന്നു. അഞ്ചാം അദ്ധ്യായത്തിൽ വിവരിച്ചതുപോലെ, നെറ്റ്ഫ്ലിക്സ് ഏതാണ്ട് 500,000 അംഗങ്ങൾ നൽകുന്ന 100 ദശലക്ഷം മൂവി റേറ്റിംഗുകൾ പുറത്തിറക്കി. ലോകമെമ്പാടുമുള്ള ആളുകൾക്ക് സിനിമ ശുപാർശ ചെയ്യാനുള്ള നെറ്റ്ഫ്ലിക്സ് കഴിവിനെ മെച്ചപ്പെടുത്താൻ കഴിയുന്ന അൽഗോരിതം സമർപ്പിച്ചു. ഡാറ്റ റിലീസ് ചെയ്യുന്നതിനു മുമ്പ്, പേരുകൾ പോലുള്ള വ്യക്തമായി തിരിച്ചറിയാവുന്ന വിവരങ്ങളെ നെറ്റ്ഫിക്സ് നീക്കംചെയ്തു. അവർ ഒരു അധിക ഘട്ടത്തിലേക്ക് പോയി ഏതാനും രേഖകളിൽ ചെറിയ വ്യതിയാനങ്ങൾ അവതരിപ്പിച്ചു. (ഉദാഹരണത്തിന്, 4 നക്ഷത്രങ്ങളിൽ നിന്ന് ചില റേറ്റിംഗുകൾ 3 നക്ഷത്രങ്ങളിലേക്ക് മാറ്റുന്നു). എന്നിരുന്നാലും, അവരുടെ പരിശ്രമം വകവയ്ക്കാതെ, ഡാറ്റ അജ്ഞാതമായിരുന്നെന്ന് അവർ പെട്ടെന്നുതന്നെ തിരിച്ചറിഞ്ഞു.

ഡാറ്റ റിലീസ് ചെയ്ത രണ്ടാഴ്ച്ച കഴിഞ്ഞ് അരവിന്ദ് നാരായണനും വിറ്റാലി ഷമാറ്റിക്കോവ് (2008) നിർദ്ദിഷ്ട ആളുകളുടെ സിനിമ മുൻഗണനകളെക്കുറിച്ച് പഠിക്കാൻ സാധിച്ചു. അവരുടെ തിരിച്ചറിവിനൽ ആക്രമണത്തെക്കുറിച്ചുള്ള സൂചന സ്വാനീയുടെ സമാനതകളാണ്. രണ്ട് വിവര സ്രോതസ്സുകൾ ഒന്നിച്ച് കൂട്ടിച്ചേർക്കുക, സാധ്യതയുള്ള വിവരങ്ങളുമായി ഒത്തുപോകുന്നതും വ്യക്തമായി തിരിച്ചറിയാൻ കഴിയാത്ത വിവരവും ജനങ്ങളുടെ തിരിച്ചറിയൽ രേഖകളുമില്ലാതെ. ഈ ഡാറ്റ സ്രോതസ്സുകളിൽ ഓരോന്നും വ്യക്തിഗതമായി സുരക്ഷിതമായിരിക്കാം, പക്ഷേ അവ സംയോജിപ്പിക്കപ്പെടുമ്പോൾ, ലയിപ്പിച്ച ഡാറ്റാഗണികൾ വിവരസാങ്കേതിക അപകട സാധ്യത സൃഷ്ടിക്കാൻ കഴിയും. നെറ്റ്ഫ്ലിക്സ് ഡാറ്റയുടെ കാര്യത്തിൽ, ഇതെങ്ങനെ സംഭവിക്കും എന്ന്. എന്റെ കോ-പ്രവർത്തകരുമായി ആക്ഷൻ, കോമഡി മൂവികൾ എന്നതിനെക്കുറിച്ച് എന്റെ ചിന്തകൾ പങ്കുവയ്ക്കാൻ ഞാൻ തീരുമാനിച്ചെങ്കിലും, മതപരവും രാഷ്ട്രീയവുമായ സിനിമകളെക്കുറിച്ചുള്ള എന്റെ അഭിപ്രായം പങ്കുവയ്ക്കാൻ ഞാൻ താല്പര്യപ്പെട്ടില്ല. നെറ്റ്ഫ്ലിക്സ് ഡാറ്റയിൽ എന്റെ റിക്കോർഡുകൾ കണ്ടെത്തുന്നതിന് എന്റെ സഹപ്രവർത്തകർക്ക് അവരുമായി പങ്കിട്ട വിവരങ്ങൾ ഉപയോഗിക്കാൻ കഴിയും; ഞാൻ പങ്കിടുന്ന വിവരങ്ങൾ വില്യം വെൽഡിൻറെ ജന്മദിനം, പിൻകോഡ്, ലൈംഗികത എന്നിവ പോലെയുള്ള വിചിത്രമായ വിരലടയാളം ആയിരിക്കും. അവർ എന്റെ വിരലടയാളം ഡാറ്റയിൽ കണ്ടെത്തിയാൽ, എല്ലാ സിനിമകളെക്കുറിച്ചും എന്റെ പങ്കാളിത്തം ഞാൻ പഠിക്കാനിടയുണ്ട്. ഒരു വ്യക്തിയെ കേന്ദ്രീകരിച്ചായിരുന്നു ലക്ഷ്യം ആക്രമണം ഇത്തരത്തിലുള്ള പുറമേ, നാരായണൻ, ശ്മതികൊവ് അത് പലരും-സ്വകാര്യ മൂവി റേറ്റിംഗ് ഡാറ്റ ഉപയോഗിച്ച് നെറ്റ്ഫിക്സ് ഡാറ്റ ലയിപ്പിച്ച് ചില ആളുകൾ തിരഞ്ഞെടുത്ത ഉൾപ്പെടുന്ന വിശാലമായ ആക്രമണം -നൽകാൻ ചെയ്യാൻ കഴിയും എന്നാണ് ഇന്റർനെറ്റ് മൂവി ഡാറ്റാബേസിൽ (ഐഎംഡിബി) പോസ്റ്റ് ചെയ്യാൻ. ലളിതമായി, ഒരു നിശ്ചിത വ്യക്തിക്ക്-അവരുടെ സിനിമാ റേറ്റിംഗിന്റെ സെറ്റ് പോലും-അദ്വിതീയമായ വിരലടയാളമായ വിവരങ്ങൾ-അവ തിരിച്ചറിയാൻ ഉപയോഗിക്കാം.

നാവിഫിക്സ് ഡാറ്റയെ ടാർഗെറ്റ് ചെയ്തതോ വിശാലമായതോ ആയ ആക്രമണങ്ങളിൽ വീണ്ടും തിരിച്ചെടുക്കുമെങ്കിലും അത് ഇപ്പോഴും കുറഞ്ഞ റിസ്ക് ആണെന്ന് തോന്നുന്നു. എല്ലാത്തിനുമുപരി, സിനിമാ റേറ്റിംഗുകൾ വളരെ സെൻസിറ്റീവ് ആയി തോന്നുന്നില്ല. അത് പൊതുവായിരിക്കുമെങ്കിലും, ഡാറ്റാഗണത്തിലെ 500,000 പേരെ സംബന്ധിച്ചിടത്തോളം മൂവി റേറ്റിംഗുകൾ വളരെ സെൻസിറ്റീവ് ആയിരിക്കാം. യഥാർഥത്തിൽ, വീണ്ടും തിരിച്ചറിയൽ എന്ന നിലയിൽ, ഒരു വേശ്യാവൃത്തിയായ സ്ത്രീക്ക് നെറ്റ്ഫ്ലിക്സിനെതിരെ ഒരു ക്ലാസ്-ആക്ഷൻ സ്യൂട്ടിൽ ചേർന്നു. ഇവിടെ അവരുടെ പ്രശ്നങ്ങളിൽ എങ്ങനെ പ്രശ്നം വെളിപ്പെട്ടു (Singel 2009) :

"[എം] ഒവിയിലും റേറ്റിംഗ് ഡാറ്റയിലും അടങ്ങിയിരിക്കുന്ന വിവരങ്ങൾ വളരെ വ്യക്തിഗതവും സെൻസിറ്റീവുമായ സ്വഭാവമാണ്. ലൈംഗികത, മാനസിക രോഗങ്ങൾ, മദ്യപാനത്തിൽനിന്നുള്ള മോചനദ്രവ്യം, അഗമ്യത്തിൽ നിന്നുള്ള ഉപദ്രവങ്ങൾ, ശാരീരിക പീഡനം, ഗാർഹിക പീഡനം, വ്യഭിചാരം, ബലാത്സംഗം തുടങ്ങി നിരവധി വ്യക്തിപരമായ പ്രശ്നങ്ങളുള്ള ഒരു നെറ്റ്ഫ്ലിക്സ് അംഗത്തിന്റെ സ്വകാര്യ താത്പര്യവും / അല്ലെങ്കിൽ സമരവും അംഗങ്ങളുടെ ചിത്ര വിവരങ്ങൾ വെളിപ്പെടുത്തുന്നു.

എല്ലാ ഡാറ്റയും തിരിച്ചറിയാൻ കഴിയുന്നതും എല്ലാ ഡാറ്റയും സെൻസിറ്റീവായതും നെറ്റ്ഫിക്സ് സമ്മാന ഡാറ്റയുടെ പുനർനിർണ്ണയം നൽകുന്നു. ജനങ്ങളെപ്പറ്റിയുള്ള ഊഹാപോഹങ്ങൾ മാത്രമായിട്ടാണ് ഇത് സംഭവിക്കുന്നത് എന്ന് നിങ്ങൾ ചിന്തിച്ചേക്കാം. അത് അത്ഭുതമല്ല. വിവര നിയമം അഭ്യർത്ഥന ഒരു ഫ്രീഡം മറുപടിയായി, ന്യൂയോർക്ക് സിറ്റി സർക്കാർ ന്യൂയോർക്കിൽ ഓരോ ടാക്സി സവാരി രേഖകൾ 2013 ൽ, പിക്കപ്പ് ഉൾപ്പെടെ പുറത്തിറങ്ങിയ തവണ, ലൊക്കേഷനുകൾ, കൂലി തുക കുറയുമ്പോൾ (തിരിച്ചുവിളിക്കാൻ അധ്യായം 2 ആ Farber (2015) ലേബർ എക്കണോമിക്സിൽ പ്രധാനപ്പെട്ട സിദ്ധാന്തങ്ങൾ പരീക്ഷിക്കാൻ സമാന ഡാറ്റ ഉപയോഗിച്ചു). ടാക്സി ട്രൈപ്പുകളെക്കുറിച്ചുള്ള ഈ വിവരങ്ങൾ ജനങ്ങളെ കുറിച്ചുള്ള വിവരങ്ങൾ നൽകുന്നതായി തോന്നുന്നില്ല, കാരണം, ആ ടാക്സി ഡാറ്റാഗതിയിൽ യഥാർത്ഥത്തിൽ ജനങ്ങളെ സംബന്ധിച്ചിടത്തോളം വളരെ പ്രധാനപ്പെട്ട വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നുവെന്ന് ആൻറണി ടാക്കാർ തിരിച്ചറിഞ്ഞു. ഉദാഹരണത്തിന്, ന്യൂയോർക്കിലെ ഒരു വലിയ സ്ട്രിപ്പ് ക്ലബ്ബായ ഹുസ്ലർ ക്ലബിൽ അർദ്ധരാത്രി മുതൽ അർദ്ധരാത്രി മുതൽ രാവിലെ 6 മണി വരെയുള്ള എല്ലാ യാത്രകളും അദ്ദേഹം നോക്കിനിന്നു. തുടർന്ന് ഡ്രോപ്പ് ഓഫ് ചെയ്ത സ്ഥലങ്ങൾ കണ്ടെത്തി. ഈ തിരയൽ-സാരസത്യത്തിൽ-ഹസ്റ്റ്ലർ ക്ലബ് (Tockar 2014) ഇടക്കിടെ ചില ആളുകളുടെ വിലാസങ്ങളുടെ പട്ടിക. ഡാറ്റ പുറത്തുവിട്ടപ്പോൾ നഗരഗവൺമെന്റിന്റെ മനസ്സിൽ ഇത് ഉണ്ടെന്ന് സങ്കൽപ്പിക്കാനാവില്ല. വാസ്തവത്തിൽ, നഗരത്തിലെ ഏതെങ്കിലും സ്ഥലത്ത് സന്ദർശിക്കുന്ന ആളുകളുടെ വീട്ടുപകരണങ്ങൾ-ഒരു മെഡിക്കൽ ക്ലിനിക്ക്, ഒരു ഗവൺമെന്റ് കെട്ടിടം, അല്ലെങ്കിൽ ഒരു മതസ്ഥാപനം കണ്ടെത്താൻ ഈ സാങ്കേതിക വിദ്യ ഉപയോഗിക്കാവുന്നതാണ്.

നെറ്റ്ഫ്ലിക്സ് പ്രൈസ്, ന്യൂയോർക്ക് സിറ്റി ടാക്സി ഡാറ്റ എന്നിവയുടെ രണ്ടുപേരും കാണിക്കുന്നത്, വിവരവിനിമയത്തിനുള്ള അപകടസാധ്യതകൾ താരതമ്യേന വിരളമായേക്കാവുന്ന ആളുകൾക്ക് അവർ ലഭ്യമാക്കുന്ന വിവരങ്ങളിൽ കൃത്യമായ കണക്കുകൾ കൃത്യമായി വിലയിരുത്താൻ കഴിയാത്തതാണ്-ഈ കേസുകൾ അദ്വിതീയമല്ല (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . കൂടാതെ, അത്തരത്തിലുള്ള കേസുകളിൽ, പ്രശ്നബാധിതമായ ഡാറ്റകൾ ഓൺലൈനിൽ സൌജന്യമായി ലഭ്യമാക്കുകയും, ഡാറ്റ റിലീസ് ചെയ്തുകൊണ്ടിരിക്കുന്നതിന്റെ ദുരന്തത്തെ സൂചിപ്പിക്കുന്നു. ഈ ഉദാഹരണങ്ങൾ, അതോടൊപ്പം കമ്പ്യൂട്ടർ സയൻസ് വിഷയങ്ങളിൽ ഗവേഷണം, ഒരു പ്രധാന നിഗമനത്തിലേയ്ക്കു നയിക്കുന്നു. ഗവേഷകർ എല്ലാ ഡാറ്റയും സാധ്യതയുള്ള തിരിച്ചറിയാനാകുന്നെങ്കിൽ എല്ലാ ഡാറ്റയും സാധ്യതയുള്ള സെൻസിറ്റീവ് അനുമാനിക്കേണ്ടതാണ്.

ദൗർഭാഗ്യവശാൽ, എല്ലാ ഡാറ്റയും തിരിച്ചറിയാൻ കഴിയുന്നതും എല്ലാ ഡാറ്റയും സെൻസിറ്റീവായതും വസ്തുതകൾക്ക് ലളിതമായ പരിഹാരം ഇല്ല. എന്നിരുന്നാലും, നിങ്ങൾ ഡാറ്റക്കൊപ്പം പ്രവർത്തിക്കുമ്പോൾ വിവരസാങ്കേതിക അപകടത്തെ കുറയ്ക്കുന്നതിനുള്ള ഒരു മാർഗ്ഗം ഒരു ഡാറ്റാ പരിരക്ഷാ പ്ലാൻ സൃഷ്ടിക്കുകയും പിന്തുടരുകയും ചെയ്യുക എന്നതാണ്. നിങ്ങളുടെ പ്ലാൻ ചോർന്നുപോകാനുള്ള അവസരം ഈ പ്ലാൻ കുറയ്ക്കും, കൂടാതെ ഒരു ലീക്ക് സംഭവിച്ചാൽ എന്തെങ്കിലും കുഴപ്പം കുറയ്ക്കും. എൻക്രിപ്ഷൻ ഏത് തരം ഉപയോഗിക്കണമെന്നതുപോലുള്ള ഡാറ്റാ സംരക്ഷണ പദ്ധതികളുടെ പ്രത്യേകതകൾ കാലാകാലങ്ങളിൽ മാറും, എന്നാൽ ഡാറ്റാ സേനയുടെ പ്ലാനിലെ ഘടകങ്ങൾ അഞ്ച് സെക്യൂരിറ്റികളെന്ന് വിളിക്കാവുന്ന സുരക്ഷിതമായ പ്രോജക്ടുകൾ, സുരക്ഷിതരായ ആളുകൾ , സുരക്ഷിതമായ സജ്ജീകരണങ്ങൾ, സുരക്ഷിതമായ ഡാറ്റ, സുരക്ഷിത ഔട്ട്പുട്ട് (പട്ടിക 6.2) (Desai, Ritchie, and Welpton 2016) . അഞ്ച് സെക്യൂരിറ്റികളിൽ ആരെയും സംരക്ഷിക്കില്ല. ഒന്നിച്ചു ചേർന്നാൽ, വിവരവിനിമയത്തിനുള്ള റിസ്ക് കുറയ്ക്കുവാൻ സാധിക്കുന്ന ഒരു ശക്തമായ ഘടകങ്ങളുടെ കൂട്ടമാണ് അവ.

പട്ടിക 6.2: "അഞ്ച് സേഫ്സ്" എന്നത് ഒരു ഡേറ്റാ പ്രൊട്ടക്ഷൻ പ്ലാൻ (Desai, Ritchie, and Welpton 2016)
സുരക്ഷിതമാണ്	പ്രവർത്തനം
സുരക്ഷിത പ്രോജക്ടുകൾ	സന്മാർഗ്ഗികതയിലുള്ളവയ്ക്ക് ഡാറ്റയുമായി പരിമിതപ്പെടുത്തുന്നു
സുരക്ഷിതരായ ആളുകൾ	ഡാറ്റയുമായി വിശ്വസനീയമായ ആളുകളിലേക്ക് ആക്സസ്സ് നിയന്ത്രിച്ചിരിക്കുന്നു (ഉദാ: സദാചാര പരിശീലനം നേടിയവർ)
സുരക്ഷിത ഡാറ്റ	സാധ്യമായത്ര അളവിൽ ഡാറ്റ തിരിച്ചറിഞ്ഞ്, സമാഹരിച്ചത്
സുരക്ഷിത ക്രമീകരണങ്ങൾ	അനുയോജ്യമായ ഫിസിക്കൽ (ഉദാ: ലോക്ക് ചെയ്ത റൂം) സോഫ്റ്റ്വെയറുകളും (ഉദാഹരണം പാസ്വേഡ് സംരക്ഷണം, എൻക്രിപ്റ്റ് ചെയ്തതും) സംരക്ഷിതമായ കമ്പ്യൂട്ടറുകളിൽ ഡാറ്റ സംഭരിച്ചിരിക്കുന്നു
സുരക്ഷിത ഔട്ട്പുട്ട്	ആകസ്മികമായ സ്വകാര്യത ലംഘനങ്ങൾ തടയുന്നതിന് ഗവേഷണ ഔട്ട്പുട്ട് അവലോകനം ചെയ്തിരിക്കുന്നു

നിങ്ങളുടെ ഡാറ്റ സംരക്ഷിക്കുന്നതിനു പുറമേ, മറ്റ് ഗവേഷകരുമായി ഡാറ്റ പങ്കിടൽ എന്നതാണ് വിവരസാങ്കേതിക അപകട സാധ്യത പ്രധാനമായിരിക്കുന്നത്. ശാസ്ത്രജ്ഞർക്കിടയിൽ ഡാറ്റ പങ്കാളിത്തമാണ് ശാസ്ത്രപരമായ പരിശ്രമത്തിന്റെ ഒരു പ്രധാന മൂല്യം, അത് വിജ്ഞാനത്തിന്റെ പുരോഗതിക്ക് സഹായകമാണ്. ഡേറ്റാ പങ്കിടൽ (Molloy 2011) ന്റെ പ്രാധാന്യം യു.കെ. ഹൗസ് ഓഫ് കോമൺസ് വിശദീകരിക്കുന്നു:

"സാഹിത്യത്തിൽ റിപ്പോർട്ടു ചെയ്യപ്പെട്ട ഫലങ്ങൾ പുനർനിർമ്മിക്കുകയോ, പരിശോധിക്കുകയോ, രൂപപ്പെടുത്തുകയോ ചെയ്യുകയാണെങ്കിൽ, ഡാറ്റയിലേക്കുള്ള പ്രവേശനം അടിസ്ഥാനപരമാണ്. വേറൊരു ശക്തമായ കാരണം ഇല്ലെങ്കിൽ, ഡാറ്റ പൂർണ്ണമായി വെളിപ്പെടുത്തി പരസ്യമായി ലഭ്യമാക്കണം എന്ന് കരുതുക.

എന്നിരുന്നാലും, മറ്റൊരു ഗവേഷകരുമായി നിങ്ങളുടെ ഡാറ്റ പങ്കുവെക്കുന്നതിലൂടെ, നിങ്ങളുടെ പങ്കാളികൾക്ക് നിങ്ങൾ വിവരസാങ്കേതിക അപകടസാധ്യത വർധിപ്പിക്കുകയാണ്. വിവരശേഖരണം മറ്റു ശാസ്ത്രജ്ഞന്മാരുമായി ഡാറ്റ പങ്കിടുന്നതിനുള്ള ഉത്തരവാദിത്തവും പങ്കാളികളുടെ അപകടസാധ്യതയെ കുറയ്ക്കുന്നതിനുള്ള ഉത്തരവാദിത്തവും തമ്മിലുള്ള വ്യത്യാസം സൃഷ്ടിക്കുന്നു. ഭാഗ്യവശാൽ, ഈ ധർമ്മസങ്കടം അത് പ്രത്യക്ഷപ്പെടുന്നതുപോലെ കഠിനമല്ല. പകരം, ഡേറ്റാ പങ്കുവയ്ക്കുന്നത് തുടർച്ചയായി വീഴുന്നതിനേക്കുറിച്ചാണ് ചിന്തിക്കുന്നത്, ആ തുടർച്ചയെക്കുറിച്ചുള്ള ഓരോ പോയിൻറുടേയും സമൂഹത്തിന് ഗുണകരമായ വ്യത്യസ്ത ആനുകൂല്യങ്ങളും പങ്കാളിത്തക്കാരുടെ അപകടസാധ്യതയും നൽകുന്നു (ചിത്രം 6.6).

അങ്ങേയറ്റം വേഗത്തിൽ, നിങ്ങളുടെ ഡാറ്റ പങ്കുവയ്ക്കാൻ ആർക്കും കഴിയില്ല, അത് പങ്കാളികൾക്ക് അപകടസാധ്യത കുറയ്ക്കുന്നതും സമൂഹത്തിന് നേട്ടങ്ങൾ കുറയ്ക്കുന്നതുമാണ്. അസാധാരണമായവിധം, നിങ്ങൾ റിലീസ് മറക്കുക കഴിയും, അവിടെ ഡാറ്റ "അജ്ഞാതമാക്കിയ" എല്ലാവർക്കുമായി പോസ്റ്റ്. വിവരങ്ങൾ പുറത്തുവിടുകയോ റിലീസ് ചെയ്യുകയോ മറക്കുകയോ ചെയ്യുന്നത് സമൂഹത്തിന് കൂടുതൽ പ്രയോജനം ചെയ്യുന്നതും പങ്കാളികൾക്ക് കൂടുതൽ അപകടസാധ്യതയുമാണ്. ഈ രണ്ട് അങ്ങേയറ്റത്തെ കേസുകളിൽ സങ്കരവർഗ്ഗങ്ങളുടെ ഒരു ശ്രേണികളാണ്. അവയിൽ ഞാൻ ഒരു മതിലാർത്തോട്ടം സമീപനം വിളിക്കും. ഈ സമീപനമനുസരിച്ച്, ചില മാനദണ്ഡങ്ങൾ പാലിക്കുന്ന ആളുകളുമൊത്ത് ഡാറ്റ പങ്കുവയ്ക്കപ്പെടുന്നു, ഒപ്പം ചില നിയമങ്ങൾ അനുസരിക്കാമെന്ന് സമ്മതിക്കുന്നു (ഉദാഹരണത്തിന്, ഒരു IRB യിൽ നിന്നുള്ള മേൽനോട്ടം, ഒരു ഡാറ്റാ പരിരക്ഷാ പ്ലാൻ). മതിലുകളുള്ള പൂന്തോട്ടപരിപാടി റിലീസ് ചെയ്ത പല പ്രയോജനങ്ങളും പ്രദാനം ചെയ്യുന്നു. തീർച്ചയായും, അത്തരമൊരു സമീപനം പല ചോദ്യങ്ങളുണ്ടാക്കുന്നു-ഏത് സാഹചര്യങ്ങളിൽ, ഏതൊക്കെ വ്യവസ്ഥകൾക്കപ്പുറം, എത്ര നാൾ, ചുമരുകളുള്ള തോട്ടത്തെ സംരക്ഷിക്കാനും പോലീസിനും അടയ്ക്കേണ്ടിവരും- എന്നാൽ ഇത് ശരിയല്ല. മിഷിഗണിലെ യൂണിവേഴ്സിറ്റിയിലെ പൊളിറ്റിക്കൽ ആന്റ് സോഷ്യൽ റിസർച്ചിന്റെ ഇന്റർ യൂണിവേഴ്സിറ്റി കൺസോർഷ്യം സംബന്ധിച്ച ഡാറ്റ ആർക്കൈവ് പോലുള്ള ഗവേഷകർ ഇപ്പോൾത്തന്നെ ഉപയോഗപ്പെടുത്താറുണ്ട്.

ചിത്രം 6.6: ഡാറ്റ റിലീസ് സ്ട്രാറ്റജികൾ തുടർച്ചയായി വീഴും. ഈ തുടർച്ചയിൽ നിങ്ങൾ എവിടെയായിരുന്നാലും, നിങ്ങളുടെ ഡാറ്റയുടെ പ്രത്യേക വിശദാംശങ്ങളെ ആശ്രയിച്ചിരിക്കും, നിങ്ങളുടെ കേസിൽ റിസ്ക്, ആനുകൂല്യത്തിന്റെ അനുയോജ്യമായ ബാലൻസ് എന്നിവ തീരുമാനിക്കാൻ മൂന്നാം-കക്ഷി അവലോകനം നിങ്ങളെ സഹായിച്ചേക്കാം. ഈ വക്രത്തിന്റെ കൃത്യമായ രൂപം ഡാറ്റയുടെയും ഗവേഷണ ലക്ഷ്യങ്ങളുടെയും (Goroff 2015) പ്രത്യേകതകളെ ആശ്രയിച്ചാണിരിക്കുന്നത്.

അതിനാൽ, നിങ്ങളുടെ പഠനത്തിലെ ഡാറ്റ പങ്കിടൽ, മതിലുള്ള തോട്ടം, റിലീസ്, മറയ്ക്കാതെ തുടർച്ചയായി എവിടെയായിരിക്കണം? ഇത് നിങ്ങളുടെ ഡാറ്റയുടെ വിശദാംശങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു: നിയമം, പൊതുതാൽപര്യത്തിനുള്ള വ്യക്തി, ആദരവ്, നീതി, ആദരവ് എന്നിവയ്ക്കുള്ള ബഹുമാനം. ഈ കാഴ്ചപ്പാടിൽ നിന്ന് കണ്ട, ഡാറ്റ പങ്കിടൽ ഒരു വ്യതിരിക്ത നൈതികതരംഗമല്ല; ഗവേഷകർക്ക് ഉചിതമായ ധാർമ്മിക ബാലൻസ് കണ്ടെത്താൻ കഴിയുന്ന ഗവേഷണത്തിൻറെ പല വശങ്ങളിലൊന്നാണ് ഇത്.

ചില വിമർശകർ പൊതുവേ വിവരവിനിമയത്തെ എതിർക്കുന്നു, കാരണം എന്റെ അഭിപ്രായത്തിൽ അവർ തങ്ങളുടെ റിസ്കുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു - അത് തീർച്ചയായും യഥാർത്ഥത്തിൽ തന്നെയാണ് - അത് അതിന്റെ ആനുകൂല്യങ്ങൾ അവഗണിക്കുകയാണ്. അതിനാൽ, രണ്ട് അപകടസാധ്യതകൾക്കും പ്രയോജനങ്ങൾക്കും പ്രോത്സാഹിപ്പിക്കുന്നതിന്, ഞാൻ ഒരു സാമ്യം അർപ്പിക്കാൻ ആഗ്രഹിക്കുന്നു. ഓരോ വർഷവും കാറുകൾ ആയിരക്കണക്കിന് മരണത്തിന് ഉത്തരവാദികളാണ്, എന്നാൽ ഞങ്ങൾ ഡ്രൈവിംഗ് നിരോധിക്കാൻ ശ്രമിക്കുന്നില്ല. ഡ്രൈവിംഗിനെ നിരോധിക്കാൻ കോൾ അസംബന്ധം തന്നെ. മറിച്ച്, ആർക്കൊക്കെ ഡ്രൈവുചെയ്യാൻ കഴിയുമോ എന്നതിനെ നിയന്ത്രിക്കാൻ സമൂഹം നിയന്ത്രണം ഏർപ്പെടുത്തുന്നു (ഉദാഹരണത്തിന്, ഒരു നിശ്ചിത പ്രായം ആയിരിക്കേണ്ടതും ചില പരീക്ഷകൾ പാസ്സാക്കേണ്ടതുമാണ്) അവ എങ്ങനെ നയിക്കുന്നു (ഉദാ, വേഗ പരിധിക്ക് കീഴിൽ). ഈ നിയമങ്ങൾ നിർവ്വഹിക്കുന്നതിനായി ജനങ്ങൾക്ക് സൊസൈറ്റി (ഉദാ: പോലീസുകാർ) ചുമതലപ്പെടുത്തിയിട്ടുണ്ട്, അവയെ ലംഘിക്കുന്നവരെ ഞങ്ങൾ ശിക്ഷിക്കും. ഡ്രൈവിങ് നിയന്ത്രിക്കുന്നതിന് സമൂഹം ബാധകമാക്കുന്ന സമാന തരത്തിലുള്ള സമാനമായ ചിന്തയും ഡാറ്റ പങ്കിടലിന് ബാധകമാണ്. അതായത്, ഡാറ്റ ഷെയറിംഗിനുള്ള എതിർകക്ഷണപരമായ വാദങ്ങൾ ഉണ്ടാക്കുന്നതിനേക്കാളുപരി, റിസ്ക്കുകൾ കുറയ്ക്കുകയും ഡാറ്റ ആനുകൂല്യങ്ങളിൽ നിന്ന് ആനുകൂല്യങ്ങൾ എങ്ങനെ വർദ്ധിപ്പിക്കാം എന്നതിനെ അടിസ്ഥാനപ്പെടുത്തിക്കൊണ്ട് ഏറ്റവും പുരോഗതി കൈവരിക്കുമെന്നും ഞാൻ കരുതുന്നു.

സമാപനത്തിൽ, വിവരസാങ്കേതിക പരിസ്ഥിതി നാടകീയമായി വർദ്ധിച്ചു, പ്രവചിക്കാൻ വളരെ വളരെ ബുദ്ധിമുട്ടാണ്. അതിനാൽ, എല്ലാ ഡാറ്റയും തിരിച്ചറിയാൻ കഴിയുന്നതും, സെൻസിറ്റീവായതുമായതാണെന്ന് അനുമാനിക്കുന്നത് നന്നായിരിക്കും. ഗവേഷണം നടത്തുമ്പോൾ വിവരസാങ്കേതിക അപകട സാധ്യത കുറയ്ക്കുന്നതിന് ഗവേഷകർക്ക് ഒരു ഡാറ്റാ പരിരക്ഷാ പ്ലാൻ സൃഷ്ടിക്കുകയും പിന്തുടരുകയും ചെയ്യാം. ഗവേഷകർക്ക് മറ്റ് ശാസ്ത്രജ്ഞരുമായി വിവരങ്ങൾ പങ്കുവെക്കുന്നതിൽ നിന്ന് വിവര ശേഖരം തടയില്ല.