6.6.2 ურთიერთგაგებისა და მართვის საინფორმაციო რისკი

ეს თარგმანი შეიქმნა კომპიუტერი. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

6.6.2 ურთიერთგაგებისა და მართვის საინფორმაციო რისკი

ინფორმაცია რისკი არის ყველაზე გავრცელებული რისკის სოციალური კვლევითი ინსტიტუტი; ის მკვეთრად გაიზარდა; და ეს არის ყველაზე მძიმე, რისკების.

მეორე ეთიკური გამოწვევა სოციალური ასაკის ციფრული კვლევის საინფორმაციო რისკი, პოტენციალი ზიანი ინფორმაციის გამჟღავნების (Council 2014) . საინფორმაციო ამწვავებს ეხლა გამჟღავნება პირადი ინფორმაცია შეიძლება იყოს ეკონომიკური (მაგალითად, კარგავს სამუშაოს), სოციალური (მაგალითად, არეულობის), ფსიქოლოგიური (მაგალითად, დეპრესია), ან თუნდაც სისხლის (მაგალითად, დაპატიმრება უკანონო ქმედება). სამწუხაროდ, ციფრული ასაკი ზრდის ინფორმაცია რისკი მკვეთრად, არსებობს მხოლოდ იმდენად მეტი ინფორმაცია ჩვენი ქცევა. და, საინფორმაციო რისკის დაამტკიცა ძალიან რთული გასაგებია და მართვა შედარებით რისკები, რომ შეშფოთება ანალოგი ასაკის სოციალური კვლევის, როგორიცაა ფიზიკური რისკი. ვნახოთ როგორ ციფრული ასაკი ზრდის საინფორმაციო რისკი, განიხილოს გადასვლას ქაღალდის ელექტრონული სამედიცინო ჩანაწერი. ორივე ტიპის ჩანაწერები რისკის ქვეშ, მაგრამ ელექტრონული შექმნა ბევრად უფრო დიდი რისკი, იმიტომ, რომ მასობრივ ისინი შეიძლება გადაეცეს არასანქცირებული პარტიის ან შეუერთდა სხვა ჩანაწერები. სოციალური მკვლევარები ციფრული ასაკი უკვე აწარმოებს შევიდა პრობლემები საინფორმაციო რისკი, ნაწილობრივ იმიტომ, რომ მათ არ ესმით, როგორ რაოდენობრივად და მართვა. ასე რომ, მე ვაპირებ გთავაზობთ სასარგებლოა გზა ვიფიქროთ საინფორმაციო რისკი, და შემდეგ მე ვაპირებ მოგცეთ რამდენიმე რჩევა, თუ როგორ უნდა მართოს საინფორმაციო რისკის თქვენი კვლევა და გათავისუფლების მონაცემები სხვა მკვლევარები.

ერთი გზა, რომ სოციალური მკვლევარები შემცირდება საინფორმაციო რისკი "anonymization" მონაცემები. "ანონიმიზების" არის პროცესი მოხსნის აშკარა საიდენტიფიკაციო როგორიცაა სახელი, მისამართი და ტელეფონის ნომერი მონაცემები. თუმცა, ეს მიდგომა ბევრად ნაკლებად ეფექტურია, ვიდრე ბევრს შეიძლება, და ეს არის, ფაქტობრივად, ღრმად და საფუძვლიანად შეზღუდულია. ამის გამო, როდესაც მე აღწერს "anonymization," მე, ბრჭყალების შეგახსენოთ, რომ ეს პროცესი ქმნის გამოჩენა ანონიმურობის მაგრამ არა ნამდვილი ანონიმურობა.

ამის ნათელი მაგალითია მარცხი "anonymization" მომდინარეობს გვიან 1990 წელს მასაჩუსეტსის (Sweeney 2002) . ჯგუფი სადაზღვევო კომისიის (GIC) იყო სამთავრობო სააგენტო პასუხისმგებელი შეძენის ჯანმრთელობის დაზღვევა ყველა სახელმწიფო მოხელეს. ამ სამუშაოს, GIC შეგროვებული ჯანდაცვისა ჩანაწერები ათასობით სახელმწიფო მოხელეები. იმ მიზნით, რომ ხელს შეუწყობენ კვლევის გზები, რათა გააუმჯობესოს ჯანდაცვის, GIC გათავისუფლების გადაწყვეტილება ამ ჩანაწერების მკვლევარები. თუმცა, ისინი არ იზიარებენ ყველა მათი მონაცემები; უფრო სწორად, ისინი "ანონიმური" ეს მოხსნის ინფორმაციას, როგორიცაა სახელი და მისამართი. თუმცა ისინი სხვა ინფორმაცია, რომ მათ ეგონათ შეიძლება იყოს სასარგებლო მკვლევართა როგორიცაა დემოგრაფიული ინფორმაცია (ZIP კოდი, დაბადების თარიღი, ეთნიკური და სქესის) და სამედიცინო საინფორმაციო (ვიზიტით მონაცემები, დიაგნოსტიკა პროცედურა) (სურათი 6.4) (Ohm 2010) . სამწუხაროდ, ეს "anonymization" არ იყო საკმარისი, რათა დავიცვათ მონაცემები.

სურათი 6.4: "ანონიმიზების" არის პროცესი მოხსნის აშკარად საიდენტიფიკაციო ინფორმაციას. მაგალითად, როდესაც გათავისუფლების სამედიცინო დაზღვევის ჩანაწერები სახელმწიფო მოხელეები მასაჩუსეტსის ჯგუფი სადაზღვევო კომისიის (GIC) ამოღებულ სახელი და მისამართი ფაილი. გამოვიყენო შეთავაზებები გარშემო სიტყვა "anonymization" იმიტომ, რომ პროცესი ითვალისწინებს გამოჩენა ანონიმურობის, მაგრამ არა ფაქტობრივი ანონიმურობა.

იმის საჩვენებლად, რომ ხარვეზები GIC "anonymization", Latanya Sweeney მაშინ კურსდამთავრებული MIT გადახდილი $ 20 შეიძინოს კენჭისყრების ქალაქ კემბრიჯში, მშობლიურ მასაჩუსეტსის გუბერნატორი უილიამ Weld. ეს კენჭისყრების მოიცავდა ინფორმაციას, როგორიცაა სახელი, მისამართი, საფოსტო ინდექსი, დაბადების თარიღი, და სქესის. ის ფაქტი, რომ სამედიცინო მონაცემების ფაილი და ამომრჩეველთა ფაილი საერთო სფეროებში-zip კოდი, დაბადების თარიღი, sex-იმას ნიშნავდა, რომ Sweeney შეიძლება უკავშირებენ მათ. Sweeney იცოდა, რომ Weld დაბადების დღე იყო 31 ივლისი, 1945, და კენჭისყრების შედის მხოლოდ ექვსი ადამიანი კემბრიჯში, რომ დაბადების დღე. გარდა ამისა, იმ ექვსი ადამიანი, მხოლოდ სამი მამაკაცი. და, იმ სამი მამაკაცი, მხოლოდ ერთი საერთო Weld ს ZIP კოდი. აქედან გამომდინარე, კენჭისყრის მონაცემები აჩვენა, რომ ვინმეს სამედიცინო მონაცემების Weld ს კომბინაცია დაბადების თარიღი, სქესი, და ZIP კოდი იყო უილიამ Weld. თავისი შინაარსით, ეს სამი ცალი მოწოდებული ინფორმაციის უნიკალური ანაბეჭდი, რომ მას მონაცემები. გამოყენება ამ ფაქტს, Sweeney შეძლო განთავსდება Weld სამედიცინო ჩანაწერი, და აცნობოს მას თავისი feat, მან ფოსტით მას ასლი მისი ჩანაწერები (Ohm 2010) .

ნახაზი 6.5: Re-idenification ანონიმური მონაცემების. Latanya Sweeney კომბინირებული ანონიმური ჯანმრთელობის ჩანაწერი ხმის ჩანაწერები, რათა სამედიცინო ჩანაწერები გუბერნატორი უილიამ Weld (Sweeney 2002).

ნახაზი 6.5: Re-idenification of "ანონიმური" მონაცემები. Latanya Sweeney კომბინირებული "ანონიმური" ჯანმრთელობის ჩანაწერი ხმის ჩანაწერები, რათა სამედიცინო ჩანაწერები გუბერნატორი უილიამ Weld (Sweeney 2002) .

Sweeney მუშაობის ასახავს ძირითადი სტრუქტურა de-anonymization თავდასხმები -ის მიღება ვადით კომპიუტერული უსაფრთხოების თანამეგობრობას. ამ თავდასხმების, ორი კომპლექტი მონაცემები, არც ერთი, რომელიც თავისთავად ცხადყოფს გასაცვლელად, რომლებიც დაკავშირებულია და ამ კავშირი, მგრძნობიარე ინფორმაცია ექვემდებარება. გარკვეული თვალსაზრისით, ეს პროცესი მსგავსია ისე, რომ საცხობი სოდა და ძმარი, ორი ნივთიერებები, რომლებიც თავად უსაფრთხო, შეიძლება კომბინირებული წარმოების nasty შედეგს.

საპასუხოდ Sweeney მუშაობა, და სხვა სამუშაოები, მკვლევარები საერთოდ ამოიღონ უფრო მეტი ინფორმაცია ყველა ე.წ. "პირადად საიდენტიფიკაციო ინფორმაციას" (PII) (Narayanan and Shmatikov 2010) აფხაზეთში ყოფნისას ამჯერად პროცესი "anonymization." გარდა ამისა, ბევრი მკვლევარები გააცნობიეროს, რომ გარკვეული მონაცემები, როგორიცაა სამედიცინო ჩანაწერი, ფინანსური ჩანაწერები, პასუხი კვლევის კითხვები უკანონო ქმედების შესახებ-, ალბათ, ძალიან მგრძნობიარე გათავისუფლების შემდეგაც კი "anonymization." თუმცა, ბოლოდროინდელი მაგალითები, რომ მე აღწერს ქვემოთ მიუთითებს იმაზე, რომ სოციალური მკვლევარები უნდა შეცვალოს მათი აზროვნება. როგორც პირველი ნაბიჯი, ეს არის ბრძენი, ვივარაუდოთ, რომ ყველა მონაცემი არის პოტენციურად ამოცნობას და ყველა მონაცემები პოტენციურად მგრძნობიარე. სხვა სიტყვებით, ვიდრე ფიქრი, რომ საინფორმაციო რისკის ვრცელდება მცირე subset პროექტები, უნდა ვივარაუდოთ, რომ ეს ეხება-, გარკვეულწილად უნდა ყველა პროექტი.

ორივე ასპექტს ამ ხელახალი ორიენტაციის ილუსტრირებული Netflix პრიზი. როგორც აღწერილია მე -5, Netflix გამოვიდა 100 მილიონი ფილმის რეიტინგები გათვალისწინებული 500,000 წევრები და ჰქონდა ღია მოწოდება, სადაც ხალხი მთელი მსოფლიოს მასშტაბით წარმოდგენილი ალგორითმები, რომ შეიძლება გაუმჯობესდეს Netflix უნარი რეკომენდაცია ფილმები. ადრე გათავისუფლების მონაცემები, Netflix ამოღებულ ნებისმიერი აშკარად საიდენტიფიკაციო ინფორმაცია, როგორიცაა სახელები. Netflix ასევე წავიდა ზედმეტი ნაბიჯი და გააცნო უმნიშვნელო perturbations ზოგიერთ ჩანაწერები (მაგ იცვლება ზოგიერთი რეიტინგები 4 ვარსკვლავი 3 ვარსკვლავი). Netflix მალე აღმოაჩინეს, რომ მიუხედავად იმისა, რომ მათი ძალისხმევა, მონაცემები არ ნიშნავს ანონიმური.

მხოლოდ ორი კვირის შემდეგ მონაცემებს გაათავისუფლეს Narayanan and Shmatikov (2008) აჩვენა, რომ შესაძლებელი იყო, რომ გაიგოთ კონკრეტული ადამიანების ფილმის შეღავათებით. შეასრულა მათი ხელახლა საიდენტიფიკაციო თავდასხმა იყო მსგავსი Sweeney ს: შერწყმა ერთად ორი საინფორმაციო წყაროს, ერთი პოტენციურად მგრძნობიარე ინფორმაციას და არ აშკარად საიდენტიფიკაციო ინფორმაციას და ერთი, რომელიც შეიცავს პირადობის ადამიანი. თითოეული ამ მონაცემების წყაროების შეიძლება ინდივიდუალურად უსაფრთხო, მაგრამ როდესაც ისინი გაერთიანებულია გაერთიანებული ნაკრებს შეგიძლიათ შექმნათ საინფორმაციო რისკი. იმ შემთხვევაში, თუ Netflix მონაცემებით, აქ არის ის, თუ როგორ შეიძლება მოხდეს. წარმოიდგინეთ, რომ მე აირჩიოს გაგიზიაროთ ჩემი მოსაზრებები იმის შესახებ, სამოქმედო და კომედია ფილმები ჩემს თანამშრომლებთან, მაგრამ მირჩევნია, არ იზიარებს, ჩემი აზრით, რელიგიური და პოლიტიკური ფილმები. ჩემი თანამშრომლებთან შეიძლება გამოიყენოთ ინფორმაცია, რომ მე მათთან ერთად მოვძებნოთ ჩემი ჩანაწერები Netflix მონაცემები; ინფორმაცია, რომ მე ვიზიარებ შეიძლება იყოს უნიკალური ანაბეჭდი ისევე, როგორც უილიამ Weld დაბადების თარიღი, საფოსტო ინდექსი, და სექსი. მაშინ, თუ ისინი ჩემი უნიკალური ანაბეჭდი მონაცემები, ისინი სწავლობენ ჩემი რეიტინგები ყველა ფილმები, მათ შორის ფილმები, სადაც მე აირჩიოს არ იზიარებენ. გარდა იმისა, რომ ამ სახის მიზნობრივი თავდასხმა ორიენტირებულია ერთი პირი, Narayanan and Shmatikov (2008) ასევე აჩვენა, რომ შესაძლებელი იყო, რომ ამის ფართო შეტევა, ერთი, რომელშიც ბევრი ადამიანი შერწყმის Netflix მონაცემებს პირად და ფილმის სარეიტინგო მონაცემები, რომ ზოგიერთი ხალხმა აირჩია პოსტი ინტერნეტ მონაცემთა ბაზა (IMDb). ნებისმიერი ინფორმაცია, რომელიც უნიკალური ანაბეჭდი კონკრეტული პირი, თუნდაც მათი კომპლექტი ფილმის რეიტინგები-შეიძლება გამოყენებულ იქნას მათი ამოცნობა.

მიუხედავად იმისა, რომ Netflix მონაცემები შეიძლება ხელახლა განსაზღვრული ან მიზანმიმართული ან ფართო თავდასხმა, ჯერ კიდევ შეიძლება, როგორც ჩანს, დაბალი რისკი. ყოველივე ამის შემდეგ, ფილმის რეიტინგები არ ჩანს, ძალიან მგრძნობიარე. მიუხედავად იმისა, რომ შეიძლება იყოს ჭეშმარიტი, ზოგადად, ზოგიერთი 500,000 ადამიანი ნაკრებს, ფილმის რეიტინგები შეიძლება იყოს საკმაოდ მგრძნობიარეა. ფაქტობრივად, საპასუხოდ de-anonymization closeted ლესბოსელი ქალი შეუერთდა კლასის აქცია სარჩელი წინააღმდეგ Netflix. აი, როგორ პრობლემა გამოიხატება მათი სარჩელი (Singel 2009) :

"[M] ovie და ნიშანი მონაცემებს შეიცავს ინფორმაციას უფრო მაღალ პირადი და მგრძნობიარე ბუნება [SIC]. წევრის ფილმის მონაცემები კარგად ჩანს, Netflix წევრის პირადი ინტერესი და / ან ბრძოლას სხვადასხვა უაღრესად პირადი საკითხები, მათ შორის სქესობრივი, ფსიქიკური დაავადება, აღდგენა ალკოჰოლიზმი და ვიქტიმიზაციის ეხლა incest, ფიზიკური შეურაცხყოფა, ოჯახური ძალადობის, მრუშობა და გაუპატიურება ".

დე-anonymization საქართველოს Netflix პრიზი მონაცემები გვიჩვენებს, როგორც, რომ ყველა მონაცემი პოტენციურად ამოცნობას და რომ ყველა მონაცემი არის პოტენციურად მგრძნობიარე. ამ ეტაპზე, თქვენ ფიქრობთ, რომ ეს მხოლოდ ეხება მონაცემები, რომ აცხადებს, რომ იყოს ადამიანი. გასაკვირი არ არის, რომ ეს არ არის საქმე. საპასუხოდ ინფორმაციის თავისუფლების კანონით მოთხოვნით, New York City Government გაათავისუფლეს ჩანაწერები ყველა ტაქსის ride in New York 2013, მათ შორის პიკაპის ჩამოაგდეს off-ჯერ, ადგილისა და მგზავრობის თანხები (გავიხსენოთ თავი 2 რომ Farber (2015) გამოიყენება ამ მონაცემების შესამოწმებლად მნიშვნელოვანი თეორიები შრომის ეკონომიკა). მიუხედავად იმისა, რომ ამ მონაცემებს ტაქსის ვიზიტებს შესაძლოა, როგორც ჩანს, კეთილთვისებიანი, რადგან ის არ ჩანს, რომ ინფორმაცია ადამიანი, Anthony Tockar მიხვდა, რომ ეს ტაქსის ნაკრებს რეალურად შეიცავს უამრავი პოტენციურად მგრძნობიარე ინფორმაცია ადამიანი. მაგალითად, მან შევხედე ყველა ვიზიტებს დაწყებული Hustler Club-დიდი ზოლები კლუბი ნიუ-იორკში შორის შუაღამისას 6am და შემდეგ მათი drop-off ადგილას. ეს გამოვლინდა-არსი-სია და მისამართები ზოგიერთი ადამიანი, ვინც ხშირი Hustler კლუბი (Tockar 2014) . ძნელი წარმოსადგენია, რომ ქალაქის ხელისუფლებამ ამის გათვალისწინებით, როდესაც ის გაათავისუფლეს მონაცემები. ფაქტობრივად, ეს იგივე ტექნიკა შეიძლება იქნას გამოყენებული, რათა იპოვოს მისამართები, ვინც ესტუმრება ნებისმიერ ადგილას ქალაქის სამედიცინო კლინიკა, მთავრობის სახლის, ან რელიგიური დაწესებულება.

ეს ორი შემთხვევა-the Netflix პრემია და ნიუ იორკში ტაქსის მონაცემთა შოუ, რომ შედარებით გამოცდილი ხალხი ვერ სწორად შეაფასებს საინფორმაციო რისკის მონაცემები, რომ მათ გაათავისუფლეს და ამ შემთხვევაში არ ნიშნავს უნიკალური (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . გარდა ამისა, ბევრი ამ შემთხვევაში, პრობლემური მონაცემები მაინც თავისუფლად ხელმისაწვდომი, რაც მიუთითებს, სირთულე ოდესმე გაუქმება მონაცემთა გათავისუფლებას. ერთობლივად ეს მაგალითები, ისევე როგორც კვლევის კომპიუტერულ მეცნიერებაში შესახებ კონფიდენციალურობის იწვევს მნიშვნელოვანი დასკვნა. მკვლევარებმა უნდა ვივარაუდოთ, რომ ყველა მონაცემი არის პოტენციურად ამოცნობას და ყველა მონაცემები პოტენციურად მგრძნობიარე.

სამწუხაროდ, არ არსებობს მარტივი გამოსავალი იმისა, რომ ყველა მონაცემი არის პოტენციურად ამოცნობას და ყველა მონაცემები პოტენციურად მგრძნობიარე. თუმცა, ერთი გზა, რათა შეამციროს ინფორმაცია რისკი, ხოლო თქვენ ვმუშაობთ მონაცემების შექმნას და დაიცვას მონაცემთა დაცვის გეგმა. ეს გეგმა ამცირებს შანსი, რომ თქვენი მონაცემები გაჟონვის და შეამცირებს ზიანი, თუ გაჟონვის რატომღაც ხდება. სპეციფიკა მონაცემთა დაცვის გეგმები, როგორიცაა რომელიც ფორმით დაშიფვრის გამოყენება, დროთა განმავლობაში შეიცვლება, მაგრამ ბრიტანეთი მონაცემთა მომსახურება სარგებელი არ აწყობს ელემენტები მონაცემთა დაცვის გეგმა 5 კატეგორია, რომ ისინი უწოდებენ 5 სეიფები: უსაფრთხო პროექტები, უსაფრთხო ადამიანი , უსაფრთხო პარამეტრები, უსაფრთხო მონაცემთა და უსაფრთხო შედეგები (ცხრილი 6.2) (Desai, Ritchie, and Welpton 2016) . არცერთი ხუთ სეიფები ინდივიდუალურად სრულყოფილი დაცვა. მაგრამ, ერთად ისინი ქმნიან ძლიერი ნაკრები ფაქტორი, რომელიც შეიძლება შეამციროს საინფორმაციო რისკი.

ცხრილი 6.2: 5 სეიფები პრინციპები დაპროექტებისა და წარმოების მონაცემების დაცვის გეგმა (Desai, Ritchie, and Welpton 2016) .
უსაფრთხო	აქცია
უსაფრთხო პროექტები	ზღუდავს პროექტების მონაცემების ის, რომ ეთიკური
Safe ადამიანი	ხელმისაწვდომობის შეზღუდულია იმ ადამიანებს, ვინც შეიძლება სანდო მონაცემები (მაგალითად, ადამიანი გაიარეს ეთიკური სწავლება)
უსაფრთხო მონაცემთა	მონაცემები დე განსაზღვრული და ერთიანი, რამდენადაც ეს შესაძლებელია
უსაფრთხო პარამეტრები	მონაცემები ინახება კომპიუტერი სათანადო ფიზიკური (მაგალითად, ჩაკეტილი ოთახი) და პროგრამული უზრუნველყოფის (მაგალითად, პაროლით დაცვა, დაშიფრული) დაცვის
უსაფრთხო გამომავალი	კვლევის შედეგებს გადაიხედება, რომ თავიდან ავიცილოთ შემთხვევით კონფიდენციალურობის არღვევს

გარდა ამისა, დაცვის თქვენი მონაცემები, ხოლო თქვენ იყენებთ, ერთი ნაბიჯი კვლევის პროცესი, სადაც საინფორმაციო რისკი განსაკუთრებით გამოირჩევა მონაცემთა გაზიარების სხვა მკვლევარები. მონაცემთა გაცვლის მეცნიერთა შორის ერთ-ერთი ძირითადი ღირებულება სამეცნიერო საქმეში, და ეს მნიშვნელოვნად ობიექტების წინსვლას ცოდნა. აი, როგორ ბრიტანეთის თემთა აღწერილი მნიშვნელობის მონაცემების გაზიარება:

"წვდომა მონაცემების ფუნდამენტური თუ მკვლევარები რეპროდუცირება, დააზუსტოს და დაეყრდნონ შედეგი, რომელიც ლიტერატურაში. პრეზუმფცია უნდა იყოს, რომ, თუ არ არის ძლიერი მიზეზი, წინააღმდეგ შემთხვევაში, მონაცემები სრულად უნდა გაიხსნას და საჯაროდ ხელმისაწვდომი. შეესაბამება ამ პრინციპის მიხედვით, სადაც ეს შესაძლებელია, დაკავშირებული მონაცემები ყველა საჯაროდ დაფინანსებული კვლევის უნდა მოხდეს ფართოდ და თავისუფლად არის შესაძლებელი. " (Molloy 2011)

მიუხედავად ამისა, გაზიარების თქვენი მონაცემები კიდევ ერთი მკვლევარი, თქვენ შეიძლება იზრდება საინფორმაციო საფრთხეს თქვენს მონაწილეებს. ასე რომ, ეს შეიძლება, როგორც ჩანს, რომ მკვლევართა, რომელთაც სურთ გაუზიაროს მათი მონაცემები ან ვალდებულნი არიან გააცნონ თავიანთი მონაცემთა წინაშე ფუნდამენტური დაძაბულობა. ერთის მხრივ, მათ აქვთ ეთიკური ვალდებულება გააცნონ თავიანთი მონაცემები სხვა მეცნიერები, განსაკუთრებით, თუ ორიგინალური კვლევის ფინანსდება სახელმწიფოს მიერ. თუმცა, ამავე დროს, მკვლევართა ეთიკური ვალდებულება მინიმუმამდე, მაქსიმალურად, ინფორმაცია რისკის მათი მონაწილეები.

საბედნიეროდ, ეს დილემა არ არის, როგორც მძიმე, როგორც ჩანს. მნიშვნელოვანია, რომ ვფიქრობ მონაცემთა გაზიარებას გასწვრივ კონტინუუმის საწყისი მონაცემები არ გაზიარების გათავისუფლების და დავივიწყოთ, სადაც მონაცემები "ანონიმური" და posted ვინმეს წვდომისათვის (სურათი 6.6). ორივე ეს უკიდურესი პოზიციები აქვს რისკები და სარგებელი. ეს არის ის, რომ ეს არ არის ავტომატურად ყველაზე ეთიკური რამ არ იზიარებს თქვენს მონაცემებს; ასეთი მიდგომა გამორიცხავს ბევრი პოტენციური სარგებელი საზოგადოებისათვის. დავბრუნდეთ გასინჯვა, კავშირები, და ახლა, მაგალითად, განხილული ადრე თავი, არგუმენტები მონაცემების გათავისუფლებას, რომ აქცენტი მხოლოდ შესაძლო ზიანს და რომ იგნორირება შესაძლო სარგებელი ზედმეტად ცალმხრივი; მე აღწერს პრობლემა ამ ცალმხრივი, ზედმეტად დამცავი მიდგომა უფრო დეტალურად ქვემოთ, როდესაც მე გთავაზობთ რჩევებს შესახებ გადაწყვეტილების მიღების სახე გაურკვევლობა (სექცია 6.6.4).

სურათი 6.6: მონაცემთა გათავისუფლებას სტრატეგიები შეიძლება დაეცემა გასწვრივ მუდმივი. სადაც თქვენ უნდა გასწვრივ კონტინუუმის დამოკიდებულია კონკრეტული დეტალები თქვენი მონაცემები. ამ შემთხვევაში, მესამე მხარის მიმოხილვა შეიძლება დაგეხმაროთ გადასაწყვეტია სათანადო ბალანსი რისკი და სარგებელი თქვენს შემთხვევაში.

გარდა ამისა, ამ ორ უკიდურეს შემთხვევაში არის ის, რაც მე მოუწოდა walled ბაღში მიდგომა, სადაც მონაცემები გაუზიარეს ადამიანი, ვინც აკმაყოფილებდეს გარკვეულ კრიტერიუმებს, რომელიც თანხმობას გარკვეული წესები (მაგალითად, ზედამხედველობა საწყისი IRB და მონაცემთა დაცვის გეგმები) . ეს walled ბაღში მიდგომა უზრუნველყოფს ბევრი სარგებელი გათავისუფლების და დაივიწყოს ნაკლები რისკი. რა თქმა უნდა, walled ბაღში მიდგომა ქმნის ბევრ კითხვას, რომელსაც უნდა ჰქონდეთ, რა პირობებში, რამდენ ხანს, ვინ უნდა გადაიხადოს, რათა შეინარჩუნოს და პოლიციის walled ბაღში და ა.შ., მაგრამ ეს არ არის დაუძლეველი. ფაქტობრივად, არ არსებობს უკვე მუშაობენ walled ბაღები ადგილი, რომ მკვლევარები შეგიძლიათ ახლავე, როგორიცაა პირადი მონაცემების შემცველი არქივი ინტერ-საუნივერსიტეტო კონსორციუმის პოლიტიკური და სოციალური კვლევითი უნივერსიტეტის Michigan.

ასე რომ, სადაც უნდა მონაცემებს თქვენი კვლევა იქნება განაგრძობს გაზიარების, walled ბაღში, და გაათავისუფლოს და დავივიწყოთ? ეს დამოკიდებული დეტალები თქვენი მონაცემები; მკვლევარებმა უნდა დაბალანსება პატივისცემა პირთა, სარგებლობის, იუსტიციის და კანონის პატივისცემით და საზოგადოებრივი ინტერესი. შეფასებისას შესაბამისი ბალანსი სხვა გადაწყვეტილებები მკვლევარები შეეცდება რჩევა და დამტკიცების IRBs და მონაცემთა გათავისუფლება შეიძლება იყოს მხოლოდ ერთი ნაწილი, რომ პროცესი. სხვა სიტყვებით, მიუხედავად იმისა, რომ ზოგიერთი ადამიანი ფიქრობს მონაცემების გათავისუფლებას უიმედო ეთიკური ჭაობი, ჩვენ უკვე გვაქვს სისტემა, რომელიც დაეხმარება მკვლევარებს დაბალანსება ამ სახის ეთიკური დილემა.

ერთი საბოლოო გზა ვიფიქროთ მონაცემები გაზიარების ანალოგიით. ყოველ წელს მანქანები პასუხისმგებელი ათასი ადამიანი დაიღუპა, მაგრამ ჩვენ არ ცდილობენ აკრძალვის მამოძრავებელი. სინამდვილეში, ასეთი მოწოდება აკრძალვის მართვის აბსურდული იქნება, რადგან მართვის საშუალებას მრავალი საოცარი რამ. უფრო მეტიც, საზოგადოების განათავსებს შეზღუდვები, რომელსაც შეუძლია მართოს (მაგალითად, უნდა იყოს გარკვეული ასაკის, უნდა გავიდა გარკვეული ტესტები) და როგორ შეიძლება მართოს (მაგალითად, ქვეშ სიჩქარის ლიმიტი). საზოგადოება ასევე აქვს ადამიანი დაევალა აღსრულების ამ წესებს (მაგალითად, პოლიცია), და ჩვენ დასაჯოს ადამიანები, რომლებიც დაიჭირეს დარღვევისთვის. ეს იგივე სახის დაბალანსებული აზროვნება, რომ საზოგადოებას მიმართავს მარეგულირებელი მამოძრავებელი შეიძლება ასევე გამოყენებული იქნას მონაცემთა ბაზას. რომ არის, ვიდრე მიღების აბსოლუტისტური თუ საწინააღმდეგო არგუმენტები მონაცემები გაზიარება, მე ვფიქრობ, რომ ყველაზე დიდი სარგებელი მოვა მჭიდროდაა თუ როგორ შეგვიძლია მეტი მონაცემები უფრო უსაფრთხოდ.

დასკვნის სახით, საინფორმაციო რისკი მკვეთრად გაიზარდა, და ეს არის ძალიან ძნელია პროგნოზირება და რაოდენობრივად. აქედან გამომდინარე, ეს არის საუკეთესო, ვივარაუდოთ, რომ ყველა მონაცემი არის პოტენციურად ამოცნობას და პოტენციურად მგრძნობიარე. შემცირდება საინფორმაციო რისკი, ხოლო აკეთებს კვლევის, მკვლევარები შეგიძლიათ შექმნათ და დაიცვას მონაცემთა დაცვის გეგმა. გარდა ამისა, საინფორმაციო რისკი არ უშლის მკვლევარები მონაცემების გაზიარება სხვა მეცნიერები.