6.6.2 ಅಂಡರ್ಸ್ಟಾಂಡಿಂಗ್ ಆಂಡ್ ಮ್ಯಾನೇಜಿಂಗ್ ಮಾಹಿತಿ ಅಪಾಯ

ಮಾಹಿತಿ ಅಪಾಯ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಹೆಚ್ಚಾಗಿ ಅಪಾಯ; ಇದು ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚಾಗಿದೆ; ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕಠಿಣ ಅಪಾಯ.

ಸಾಮಾಜಿಕ ವಯಸ್ಸು ಡಿಜಿಟಲ್ ಸಂಶೋಧನೆಗೆ ಎರಡನೇ ನೈತಿಕ ಸವಾಲು ಮಾಹಿತಿ ಅಪಾಯ, ಮಾಹಿತಿಯ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ ಆಗುವ ಹಾನಿಯನ್ನು ಸಂಭಾವ್ಯತೆ (Council 2014) . ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯ ಬಹಿರಂಗಪಡಿಸುವಿಕೆಯ ರಿಂದ ಮಾಹಿತಿ ಕ್ರೆಡಿಬಿಲಿಟಿ ಆರ್ಥಿಕ ಆಗಿರಬಹುದು (ಉದಾಹರಣೆಗೆ, ಒಂದು ಕೆಲಸ ಕಳೆದುಕೊಳ್ಳುವ), ಸಾಮಾಜಿಕ (ಉದಾಹರಣೆಗೆ, ಕಿರಿಕಿರಿ), ಮನೋವೈಜ್ಞಾನಿಕ (ಉದಾ, ಖಿನ್ನತೆ), ಅಥವಾ ಕ್ರಿಮಿನಲ್ (ಉದಾಹರಣೆಗೆ, ಅಕ್ರಮ ವರ್ತನೆಗೆ ಬಂಧನ). ದುರದೃಷ್ಟವಶಾತ್, ಡಿಜಿಟಲ್ ವಯಸ್ಸು ಮಾಹಿತಿ ಅಪಾಯ ನಾಟಕೀಯವಾಗಿ ಅಲ್ಲಿ ಕೇವಲ ತುಂಬಾ ನಮ್ಮ ವರ್ತನೆಯನ್ನು ಕುರಿತು ಇನ್ನಷ್ಟು ಮಾಹಿತಿ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಮತ್ತು, ಮಾಹಿತಿ ಅಪಾಯ ಭೌತಿಕ ಅಪಾಯ ಅನಲಾಗ್ ವಯಸ್ಸು ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಕಾಳಜಿ, ಎಂದು ಅಪಾಯಗಳನ್ನು ಹೋಲಿಸಿದರೆ ಅರ್ಥ ಮತ್ತು ನಿರ್ವಹಿಸಲು ತುಂಬಾ ಕಷ್ಟ ಸಾಬೀತಾಗಿದೆ. ಡಿಜಿಟಲ್ ವಯಸ್ಸು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡಲು, ವಿದ್ಯುನ್ಮಾನ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು ಕಾಗದದ ಪರಿವರ್ತನೆ ಪರಿಗಣಿಸುತ್ತಾರೆ. ದಾಖಲೆಗಳನ್ನು ಎರಡೂ ರೀತಿಯ ಅಪಾಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ, ಆದರೆ ಭಾರಿ ಪ್ರಮಾಣದ ಅವರು ಅನಧಿಕೃತ ಪಕ್ಷಕ್ಕೆ ಹರಡುವ ಅಥವಾ ಇತರ ದಾಖಲೆಗಳನ್ನು ವಿಲೀನಗೊಂಡಿತು ಏಕೆಂದರೆ ವಿದ್ಯುನ್ಮಾನ ದಾಖಲೆಗಳು ಹೆಚ್ಚು ಅಪಾಯಗಳನ್ನು ರಚಿಸಲು. ಡಿಜಿಟಲ್ ಯುಗದಲ್ಲಿ ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಈಗಾಗಲೇ ಮಾಹಿತಿ ಅಪಾಯ ತೊಂದರೆಗೆ ಅವರು ಸಂಪೂರ್ಣವಾಗಿ ಪ್ರಮಾಣೀಕರಿಸಿ ಮತ್ತು ಅದನ್ನು ನಿರ್ವಹಿಸಲು ಹೇಗೆ ಅರ್ಥವಾಗಲಿಲ್ಲ ಏಕೆಂದರೆ ಭಾಗಶಃ, ಓಡಿದ್ದಾರೆ. ಆದ್ದರಿಂದ, ನಾನು ಮಾಹಿತಿ ಅಪಾಯದ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಉಪಯುಕ್ತ ರೀತಿಯಲ್ಲಿ ನೀಡಲು ಪಡೆಯಲಿದ್ದೇನೆ, ಮತ್ತು ನಂತರ ನಾನು ನೀವು ಮತ್ತು ನಿಮ್ಮ ಸಂಶೋಧನೆಯಲ್ಲಿ ಮಾಹಿತಿ ಅಪಾಯ ನಿರ್ವಹಿಸಿ ಹೇಗೆಂದು ಇತರ ಸಂಶೋಧಕರ ಡೇಟಾ ಬಿಡುಗಡೆ ಕೆಲವು ಸಲಹೆ ನೀಡಲು ಪಡೆಯಲಿದ್ದೇನೆ.

ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಒಂದು ಮಾರ್ಗವಾಗಿದೆ ದತ್ತಾಂಶದ "anonymization" ಆಗಿದೆ. "Anonymization" ಹೆಸರು, ವಿಳಾಸ, ಮತ್ತು ದಶಮಾಂಶ ದೂರವಾಣಿ ಸಂಖ್ಯೆ ಸ್ಪಷ್ಟ ವೈಯಕ್ತಿಕ ಗುರುತಿಸುವಿಕೆಗಳನ್ನು ತೆಗೆದುಹಾಕುವ ಪ್ರಕ್ರಿಯೆ. ಆದಾಗ್ಯೂ, ಈ ಮಾರ್ಗವು ಆಳವಾಗಿ ಮತ್ತು ಮೂಲಭೂತವಾಗಿ ಸೀಮಿತ ಅನೇಕ ಜನರು ಅರ್ಥ ಹೆಚ್ಚು ಕಡಿಮೆ ಪರಿಣಾಮಕಾರಿ, ಮತ್ತು, ಇದು ವಾಸ್ತವವಾಗಿ, ಆಗಿದೆ. ಆ ಕಾರಣಕ್ಕಾಗಿ, ನಾನು ವಿವರಿಸಲು ಬಂದ "anonymization," ನಾನು ಉದ್ಧರಣಾ ಚಿಹ್ನೆಗಳು ನೀವು ನೆನಪಿನಲ್ಲಿ ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿಜವಾದ ಅನಾಮಕತೆಯು ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣಿಸಿಕೊಂಡ ಆದರೆ ಸೃಷ್ಟಿಸುವ ಬಳಸಿ.

"Anonymization" ವೈಫಲ್ಯದ ಒಂದು ಎದ್ದುಕಾಣುವ ಉದಾಹರಣೆಗೆ ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ನ 1990 ಬರುತ್ತದೆ (Sweeney 2002) . ಗುಂಪು ವಿಮೆ ಆಯೋಗ (GIC) ಎಲ್ಲ ರಾಜ್ಯ ನೌಕರರಿಗೆ ಆರೋಗ್ಯ ವಿಮೆ ಖರೀದಿ ಜವಾಬ್ದಾರಿ ಸರ್ಕಾರಿ ಸಂಸ್ಥೆಯಾಯಿತು. ಈ ಕೆಲಸದ ಮೂಲಕ, GIC ರಾಜ್ಯದ ನೌಕರರು ಸಾವಿರಾರು ಬಗ್ಗೆ ವಿವರವಾದ ಆರೋಗ್ಯ ದಾಖಲೆಗಳ ಸಂಗ್ರಹಿಸಿದ. ಆರೋಗ್ಯ ಸುಧಾರಿಸಲು ರೀತಿಯಲ್ಲಿ ಬಗ್ಗೆ ಸಂಶೋಧನೆ ಸ್ಪರ್ ಪ್ರಯತ್ನದಲ್ಲಿ, GIC ಸಂಶೋಧಕರು ಈ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ನಿರ್ಧರಿಸಿದ್ದಾರೆ. ಆದಾಗ್ಯೂ, ಅವರು ತಮ್ಮ ಮಾಹಿತಿ ಎಲ್ಲಾ ಹಂಚಿಕೊಳ್ಳಲು ಇಲ್ಲ; ಬದಲಿಗೆ, ಅವರು ಹೆಸರು ಮತ್ತು ವಿಳಾಸ ಮಾಹಿತಿ ತೆಗೆದು ಇದು "ಅನಾಮಧೇಯ". ಆದಾಗ್ಯೂ, ಅವರು ಇಂತಹ ಜನಸಂಖ್ಯೆ ಮಾಹಿತಿಯನ್ನು (ಪಿನ್ ಕೋಡ್, ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಜನಾಂಗೀಯತೆ, ಮತ್ತು ಕಾಮ) ಹಾಗೂ ವೈದ್ಯಕೀಯ ಮಾಹಿತಿಯನ್ನು (ಭೇಟಿ ಡೇಟಾ, ರೋಗ, ವಿಧಾನ) (ಚಿತ್ರ 6.4) ಎಂದು ಭಾವಿಸಿದ್ದ ಸಂಶೋಧಕರು ಉಪಯುಕ್ತ ಆಗಿರಬಹುದು ಇತರ ಮಾಹಿತಿ ಬಿಟ್ಟು (Ohm 2010) . ದುರದೃಷ್ಟವಶಾತ್, ಈ "anonymization" ಅಲ್ಲ ಡೇಟಾವನ್ನು ರಕ್ಷಿಸಲು ಸಾಕಾಗಿತ್ತು.

ಚಿತ್ರ 6.4: anonymization ನಿಸ್ಸಂಶಯವಾಗಿ ತೆಗೆದು ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ಪ್ರಕ್ರಿಯೆ. ಉದಾಹರಣೆಗೆ, ರಾಜ್ಯದ ನೌಕರರು ವೈದ್ಯಕೀಯ ವಿಮೆ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದಾಗ ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಗುಂಪು ವಿಮೆ ಆಯೋಗ (GIC) ಕಡತಗಳನ್ನು ತೆಗೆದು ಹೆಸರು ಮತ್ತು ವಿಳಾಸ. ಪ್ರಕ್ರಿಯೆ ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣಿಸಿಕೊಂಡ ನಿಜವಾದ ಅನಾಮಧೇಯತೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಆದರೆ ಏಕೆಂದರೆ ನಾನು ಪದ anonymization ಸುಮಾರು ಉಲ್ಲೇಖಗಳು ಬಳಸಿ.

ಚಿತ್ರ 6.4: "anonymization" ನಿಸ್ಸಂಶಯವಾಗಿ ತೆಗೆದು ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ಪ್ರಕ್ರಿಯೆ. ಉದಾಹರಣೆಗೆ, ರಾಜ್ಯದ ನೌಕರರು ವೈದ್ಯಕೀಯ ವಿಮೆ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದಾಗ ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಗುಂಪು ವಿಮೆ ಆಯೋಗ (GIC) ಕಡತಗಳನ್ನು ತೆಗೆದು ಹೆಸರು ಮತ್ತು ವಿಳಾಸ. ಪ್ರಕ್ರಿಯೆ ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣಿಸಿಕೊಂಡ ನಿಜವಾದ ಅನಾಮಧೇಯತೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಆದರೆ ಏಕೆಂದರೆ ನಾನು ಪದ "anonymization" ಸುಮಾರು ಉಲ್ಲೇಖಗಳು ಬಳಸಿ.

GIC "anonymization" ನ್ಯೂನತೆಗಳನ್ನು ವಿವರಿಸಲು, Latanya ಸ್ವೀನೀ ಆಗಿನ ಕೇಂಬ್ರಿಡ್ಜ್, ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಗವರ್ನರ್ ವಿಲಿಯಂ ವೆಲ್ಡ್ ತವರು ನಗರದಿಂದ ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಪಡೆಯಲು $ 20 MIT ಯಲ್ಲಿ ಹಣ ಪದವಿ ವಿದ್ಯಾರ್ಥಿ. ಈ ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಹೆಸರು, ವಿಳಾಸ, ಪಿನ್ ಕೋಡ್, ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಮತ್ತು ಲಿಂಗ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ವಾಸ್ತವವಾಗಿ ವೈದ್ಯಕೀಯ ಡೇಟಾ ಫೈಲ್ ಮತ್ತು ಮತದಾರ ಕಡತ ಹಂಚಿಕೆಯ ಜಾಗ ಜಿಪ್ ಕೋಡ್, ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಮತ್ತು ಲಿಂಗ ಅರ್ಥ ಸ್ವೀನೀ ಅವುಗಳನ್ನು ಲಿಂಕ್ ಎಂದು. ಸ್ವೀನೀ ವೆಲ್ಡ್ ಹುಟ್ಟುಹಬ್ಬ ಜುಲೈ 31, 1945 ಎಂದು ತಿಳಿದಿದ್ದರು, ಮತ್ತು ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಎಂದು ಹುಟ್ಟುಹಬ್ಬದ ಕೇಂಬ್ರಿಡ್ಜ್ ಕೇವಲ ಆರು ಜನರನ್ನು ಒಳಗೊಂಡಿತ್ತು. ಇದಲ್ಲದೆ, ಆ ಆರು ಜನರ, ಕೇವಲ ಮೂರು ಪುರುಷ ಇದ್ದರು. ಮತ್ತು, ಆ ಮೂರು ಪುರುಷರು ಕೇವಲ ಒಂದು ವೆಲ್ಡ್ ನ ಪಿನ್ ಕೋಡ್ ಹಂಚಿಕೊಂಡಿದ್ದಾರೆ. ಹೀಗಾಗಿ, ಮತದಾನದ ಅಂಕಿ ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಲಿಂಗ, ಮತ್ತು ZIP ಕೋಡ್ ವೆಲ್ಡ್ ನ ಸಂಯೋಜನೆಯೊಂದಿಗೆ ವೈದ್ಯಕೀಯ ದತ್ತಾಂಶ ಯಾರಾದರೂ ವಿಲಿಯಂ ವೆಲ್ಡ್ ಎಂದು ತೋರಿಸಿದರು. ಮೂಲಭೂತವಾಗಿ, ಮಾಹಿತಿಯನ್ನು ಈ ಮೂರು ಕಾಯಿಗಳು ಡೇಟಾ ಅವನಿಗೆ ಒಂದು ಅನನ್ಯ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಒದಗಿಸಿದ. ಈ ವಾಸ್ತವವಾಗಿ ಬಳಸಿಕೊಂಡು, ಸ್ವೀನೀ ವೆಲ್ಡ್ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು ಪತ್ತೆ, ಮತ್ತು ತನ್ನ ಸಾಧನೆಯನ್ನು ಅವನಿಗೆ ತಿಳಿಸಲು ಸಾಧ್ಯವಾಯಿತು, ಅವಳು ಅವನ ದಾಖಲೆಗಳ ಪ್ರತಿಯನ್ನು ಮೇಲ್ (Ohm 2010) .

ಚಿತ್ರ 6.5: ಪುನಃ idenification ಅನಾಮಧೇಯ ದತ್ತಾಂಶದ. Latanya ಸ್ವೀನೀ ಗವರ್ನರ್ ವಿಲಿಯಮ್ ವೆಲ್ಡ್ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು (ಸ್ವೀನೀ 2002) ಪಡೆಯುವ ಸಲುವಾಗಿ ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಜೊತೆ ಅನಾಮಧೇಯ ಆರೋಗ್ಯ ದಾಖಲೆಗಳ ಸೇರಿ.

ಚಿತ್ರ 6.5: ಪುನಃ idenification "ಅನಾಮಧೇಯ" ದತ್ತಾಂಶದ. Latanya ಸ್ವೀನೀ ಗವರ್ನರ್ ವಿಲಿಯಮ್ ವೆಲ್ಡ್ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳನ್ನು ಪಡೆಯುವ ಸಲುವಾಗಿ ಮತದಾನದ ದಾಖಲೆಗಳನ್ನು ಜೊತೆ "ಅನಾಮಧೇಯ" ಆರೋಗ್ಯ ದಾಖಲೆಗಳ ಸೇರಿ (Sweeney 2002) .

ಸ್ವೀನೀ ಕೆಲಸ -to ಕಂಪ್ಯೂಟರ್ ಭದ್ರತಾ ಸಮುದಾಯದಿಂದ ಒಂದು ಪದ ಅಳವಡಿಸಿಕೊಳ್ಳಲು ಡಿ-anonymization ದಾಳಿಯ ಮೂಲ ರಚನೆಯನ್ನು ವಿವರಿಸುತ್ತದೆ. ಈ ದಾಳಿಗಳಲ್ಲಿ, ಎರಡು ಡೇಟಾ ಸೆಟ್, ಸ್ವತಃ ಎರಡೂ ಇದು ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯನ್ನು ತಿಳಿಸುತ್ತದೆ, ಕೊಂಡಿಯಾಗಿವೆ, ಮತ್ತು ಈ ಸಂಪರ್ಕ ಮೂಲಕ, ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯನ್ನು ಒಡ್ಡಲಾಗುತ್ತದೆ. ರೀತಿಯಲ್ಲಿ ಈ ಪ್ರಕ್ರಿಯೆ ಸೋಡಾ ಮತ್ತು ವಿನೆಗರ್, ಸುರಕ್ಷಿತ ಸ್ವತಃ ಎರಡು ಪದಾರ್ಥಗಳಾಗಿವೆ ಅಡಿಗೆ, ಒಂದು ಅಸಹ್ಯ ಫಲಿತಾಂಶವನ್ನು ಉತ್ಪಾದಿಸಲು ಸಂಯೋಜಿಸಬಹುದು ರೀತಿಯಲ್ಲಿ ಹೋಲುತ್ತದೆ.

ಸ್ವೀನೀ ಕೆಲಸ, ಮತ್ತು ಇತರ ಸಂಬಂಧಿತ ಕೆಲಸ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ಸಂಶೋಧಕರು ಈಗ ಸಾಮಾನ್ಯವಾಗಿ ಹೆಚ್ಚು ಮಾಹಿತಿ ಎಲ್ಲಾ ಆದ್ದರಿಂದ "ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು" (PII) ತೆಗೆದುಹಾಕಲು (Narayanan and Shmatikov 2010) ಅಷ್ಟೇ ಅಲ್ಲದೇ, ಅನೇಕ ಸಂಶೋಧಕರು ಈಗ ಪ್ರಕ್ರಿಯೆ -during "anonymization." , ಇಂತಹ ಡೇಟಾ ಕೆಲವು ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು, ಹಣಕಾಸು ದಾಖಲೆಗಳ ಪ್ರಕಾರ, ಅಕ್ರಮ ಬಗ್ಗೆ ಪ್ರಶ್ನೆಗಳನ್ನು ಸಮೀಕ್ಷೆ ಉತ್ತರಗಳನ್ನು ನಂತರವೂ ಬಿಡುಗಡೆ ಬಹುಶಃ ತುಂಬಾ ಸೂಕ್ಷ್ಮ ನಡವಳಿಕೆ-ಅರ್ಥ "anonymization." ಆದಾಗ್ಯೂ ನಾನು ಕೆಳಗೆ ವಿವರಿಸಲು ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಅಗತ್ಯವಿದೆ ಎಂದು ಸೂಚಿಸಲು ಮಾಡುತ್ತೇವೆ ಎಂದು ಹೆಚ್ಚು ಇತ್ತೀಚಿನ ಉದಾಹರಣೆಗಳಾಗಿವೆ ಅವರ ಚಿಂತನೆ ಬದಲಾಯಿಸಬಹುದು. ಮೊದಲ ಹಂತವಾಗಿ, ಇದು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಚಿರಪರಿಚಿತವಾಗಿದೆ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಎಂದು ತಿಳಿಯುವುದು ಬುದ್ಧಿವಂತ. ಅರ್ಥಾತ್, ಯೋಜನೆಗಳ ಸಣ್ಣ ಉಪ ಅನ್ವಯಿಸುತ್ತದೆ ಮಾಹಿತಿ ಅಪಾಯ ಆಲೋಚನೆ ಬದಲಿಗೆ, ನಾವು ಅನ್ವಯಿಸುತ್ತದೆ-ಕೆಲವು ಎಲ್ಲಾ ಯೋಜನೆಗಳು ಪದವಿ ಯಾ ಭಾವಿಸುತ್ತಾರೆ ಮಾಡಬೇಕು.

ಈ ಮರು ದೃಷ್ಟಿಕೋನ ಎರಡೂ ಅಂಶಗಳನ್ನು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿ ಸ್ಪಷ್ಟವಾಗಿ ಉಲ್ಲೇಖಿಸಲಾಗಿದೆ. ಅಧ್ಯಾಯ 5 ವಿವರಿಸಿದಂತೆ, ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸುಮಾರು 500,000 ಸದಸ್ಯರು ಒದಗಿಸಿದ 100 ಮಿಲಿಯನ್ ಚಿತ್ರದಲ್ಲಿ ರೇಟಿಂಗ್ ಬಿಡುಗಡೆ, ಮತ್ತು ವಿಶ್ವದಾದ್ಯಂತ ಜನರು ಚಲನಚಿತ್ರಗಳು ಶಿಫಾರಸು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸಾಮರ್ಥ್ಯವನ್ನು ಸುಧಾರಿಸಲು ಕ್ರಮಾವಳಿಗಳು ಸಲ್ಲಿಸಿದ ಅಲ್ಲಿ ಮುಕ್ತ ಕರೆ ಹೊಂದಿತ್ತು. ಡೇಟಾ ಬಿಡುಗಡೆ ಮೊದಲು, ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಅಂತಹ ಹೆಸರುಗಳನ್ನು ಯಾವುದೇ ನಿಸ್ಸಂಶಯವಾಗಿ ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿ ತೆಗೆದುಹಾಕಲಾಗಿದೆ. ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಒಂದು ಹೆಚ್ಚುವರಿ ಹೆಜ್ಜೆ ಹೋಗಿ ಕೆಲವೊಂದು ದಾಖಲೆಗಳು ಸ್ವಲ್ಪ ಪ್ರಕ್ಷುಬ್ಧತೆಗಳು (ಉದಾಹರಣೆಗೆ, 3 ನಕ್ಷತ್ರಗಳು 4 ನಕ್ಷತ್ರಗಳ ಕೆಲವು ರೇಟಿಂಗ್ ಬದಲಾವಣೆ) ಪರಿಚಯಿಸಿತು. ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಶೀಘ್ರದಲ್ಲೇ ಪತ್ತೆ ಆದರೆ, ತಮ್ಮ ಪ್ರಯತ್ನಗಳ ಹೊರತಾಗಿಯೂ, ಡೇಟಾ ಯಾವುದೇ ಮೂಲಕ ಎಂದು ಅನಾಮಧೇಯ ಅರ್ಥ.

ದಶಮಾಂಶ ನಂತರ ಕೇವಲ ಎರಡು ವಾರಗಳ ಬಿಡುಗಡೆ Narayanan and Shmatikov (2008) ಇದು ನಿರ್ದಿಷ್ಟ ಜನರ ಚಿತ್ರ ಆದ್ಯತೆಗಳ ಬಗ್ಗೆ ತಿಳಿಯಲು ಸಾಧ್ಯ ಎಂದು ತೋರಿಸಿದರು. ಅವರ ಮರು ಗುರುತಿನ ದಾಳಿ ಟ್ರಿಕ್ ಸ್ವೀನಿಯ ಹೋಲುತ್ತಿತ್ತು: ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿ ಮತ್ತು ಯಾವುದೇ ನಿಸ್ಸಂಶಯವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿ ಮತ್ತು ಜನರ ಗುರುತನ್ನು ಒಳಗೊಂಡಿರುವ ಒಂದು ಎರಡು ಮಾಹಿತಿಯ ಮೂಲಗಳನ್ನು ಒಂದು ಒಟ್ಟಿಗೆ ವಿಲೀನಗೊಳ್ಳಲು. ಈ ದಶಮಾಂಶ ಮೂಲಗಳ ಪ್ರತಿ ಪ್ರತ್ಯೇಕವಾಗಿ ಸುರಕ್ಷಿತ, ಆದರೆ ಅವರು ಸೇರಿಕೊಂಡಾಗ ವಿಲೀನಗೊಂಡ ದತ್ತಾಂಶ ಮಾಹಿತಿ ಅಪಾಯ ರಚಿಸಬಹುದು. ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾ ಸಂದರ್ಭದಲ್ಲಿ, ಇಲ್ಲಿ ಇದು ಆಗಬಹುದು ಹೇಗೆ. ನನ್ನ ಸಹೋದ್ಯೋಗಿಗಳೊಂದಿಗೆ ಆಕ್ಷನ್ ಮತ್ತು ಹಾಸ್ಯ ಸಿನೆಮಾ ಬಗ್ಗೆ ನನ್ನ ಆಲೋಚನೆಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಆಯ್ಕೆ, ಆದರೆ ನಾನು ಧಾರ್ಮಿಕ ಮತ್ತು ರಾಜಕೀಯ ಸಿನೆಮಾ ಬಗ್ಗೆ ನನ್ನ ಅಭಿಪ್ರಾಯ ಹಂಚಿಕೊಳ್ಳಲು ಬಯಸುತ್ತಾರೆ ಎಂದು ಇಮ್ಯಾಜಿನ್. ನನ್ನ ಸಹ ಕೆಲಸಗಾರರು ನಾನು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡಾಟಾ ನನ್ನ ದಾಖಲೆಗಳನ್ನು ಹುಡುಕಲು ಅವರೊಂದಿಗೆ ಹಂಚಿಕೊಂಡಿದ್ದೇನೆ ಮಾಹಿತಿಯನ್ನು ಬಳಸಿ; ನಾನು ಹಂಚಿಕೊಳ್ಳಲು ಮಾಹಿತಿಯನ್ನು ಕೇವಲ ವಿಲಿಯಂ ವೆಲ್ಡ್ ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಪಿನ್ ಕೋಡ್, ಮತ್ತು ಲೈಂಗಿಕ ಒಂದು ಅನನ್ಯ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಆಗಿರಬಹುದು. ನಂತರ, ಅವರು ಡೇಟಾ ನನ್ನ ಅನನ್ಯ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಹುಡುಕಲು ವೇಳೆ, ಅವರು ನನ್ನ ರೇಟಿಂಗ್ ನಾನು ಹಂಚಿಕೊಳ್ಳಲು ಆಯ್ಕೆ ಅಲ್ಲಿ ಚಲನಚಿತ್ರಗಳು ಎಲ್ಲಾ ಚಲನಚಿತ್ರಗಳು, ಬಗ್ಗೆ ಕಲಿಯಲು. ಒಂದು ವ್ಯಕ್ತಿಯ ಗಮನ ಉದ್ದೇಶಿತ ದಾಳಿ ಈ ರೀತಿಯ ಜೊತೆಗೆ, Narayanan and Shmatikov (2008) ಇದು ವೈಯಕ್ತಿಕ ಮತ್ತು ಚಿತ್ರದ ರೇಟಿಂಗ್ ದತ್ತಾಂಶ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾ ವಿಲೀನಗೊಳಿಸುವ ಮೂಲಕ ಜನರು ಅನೇಕ ಒಳಗೊಂಡ ವಿಶಾಲ ದಾಳಿ -ಒಂದು ಮಾಡಲು ಸಾಧ್ಯ ಎಂದು ತೋರಿಸಿದರು ಕೆಲವು ಜನರು ಇಂಟರ್ನೆಟ್ ಮೂವೀ ಡೇಟಾಬೇಸ್ (IMDb) ಪೋಸ್ಟ್ ಆಯ್ಕೆ. ನಿರ್ದಿಷ್ಟ ವ್ಯಕ್ತಿ ತಮ್ಮ ಚಿತ್ರದ ಸೆಟ್ಗೆ ಅನನ್ಯ ಬೆರಳುಗುರುತು ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಗುರುತಿಸಲು ರೇಟಿಂಗ್ ಬಳಸಬಹುದು.

ಎರಡೂ ಒಂದು ಉದ್ದೇಶಿತ ಅಥವಾ ವಿಶಾಲ ದಾಳಿಯಲ್ಲಿ ಕೂಡ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾ ಮರು ಗುರುತಿಸಬಹುದು, ಇದು ಇನ್ನೂ ಕಡಿಮೆ ಅಪಾಯ ಎಂದು ಕಾಣಿಸಬಹುದು. ಎಲ್ಲಾ ನಂತರ, ಚಲನಚಿತ್ರದಲ್ಲಿ ರೇಟಿಂಗ್ಗಳು ಬಹಳ ಸೂಕ್ಷ್ಮ ತೋರುತ್ತಿಲ್ಲ. ಸಾಮಾನ್ಯವಾಗಿ ನಿಜವಾದ ಎಂದು ಇರಬಹುದು, ದತ್ತಾಂಶ 500,000 ಜನರು ಕೆಲವು, ಚಿತ್ರ ರೇಟಿಂಗ್ ಸಾಕಷ್ಟು ಸೂಕ್ಷ್ಮ ಇರಬಹುದು. ವಾಸ್ತವವಾಗಿ, ಡಿ-anonymization ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ ಒಂದು closeted ಲೆಸ್ಬಿಯನ್ ಮಹಿಳೆ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ವಿರುದ್ಧ ವರ್ಗ-ಆಕ್ಷನ್ ಮೊಕದ್ದಮೆಯಲ್ಲಿ ಸೇರಿದರು. ಇಲ್ಲಿ ಸಮಸ್ಯೆ ತಮ್ಮ ಮೊಕದ್ದಮೆಯನ್ನು ವ್ಯಕ್ತವಾಗಿದ್ದು ಹೇಗೆ (Singel 2009) :

"[ಎಂ] ovie ಮತ್ತು ರೇಟಿಂಗ್ ದಶಮಾಂಶ ಹೆಚ್ಚು ವೈಯಕ್ತಿಕ ಮತ್ತು ಸೂಕ್ಷ್ಮ ಸ್ವರೂಪದ [sic], ಮಾಹಿತಿ ಹೊಂದಿದೆ. ಸದಸ್ಯರ ಚಿತ್ರ ಡೇಟಾ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸದಸ್ಯರ ವೈಯಕ್ತಿಕ ಮತ್ತು / ಅಥವಾ ಲೈಂಗಿಕತೆ, ಮಾನಸಿಕ ಅಸ್ವಸ್ಥತೆಯ ಕುಡಿತದ ಚೇತರಿಕೆ, ಮತ್ತು ಹಿಂಸೆಯನ್ನು ಸಂಭೋಗ, ದೈಹಿಕ ಕಿರುಕುಳ, ಕೌಟುಂಬಿಕ ಹಿಂಸೆ, ವ್ಯಭಿಚಾರ, ಮತ್ತು ಅತ್ಯಾಚಾರ ಸೇರಿದಂತೆ ಹಲವು ಹೆಚ್ಚು ವೈಯಕ್ತಿಕ ಸಮಸ್ಯೆಗಳು, ಹೋರಾಟಗಳು ತೆರೆದಿಡುತ್ತದೆ. "

ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿ ಡೇಟಾ ಡಿ anonymization ವಿವರಿಸುತ್ತದೆ ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಚಿರಪರಿಚಿತವಾಗಿದೆ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಎಂದು ಎರಡೂ. ಈ ಹಂತದಲ್ಲಿ, ನೀವು ಈ ಮಾತ್ರ ವ್ಯಕ್ತಿಗಳ ಬಗ್ಗೆ ಎಂದು ಇಲ್ಲದ ಡೇಟಾ ಅನ್ವಯಿಸುತ್ತದೆ ಎಂದು ಭಾವಿಸುತ್ತೇನೆ ಇರಬಹುದು. ಆಶ್ಚರ್ಯಕರವಾಗಿ, ಆ ಸಂದರ್ಭದಲ್ಲಿ ಅಲ್ಲ. ಮಾಹಿತಿ ಲಾ ಸ್ವಾತಂತ್ರ್ಯ ಮನವಿಯನ್ನು ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ನ್ಯೂಯಾರ್ಕ್ ನಗರ ಸರಕಾರ ನ್ಯೂಯಾರ್ಕ್ ಪ್ರತಿ ಟ್ಯಾಕ್ಸಿ ಸವಾರಿಯ ದಾಖಲೆಗಳನ್ನು 2013 ರಲ್ಲಿ, ಎತ್ತಿಕೊಳ್ಳುವ ಸೇರಿದಂತೆ ಬಿಡುಗಡೆ ಅಧ್ಯಾಯ 2 ಬಾರಿ, ಸ್ಥಳಗಳು, ಮತ್ತು ದರದ ಪ್ರಮಾಣದ (ಮರುಸ್ಥಾಪನೆ ವಸೂಲಿ Farber (2015) ಕಾರ್ಮಿಕ ಅರ್ಥವ್ಯವಸ್ಥೆಯಲ್ಲಿ ಪ್ರಮುಖ ಸಿದ್ಧಾಂತಗಳು) ಪರೀಕ್ಷಿಸಲು ಈ ದತ್ತಾಂಶವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಇದು ಜನರ ಬಗ್ಗೆ ಮಾಹಿತಿ ಎಂದು ತೋರುತ್ತದೆ ಏಕೆಂದರೆ ಟ್ಯಾಕ್ಸಿ ಪ್ರವಾಸಗಳ ಕುರಿತು ಈ ಡೇಟಾವನ್ನು ಸೌಮ್ಯ ತೋರುತ್ತದೆ ಇರಬಹುದು, ಆಂಟನಿ Tockar ಈ ಟ್ಯಾಕ್ಸಿ ದತ್ತಾಂಶ ವಾಸ್ತವವಾಗಿ ಜನರು ಬಗ್ಗೆ ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿ ಸಾಕಷ್ಟು ಒಳಗೊಂಡಿರುವ ಅರಿವಾಯಿತು. ಸ್ಪಷ್ಟಪಡಿಸಲು, ಅವರು ತಮ್ಮ ಡ್ರಾಪ್ ಆಫ್ ಸ್ಥಳಗಳಲ್ಲಿ ಹಸ್ಲರ್ ಕ್ಲಬ್ ದೊಡ್ಡ ಸ್ಟ್ರಿಪ್ ಹೊಸ ಮಧ್ಯರಾತ್ರಿಯಿಂದ ಪೂರ್ವಾಹ್ನದಿಂದ 6 ಗಂಟೆ ಪೂರ್ವಾಹ್ನದವರೆಗೆ ನಂತರ ಯಾರ್ಕ್ ನಡುವೆ ಕ್ಲಬ್ ಪ್ರಾರಂಭವಾಗುವ ಕಂಡು ಪ್ರಯಾಣದಲ್ಲೂ ನೋಡಿದ್ದಾರೆ. ಈ ಹುಡುಕಾಟ ಬಹಿರಂಗ ಇನ್ ಮೂಲಭೂತವಾಗಿ ಒಂದು ಹಸ್ಲರ್ ಕ್ಲಬ್ ಆಗಾಗ್ಗೆ ಬರುವ ಕೆಲವು ಜನರ ವಿಳಾಸಗಳ ಪಟ್ಟಿಯನ್ನು (Tockar 2014) . ಇದು ದಶಮಾಂಶ ಬಿಡುಗಡೆ ನಗರದಲ್ಲಿ ಸರ್ಕಾರದ ಮನಸ್ಸಿನಲ್ಲಿ ಈ ಎಂದು ಕಲ್ಪಿಸುವುದು ಕಷ್ಟ. ವಾಸ್ತವವಾಗಿ, ಈ ರೀತಿಯ ತಂತ್ರವನ್ನೇ ನಗರ ದವಾಖಾನೆ, ಸರ್ಕಾರಿ ಕಟ್ಟಡ ಅಥವಾ ಒಂದು ಧಾರ್ಮಿಕ ಸಂಸ್ಥೆ ಯಾವುದೇ ಸ್ಥಳದಲ್ಲಿ ಭೇಟಿ ಜನರ ಮನೆ ವಿಳಾಸಗಳನ್ನು ಹುಡುಕಲು ಬಳಸಬಹುದು.

ಯಾವುದೇ ರೀತಿಯಾದ ಮೂಲಕ ಈ ಎರಡು ಪ್ರಕರಣಗಳಲ್ಲಿ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿ ಮತ್ತು ತುಲನಾತ್ಮಕವಾಗಿ ನುರಿತ ಜನರು ಸರಿಯಾಗಿ ಅವರು ಬಿಡುಗಡೆ ಇದರಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಮಾಹಿತಿ ಅಪಾಯ ಅಂದಾಜು ವಿಫಲವಾಗಿದೆ ಎಂದು ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿ ಟ್ಯಾಕ್ಸಿ ಡೇಟಾ ಪ್ರದರ್ಶನ, ಮತ್ತು ಈ ಸಂದರ್ಭಗಳಲ್ಲಿ (Barbaro and Zeller Jr 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . ಇದಲ್ಲದೆ, ಈ ಸಂದರ್ಭಗಳಲ್ಲಿ ಅನೇಕ ಸಮಸ್ಯಾತ್ಮಕ ಡೇಟಾ ಇನ್ನೂ ಮುಕ್ತವಾಗಿ ಲಭ್ಯವಿರುವ ಇದುವರೆಗೆ ಡೇಟಾ ಬಿಡುಗಡೆ ಬಿಚ್ಚುವುದು ತೊಂದರೆ ಸೂಚಿಸುವ ಆಗಿದೆ. ಸಾಮೂಹಿಕವಾಗಿ ಈ ಉದಾಹರಣೆಗಳು-ಹಾಗೂ ಪ್ರಮುಖ ತೀರ್ಮಾನಕ್ಕೆ ಗೌಪ್ಯತೆ ಪಾತ್ರಗಳ ಕುರಿತು ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನ. ಸಂಶೋಧಕರು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಚಿರಪರಿಚಿತವಾಗಿದೆ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಎಂದು ತಿಳಿಯುವುದು ಬೇಕು.

ದುರದೃಷ್ಟವಶಾತ್, ವಾಸ್ತವವಾಗಿ ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಚಿರಪರಿಚಿತವಾಗಿದೆ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಸೂಕ್ಷ್ಮ ಎಂದು ಯಾವುದೇ ಸರಳ ಪರಿಹಾರವಿದೆ. ಆದಾಗ್ಯೂ, ನೀವು ದಶಮಾಂಶ ಕೆಲಸ ಮಾಡುವಾಗ ಮಾಹಿತಿಯನ್ನು ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಒಂದು ರೀತಿಯಲ್ಲಿ ರಚಿಸಲು ಮತ್ತು ಡೇಟಾ ರಕ್ಷಣೆ ಯೋಜನೆಯನ್ನು ಅನುಸರಿಸಲು ಆಗಿದೆ. ಈ ಯೋಜನೆಯನ್ನು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಸೋರಿಕೆ ಮತ್ತು ಸೋರಿಕೆ ಹೇಗೋ ಉಂಟಾದರೆ ಹಾನಿ ಕಡಿಮೆಯಾಗುತ್ತದೆ ಎಂದು ಅವಕಾಶ ಕಡಿಮೆಯಾಗುತ್ತದೆ ಕಾಣಿಸುತ್ತದೆ. ಗೂಢಲಿಪೀಕರಣ ರೂಪ ಬಳಸಲು ಉದಾಹರಣೆಗೆ ದಶಮಾಂಶ ರಕ್ಷಣೆ ಯೋಜನೆಗಳನ್ನು ನಿಶ್ಚಿತಗಳು, ಕಾಲಾನಂತರದಲ್ಲಿ ಬದಲಾಗುತ್ತವೆ, ಆದರೆ ಯುಕೆ ಡೇಟಾ ಸೇವೆಗಳು ಪ್ರಯೋಜನಕಾರಿಯಾಗಿ ಅವರು 5 ಜನರ ಕೈಯಲ್ಲಿ ಕರೆ 5 ವಿಭಾಗಗಳು ಒಂದು ದತ್ತಾಂಶ ರಕ್ಷಣೆ ಯೋಜನೆ ಅಂಶಗಳನ್ನು ಆಯೋಜಿಸುತ್ತದೆ ಕಾಣಿಸುತ್ತದೆ: ಸುರಕ್ಷಿತ ಯೋಜನೆಗಳು, ಸುರಕ್ಷಿತ ಜನರು ಸುರಕ್ಷಿತ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು, ಸುರಕ್ಷಿತ ಡೇಟಾ, ಮತ್ತು ಸುರಕ್ಷಿತ ಉತ್ಪನ್ನಗಳೆಂದರೆ (ಟೇಬಲ್ 6.2) (Desai, Ritchie, and Welpton 2016) . ಐದು ಜನರ ಕೈಯಲ್ಲಿ ಯಾವುದೇ ಪ್ರತ್ಯೇಕವಾಗಿ ಪರಿಪೂರ್ಣ ರಕ್ಷಣೆಯನ್ನು. ಆದರೆ, ಒಟ್ಟಿಗೆ ಅವರು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಎಂದು ಅಂಶಗಳ ಪ್ರಬಲ ಸೆಟ್ ರೂಪಿಸುತ್ತವೆ.

ಟೇಬಲ್ 6.2: 5 ಜನರ ಕೈಯಲ್ಲಿ ವಿನ್ಯಾಸ ಮತ್ತು ಡೇಟಾ ರಕ್ಷಣೆ ಯೋಜನೆ ನಿರ್ವಹಿಸುವುದಕ್ಕಾಗಿ ತತ್ವಗಳನ್ನು (Desai, Ritchie, and Welpton 2016) .
ಸುರಕ್ಷಿತ ಕ್ರಿಯೆ
ಸುರಕ್ಷಿತ ಯೋಜನೆಗಳು ನೈತಿಕ ಎಂದು ಆ ದತ್ತಾಂಶ ಯೋಜನೆಗಳು ಸೀಮಿತಗೊಳಿಸುತ್ತದೆ
ಸುರಕ್ಷಿತ ಜನರು ಪ್ರವೇಶಿಸಬಹುದು ದತ್ತಾಂಶ ವಿಶ್ವಾಸಾರ್ಹವಾಗುತ್ತದೆ ಜನರಿಗೆ ನಿರ್ಬಂಧಿಸಲಾಗುತ್ತದೆ (ಉದಾಹರಣೆಗೆ, ಜನರು ಒಳಗಾದ ನೈತಿಕ ತರಬೇತಿ)
ಸುರಕ್ಷಿತ ಡೇಟಾ ಡೇಟಾ ಡಿ ಗುರುತಿಸಿ ಸಾಧ್ಯವಾದಷ್ಟು ಮಟ್ಟಿಗೆ ಮೌಲ್ಯಮಾಪನ
ಸುರಕ್ಷಿತ ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಡೇಟಾ ಸೂಕ್ತ ದೈಹಿಕ (ಉದಾಹರಣೆಗೆ, ಕೊಠಡಿ ಲಾಕ್) ಮತ್ತು ತಂತ್ರಾಂಶ (ಉದಾ, ಪಾಸ್ವರ್ಡ್ ರಕ್ಷಣೆ, ಎನ್ಕ್ರಿಪ್ಟ್) ರಕ್ಷಿಸುವುದಕ್ಕಾಗಿ, ಕಂಪ್ಯೂಟರ್ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ
ಸುರಕ್ಷಿತ ಔಟ್ಪುಟ್ ಸಂಶೋಧನಾ ಫಲಿತಾಂಶಕ್ಕೆ ಆಕಸ್ಮಿಕವಾಗಿ ಖಾಸಗಿತನದ ಬಹಿರಂಗಕ್ಕೂ ತಡೆಗಟ್ಟಲು ವಿಮರ್ಶೆ ಇದೆ

ನೀವು ಅದನ್ನು ಬಳಸಿಕೊಂಡು ಸಹ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ರಕ್ಷಿಸುವ ಜೊತೆಗೆ, ಮಾಹಿತಿ ಅಪಾಯ ವಿಶೇಷವಾಗಿ ಪ್ರಧಾನ ಅಲ್ಲಿ ಸಂಶೋಧನಾ ಪ್ರಕ್ರಿಯೆಯ ಒಂದು ಹೆಜ್ಜೆ ಇತರ ಸಂಶೋಧಕರು ಡೇಟಾ ಹಂಚಿಕೊಳ್ಳುತ್ತಿದ್ದಾರೆ. ವಿಜ್ಞಾನಿಗಳ ನಡುವೆ ಮಾಹಿತಿ ಹಂಚಿಕೆ ವೈಜ್ಞಾನಿಕ ಪ್ರಯತ್ನದ ಒಂದು ಕೋರ್ ಮೌಲ್ಯವನ್ನು ಹೊಂದಿದೆ, ಮತ್ತು ಇದು ಬಹಳ ಸೌಲಭ್ಯಗಳನ್ನು ಜ್ಞಾನದ ಬೆಳವಣಿಗೆಯು. ಇಲ್ಲಿ ಕಾಮನ್ಸ್ UK ಹೌಸ್ ಆಫ್ ದಶಮಾಂಶ ಹಂಚಿಕೆ ಪ್ರಾಮುಖ್ಯತೆಯನ್ನು ವಿವರಿಸಿದ್ದಾರೆ ಹೇಗೆ:

ಸಂಶೋಧಕರು ಸಂತಾನೋತ್ಪತ್ತಿ ಪರಿಶೀಲಿಸಲು ಮತ್ತು ಸಾಹಿತ್ಯದಲ್ಲಿ ವರದಿ ಎಂದು ಫಲಿತಾಂಶಗಳಲ್ಲಿ ನಿರ್ಮಿಸಲು ವೇಳೆ "ದತ್ತಾಂಶಕ್ಕೆ ಪ್ರವೇಶವು ಮೂಲಭೂತವಾಗಿದೆ. ಕಲ್ಪನೆಯೊಂದಿಗೆ ಬಲವಾದ ಕಾರಣ ಇಲ್ಲದಿದ್ದರೆ ಹೊರತು, ದಶಮಾಂಶ ಸಂಪೂರ್ಣ ವಿವರ, ತೆಗೆದುಹಾಕಿ ಸಾರ್ವಜನಿಕರಿಗೆ ಲಭ್ಯವಾಗುವಂತೆ ಇರಬೇಕು. ಎಲ್ಲಾ ಸಾರ್ವಜನಿಕವಾಗಿ ಹಣ ಸಂಶೋಧನೆ ಸಂಬಂಧಿತವಾದ, ದಶಮಾಂಶ ಮಾಡಬೇಕು ವ್ಯಾಪಕವಾಗಿ ಮತ್ತು ಮುಕ್ತವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಅಲ್ಲಿ ಈ ತತ್ವ ಸಾಲಿನಲ್ಲಿರುವ. " (Molloy 2011)

ಇದು ಮತ್ತೊಂದು ಸಂಶೋಧಕ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಮೂಲಕ ನೀವು ಮಾಹಿತಿ ಅಪಾಯ ನಿಮ್ಮ ಭಾಗವಹಿಸುವವರಿಗೆ ಹೆಚ್ಚಿಸುವ. ಹೀಗಾಗಿ, ಇದು ತಮ್ಮ ಹಂಚಿಕೊಳ್ಳಲು ಬಯಸುವ ಡೇಟಾ ಅಥವಾ ತಮ್ಮ ಹಂಚ ಯಾರು ಸಂಶೋಧಕರು ಮೂಲಭೂತ ಒತ್ತಡ ಡೇಟಾ ಎದುರಿಸುತ್ತಿರುವ ಎಂದು ಕಾಣಬಹುದು. ಒಂದೆಡೆ ಮೂಲ ಸಂಶೋಧನೆ ಸಾರ್ವಜನಿಕವಾಗಿ ಹಣ ವಿಶೇಷವಾಗಿ, ಇತರ ವಿಜ್ಞಾನಿಗಳು ತಮ್ಮ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ನೈತಿಕ ಜವಾಬ್ದಾರಿ. ಇನ್ನೂ, ಅದೇ ಸಮಯದಲ್ಲಿ, ಸಂಶೋಧಕರು ಕಡಿಮೆ ಒಂದು ನೈತಿಕ ಬಾಧ್ಯತೆ, ಸಾಧ್ಯವಾದಷ್ಟು, ತಮ್ಮ ಭಾಗವಹಿಸುವವರಿಗೆ ಮಾಹಿತಿ ಅಪಾಯ.

ಅದೃಷ್ಟವಶಾತ್, ಈ ಸಂದಿಗ್ಧತೆ ಅಲ್ಲ ಕಾಣುವ ತೀವ್ರವಾಗಿರುತ್ತದೆ. ಇದು ಯಾವುದೇ ಮಾಹಿತಿ ಹಂಚಿಕೆ ಬಿಡುಗಡೆ ಮತ್ತು ಮರೆಯಲು ಡೇಟಾ "ಅನಾಮಧೇಯ" ಅಲ್ಲಿ ಮತ್ತು ಪ್ರವೇಶಿಸಲು ಯಾರಾದರೂ ಪೋಸ್ಟ್ ಅಖಂಡವಾದ ಜೊತೆಗೆ ಹಂಚಿಕೊಳ್ಳಲು ಮಾಹಿತಿಯನ್ನು (ಚಿತ್ರ 6.6) ನಗರದ ಮುಖ್ಯ. ಈ ತೀವ್ರ ಸ್ಥಾನಗಳನ್ನು ಎರಡೂ ಅಪಾಯಗಳು ಮತ್ತು ಲಾಭಗಳಿವೆ. ಅಂದರೆ, ಇದು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಅಲ್ಲ ಅತ್ಯಂತ ನೈತಿಕ ಕೆಲಸವಲ್ಲ; ಅಂತಹ ಮಾರ್ಗವನ್ನು ಸಮಾಜಕ್ಕೆ ಅನೇಕ ಸಂಭಾವ್ಯ ಪ್ರಯೋಜನಗಳನ್ನು ನಿವಾರಿಸುತ್ತದೆ. ಹಿಂದಿರುಗುತ್ತಿದ್ದೀರಾ ಟೇಸ್ಟ್ ಗೆ, ಟೈಸ್, ಮತ್ತು ಸಮಯ, ಹಿಂದಿನ ಅಧ್ಯಾಯದಲ್ಲಿ ಚರ್ಚಿಸಲಾಗಿದೆ ಉದಾಹರಣೆ ಮಾತ್ರ ಸಾಧ್ಯ ಕ್ರೆಡಿಬಿಲಿಟಿ ಗಮನ ಮತ್ತು ಸಂಭಾವ್ಯ ಪ್ರಯೋಜನಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸಿ ಡೇಟಾ ಬಿಡುಗಡೆ ವಿರುದ್ಧ ವಾದಗಳನ್ನು ಏಕಪಕ್ಷೀಯ ವಿಪರೀತ ಇವೆ; ನಾನು ಅನಿಶ್ಚಿತತೆ (ವಿಭಾಗ 6.6.4) ಮುಖಕ್ಕೆ ನಿರ್ಧಾರಗಳಿಗೆ ಬಗ್ಗೆ ಸಲಹೆ ನೀಡಲು ಕೆಳಗೆ ಹೆಚ್ಚಿನ ವಿವರ ಈ ಏಕಪಕ್ಷೀಯ ವಿಪರೀತ ರಕ್ಷಣಾತ್ಮಕ ವಿಧಾನ ಸಮಸ್ಯೆಗಳನ್ನು ವಿವರಿಸಲು ಮಾಡುತ್ತೇವೆ.

ಚಿತ್ರ 6.6: ಡೇಟಾ ಬಿಡುಗಡೆ ತಂತ್ರಗಳನ್ನು ಅಖಂಡವಾದ ಜೊತೆಗೆ ಬೀಳಬಹುದು. ಅಲ್ಲಿ ನೀವು ಇರಬೇಕು ಈ ಅನಂತ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನಿರ್ದಿಷ್ಟ ವಿವರಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ ಜೊತೆಗೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಮೂರನೇ ಪಕ್ಷದ ವಿಮರ್ಶೆ ನೀವು ಅಪಾಯದ ಸರಿಯಾದ ಸಮತೋಲನ ಮತ್ತು ಲಾಭ ನಿಮ್ಮ ಸಂದರ್ಭದಲ್ಲಿ ನಿರ್ಧರಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು.

ಚಿತ್ರ 6.6: ಡೇಟಾ ಬಿಡುಗಡೆ ತಂತ್ರಗಳನ್ನು ಅಖಂಡವಾದ ಜೊತೆಗೆ ಬೀಳಬಹುದು. ಅಲ್ಲಿ ನೀವು ಇರಬೇಕು ಈ ಅನಂತ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನಿರ್ದಿಷ್ಟ ವಿವರಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ ಜೊತೆಗೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಮೂರನೇ ಪಕ್ಷದ ವಿಮರ್ಶೆ ನೀವು ಅಪಾಯದ ಸರಿಯಾದ ಸಮತೋಲನ ಮತ್ತು ಲಾಭ ನಿಮ್ಮ ಸಂದರ್ಭದಲ್ಲಿ ನಿರ್ಧರಿಸಲು ಸಹಾಯ ಮಾಡಬಹುದು.

ಇದಲ್ಲದೆ, ಈ ಎರಡು ಪ್ರಕರಣಗಳಲ್ಲಿ ನಡುವೆ ನಾನು ಡೇಟಾ ಕೆಲವು ಮಾನದಂಡಗಳನ್ನು ಮತ್ತು ಕೆಲವು ನಿಯಮಗಳನ್ನು ಬದ್ಧರಾಗಿರಲು ಒಪ್ಪುತ್ತೀರಿ ಜನರ ಹಂಚಿಕೊಂಡಿದ್ದಾರೆ ಅಲ್ಲಿ ವಾಲ್ ಗಾರ್ಡನ್ ವಿಧಾನ ಎಂಬ ಮಾಡುತ್ತೇವೆ ಏನು (ಉದಾಹರಣೆಗೆ, ಒಂದು ಸಮಿತಿ ರಿಂದ ಮೇಲ್ವಿಚಾರಣೆ ಮತ್ತು ಮಾಹಿತಿ ಸಂರಕ್ಷಣೆ ಯೋಜನೆ) . ಈ ವಾಲ್ಡ್ ಗಾರ್ಡನ್ ವಿಧಾನ ಬಿಡುಗಡೆಯ ಲಾಭಗಳು ಅನೇಕ ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಕಡಿಮೆ ಅಪಾಯ ಮರೆಯಬೇಡಿ. ಸಹಜವಾಗಿ, ವಾಲ್ ಗಾರ್ಡನ್ ವಿಧಾನ ಅನೇಕ ಪ್ರಶ್ನೆಗಳನ್ನು-ಯಾರು ಪ್ರವೇಶ ಇರಬೇಕು, ಯಾವ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ, ಎಷ್ಟು ನಿರ್ವಹಿಸಲು ಮತ್ತು ವಾಲ್ಡ್ ಗಾರ್ಡನ್ ರಕ್ಷಣೆ ಮಾಡಲು ಪಾವತಿಸಬೇಕೆಂಬ ಯಾರು ಇತ್ಯಾದಿ ಆದರೆ ಈ ದುಸ್ತರ ಅಲ್ಲ ಸೃಷ್ಟಿಸುತ್ತದೆ. ವಾಸ್ತವವಾಗಿ, ಈಗಾಗಲೇ ಸಂಶೋಧಕರು ಡೇಟಾ ಮಿಚಿಗನ್ ವಿಶ್ವವಿದ್ಯಾಲಯದಲ್ಲಿ ರಾಜಕೀಯ ಮತ್ತು ಸಾಮಾಜಿಕ ಸಂಶೋಧನಾ ಅಂತರ ವಿಶ್ವವಿದ್ಯಾಲಯ ಒಕ್ಕೂಟ ಆರ್ಕೈವ್, ಇದೀಗ ಬಳಸಬಹುದಾದ ಸ್ಥಳದಲ್ಲಿ ಗೋಡೆಯ ತೋಟಗಳಲ್ಲಿ ಕೆಲಸ.

ಆದ್ದರಿಂದ, ಅಲ್ಲಿ ನಿಮ್ಮ ಅಧ್ಯಯನ ದತ್ತಾಂಶವನ್ನು ಯಾವುದೇ ಹಂಚಿಕೆ, ವಾಲ್ಡ್ ಗಾರ್ಡನ್ ಆಫ್ ಅನಂತ ಮೇಲೆ, ಮತ್ತು ಬಿಡುಗಡೆ ಮತ್ತು ಮರೆಯಲು? ಇದು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ವಿವರಗಳನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ; ಸಂಶೋಧಕರು ಕಾನೂನು ಮತ್ತು ಸಾರ್ವಜನಿಕ ಆಸಕ್ತಿಗೆ ವ್ಯಕ್ತಿಗಳು, ಲಾಭಕಾರಕತೆ, ಜಸ್ಟೀಸ್ ಗೌರವ ಮತ್ತು ಗೌರವವನ್ನು ಸಮತೋಲನ ಮಾಡಬೇಕು. ಇತರ ನಿರ್ಧಾರಗಳನ್ನು ಸರಿಯಾದ ಸಮತೋಲನ ಪರಿಶೀಲಿಸುವಾಗ ಸಂಶೋಧಕರು ಸಲಹೆ ಮತ್ತು IRBs ಅನುಮೋದನೆ ಹುಡುಕುವುದು, ಮತ್ತು ದತ್ತಾಂಶ ಬಿಡುಗಡೆ ಪ್ರಕ್ರಿಯೆಯ ಮತ್ತೊಂದು ಭಾಗವಾಗಬಹುದು. ಅರ್ಥಾತ್, ಕೆಲವು ಜನರು ಒಂದು ಆಶಾರಹಿತ ನೈತಿಕ ವಿರುದ್ಧ ನಡೆಸಿದ ದಶಮಾಂಶ ಬಿಡುಗಡೆಯ ಭಾವಿಸುತ್ತೇನೆ ಆದರೂ, ನಾವು ಈಗಾಗಲೇ ಸಂಶೋಧಕರು ನೈತಿಕ ಇಕ್ಕಟ್ಟುಗಳು ಈ ರೀತಿಯ ಸಮತೋಲನ ಸಹಾಯ ಸ್ಥಳದಲ್ಲಿ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಹೊಂದಿವೆ.

ಮಾಹಿತಿ ಹಂಚಿಕೆ ಬಗ್ಗೆ ಒಂದು ಅಂತಿಮ ರೀತಿಯಲ್ಲಿ ಸಾದೃಶ್ಯದ ಮೂಲಕ. ಪ್ರತಿ ವರ್ಷ ಕಾರುಗಳು ಸಾವುಗಳು ಸಾವಿರಾರು ಹೊಣೆ, ಆದರೆ ನಾವು ಚಾಲನೆ ನಿಷೇಧಿಸುವ ಪ್ರಯತ್ನ ಮಾಡುವುದಿಲ್ಲ. ಏಕೆಂದರೆ ಚಾಲನೆ ಅನೇಕ ಅದ್ಭುತ ವಿಷಯಗಳನ್ನು ಶಕ್ತಗೊಳಿಸುತ್ತದೆ ವಾಸ್ತವವಾಗಿ, ಚಾಲನೆಯಿಂದ ನಿಷೇಧಿಸಲಾಯಿತು ಇಂತಹ ಕರೆ ಅಸಂಬದ್ಧ ಎಂದು. ಬದಲಿಗೆ, ಸಮಾಜದ ಚಾಲನೆ ಮಾಡುವ ನಿರ್ಬಂಧಗಳನ್ನು ವಿಧಿಸುತ್ತದೆಯಾದರೂ (ಉದಾಹರಣೆಗೆ, ಕೆಲವು ವಯಸ್ಸಿನ ಅಗತ್ಯವಿದೆ, ಕೆಲವು ಪರೀಕ್ಷೆಗಳನ್ನು ಪಾಸು ಮಾಡಬೇಕು) ಮತ್ತು ಹೇಗೆ (ವೇಗದ ಮಿತಿ ಅಡಿಯಲ್ಲಿ, ಉದಾ) ಒದಗಿಸಬಹುದು. ಸೊಸೈಟಿಯು ಈ ನಿಯಮಗಳನ್ನು (ಉದಾಹರಣೆಗೆ, ಪೊಲೀಸ್) ಒತ್ತಾಯ ವಹಿಸಲಾಯಿತು ಜನರು ಹೊಂದಿದೆ, ಮತ್ತು ನಾವು ಅವುಗಳನ್ನು ಉಲ್ಲಂಘಿಸಿದ ಹಿಡಿಯುತ್ತಾರೆ ಜನರಿಗೆ ಶಿಕ್ಷೆ. ಸಮತೋಲಿತ ಚಿಂತನೆಯ ಇದೇ ರೀತಿಯ ಸಮಾಜದ ಚಾಲನೆ ನಿಯಂತ್ರಿಸುವ ಅನ್ವಯಿಸುತ್ತದೆ ದತ್ತಾಂಶ ಹಂಚಿಕೆ ಅನ್ವಯಿಸಬಹುದು. ಬದಲಿಗೆ ಅಥವಾ ಮಾಹಿತಿ ಹಂಚಿಕೆ ವಿರುದ್ಧ ಪರಿಪೂರ್ಣ ವಾದಗಳು ಮಾಡುವುದಕ್ಕಿಂತ, ನಾನು ಅತಿದೊಡ್ಡ ಪ್ರಯೋಜನ ಹೇಗೆ ನಾವು ಹೆಚ್ಚು ಸುರಕ್ಷಿತವಾಗಿ ಹೆಚ್ಚು ಮಾಹಿತಿ ಹಂಚಿಕೊಳ್ಳಬಹುದು ಕುರಿತಾಗಿ ಬರುತ್ತದೆ ಭಾವಿಸುತ್ತೇನೆ, ಆಗಿದೆ.

ತೀರ್ಮಾನಿಸಲು, ಮಾಹಿತಿ ಅಪಾಯ ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚಾಗಿದೆ, ಮತ್ತು ಇದು ಊಹಿಸಲು ಮತ್ತು ದರ ನಿರ್ಧಾರ ಬಹಳ ಕಷ್ಟ. ಆದ್ದರಿಂದ, ಇದು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮತ್ತು ಸಂಭಾವ್ಯ ಸೂಕ್ಷ್ಮ ಎಂದು ತಿಳಿಯುವುದು ಉತ್ತಮ. ಸಂಶೋಧನೆ ಮಾಡುವ ಸಂದರ್ಭದಲ್ಲಿ ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಸಂಶೋಧಕರು ರಚಿಸಲು ಮತ್ತು ಡೇಟಾ ರಕ್ಷಣೆ ಯೋಜನೆ ಅನುಸರಿಸಬಹುದು. ಇದಲ್ಲದೆ, ಮಾಹಿತಿ ಅಪಾಯ ಇತರ ವಿಜ್ಞಾನಿಗಳೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಹಂಚುವುದನ್ನು ಸಂಶೋಧಕರು ತಡೆಯುವುದಿಲ್ಲ.