6.6.2 ಅಂಡರ್ಸ್ಟಾಂಡಿಂಗ್ ಆಂಡ್ ಮ್ಯಾನೇಜಿಂಗ್ ಮಾಹಿತಿ ಅಪಾಯ

ಈ ಅನುವಾದ ಒಂದು ಕಂಪ್ಯೂಟರ್ ರಚಿಸಲಾಗಿದೆ. ×

6.6.2 ಅಂಡರ್ಸ್ಟಾಂಡಿಂಗ್ ಆಂಡ್ ಮ್ಯಾನೇಜಿಂಗ್ ಮಾಹಿತಿ ಅಪಾಯ

ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಸಾಮಾನ್ಯ ಅಪಾಯವು ಅಪಾಯಕಾರಿ; ಇದು ನಾಟಕೀಯವಾಗಿ ಹೆಚ್ಚಾಗಿದೆ; ಮತ್ತು ಇದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಕಠಿಣ ಅಪಾಯವಾಗಿದೆ.

ಡಿಜಿಟಲ್-ವಯಸ್ಸು ಸಂಶೋಧನೆಗೆ ಎರಡನೇ ನೈತಿಕ ಸವಾಲು ಮಾಹಿತಿಯ ಅಪಾಯ , ಮಾಹಿತಿಯ ಬಹಿರಂಗಪಡಿಸುವಿಕೆ (National Research Council 2014) ನಿಂದ ಹಾನಿಯಾಗುವ ಸಾಮರ್ಥ್ಯ. ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯ ಬಹಿರಂಗಪಡಿಸುವಿಕೆಯಿಂದ ಮಾಹಿತಿ ಹಾನಿಯು ಆರ್ಥಿಕವಾಗಿರಬಹುದು (ಉದಾಹರಣೆಗೆ, ಕೆಲಸ ಕಳೆದುಕೊಳ್ಳುವುದು), ಸಾಮಾಜಿಕ (ಉದಾ., ಕಿರಿಕಿರಿ), ಮಾನಸಿಕ (ಉದಾಹರಣೆಗೆ, ಖಿನ್ನತೆ), ಅಥವಾ ಕ್ರಿಮಿನಲ್ (ಉದಾ, ಅಕ್ರಮ ನಡವಳಿಕೆಗೆ ಬಂಧನ). ದುರದೃಷ್ಟವಶಾತ್, ಡಿಜಿಟಲ್ ಯುಗವು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ನಾಟಕೀಯವಾಗಿ ಹೆಚ್ಚಿಸುತ್ತದೆ-ನಮ್ಮ ನಡವಳಿಕೆಯ ಬಗ್ಗೆ ತುಂಬಾ ಹೆಚ್ಚು ಮಾಹಿತಿ ಇದೆ. ಅನಲಾಗ್-ವಯಸ್ಸಿನ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆ, ದೈಹಿಕ ಅಪಾಯದಂತಹ ಅಪಾಯಗಳೊಂದಿಗೆ ಹೋಲಿಸಿದರೆ ಮಾಹಿತಿ ಅಪಾಯವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮತ್ತು ನಿರ್ವಹಿಸುವುದು ಬಹಳ ಕಷ್ಟ ಎಂದು ಸಾಬೀತಾಗಿದೆ.

ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಒಂದು ಮಾರ್ಗವಾಗಿದೆ ದತ್ತಾಂಶದ "anonymization" ಆಗಿದೆ. "Anonymization" ಹೆಸರು, ವಿಳಾಸ, ಮತ್ತು ದಶಮಾಂಶ ದೂರವಾಣಿ ಸಂಖ್ಯೆ ಸ್ಪಷ್ಟ ವೈಯಕ್ತಿಕ ಗುರುತಿಸುವಿಕೆಗಳನ್ನು ತೆಗೆದುಹಾಕುವ ಪ್ರಕ್ರಿಯೆ. ಆದಾಗ್ಯೂ, ಈ ಮಾರ್ಗವು ಆಳವಾಗಿ ಮತ್ತು ಮೂಲಭೂತವಾಗಿ ಸೀಮಿತ ಅನೇಕ ಜನರು ಅರ್ಥ ಹೆಚ್ಚು ಕಡಿಮೆ ಪರಿಣಾಮಕಾರಿ, ಮತ್ತು, ಇದು ವಾಸ್ತವವಾಗಿ, ಆಗಿದೆ. ಆ ಕಾರಣಕ್ಕಾಗಿ, ನಾನು ವಿವರಿಸಲು ಬಂದ "anonymization," ನಾನು ಉದ್ಧರಣಾ ಚಿಹ್ನೆಗಳು ನೀವು ನೆನಪಿನಲ್ಲಿ ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿಜವಾದ ಅನಾಮಕತೆಯು ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣಿಸಿಕೊಂಡ ಆದರೆ ಸೃಷ್ಟಿಸುವ ಬಳಸಿ.

"ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಯ ವೈಫಲ್ಯದ ಒಂದು ಸ್ಪಷ್ಟ ಉದಾಹರಣೆಯೆಂದರೆ 1990 ರ ಕೊನೆಯಲ್ಲಿ ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ನಲ್ಲಿ (Sweeney 2002) . ಎಲ್ಲಾ ರಾಜ್ಯ ನೌಕರರಿಗೆ ಆರೋಗ್ಯ ವಿಮೆಯನ್ನು ಖರೀದಿಸಲು ಜವಾಬ್ದಾರಿಯುತ ಸರ್ಕಾರಿ ಸಂಸ್ಥೆ ಗ್ರೂಪ್ ಇನ್ಶುರೆನ್ಸ್ ಕಮಿಷನ್ (ಜಿಐಸಿ). ಈ ಕೆಲಸದ ಮೂಲಕ, ಜಿಐಸಿ ಸಾವಿರಾರು ರಾಜ್ಯ ಉದ್ಯೋಗಿಗಳ ಬಗ್ಗೆ ವಿವರವಾದ ಆರೋಗ್ಯ ದಾಖಲೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಿದೆ. ಸಂಶೋಧನೆಗೆ ಉತ್ತೇಜನ ನೀಡುವ ಪ್ರಯತ್ನದಲ್ಲಿ, ಸಂಶೋಧಕರು ಈ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲು ಜಿಐಸಿ ನಿರ್ಧರಿಸಿತು. ಆದಾಗ್ಯೂ, ಅವರು ತಮ್ಮ ಎಲ್ಲ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳಲಿಲ್ಲ; ಬದಲಿಗೆ, ಅವರು ಹೆಸರುಗಳು ಮತ್ತು ವಿಳಾಸಗಳಂತಹ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಹಾಕುವ ಮೂಲಕ ಈ ಡೇಟಾವನ್ನು "ಅನಾಮಧೇಯಗೊಳಿಸಿದ್ದಾರೆ". ಆದಾಗ್ಯೂ, ಜನಸಂಖ್ಯಾ ಮಾಹಿತಿ (ಪಿನ್ ಕೋಡ್, ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಜನಾಂಗೀಯತೆ ಮತ್ತು ಲೈಂಗಿಕತೆ) ಮತ್ತು ವೈದ್ಯಕೀಯ ಮಾಹಿತಿ (ಡೇಟಾವನ್ನು ಭೇಟಿ ಮಾಡಿ, ರೋಗನಿರ್ಣಯ, ಕಾರ್ಯವಿಧಾನ) (ಫಿಗರ್ 6.4) (Ohm 2010) ಮುಂತಾದ ಸಂಶೋಧಕರಿಗೆ ಅವರು ಉಪಯುಕ್ತವೆಂದು ಅವರು ಭಾವಿಸಿದ ಇತರ ಮಾಹಿತಿಯನ್ನು ಅವರು ಬಿಟ್ಟರು. ದುರದೃಷ್ಟವಶಾತ್, ಡೇಟಾವನ್ನು ರಕ್ಷಿಸಲು ಈ "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಸಾಕಾಗಲಿಲ್ಲ.

ಚಿತ್ರ 6.4: ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ ಎನ್ನುವುದು ನಿಸ್ಸಂಶಯವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಹಾಕುವುದು. ಉದಾಹರಣೆಗೆ, ರಾಜ್ಯ ಉದ್ಯೋಗಿಗಳ ವೈದ್ಯಕೀಯ ವಿಮೆ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವಾಗ, ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಗ್ರೂಪ್ ಇನ್ಶುರೆನ್ಸ್ ಕಮಿಷನ್ (ಜಿಐಸಿ) ಫೈಲ್ಗಳಿಂದ ಹೆಸರುಗಳು ಮತ್ತು ವಿಳಾಸಗಳನ್ನು ತೆಗೆದು ಹಾಕುತ್ತದೆ. ಅನಾಮಧೇಯತೆಯ ಪದದ ಸುತ್ತಲಿನ ಉದ್ಧರಣ ಚಿಹ್ನೆಗಳನ್ನು ನಾನು ಬಳಸುತ್ತಿದ್ದೇನೆ ಏಕೆಂದರೆ ಪ್ರಕ್ರಿಯೆಯು ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣುತ್ತದೆ ಆದರೆ ನಿಜವಾದ ಅನಾಮಧೇಯತೆಯಲ್ಲ.

ಚಿತ್ರ 6.4: "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಎನ್ನುವುದು ನಿಸ್ಸಂಶಯವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಹಾಕುವ ಪ್ರಕ್ರಿಯೆ. ಉದಾಹರಣೆಗೆ, ರಾಜ್ಯ ಉದ್ಯೋಗಿಗಳ ವೈದ್ಯಕೀಯ ವಿಮೆ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವಾಗ, ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಗ್ರೂಪ್ ಇನ್ಶುರೆನ್ಸ್ ಕಮಿಷನ್ (ಜಿಐಸಿ) ಫೈಲ್ಗಳಿಂದ ಹೆಸರುಗಳು ಮತ್ತು ವಿಳಾಸಗಳನ್ನು ತೆಗೆದು ಹಾಕುತ್ತದೆ. "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಎಂಬ ಪದದ ಸುತ್ತಲೂ ನಾನು ಉದ್ಧರಣ ಚಿಹ್ನೆಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದೇನೆ ಏಕೆಂದರೆ ಈ ಪ್ರಕ್ರಿಯೆಯು ಅನಾಮಧೇಯತೆಯನ್ನು ಕಾಣುತ್ತದೆ ಆದರೆ ನಿಜವಾದ ಅನಾಮಧೇಯತೆಯನ್ನು ಹೊಂದಿಲ್ಲ.

ಜಿಐಸಿ "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಯ ನ್ಯೂನತೆಗಳನ್ನು ವಿವರಿಸಲು, ಲ್ಯಾಟಿನಾ ಸ್ವೀನೀ-ಎಮ್ಐಟಿಯಲ್ಲಿ ಪದವೀಧರ ವಿದ್ಯಾರ್ಥಿ-$ 20 ಹಣವನ್ನು ಪಾವತಿಸಿದ್ದಾನೆ-ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ನ ಗವರ್ನರ್ ವಿಲ್ಲಿಯಮ್ ವೆಲ್ಡ್ನ ಕೇಂಬ್ರಿಡ್ಜ್ ನಗರದಿಂದ ಮತದಾನ ದಾಖಲೆಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳಲು. ಈ ಮತದಾನ ದಾಖಲೆಗಳಲ್ಲಿ ಹೆಸರು, ವಿಳಾಸ, ಪಿನ್ ಕೋಡ್, ಜನ್ಮ ದಿನಾಂಕ ಮತ್ತು ಲಿಂಗ ಮುಂತಾದ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ವೈದ್ಯಕೀಯ ಡೇಟಾ ಫೈಲ್ ಮತ್ತು ಮತದಾರ ಫೈಲ್ ಕ್ಷೇತ್ರಗಳು-ಜಿಪ್ ಕೋಡ್, ಹುಟ್ಟಿದ ದಿನಾಂಕ ಮತ್ತು ಲೈಂಗಿಕ-ಹಂಚಿಕೆಯ ಸಂಗತಿಗಳನ್ನು ಸ್ವೀನೀ ಅವರಿಗೆ ಲಿಂಕ್ ಮಾಡಬಹುದೆಂಬುದು. ವೆಲೆಡ್ಸ್ ಹುಟ್ಟುಹಬ್ಬವು ಜುಲೈ 31, 1945 ಎಂದು ಸ್ವೀನಿಯವರಿಗೆ ತಿಳಿದಿತ್ತು, ಮತ್ತು ಮತದಾನ ದಾಖಲೆಗಳಲ್ಲಿ ಆ ಜನವರಿಯಲ್ಲಿ ಕೇಂಬ್ರಿಜ್ನಲ್ಲಿ ಕೇವಲ ಆರು ಜನರು ಸೇರಿದ್ದಾರೆ. ಇದಲ್ಲದೆ, ಆ ಆರು ಜನರಲ್ಲಿ ಕೇವಲ ಮೂವರು ಪುರುಷರಾಗಿದ್ದರು. ಮತ್ತು, ಆ ಮೂವರು ಪುರುಷರಲ್ಲಿ ಒಬ್ಬರು ವೆಲ್ಡ್ನ ಜಿಪ್ ಕೋಡ್ ಅನ್ನು ಹಂಚಿಕೊಂಡಿದ್ದಾರೆ. ಆದ್ದರಿಂದ, ಮತದಾನ ಮಾಹಿತಿಯು ವೆಲ್ಡ್ನ ಜನ್ಮ ದಿನಾಂಕ, ಲಿಂಗ ಮತ್ತು ಪಿನ್ ಕೋಡ್ಗಳ ಸಂಯೋಜನೆಯೊಂದಿಗಿನ ವೈದ್ಯಕೀಯ ಮಾಹಿತಿಯಲ್ಲಿ ಯಾರಿಗಾದರೂ ವಿಲಿಯಂ ವೆಲ್ಡ್ ಎಂದು ತೋರಿಸಿದೆ. ಮೂಲಭೂತವಾಗಿ, ಮಾಹಿತಿಯ ಈ ಮೂರು ತುಣುಕುಗಳು ಡೇಟಾದಲ್ಲಿ ಅವನಿಗೆ ವಿಶಿಷ್ಟ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಅನ್ನು ಒದಗಿಸಿವೆ. ಈ ಸತ್ಯವನ್ನು ಬಳಸಿಕೊಂಡು, ಸ್ವೀನೀ ವೆಲ್ಡ್ರ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಸಾಧ್ಯವಾಯಿತು, ಮತ್ತು ಅವರ ಸಾಧನೆಯ ಬಗ್ಗೆ ತಿಳಿಸಲು ಅವಳು ತನ್ನ ದಾಖಲೆಗಳ (Ohm 2010) ಪ್ರತಿಯನ್ನು ಕಳುಹಿಸಿದಳು.

ಚಿತ್ರ 6.5: ಅನಾಮಧೇಯ ಡೇಟಾವನ್ನು ಪುನಃ ಸ್ಥಾಪಿಸುವುದು. ಲಥಾನಿಯ ಸ್ವೀನೀ ಅವರು ಅನಾಮಧೇಯ ಆರೋಗ್ಯ ದಾಖಲೆಯನ್ನು ಮತದಾನ ದಾಖಲೆಗಳೊಂದಿಗೆ ಒಟ್ಟುಗೂಡಿಸಿದರು. ಸ್ವೀನೀ (2002), ಫಿಗರ್ 1 ನಿಂದ ಅಳವಡಿಸಲಾದ ಗವರ್ನರ್ ವಿಲಿಯಂ ವೆಲ್ಡ್ ಅವರ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಈ ದಾಖಲೆಗಳು ಸೇರಿವೆ.

ಚಿತ್ರ 6.5: "ಅನಾಮಧೇಯಗೊಳಿಸಿದ" ಡೇಟಾವನ್ನು ಪುನಃ ಸ್ಥಾಪಿಸುವುದು. ಲತನ್ಯ ಸ್ವೀನೀ "ಅನಾಮಧೇಯಗೊಳಿಸಿದ" ಆರೋಗ್ಯ ದಾಖಲೆಗಳನ್ನು ಮತದಾನ ದಾಖಲೆಗಳೊಂದಿಗೆ ಒಟ್ಟುಗೂಡಿಸಿದರು, ಗವರ್ನರ್ ವಿಲಿಯಂ ವೆಲ್ಡ್ನ ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳನ್ನು Sweeney (2002) , ಫಿಗರ್ 1 ರಿಂದ ಅಳವಡಿಸಿಕೊಳ್ಳಲಾಗಿದೆ.

ಸ್ವೀನೀ ಕಾರ್ಯವು ಮರು-ಗುರುತಿಸುವಿಕೆಯ ದಾಳಿಯ ಮೂಲ ರಚನೆಯನ್ನು ವಿವರಿಸುತ್ತದೆ -ಅನ್ನು ಕಂಪ್ಯೂಟರ್ ಭದ್ರತಾ ಸಮುದಾಯದಿಂದ ಒಂದು ಪದವನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವುದು. ಈ ದಾಳಿಯಲ್ಲಿ, ಎರಡು ಡೇಟಾ ಸೆಟ್ಗಳು, ಸ್ವತಃ ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸುವುದಿಲ್ಲ, ಅವುಗಳು ಸಂಬಂಧಿಸಿರುತ್ತವೆ, ಮತ್ತು ಈ ಸಂಪರ್ಕದ ಮೂಲಕ, ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯನ್ನು ಬಹಿರಂಗಪಡಿಸಲಾಗುತ್ತದೆ.

ಸ್ವೀನಿಯ ಕೆಲಸಕ್ಕೆ ಮತ್ತು ಇತರ ಸಂಬಂಧಿತ ಕೆಲಸಕ್ಕೆ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ಸಂಶೋಧಕರು ಈಗ ಸಾಮಾನ್ಯವಾಗಿ "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆಯ" ಪ್ರಕ್ರಿಯೆಯನ್ನು "ಹೆಚ್ಚು ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿ" (PII) (Narayanan and Shmatikov 2010) - ಹೆಚ್ಚಿನ ಸಂಶೋಧಕರು ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು, ಹಣಕಾಸು ದಾಖಲೆಗಳು, ಕಾನೂನುಬಾಹಿರ ನಡವಳಿಕೆಯ ಬಗ್ಗೆ ಪ್ರಶ್ನೆಗಳನ್ನು ಪರಿಶೀಲಿಸುವ ಉತ್ತರಗಳು "ಅನಾಮಧೇಯಗೊಳಿಸುವಿಕೆ" ಯ ನಂತರ ಬಿಡುಗಡೆ ಮಾಡಲು ತುಂಬಾ ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತವೆ ಎಂದು ಈಗ ತಿಳಿದುಬಂದಿದೆ. ಆದರೆ, ನಾನು ನೀಡುವಂತಹ ಉದಾಹರಣೆಗಳು ಸಾಮಾಜಿಕ ಸಂಶೋಧಕರು ಅಗತ್ಯವೆಂದು ಸೂಚಿಸುತ್ತವೆ ತಮ್ಮ ಚಿಂತನೆಯನ್ನು ಬದಲಿಸಲು. ಮೊದಲ ಹಂತವಾಗಿ, ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಂಭಾವ್ಯವಾಗಿ ಗುರುತಿಸಬಹುದಾಗಿದೆ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವು ಸಂಭಾವ್ಯವಾಗಿ ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತದೆ ಎಂದು ಊಹಿಸಲು ಬುದ್ಧಿವಂತವಾಗಿದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಮಾಹಿತಿ ಅಪಾಯವು ಯೋಜನೆಗಳ ಸಣ್ಣ ಉಪವಿಭಾಗಕ್ಕೆ ಅನ್ವಯಿಸುತ್ತದೆ ಎಂದು ಯೋಚಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ಅದು ಕೆಲವು ಪದವಿ-ಎಲ್ಲಾ ಯೋಜನೆಗಳಿಗೆ ಅನ್ವಯಿಸುತ್ತದೆ ಎಂದು ನಾವು ಭಾವಿಸಬೇಕು.

ಈ ಮರುನಿರ್ಮಾಣದ ಎರಡೂ ಅಂಶಗಳು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿಗಳಿಂದ ವಿವರಿಸಲ್ಪಟ್ಟಿವೆ. 5 ನೇ ಅಧ್ಯಾಯದಲ್ಲಿ ವಿವರಿಸಿದಂತೆ, ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸುಮಾರು 500,000 ಸದಸ್ಯರು ಒದಗಿಸಿದ 100 ದಶಲಕ್ಷ ಚಲನಚಿತ್ರದ ರೇಟಿಂಗ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತು, ಮತ್ತು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸಿನೆಮಾವನ್ನು ಶಿಫಾರಸು ಮಾಡುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಸುಧಾರಿಸುವ ವಿಶ್ವದಾದ್ಯಂತದ ಜನರು ಕ್ರಮಾವಳಿಗಳನ್ನು ಸಲ್ಲಿಸಿದ ಮುಕ್ತ ಕರೆಗಳನ್ನು ಹೊಂದಿದ್ದರು. ಡೇಟಾವನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ಮೊದಲು, ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಹೆಸರುಗಳಂತಹ ಯಾವುದೇ ವೈಯಕ್ತಿಕವಾಗಿ ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ತೆಗೆದುಹಾಕಿದೆ. ಅವರು ಒಂದು ಹೆಚ್ಚುವರಿ ಹೆಜ್ಜೆ ಮತ್ತು ಕೆಲವೊಂದು ರೆಕಾರ್ಡ್ಗಳಲ್ಲಿ ಸ್ವಲ್ಪ ಸಂಭವನೀಯತೆಗಳನ್ನು ಪರಿಚಯಿಸಿದರು (ಉದಾಹರಣೆಗೆ, 4 ನಕ್ಷತ್ರಗಳಿಂದ 3 ನಕ್ಷತ್ರಗಳಿಗೆ ಕೆಲವು ರೇಟಿಂಗ್ಗಳನ್ನು ಬದಲಾಯಿಸುವುದು). ಆದಾಗ್ಯೂ, ತಮ್ಮ ಪ್ರಯತ್ನಗಳ ಹೊರತಾಗಿಯೂ, ದತ್ತಾಂಶವು ಅನಾಮಧೇಯವಾಗಿಲ್ಲ ಎಂದು ಅವರು ಶೀಘ್ರದಲ್ಲೇ ಪತ್ತೆಹಚ್ಚಿದರು.

ಡೇಟಾ ಬಿಡುಗಡೆಯಾದ ಎರಡು ವಾರಗಳ ನಂತರ, ಅರವಿಂದ ನಾರಾಯಣನ್ ಮತ್ತು ವಿಟಲಿ ಶಮತಿಕೋವ್ (2008) ನಿರ್ದಿಷ್ಟ ಜನರ ಚಲನಚಿತ್ರ ಆದ್ಯತೆಗಳ ಬಗ್ಗೆ ಕಲಿಯಲು ಸಾಧ್ಯ ಎಂದು ತೋರಿಸಿದರು. ತಮ್ಮ ಮರು-ಗುರುತಿಸುವಿಕೆಯ ದಾಳಿಯ ಟ್ರಿಕ್ ಸ್ವೀನೀಸ್ಗೆ ಹೋಲುತ್ತದೆ: ಎರಡು ಮಾಹಿತಿ ಮೂಲಗಳನ್ನು ವಿಲೀನಗೊಳಿಸಿ, ಸಂಭಾವ್ಯ ಸೂಕ್ಷ್ಮ ಮಾಹಿತಿಯೊಂದಿಗೆ ಮತ್ತು ಒಂದು ಗುರುತಿಸುವ ಮಾಹಿತಿಯನ್ನು ಮತ್ತು ಜನರ ಗುರುತನ್ನು ಒಳಗೊಂಡಿರುವ ಒಂದು ಇಲ್ಲ. ಈ ಪ್ರತಿಯೊಂದು ಡೇಟಾ ಮೂಲಗಳು ಪ್ರತ್ಯೇಕವಾಗಿ ಸುರಕ್ಷಿತವಾಗಿರಬಹುದು, ಆದರೆ ಅವು ಸೇರಿದಾಗ, ವಿಲೀನಗೊಂಡ ದತ್ತಾಂಶವು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ರಚಿಸಬಹುದು. ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾದ ಸಂದರ್ಭದಲ್ಲಿ, ಅದು ಹೇಗೆ ಸಂಭವಿಸಬಹುದು ಎಂದು ಇಲ್ಲಿದೆ. ನನ್ನ ಸಹೋದ್ಯೋಗಿಗಳೊಂದಿಗೆ ಆಕ್ಷನ್ ಮತ್ತು ಹಾಸ್ಯ ಸಿನೆಮಾ ಬಗ್ಗೆ ನನ್ನ ಆಲೋಚನೆಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ನಾನು ಆರಿಸಿಕೊಂಡಿದ್ದೇನೆ, ಆದರೆ ಧಾರ್ಮಿಕ ಮತ್ತು ರಾಜಕೀಯ ಸಿನೆಮಾಗಳ ಬಗ್ಗೆ ನನ್ನ ಅಭಿಪ್ರಾಯವನ್ನು ಹಂಚಿಕೊಳ್ಳಬಾರದೆಂದು ನಾನು ಬಯಸುತ್ತೇನೆ. ನನ್ನ ಸಹೋದ್ಯೋಗಿಗಳು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾದಲ್ಲಿ ನನ್ನ ದಾಖಲೆಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಾನು ಅವರೊಂದಿಗೆ ಹಂಚಿಕೊಂಡ ಮಾಹಿತಿಯನ್ನು ಬಳಸಬಹುದಾಗಿತ್ತು; ನಾನು ಹಂಚಿಕೊಳ್ಳುವ ಮಾಹಿತಿಯು ವಿಲಿಯಂ ವೆಲ್ಡ್ನ ಹುಟ್ಟಿದ ದಿನಾಂಕ, ಪಿನ್ ಕೋಡ್, ಮತ್ತು ಲೈಂಗಿಕತೆಯಂತೆಯೇ ಅನನ್ಯ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಆಗಿರಬಹುದು. ನಂತರ, ಅವರು ಡೇಟಾದಲ್ಲಿ ನನ್ನ ಅನನ್ಯ ಫಿಂಗರ್ಪ್ರಿಂಟ್ ಅನ್ನು ಕಂಡುಕೊಂಡರೆ, ಅವರು ಹಂಚಿಕೊಳ್ಳಲು ಇಷ್ಟಪಡದ ಚಲನಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಎಲ್ಲಾ ಚಲನಚಿತ್ರಗಳ ಕುರಿತು ನನ್ನ ರೇಟಿಂಗ್ಗಳನ್ನು ಅವರು ತಿಳಿದುಕೊಳ್ಳಬಹುದು. ಏಕೈಕ ವ್ಯಕ್ತಿಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದ ಈ ರೀತಿಯ ದಾಳಿಗಳಿಗೆ ಹೆಚ್ಚುವರಿಯಾಗಿ, ನಾರಾಯಣನ್ ಮತ್ತು ಶ್ಮತಿಕೊವ್ ಕೂಡಾ ಅನೇಕ ಜನರನ್ನು ಒಳಗೊಂಡಿರುವ ಒಂದು ವಿಶಾಲ ದಾಳಿಯನ್ನು ಮಾಡಲು ಸಾಧ್ಯ ಎಂದು ತೋರಿಸಿದರು - ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾವನ್ನು ವೈಯಕ್ತಿಕ ಮತ್ತು ಚಲನಚಿತ್ರ ರೇಟಿಂಗ್ ಡೇಟಾದೊಂದಿಗೆ ವಿಲೀನಗೊಳಿಸುವುದರ ಮೂಲಕ ಕೆಲವು ಜನರು ಆಯ್ಕೆಮಾಡಿದ್ದಾರೆ ಇಂಟರ್ನೆಟ್ ಮೂವೀ ಡೇಟಾಬೇಸ್ (IMDb) ನಲ್ಲಿ ಪೋಸ್ಟ್ ಮಾಡಲು. ಸರಳವಾಗಿ, ಒಂದು ನಿರ್ದಿಷ್ಟ ವ್ಯಕ್ತಿಗೆ ವಿಶಿಷ್ಟ ಫಿಂಗರ್ಪ್ರಿಂಟ್-ಯಾವುದೇ ಚಲನಚಿತ್ರ ರೇಟಿಂಗ್ಗಳ ಸೆಟ್ ಕೂಡ-ಅವುಗಳನ್ನು ಗುರುತಿಸಲು ಬಳಸಬಹುದು.

ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಡೇಟಾವನ್ನು ಉದ್ದೇಶಿತ ಅಥವಾ ವಿಶಾಲವಾದ ದಾಳಿಯಲ್ಲಿ ಮರು ಗುರುತಿಸಬಹುದು ಸಹ, ಇದು ಇನ್ನೂ ಕಡಿಮೆ ಅಪಾಯ ಎಂದು ಕಾಣಿಸಬಹುದು. ಎಲ್ಲಾ ನಂತರ, ಚಲನಚಿತ್ರದ ರೇಟಿಂಗ್ಗಳು ಬಹಳ ಸೂಕ್ಷ್ಮವಾಗಿ ಕಾಣುತ್ತಿಲ್ಲ. ಅದು ಸಾಮಾನ್ಯವಾಗಿ ನಿಜವಾಗಿದ್ದರೂ, ಡೇಟಾಸೆಟ್ನಲ್ಲಿರುವ ಸುಮಾರು 500,000 ಜನರಿಗೆ, ಚಲನಚಿತ್ರದ ರೇಟಿಂಗ್ಗಳು ತುಂಬಾ ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತವೆ. ವಾಸ್ತವವಾಗಿ, ಮರು ಗುರುತಿಸುವಿಕೆಗೆ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ನಿಕಟವಾದ ಸಲಿಂಗಕಾಮಿ ಮಹಿಳೆ ನೆಟ್ಫ್ಲಿಕ್ಸ್ ವಿರುದ್ಧ ಕ್ಲಾಸ್ ಆಕ್ಷನ್ ಮೊಕದ್ದಮೆಗೆ ಸೇರಿದರು. ತಮ್ಮ ಮೊಕದ್ದಮೆಯಲ್ಲಿ ಸಮಸ್ಯೆಯನ್ನು ಹೇಗೆ ವ್ಯಕ್ತಪಡಿಸಲಾಗಿದೆ (Singel 2009) :

"[M] ಒವಿ ಮತ್ತು ರೇಟಿಂಗ್ ಡೇಟಾವು ಒಂದು ವೈಯಕ್ತಿಕ ಮತ್ತು ಸೂಕ್ಷ್ಮ ಸ್ವಭಾವದ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ಸದಸ್ಯರ ಚಲನಚಿತ್ರ ಮಾಹಿತಿಯು ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಸದಸ್ಯರ ವೈಯಕ್ತಿಕ ಆಸಕ್ತಿಯನ್ನು ಮತ್ತು / ಅಥವಾ ಲೈಂಗಿಕತೆ, ಮಾನಸಿಕ ಅಸ್ವಸ್ಥತೆ, ಮದ್ಯಪಾನದಿಂದ ಹಿಂಪಡೆಯುವಿಕೆ, ಮತ್ತು ಸಂಭೋಗದಿಂದ ಹಿಂಸೆಯನ್ನು, ದೈಹಿಕ ದುರುಪಯೋಗ, ಗೃಹ ಹಿಂಸೆ, ವ್ಯಭಿಚಾರ ಮತ್ತು ಅತ್ಯಾಚಾರ ಸೇರಿದಂತೆ ಹಲವು ವೈಯಕ್ತಿಕ ಸಮಸ್ಯೆಗಳೊಂದಿಗೆ ಹೋರಾಡುತ್ತಿದೆ. "

ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿ ಡೇಟಾ ಮರು-ಗುರುತಿಸುವಿಕೆಯೆಲ್ಲವೂ ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಸಂಭಾವ್ಯವಾಗಿ ಗುರುತಿಸಬಲ್ಲವು ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವು ಸಂಭಾವ್ಯವಾಗಿ ಸಂವೇದನಾಶೀಲವಾಗಿರುತ್ತದೆ ಎಂದು ವಿವರಿಸುತ್ತದೆ. ಈ ಹಂತದಲ್ಲಿ, ಇದು ಜನರಿಗೆ ಸಂಬಂಧಿಸಿರುವ ಡೇಟಾಕ್ಕೆ ಮಾತ್ರ ಅನ್ವಯಿಸುತ್ತದೆ ಎಂದು ನೀವು ಭಾವಿಸಬಹುದು. ಆಶ್ಚರ್ಯಕರವಾಗಿ, ಅದು ನಿಜವಲ್ಲ. ಮಾಹಿತಿ ಕಾನೂನು ವಿನಂತಿಯ ಸ್ವಾತಂತ್ರ್ಯಕ್ಕೆ ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿ ಸರ್ಕಾರವು 2013 ರಲ್ಲಿ ನ್ಯೂಯಾರ್ಕ್ನ ಪ್ರತಿ ಟ್ಯಾಕ್ಸಿ ಸವಾರಿಯ ದಾಖಲೆಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತು, ಅದರಲ್ಲಿ ಪಿಕಪ್ ಮತ್ತು ಬಿಡಿ ಆಫ್ ಟೈಮ್ಗಳು, ಸ್ಥಳಗಳು ಮತ್ತು ಶುಲ್ಕ ಪ್ರಮಾಣಗಳು (ಅಧ್ಯಾಯ 2 ರಿಂದ Farber (2015) ಕಾರ್ಮಿಕ ಅರ್ಥಶಾಸ್ತ್ರದಲ್ಲಿ ಪ್ರಮುಖವಾದ ಸಿದ್ಧಾಂತಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಇದೇ ರೀತಿಯ ಡೇಟಾವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ). ಟ್ಯಾಕ್ಸಿ ಪ್ರಯಾಣದ ಬಗ್ಗೆ ಈ ಮಾಹಿತಿಯು ಹಾನಿಕರವಾಗಬಹುದು ಏಕೆಂದರೆ ಅವರು ಜನರ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತಿಲ್ಲ, ಆದರೆ ಆಂಥೋನಿ ಟೋಕರ್ ಈ ಟ್ಯಾಕ್ಸಿ ದತ್ತಾಂಶವು ವಾಸ್ತವವಾಗಿ ಜನರ ಬಗ್ಗೆ ಸಾಕಷ್ಟು ಸಂವೇದನಾಶೀಲ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ ಎಂಬುದನ್ನು ಅರಿತುಕೊಂಡಿದೆ. ವಿವರಿಸಲು, ಅವರು ಹಸ್ಲರ್ ಕ್ಲಬ್ನಲ್ಲಿ-ನ್ಯೂಯಾರ್ಕ್ನ ದೊಡ್ಡ ಸ್ಟ್ರಿಪ್ ಕ್ಲಬ್ನಲ್ಲಿ ಮಧ್ಯರಾತ್ರಿ ಮತ್ತು 6 ಗಂಟೆಗೆ ಪ್ರಾರಂಭವಾಗುವ ಎಲ್ಲಾ ಪ್ರವಾಸಗಳನ್ನು ನೋಡಿದರು ಮತ್ತು ನಂತರ ತಮ್ಮ ಡ್ರಾಪ್-ಆಫ್ ಸ್ಥಳಗಳನ್ನು ಕಂಡುಕೊಂಡರು. ಈ ಹುಡುಕಾಟ ಬಹಿರಂಗ-ಮೂಲಭೂತವಾಗಿ-ಹಸ್ಲರ್ ಕ್ಲಬ್ (Tockar 2014) ಆಗಾಗ್ಗೆ ನಡೆಸಿದ ಕೆಲವು ಜನರ ವಿಳಾಸಗಳ ಪಟ್ಟಿ. ಡೇಟಾವನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದಾಗ ನಗರದ ಸರ್ಕಾರವು ಈ ಮನಸ್ಸಿನಲ್ಲಿದೆ ಎಂದು ಊಹಿಸಿಕೊಳ್ಳುವುದು ಕಷ್ಟ. ವಾಸ್ತವವಾಗಿ, ನಗರದಲ್ಲಿ ಅದೇ ಸ್ಥಳವನ್ನು ಭೇಟಿ ಮಾಡುವ ಜನರ ಮನೆಯ ವಿಳಾಸಗಳನ್ನು-ವೈದ್ಯಕೀಯ ಆಸ್ಪತ್ರೆ, ಸರ್ಕಾರಿ ಕಟ್ಟಡ, ಅಥವಾ ಧಾರ್ಮಿಕ ಸಂಸ್ಥೆಯನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇದೇ ವಿಧಾನವನ್ನು ಬಳಸಬಹುದಾಗಿದೆ.

ನೆಟ್ಫ್ಲಿಕ್ಸ್ ಪ್ರಶಸ್ತಿ ಮತ್ತು ನ್ಯೂಯಾರ್ಕ್ ಸಿಟಿ ಟ್ಯಾಕ್ಸಿ ದತ್ತಾಂಶಗಳ ಈ ಎರಡು ಪ್ರಕರಣಗಳು ತುಲನಾತ್ಮಕವಾಗಿ ನುರಿತ ಜನರು ಅವರು ಬಿಡುಗಡೆ ಮಾಡಲಾದ ಮಾಹಿತಿಯಲ್ಲಿನ ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಸರಿಯಾಗಿ ಅಂದಾಜು ಮಾಡಲಾಗುವುದಿಲ್ಲ ಎಂದು ತೋರಿಸುತ್ತವೆ-ಮತ್ತು ಈ ಸಂದರ್ಭಗಳು ಯಾವುದೇ ರೀತಿಯ ಅನನ್ಯತೆಯಿಲ್ಲ (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . ಇದಲ್ಲದೆ, ಅಂತಹ ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಮಸ್ಯಾತ್ಮಕ ದತ್ತಾಂಶಗಳು ಇನ್ನೂ ಆನ್ಲೈನ್ನಲ್ಲಿ ಲಭ್ಯವಿವೆ, ಇದು ಡೇಟಾ ಬಿಡುಗಡೆಯನ್ನು ಎಂದಿಗೂ ರದ್ದುಗೊಳಿಸುವ ಕಷ್ಟವನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಒಟ್ಟಾರೆಯಾಗಿ, ಈ ಉದಾಹರಣೆಗಳು-ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನದಲ್ಲಿ ಗೌಪ್ಯತೆ ಬಗ್ಗೆ ಸಂಶೋಧನೆ-ಪ್ರಮುಖ ತೀರ್ಮಾನಕ್ಕೆ ಕಾರಣವಾಗುತ್ತದೆ. ಸಂಶೋಧಕರು ಎಲ್ಲ ಡೇಟಾವನ್ನು ಸಂಭಾವ್ಯವಾಗಿ ಗುರುತಿಸಬಲ್ಲವು ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವು ಸಂಭಾವ್ಯವಾಗಿ ಸಂವೇದನಾಶೀಲವಾಗಿರುತ್ತದೆ ಎಂದು ತಿಳಿಯಬೇಕು.

ದುರದೃಷ್ಟವಶಾತ್, ಎಲ್ಲಾ ಡೇಟಾವು ಸಂಭಾವ್ಯವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮತ್ತು ಎಲ್ಲಾ ಡೇಟಾವು ಸಂಭಾವ್ಯವಾಗಿ ಸೂಕ್ಷ್ಮವಾಗಿರುವ ಸತ್ಯಗಳಿಗೆ ಯಾವುದೇ ಸರಳ ಪರಿಹಾರವಿಲ್ಲ. ಹೇಗಾದರೂ, ನೀವು ದತ್ತಾಂಶದೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿರುವಾಗ ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಒಂದು ಮಾರ್ಗವೆಂದರೆ ಡೇಟಾ ರಕ್ಷಣೆ ಯೋಜನೆಯನ್ನು ರಚಿಸುವುದು ಮತ್ತು ಅನುಸರಿಸುವುದು. ಈ ಯೋಜನೆಯು ನಿಮ್ಮ ಡೇಟಾ ಸೋರಿಕೆಯಾಗುವ ಸಾಧ್ಯತೆಯನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ಸೋರಿಕೆ ಏನಾಗುತ್ತದೆಯಾದರೂ ಹಾನಿ ಕಡಿಮೆಯಾಗುತ್ತದೆ. ಗೂಢಲಿಪೀಕರಣ ರೂಪದಲ್ಲಿ ಬಳಸಲು ರೀತಿಯ, ಮಾಹಿತಿ ಸಂರಕ್ಷಣೆ ಯೋಜನೆಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ಅಂಶಗಳನ್ನು, ಕಾಲಾನಂತರದಲ್ಲಿ ಬದಲಾಗುತ್ತವೆ, ಆದರೆ ಯುಕೆ ಡೇಟಾ ಸೇವೆಗಳು ಪ್ರಯೋಜನಕಾರಿಯಾಗಿ ಅವರು ಐದು ಜನರ ಕೈಯಲ್ಲಿ ಕರೆಯುವ ಐದು ವರ್ಗಗಳಾಗಿ ಒಂದು ಮಾಹಿತಿ ಸಂರಕ್ಷಣೆ ಯೋಜನೆಯ ಅಂಶಗಳನ್ನು ಆಯೋಜಿಸುತ್ತದೆ ಕಾಣಿಸುತ್ತದೆ: ಸುರಕ್ಷಿತ ಯೋಜನೆಗಳು, ಸುರಕ್ಷಿತ ಜನರು , ಸುರಕ್ಷಿತ ಸೆಟ್ಟಿಂಗ್ಗಳು, ಸುರಕ್ಷಿತ ಡೇಟಾ ಮತ್ತು ಸುರಕ್ಷಿತ ಉತ್ಪನ್ನಗಳು (ಕೋಷ್ಟಕ 6.2) (Desai, Ritchie, and Welpton 2016) . ಐದು safes ಯಾವುದೇ ಪ್ರತ್ಯೇಕವಾಗಿ ಪರಿಪೂರ್ಣ ರಕ್ಷಣೆ ನೀಡುತ್ತವೆ. ಆದರೆ ಒಟ್ಟಾಗಿ ಅವರು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಶಕ್ತಿಶಾಲಿ ಅಂಶಗಳಾಗಿವೆ.

ಕೋಷ್ಟಕ 6.2: "ಫೈವ್ ಎಸ್ಫೇಸ್" ಒಂದು ಡೇಟಾ ಪ್ರೊಟೆಕ್ಷನ್ ಪ್ಲ್ಯಾನ್ ವಿನ್ಯಾಸ (Desai, Ritchie, and Welpton 2016)
ಸುರಕ್ಷಿತ	ಕ್ರಿಯೆ
ಸುರಕ್ಷಿತ ಯೋಜನೆಗಳು	ನೈತಿಕತೆ ಹೊಂದಿರುವ ಡೇಟಾದೊಂದಿಗೆ ಲಿಮಿಟ್ಸ್ ಯೋಜನೆಗಳು
ಸುರಕ್ಷಿತ ಜನರು	ಡೇಟಾವನ್ನು ವಿಶ್ವಾಸಾರ್ಹಗೊಳಿಸಬಹುದಾದ ಜನರಿಗೆ ಪ್ರವೇಶವನ್ನು ನಿರ್ಬಂಧಿಸಲಾಗಿದೆ (ಉದಾ: ನೈತಿಕ ತರಬೇತಿ ಪಡೆದ ಜನರು)
ಸುರಕ್ಷಿತ ಡೇಟಾ	ಡೇಟಾವನ್ನು ಗುರುತಿಸಿ ಮತ್ತು ಸಾಧ್ಯವಾದಷ್ಟು ಮಟ್ಟಿಗೆ ಒಟ್ಟುಗೂಡಿಸಲಾಗುತ್ತದೆ
ಸುರಕ್ಷಿತ ಸೆಟ್ಟಿಂಗ್ಗಳು	ಡೇಟಾವನ್ನು ಸರಿಯಾದ ದೈಹಿಕ (ಉದಾಹರಣೆಗೆ, ಲಾಕ್ ಮಾಡಿದ ಕೊಠಡಿ) ಮತ್ತು ಸಾಫ್ಟ್ವೇರ್ (ಉದಾ, ಪಾಸ್ವರ್ಡ್ ರಕ್ಷಣೆ, ಗೂಢಲಿಪೀಕರಣಗೊಂಡ) ರಕ್ಷಣೆ ಹೊಂದಿರುವ ಕಂಪ್ಯೂಟರ್ಗಳಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ
ಸುರಕ್ಷಿತ ಉತ್ಪಾದನೆ	ಆಕಸ್ಮಿಕ ಗೌಪ್ಯತೆ ಉಲ್ಲಂಘನೆಯನ್ನು ತಡೆಗಟ್ಟಲು ಸಂಶೋಧನಾ ಫಲಿತಾಂಶವನ್ನು ಪರಿಶೀಲಿಸಲಾಗಿದೆ

ನೀವು ಅವುಗಳನ್ನು ಬಳಸುವಾಗ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ರಕ್ಷಿಸುವುದರ ಜೊತೆಗೆ, ಸಂಶೋಧನಾ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಒಂದು ಹೆಜ್ಜೆಯಿರುವುದು ಮಾಹಿತಿ ಅಪಾಯವು ನಿರ್ದಿಷ್ಟವಾಗಿ ಪ್ರಮುಖವಾದದ್ದು ಇತರ ಸಂಶೋಧಕರೊಂದಿಗೆ ಡೇಟಾ ಹಂಚಿಕೆಯಾಗಿದೆ. ವಿಜ್ಞಾನಿಗಳ ನಡುವೆ ದತ್ತಾಂಶ ಹಂಚಿಕೆ ವೈಜ್ಞಾನಿಕ ಪ್ರಯತ್ನದ ಒಂದು ಪ್ರಮುಖ ಮೌಲ್ಯವಾಗಿದೆ, ಮತ್ತು ಅದು ಜ್ಞಾನದ ಪ್ರಗತಿಗೆ ಹೆಚ್ಚು ಅನುಕೂಲಕರವಾಗಿರುತ್ತದೆ. ಯುಕೆ ಹೌಸ್ ಆಫ್ ಕಾಮನ್ಸ್ ಹೇಗೆ ಡೇಟಾ ಹಂಚಿಕೆ ಪ್ರಾಮುಖ್ಯತೆಯನ್ನು ವಿವರಿಸಿದೆ (Molloy 2011) :

"ಸಾಹಿತ್ಯದಲ್ಲಿ ವರದಿ ಮಾಡಲಾದ ಫಲಿತಾಂಶಗಳ ಮೇಲೆ ಸಂಶೋಧಕರು ಪುನರುತ್ಪಾದಿಸಲು, ಪರಿಶೀಲಿಸಲು ಮತ್ತು ನಿರ್ಮಿಸಲು ವೇಳೆ ಡೇಟಾಗೆ ಪ್ರವೇಶವು ಮೂಲಭೂತವಾಗಿದೆ. ಕಲ್ಪನೆಯು ಇರಬೇಕು, ಇಲ್ಲದಿದ್ದರೆ ಬಲವಾದ ಕಾರಣವಿಲ್ಲದಿದ್ದರೆ, ಡೇಟಾವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಬಹಿರಂಗಪಡಿಸಬೇಕು ಮತ್ತು ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಬೇಕು. "

ಆದರೂ, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಮತ್ತೊಂದು ಸಂಶೋಧಕರೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳುವ ಮೂಲಕ, ನಿಮ್ಮ ಭಾಗವಹಿಸುವವರಿಗೆ ನೀವು ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು. ಆದ್ದರಿಂದ, ದತ್ತಾಂಶ ಹಂಚಿಕೆ ಇತರ ವಿಜ್ಞಾನಿಗಳೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳುವ ಬಾಧ್ಯತೆ ಮತ್ತು ಭಾಗವಹಿಸುವವರಿಗೆ ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆಗೊಳಿಸುವ ಬಾಧ್ಯತೆಯ ನಡುವಿನ ಮೂಲಭೂತ ಉದ್ವೇಗವನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ ಎಂದು ಕಾಣಿಸಬಹುದು. ಅದೃಷ್ಟವಶಾತ್, ಈ ಸಂದಿಗ್ಧತೆ ಕಾಣಿಸಿಕೊಳ್ಳುವಷ್ಟು ತೀವ್ರವಲ್ಲ. ಬದಲಿಗೆ, ದತ್ತಾಂಶ ಹಂಚಿಕೆಯು ನಿರಂತರವಾಗಿ ಬೀಳುವಂತೆ ಯೋಚಿಸುವುದು ಒಳ್ಳೆಯದು, ಆ ನಿರಂತರತೆಯ ಮೇಲೆ ಪ್ರತಿ ಹಂತವು ಸಮಾಜಕ್ಕೆ ಅನುಕೂಲಕರವಾದ ಮಿಶ್ರಣವನ್ನು ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಭಾಗವಹಿಸುವವರಿಗೆ ಅಪಾಯವನ್ನುಂಟು ಮಾಡುತ್ತದೆ (ಚಿತ್ರ 6.6).

ಒಂದು ತೀವ್ರವಾಗಿ, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೀವು ಯಾರೊಂದಿಗೂ ಹಂಚಿಕೊಳ್ಳಬಾರದು, ಇದು ಭಾಗವಹಿಸುವವರಿಗೆ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಆದರೆ ಸಮಾಜಕ್ಕೆ ಲಾಭಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ. ಇತರ ತೀವ್ರವಾಗಿ, ನೀವು ಡೇಟಾವನ್ನು "ಅನಾಮಧೇಯಗೊಳಿಸಿದ್ದು" ಮತ್ತು ಪ್ರತಿಯೊಬ್ಬರಿಗೂ ಪೋಸ್ಟ್ ಮಾಡಬಹುದಾದಂತಹ, ಬಿಡುಗಡೆ ಮತ್ತು ಮರೆತುಬಿಡಬಹುದು . ಡೇಟಾವನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವುದಿಲ್ಲ, ಬಿಡುಗಡೆ ಮಾಡಿ ಮತ್ತು ಕೊಡುಗೆಗಳನ್ನು ಸಮಾಜಕ್ಕೆ ಹೆಚ್ಚಿನ ಪ್ರಯೋಜನಗಳನ್ನು ಮತ್ತು ಭಾಗವಹಿಸುವವರಿಗೆ ಹೆಚ್ಚಿನ ಅಪಾಯವನ್ನು ಮರೆತುಬಿಡುವುದಿಲ್ಲ. ಈ ಎರಡು ವಿಪರೀತ ಪ್ರಕರಣಗಳ ನಡುವೆ ನಾನು ಗೋಡೆ ತೋಟದ ವಿಧಾನವನ್ನು ಕರೆಯುವುದನ್ನು ಒಳಗೊಂಡಂತೆ ಮಿಶ್ರತಳಿಗಳ ವ್ಯಾಪ್ತಿಯಿದೆ. ಈ ವಿಧಾನದ ಅಡಿಯಲ್ಲಿ, ಕೆಲವು ಮಾನದಂಡಗಳನ್ನು ಪೂರೈಸುವ ಮತ್ತು ಕೆಲವೊಂದು ನಿಯಮಗಳಿಂದ (ಉದಾ., ಐಆರ್ಬಿ ಮತ್ತು ಡೇಟಾ ರಕ್ಷಣೆ ಯೋಜನೆಯಿಂದ ಮೇಲ್ವಿಚಾರಣೆ) ಬಂಧಿಸುವ ಜನರೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಹಂಚಿಕೊಳ್ಳಲಾಗುತ್ತದೆ. ಗೋಡೆಯ ಉದ್ಯಾನ ವಿಧಾನವು ಬಿಡುಗಡೆಯ ಪ್ರಯೋಜನಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ ಮತ್ತು ಕಡಿಮೆ ಅಪಾಯವನ್ನು ಮರೆತುಬಿಡುತ್ತದೆ. ಅಂತಹ ವಿಧಾನವು ಅನೇಕ ಪ್ರಶ್ನೆಗಳನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ-ಯಾರು ಪ್ರವೇಶವನ್ನು ಹೊಂದಿರಬೇಕು, ಯಾವ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ, ಮತ್ತು ಎಷ್ಟು ಕಾಲ, ಗೋಡೆ ತೋಟವನ್ನು ನಿರ್ವಹಿಸುವುದು ಮತ್ತು ಪೋಲಿಸ್ ಮಾಡುವುದಕ್ಕೆ ಪಾವತಿಸಬೇಕಾದರೆ-ಇವುಗಳು ದುರ್ಬಲವಾಗಿಲ್ಲ. ವಾಸ್ತವವಾಗಿ, ಸಂಶೋಧಕರು ಇದೀಗ ಬಳಸಬಹುದಾದ ಸ್ಥಳದಲ್ಲಿ ಈಗಾಗಲೇ ಗೋಡೆಯ ಉದ್ಯಾನಗಳನ್ನು ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದಾರೆ, ಮಿಚಿಗನ್ ವಿಶ್ವವಿದ್ಯಾನಿಲಯದ ರಾಜಕೀಯ ಮತ್ತು ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗಾಗಿ ಇಂಟರ್-ಯೂನಿವರ್ಸಿಟಿ ಕನ್ಸೋರ್ಟಿಯಂನ ಮಾಹಿತಿ ಆರ್ಕೈವ್.

ಚಿತ್ರ 6.6: ದತ್ತಾಂಶ ಬಿಡುಗಡೆಯ ತಂತ್ರಗಳು ನಿರಂತರವಾಗಿ ಬೀಳಬಹುದು. ಈ ನಿರಂತರತೆಗೆ ನೀವು ಎಲ್ಲಿಯವರೆಗೆ ನಿಮ್ಮ ಡೇಟಾದ ನಿರ್ದಿಷ್ಟ ವಿವರಗಳನ್ನು ಅವಲಂಬಿಸಿರಬೇಕು ಮತ್ತು ಮೂರನೇ ವ್ಯಕ್ತಿಯ ಪರಿಶೀಲನೆಯು ನಿಮ್ಮ ಸಂದರ್ಭದಲ್ಲಿ ಅಪಾಯದ ಸಮತೋಲನ ಮತ್ತು ಲಾಭವನ್ನು ನಿರ್ಧರಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಬಹುದು. ಈ ವಕ್ರರೇಖೆಯ ನಿಖರವಾದ ಆಕಾರವು ಡೇಟಾ ಮತ್ತು ಸಂಶೋಧನಾ ಗುರಿಗಳ ವಿಶಿಷ್ಟತೆಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ (Goroff 2015) .

ಆದ್ದರಿಂದ, ನಿಮ್ಮ ಅಧ್ಯಯನದ ಡೇಟಾವು ಹಂಚಿಕೆ, ಗೋಡೆಯ ಉದ್ಯಾನ, ಬಿಡುಗಡೆ ಮತ್ತು ಮರೆತುಹೋಗುವಿಕೆಗೆ ಎಲ್ಲಿ ಇರಬೇಕು? ಇದು ನಿಮ್ಮ ಡೇಟಾದ ವಿವರಗಳನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ: ಸಂಶೋಧಕರು ವ್ಯಕ್ತಿಗಳಿಗೆ ಗೌರವ, ಸಮೃದ್ಧತೆ, ನ್ಯಾಯ ಮತ್ತು ಕಾನೂನು ಮತ್ತು ಸಾರ್ವಜನಿಕ ಹಿತಾಸಕ್ತಿಯ ಗೌರವವನ್ನು ಸಮತೋಲನಗೊಳಿಸಬೇಕು. ಈ ದೃಷ್ಟಿಕೋನದಿಂದ ನೋಡಿದ, ಡೇಟಾ ಹಂಚಿಕೆಯು ವಿಶಿಷ್ಟ ನೈತಿಕ ಸೆಖಿನೋ ಅಲ್ಲ; ಸಂಶೋಧಕರು ಸೂಕ್ತವಾದ ನೈತಿಕ ಸಮತೋಲನವನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕಾದ ಸಂಶೋಧನೆಯ ಅನೇಕ ಅಂಶಗಳಲ್ಲಿ ಇದೂ ಒಂದು.

ಕೆಲವು ಟೀಕಾಕಾರರು ಸಾಮಾನ್ಯವಾಗಿ ದತ್ತಾಂಶ ಹಂಚಿಕೆಗೆ ವಿರುದ್ಧವಾಗಿರುತ್ತಾರೆ, ಏಕೆಂದರೆ ನನ್ನ ಅಭಿಪ್ರಾಯದಲ್ಲಿ ಅವರು ಅದರ ಅಪಾಯಗಳ ಮೇಲೆ ಕೇಂದ್ರಿಕೃತರಾಗಿದ್ದಾರೆ-ಇದು ನಿಸ್ಸಂದೇಹವಾಗಿ ನೈಜವಾಗಿದೆ ಮತ್ತು ಅದರ ಪ್ರಯೋಜನಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸುತ್ತಿದೆ. ಆದ್ದರಿಂದ, ಅಪಾಯಗಳು ಮತ್ತು ಪ್ರಯೋಜನಗಳೆರಡರಲ್ಲೂ ಗಮನವನ್ನು ಪ್ರೋತ್ಸಾಹಿಸುವ ಸಲುವಾಗಿ, ನಾನು ಸಾದೃಶ್ಯವನ್ನು ನೀಡಲು ಬಯಸುತ್ತೇನೆ. ಪ್ರತಿ ವರ್ಷವೂ ಸಾವಿರ ಸಾವಿರ ಕಾರುಗಳು ಕಾರುಗಳಿಗೆ ಹೊಣೆಯಾಗುತ್ತವೆ, ಆದರೆ ನಾವು ಚಾಲನೆ ನಿಷೇಧಿಸಲು ಪ್ರಯತ್ನಿಸುವುದಿಲ್ಲ. ವಾಸ್ತವವಾಗಿ, ಚಾಲನೆ ನಿಷೇಧಿಸಲು ಕರೆ ಅಸಂಬದ್ಧ ಎಂದು ಏಕೆಂದರೆ ಚಾಲನೆ ಅನೇಕ ಅದ್ಭುತ ವಿಷಯಗಳನ್ನು ಶಕ್ತಗೊಳಿಸುತ್ತದೆ. ಬದಲಿಗೆ, ಯಾರು ಓಡಿಸಬಹುದೆಂದು (ಉದಾ, ನಿರ್ದಿಷ್ಟ ವಯಸ್ಸು ಮತ್ತು ಕೆಲವು ಪರೀಕ್ಷೆಗಳನ್ನು ಹಾದುಹೋಗಬೇಕಾದ ಅವಶ್ಯಕತೆ) ಮತ್ತು ಅವರು ಹೇಗೆ ಓಡಿಸಬಹುದು ಎಂಬುದರ ಮೇಲೆ ಸಮಾಜವು ನಿರ್ಬಂಧಗಳನ್ನು ಇರಿಸುತ್ತದೆ (ಉದಾಹರಣೆಗೆ, ವೇಗ ಮಿತಿಯ ಅಡಿಯಲ್ಲಿ). ಸೊಸೈಟಿಯು ಈ ನಿಯಮಗಳನ್ನು ಜಾರಿಗೊಳಿಸುವ ಕೆಲಸವನ್ನು ಹೊಂದಿದೆ (ಉದಾ., ಪೋಲಿಸ್), ಮತ್ತು ಅವರನ್ನು ಹಿಂಸೆಗೆ ಒಳಗಾದ ಜನರನ್ನು ಶಿಕ್ಷಿಸುತ್ತೇವೆ. ಚಾಲನಾ ನಿಯಂತ್ರಣಕ್ಕೆ ಸಮಾಜವು ಅನ್ವಯಿಸುತ್ತದೆ ಎಂದು ಇದೇ ರೀತಿಯ ಸಮತೋಲಿತ ಚಿಂತನೆಯು ಡೇಟಾ ಹಂಚಿಕೆಗೆ ಸಹ ಅನ್ವಯಿಸಬಹುದು. ಡೇಟಾ ಹಂಚಿಕೆಗಾಗಿ ಅಥವಾ ವಿರುದ್ಧವಾಗಿ ಸಂಪೂರ್ಣವಾದ ವಾದಗಳನ್ನು ಮಾಡುವ ಬದಲು, ನಾವು ಅಪಾಯಗಳನ್ನು ಕಡಿಮೆಗೊಳಿಸುವುದು ಮತ್ತು ಡೇಟಾ ಹಂಚಿಕೆಯಿಂದ ಪ್ರಯೋಜನಗಳನ್ನು ಹೆಚ್ಚಿಸುವುದು ಹೇಗೆ ಎಂಬ ಬಗ್ಗೆ ಕೇಂದ್ರೀಕರಿಸುವ ಮೂಲಕ ನಾವು ಹೆಚ್ಚು ಪ್ರಗತಿ ಸಾಧಿಸುತ್ತೇವೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.

ತೀರ್ಮಾನಕ್ಕೆ, ಮಾಹಿತಿ ಅಪಾಯವು ನಾಟಕೀಯವಾಗಿ ಹೆಚ್ಚಾಗಿದೆ ಮತ್ತು ಊಹಿಸಲು ಮತ್ತು ಪ್ರಮಾಣೀಕರಿಸುವುದು ತುಂಬಾ ಕಷ್ಟ. ಆದ್ದರಿಂದ, ಎಲ್ಲಾ ಡೇಟಾವು ಸಮರ್ಥವಾಗಿ ಗುರುತಿಸಬಹುದಾದ ಮತ್ತು ಸಂಭಾವ್ಯವಾಗಿ ಸೂಕ್ಷ್ಮವಾದುದು ಎಂದು ಭಾವಿಸುವುದು ಉತ್ತಮವಾಗಿದೆ. ಸಂಶೋಧನೆ ಮಾಡುವಾಗ ಮಾಹಿತಿ ಅಪಾಯವನ್ನು ಕಡಿಮೆ ಮಾಡಲು, ಸಂಶೋಧಕರು ಡೇಟಾ ಸಂರಕ್ಷಣಾ ಯೋಜನೆಯನ್ನು ರಚಿಸಬಹುದು ಮತ್ತು ಅನುಸರಿಸಬಹುದು. ಇದಲ್ಲದೆ, ಮಾಹಿತಿ ಅಪಾಯವು ಸಂಶೋಧಕರಿಗೆ ಇತರ ವಿಜ್ಞಾನಿಗಳೊಂದಿಗೆ ದತ್ತಾಂಶವನ್ನು ಹಂಚಿಕೊಳ್ಳುವುದನ್ನು ತಡೆಯುವುದಿಲ್ಲ.