bình luận thêm

Bản dịch này đã được tạo ra bởi một máy tính. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

bình luận thêm

Phần này được thiết kế để được sử dụng như một tài liệu tham khảo, chứ không phải là để được đọc như một câu chuyện.

Giới thiệu (Phần 6.1)

đạo đức nghiên cứu đã theo truyền thống cũng bao gồm các chủ đề như gian lận khoa học và phân bổ tín dụng. Các chủ đề này sẽ được thảo luận chi tiết hơn trong Engineering (2009) .

Chương này được định hình mạnh mẽ bởi tình hình tại Hoa Kỳ. Để biết thêm về các thủ tục đánh giá đạo đức ở các nước khác, xem Chương 6, 7, 8 và 9 của Desposato (2016b) . Đối với một lập luận rằng các nguyên tắc đạo đức y sinh học đã ảnh hưởng đến chương này là quá mức của Mỹ, xem Holm (1995) . Để xem xét lại lịch sử hơn Institutional Review Ban ở Mỹ, xem Stark (2012) .

Báo cáo Belmont và các quy định sau đó của Mỹ đã thực hiện một sự phân biệt giữa nghiên cứu và thực hành. Sự khác biệt này đã bị chỉ trích sau đó (Beauchamp and Saghai 2012; boyd 2016; Metcalf and Crawford 2016; Meyer 2015) . Tôi không làm cho sự khác biệt này trong chương này vì tôi nghĩ rằng các nguyên tắc và khuôn khổ đạo đức áp dụng cho cả các thiết lập. Để biết thêm về giám sát nghiên cứu tại Facebook, xem Jackman and Kanerva (2016) . Đối với một đề nghị cho giám sát nghiên cứu tại công ty và các tổ chức, xem Polonetsky, Tene, and Jerome (2015) và Tene and Polonetsky (2016) .

Để biết thêm về trường hợp của dịch Ebola trong năm 2014, thấy McDonald (2016) , và để biết thêm về những rủi ro bảo mật của dữ liệu điện thoại di động, xem Mayer, Mutchler, and Mitchell (2016) . Đối với một ví dụ về nghiên cứu khủng hoảng liên quan đến sử dụng dữ liệu điện thoại di động, xem Bengtsson et al. (2011) và Lu, Bengtsson, and Holme (2012) .

Ba ví dụ (Phần 6.2)

Nhiều người đã viết về Contagion cảm xúc. Tạp chí Nghiên cứu Đạo đức cống hiến toàn bộ vấn đề của họ trong tháng 1 năm 2016 thảo luận về thí nghiệm; thấy Hunter and Evans (2016) cho một cái nhìn tổng quan. Kỷ yếu của Học Khoa học Quốc gia xuất bản hai tác phẩm về cuộc thử nghiệm: Kahn, Vayena, and Mastroianni (2014) và Fiske and Hauser (2014) . Phần khác về các thí nghiệm bao gồm: Puschmann and Bozdag (2014) ; Meyer (2014) ; Grimmelmann (2015) ; Meyer (2015) ; Selinger and Hartzog (2015) ; Kleinsman and Buckley (2015) ; Shaw (2015) ; Flick (2015) .

Để biết thêm về Encore, xem Jones and Feamster (2015) .

Kỹ thuật số là khác nhau (mục 6.3)

Về giám sát khối lượng, tổng quan rộng được cung cấp trong Mayer-Schönberger (2009) và Marx (2016) . Đối với một ví dụ cụ thể của chi phí thay đổi giám sát, Bankston and Soltani (2013) ước tính rằng theo dõi một nghi can tội phạm sử dụng điện thoại di động là rẻ hơn so với sử dụng giám sát vật lý khoảng 50 lần. Bell and Gemmell (2009) cung cấp một cái nhìn lạc quan hơn về tự giám sát. Ngoài ra để có thể theo dõi hành vi quan sát đó là công cộng hoặc một phần công cộng (ví dụ, vị giác, Ties, và Thời gian), các nhà nghiên cứu ngày càng có thể suy ra những điều mà nhiều người tham gia xem xét để được tư nhân. Ví dụ, Michal Kosinski và các cộng sự đã cho thấy rằng họ có thể suy luận thông tin nhạy cảm về con người, chẳng hạn như xu hướng tình dục và sử dụng các chất gây nghiện từ dường như bình thường dữ liệu dấu vết kỹ thuật số (Facebook Likes) (Kosinski, Stillwell, and Graepel 2013) . Điều này có vẻ huyền diệu, nhưng cách tiếp cận Kosinski và các đồng nghiệp sử dụng-trong đó kết hợp các dấu vết kỹ thuật số, khảo sát và giám sát thực sự học tập-là cái gì mà tôi đã nói với bạn về. Nhớ lại rằng trong Chương 3 (Đặt câu hỏi) Tôi đã nói với bạn như thế nào Josh Blumenstock và các cộng sự (2015) dữ liệu khảo sát kết hợp với dữ liệu điện thoại di động để ước lượng đói nghèo ở Rwanda. Cách tiếp cận này chính xác như nhau, mà có thể được sử dụng để đo lường hiệu quả nghèo ở một nước đang phát triển, cũng có thể được sử dụng cho các kết luận có khả năng riêng tư vi phạm.

Pháp luật và định mức không phù hợp có thể dẫn đến nghiên cứu mà không tôn trọng mong muốn của người tham gia, và nó có thể dẫn đến "mua sắm quy định" các nhà nghiên cứu (Grimmelmann 2015; Nickerson and Hyde 2016) . Đặc biệt, một số nhà nghiên cứu, những người muốn tránh sự giám sát IRB có người bạn đời không được bao phủ bởi IRBs (ví dụ, người dân tại các công ty hoặc tổ chức NGO) thu thập và de-xác định dữ liệu. Sau đó, các nhà nghiên cứu có thể phân tích này de-xác định dữ liệu mà không cần sự giám sát IRB, ít nhất là theo một số cách diễn giải các quy tắc hiện tại. Kiểu này trốn IRB dường như không phù hợp với một phương pháp tiếp cận dựa trên nguyên tắc.

Để biết thêm về những ý tưởng không phù hợp và không đồng nhất mà mọi người có về dữ liệu y tế, xem Fiore-Gartland and Neff (2015) . Để biết thêm về các vấn đề mà không đồng nhất tạo ra cho đạo đức nghiên cứu quyết định xem Meyer (2013) .

Một sự khác biệt giữa các độ tuổi tương tự và nghiên cứu đại kỹ thuật số là trong thời đại số tương tác nghiên cứu với sự tham gia là xa hơn. Những tương tác thường xảy ra thông qua một trung gian như một công ty, và có thường là một vật lý-xã hội và khoảng cách lớn giữa các nhà nghiên cứu và những người tham gia. tương tác xa này làm cho một số những điều dễ dàng trong nghiên cứu Tuổi analog khó khăn trong nghiên cứu đại kỹ thuật số, chẳng hạn như lọc ra những người tham gia cần được bảo vệ thêm, phát hiện các tác dụng phụ, và remediating hại nếu nó xảy ra. Ví dụ, chúng ta hãy đối chiếu Contagion cảm xúc với một thí nghiệm trong phòng thí nghiệm giả thuyết về cùng một chủ đề. Trong thí nghiệm trong phòng thí nghiệm, các nhà nghiên cứu có thể lọc ra bất cứ ai đến tại phòng thí nghiệm cho thấy những dấu hiệu rõ ràng của cảm xúc buồn khổ. Hơn nữa, nếu thử nghiệm trong phòng thí nghiệm tạo ra một sự kiện bất lợi, các nhà nghiên cứu sẽ nhìn thấy nó, cung cấp dịch vụ để khắc phục những thiệt hại, và sau đó thực hiện điều chỉnh các giao thức thử nghiệm để ngăn chặn thiệt hại trong tương lai. Bản chất xa của sự tương tác trong thí nghiệm Contagion cảm xúc thực tế làm cho mỗi người trong các bước đơn giản và hợp lý vô cùng khó khăn. Ngoài ra, tôi nghi ngờ rằng, khoảng cách giữa các nhà nghiên cứu và những người tham gia làm cho các nhà nghiên cứu ít nhạy cảm với những mối quan tâm của những người tham gia của họ.

Các nguồn khác của các chuẩn mực và pháp luật không phù hợp. Một số mâu thuẫn này xuất phát từ thực tế rằng nghiên cứu này đang xảy ra khắp nơi trên thế giới. Ví dụ, Encore liên quan đến người dân từ khắp nơi trên thế giới, và do đó nó có thể là đối tượng để bảo vệ dữ liệu và các luật riêng tư của nhiều quốc gia khác nhau. Điều gì nếu các chỉ tiêu quản lý các yêu cầu web của bên thứ ba (những gì Encore đã làm) là khác nhau ở Đức, Hoa Kỳ, Kenya, và Trung Quốc? Điều gì nếu định mức thậm chí không phù hợp trong một quốc gia duy nhất? Một nguồn tin thứ hai của mâu thuẫn xuất phát từ sự hợp tác giữa các nhà nghiên cứu tại các trường đại học và các công ty; Ví dụ, về tình cảm Contagion là một sự hợp tác giữa một nhà khoa học dữ liệu tại Facebook và là giáo sư và sau đại học tại Cornell. Tại Facebook chạy thí nghiệm lớn là thói quen, và tại thời điểm đó, không đòi hỏi bất kỳ bên thứ ba xem xét đạo đức. Tại Cornell tiêu chuẩn và quy định là khá khác nhau; hầu như tất cả các thí nghiệm phải được xem xét lại bởi Cornell IRB. Vì vậy, mà tập hợp các quy tắc nên chi phối cảm xúc Contagion-Facebook hoặc Cornell?

Để biết thêm về những nỗ lực để sửa đổi Quy tắc chung, xem Evans (2013) , Council (2014) , Metcalf (2016) , và Hudson and Collins (2015) .

Bốn nguyên tắc (Phần 6.4)

Các phương pháp cổ điển dựa trên nguyên tắc đạo đức y sinh là Beauchamp and Childress (2012) . Họ đề xuất rằng bốn nguyên tắc chính nên hướng dẫn đạo đức y sinh: Tôn trọng quyền tự trị, Nonmaleficence, beneficence, và Tư pháp. Các nguyên tắc nonmaleficence thúc giục một để tránh gây hại cho người khác. Khái niệm này được kết nối sâu sắc với ý tưởng Hippocratic của "Do không có hại." Trong đạo đức nghiên cứu, nguyên tắc này thường được kết hợp với các nguyên tắc của beneficence, nhưng thấy Beauchamp and Childress (2012) (Chương 5) để biết thêm về sự khác biệt giữa hai . Đối với một lời chỉ trích rằng những nguyên tắc này là quá Mỹ, xem Holm (1995) . Để biết thêm về cân bằng khi các nguyên tắc xung đột, xem Gillon (2015) .

Bốn nguyên tắc trong chương này cũng đã được đề xuất để hướng dẫn giám sát đạo đức cho các nghiên cứu xảy ra tại các công ty và các tổ chức NGO (Polonetsky, Tene, and Jerome 2015) thông qua các cơ quan được gọi là "Chủ đề người tiêu dùng giá đồng" (CSRBs) (Calo 2013) .

Tôn trọng người (mục 6.4.1)

Ngoài tôn trọng quyền tự chủ, Báo cáo Belmont cũng thừa nhận rằng không phải mọi người có khả năng thực sự tự quyết. Ví dụ, trẻ em, những người bị bệnh tật, hoặc những người sống trong các tình huống tự do hạn chế nghiêm trọng có thể không có khả năng hành động cá nhân hoàn toàn tự trị, và những người này, do đó, tùy thuộc vào sự bảo vệ thêm.

Áp dụng các nguyên tắc của sự tôn trọng đối với người trong thời đại kỹ thuật số có thể được thử thách. Ví dụ, trong nghiên cứu đại kỹ thuật số, nó có thể được khó khăn để cung cấp bảo vệ thêm cho những người có khả năng bị suy giảm tự quyết bởi vì các nhà nghiên cứu thường biết rất ít về những người tham gia của họ. Hơn nữa, đồng ý tham gia nghiên cứu xã hội đại kỹ thuật số là một thách thức rất lớn. Trong một số trường hợp, sự đồng ý thực sự thông báo có thể bị nghịch lý minh bạch (Nissenbaum 2011) , nơi mà thông tin và hiểu biết đều mâu thuẫn. Khoảng, nếu các nhà nghiên cứu cung cấp thông tin đầy đủ về bản chất của việc thu thập dữ liệu, phân tích dữ liệu, và thực hành bảo mật dữ liệu, nó sẽ được khó khăn cho nhiều người tham gia hiểu. Nhưng, nếu các nhà nghiên cứu cung cấp thông tin dễ hiểu, nó có thể thiếu thông tin kỹ thuật quan trọng. Trong nghiên cứu y học trong tương tự với lứa tuổi các thiết lập thống trị xem xét bởi Belmont Báo cáo ai có thể tưởng tượng một bác sĩ nói chuyện riêng với mỗi người tham gia để giúp giải quyết các nghịch lý minh bạch. Trong các nghiên cứu trực tuyến liên quan đến hàng ngàn hoặc hàng triệu người, một cách tiếp cận như vậy mặt đối mặt là không thể. Vấn đề thứ hai với sự đồng ý trong thời đại kỹ thuật số là trong một số nghiên cứu, chẳng hạn như phân tích các kho dữ liệu khổng lồ, nó sẽ là không thực tế để có được sự đồng ý của tất cả những người tham gia. Tôi thảo luận về những điều này và các câu hỏi khác về sự đồng ý thông báo chi tiết hơn tại mục 6.6.1. Mặc dù có những khó khăn, tuy nhiên, chúng ta nên nhớ rằng sự đồng ý là không cần thiết và cũng không đủ để tôn trọng người.

Để biết thêm về nghiên cứu y khoa trước khi có sự đồng ý thông báo, xem Miller (2014) . Đối với một điều trị cuốn sách dài của sự đồng ý thông báo, xem Manson and O'Neill (2007) . Xem thêm các bài đọc gợi ý về sự đồng ý thông báo dưới đây.

Beneficence (mục 6.4.2)

Thiệt hại đối với bối cảnh là những tác hại mà nghiên cứu có thể gây ra không để những người cụ thể nhưng để thiết lập xã hội. Khái niệm này là một chút trừu tượng, nhưng tôi sẽ minh họa với hai ví dụ: một analog và kỹ thuật số một.

Một ví dụ điển hình của việc tổn hại đến bối cảnh đến từ Ban giám khảo Nghiên cứu Wichita [ Vaughan (1967) ; Katz, Capron, and Glass (1972) ; Ch 2] -. Đôi khi cũng được gọi là ban giám khảo dự án Chicago (Cornwell 2010) . Trong này các nhà nghiên cứu nghiên cứu từ Đại học Chicago, như là một phần của một nghiên cứu lớn hơn về các khía cạnh xã hội của hệ thống pháp luật, bí mật ghi sáu cân nhắc ban giám khảo ở Wichita, Kansas. Các thẩm phán và luật sư trong các trường hợp đã được phê duyệt bản ghi âm, và có sự giám sát chặt chẽ của quá trình. Tuy nhiên, Hội thẩm đã không biết rằng bản ghi âm đã xảy ra. Khi nghiên cứu đã được phát hiện, có phẫn nộ công cộng. Bộ Tư pháp Mỹ đã bắt đầu một cuộc điều tra nghiên cứu, và các nhà nghiên cứu đã được gọi để làm chứng trước Quốc hội. Cuối cùng, Quốc hội đã thông qua một đạo luật mới mà làm cho nó bất hợp pháp để bí mật ghi lại ban giám khảo cân nhắc.

Mối quan tâm của các nhà phê bình của nghiên cứu Wichita Ban giám khảo đã không gây tổn hại cho người tham gia; đúng hơn, đó là tổn hại đến bối cảnh của ban giám khảo cân nhắc. Đó là, người ta tin rằng nếu các thành viên ban giám khảo đã không tin rằng họ đã có các cuộc thảo luận trong một không gian an toàn và bảo vệ, nó sẽ khó khăn hơn cho các cuộc thảo luận ban giám khảo để tiến hành trong tương lai. Ngoài ban giám khảo cân nhắc, có bối cảnh xã hội cụ thể khác mà xã hội cung cấp với bảo vệ phụ như mối quan hệ của luật sư và khách hàng và chăm sóc tâm lý (MacCarthy 2015) .

Nguy cơ tổn hại đến bối cảnh và sự đổ vỡ của hệ thống xã hội cũng đi lên trong một số thí nghiệm Khoa học Chính trị (Desposato 2016b) . Đối với một ví dụ về một nhiều hơn tính toán chi phí-lợi ích bối cảnh nhạy cảm trong một thí nghiệm lĩnh vực khoa học chính trị, xem Zimmerman (2016) .

Tư pháp (mục 6.4.3)

Bồi thường cho người tham gia đã được thảo luận trong một số thiết lập liên quan đến nghiên cứu đại kỹ thuật số. Lanier (2014) đề xuất trả người tham gia cho dấu vết kỹ thuật số mà họ tạo ra. Bederson and Quinn (2011) thảo luận về thanh toán trong thị trường lao động trực tuyến. Cuối cùng, Desposato (2016a) đề nghị trả tiền người tham gia thí nghiệm. Ông chỉ ra rằng ngay cả những người tham gia không thể được trả trực tiếp, một hiến có thể được thực hiện cho một nhóm làm việc cho họ. Ví dụ, trong Encore các nhà nghiên cứu có thể đã thực hiện một hiến cho một nhóm làm việc để hỗ trợ truy cập vào Internet.

Tôn trọng luật pháp và lợi ích cộng đồng (Mục 6.4.4)

Điều khoản của dịch vụ thỏa thuận nên có trọng lượng ít hơn so với các hợp đồng đàm phán giữa các bên bình đẳng và pháp luật được tạo ra bởi các chính phủ hợp pháp. Tình huống mà các nhà nghiên cứu đã vi phạm các điều khoản của dịch vụ thỏa thuận trong quá khứ thường liên quan đến sử dụng các truy vấn tự động để kiểm toán các hoạt động của công ty (giống như thí nghiệm để đo lường phân biệt đối xử). Để thảo luận thêm xem Vaccaro et al. (2015) , Bruckman (2016a) , Bruckman (2016b) . Đối với một ví dụ về nghiên cứu thực nghiệm mà thảo luận về các điều khoản của dịch vụ, xem Soeller et al. (2016) . Để biết thêm về các vấn đề pháp lý có thể các nhà nghiên cứu phải đối mặt nếu họ vi phạm điều khoản dịch vụ xem Sandvig and Karahalios (2016) .

Hai khuôn khổ đạo đức (Phần 6.5)

Rõ ràng, một lượng lớn đã được viết về hệ quả luận và nghĩa vụ học. Đối với một ví dụ về làm thế nào những khuôn khổ đạo đức, và những người khác, có thể được sử dụng để suy luận về nghiên cứu đại kỹ thuật số, xem Zevenbergen et al. (2015) . Đối với một ví dụ về làm thế nào những khuôn khổ đạo đức có thể được áp dụng cho các thí nghiệm trong phát triển kinh tế, xem Baele (2013) .

Sự đồng ý thông báo (mục 6.6.1)

Để biết thêm về các nghiên cứu kiểm toán của phân biệt đối xử, xem Pager (2007) và Riach and Rich (2004) . Không chỉ làm những nghiên cứu này không có sự chấp thuận, họ cũng liên quan đến việc lừa dối mà không cần phỏng vấn.

Cả hai Desposato (2016a) và Humphreys (2015) đưa ra lời khuyên về các thí nghiệm mà không cần sự đồng ý.

Sommers and Miller (2013) đánh giá nhiều lập luận ủng hộ không cuộc trao người tham gia sau khi lừa dối, và lập luận rằng các nhà nghiên cứu nên từ bỏ "cuộc trao dưới một tập hợp rất hẹp của hoàn cảnh, cụ thể là, trong lĩnh vực nghiên cứu, trong đó phỏng vấn đặt ra rào cản thực tế đáng kể nhưng các nhà nghiên cứu sẽ có không lo ngại về cuộc trao nếu có thể. Các nhà nghiên cứu không nên được phép bỏ cuộc trao đổi này để duy trì một hồ bơi viên ngây thơ, che mình khỏi tham gia giận dữ, hay bảo vệ người tham gia khỏi bị tổn hại. "Những người khác cho rằng nếu cuộc trao đổi này gây hại nhiều hơn lợi nên tránh. Phỏng vấn là một trường hợp mà một số nhà nghiên cứu ưu tiên Tôn trọng người trên beneficence, và một số nhà nghiên cứu làm ngược lại. Một giải pháp có thể sẽ phải tìm cách để làm cho cuộc trao một kinh nghiệm học tập cho những người tham gia. Đó là, thay vì nghĩ đến việc thẩm vấn như một cái gì đó mà có thể gây ra thiệt hại, có lẽ cuộc trao cũng có thể là một cái gì đó có lợi cho người tham gia. Đối với một ví dụ về loại này của cuộc trao đổi giáo dục, xem Jagatic et al. (2007) về cuộc trao học sinh sau khi một thí nghiệm lừa đảo xã hội. Các nhà tâm lý đã phát triển kỹ thuật cho cuộc trao (DS Holmes 1976a; DS Holmes 1976b; Mills 1976; Baumrind 1985; Oczak and Niedźwieńska 2007) và một số trong số này có thể hữu ích áp dụng để nghiên cứu đại kỹ thuật số. Humphreys (2015) cung cấp những suy nghĩ thú vị về sự đồng ý trì hoãn, mà là liên quan chặt chẽ với chiến lược phỏng vấn mà tôi mô tả.

Ý tưởng về hỏi một mẫu người tham gia cho có sự đồng ý của họ là có liên quan đến những gì Humphreys (2015) gọi suy ra sự đồng ý.

Một ý tưởng nữa mà đã được đề xuất có liên quan đến sự đồng ý là để xây dựng một bảng điều khiển của người đồng ý là trong các thí nghiệm trực tuyến (Crawford 2014) . Một số người cho rằng bảng này sẽ là một mẫu không ngẫu nhiên của mọi người. Nhưng, Chương 3 (Đặt câu hỏi) cho thấy rằng những vấn đề này là có khả năng sử dụng địa chỉ sau phân tầng và phù hợp với mẫu. Ngoài ra, đồng ý là trên bảng điều khiển có thể bao gồm một loạt các thí nghiệm. Nói cách khác, người tham gia có thể không cần để bằng lòng mỗi thí nghiệm riêng rẽ, một khái niệm gọi là sự đồng ý rộng (Sheehan 2011) .

Sự hiểu biết và quản lý rủi ro thông tin (Mục 6.6.2)

Xa độc đáo, giải Netflix minh họa một tính chất kỹ thuật quan trọng của các bộ dữ liệu chứa thông tin chi tiết về con người, và do đó cung cấp những bài học quan trọng về khả năng "nặc danh" các bộ dữ liệu xã hội hiện đại. Các tập tin với nhiều mẩu thông tin về mỗi người có thể sẽ là thưa thớt, trong ý nghĩa được xác định chính thức trong Narayanan and Shmatikov (2008) . Đó là, cho mỗi bản ghi không có hồ sơ đó là như nhau, và trong thực tế không có hồ sơ mà rất giống nhau: mỗi người là xa láng giềng gần nhất của họ trong tập dữ liệu. Người ta có thể tưởng tượng rằng các dữ liệu Netflix có thể là thưa thớt vì với khoảng 20.000 bộ phim trên thang điểm 5 sao, có khoảng \ (6 ^ {20.000} \) các giá trị có thể là mỗi người có thể có (6 bởi vì ngoài một đến 5 sao , một người nào đó có thể đã không đánh giá bộ phim ở tất cả). Con số này là quá lớn, khó có thể nào hiểu nổi.

Thưa thớt có hai ý nghĩa chính. Đầu tiên, nó có nghĩa là cố gắng "anonymize" các số liệu dựa trên nhiễu loạn ngẫu nhiên có khả năng sẽ thất bại. Đó là, ngay cả khi Netflix là để điều chỉnh một cách ngẫu nhiên một số xếp hạng (mà họ đã làm), điều này sẽ không đủ vì kỷ lục bị nhiễu loạn vẫn là kỷ lục gần nhất có thể để các thông tin mà kẻ tấn công có. Thứ hai, thưa thớt có nghĩa là de-nặc danh là có thể ngay cả khi kẻ tấn công có kiến thức không hoàn hảo hoặc vô tư. Ví dụ, trong các dữ liệu Netflix, chúng ta hãy tưởng tượng kẻ tấn công biết xếp hạng của bạn cho hai bộ phim và những ngày bạn đã thực hiện những đánh giá +/- 3 ngày; chỉ là thông tin đó một mình là đủ để xác định duy nhất 68% số người trong các dữ liệu Netflix. Nếu kẻ tấn công biết 8 phim mà bạn đã đánh giá +/- 14 ngày, sau đó ngay cả khi hai trong số các xếp hạng được biết đến là hoàn toàn sai, 99% số hồ sơ có thể được xác định duy nhất trong tập dữ liệu. Nói cách khác, thưa thớt là một vấn đề cơ bản cho những nỗ lực "anonymize" dữ liệu, mà là không may vì số liệu xã hội hiện đại nhất là thưa thớt.

siêu dữ liệu qua điện thoại cũng có thể xuất hiện được "vô danh" và không nhạy cảm, nhưng đó không phải là trường hợp. Siêu dữ liệu điện thoại là nhận biết và nhạy cảm (Mayer, Mutchler, and Mitchell 2016; Landau 2016) .

Trong hình 6.6, tôi phác thảo ra một thương mại-off giữa rủi ro cho người tham gia và lợi ích cho nghiên cứu từ phát hành dữ liệu. Để so sánh giữa các phương pháp hạn chế truy cập (ví dụ, một khu vườn có tường bao quanh) và cách tiếp cận dữ liệu bị hạn chế (ví dụ, một số hình thức nặc danh) thấy Reiter and Kinney (2011) . Đối với một hệ thống phân loại được đề xuất mức độ rủi ro của dữ liệu, xem Sweeney, Crosas, and Bar-Sinai (2015) . Cuối cùng, cho một cuộc thảo luận tổng quát hơn của việc chia sẻ dữ liệu, xem Yakowitz (2011) .

Đối với phân tích chi tiết hơn về điều này thương mại-off giữa rủi ro và lợi ích của dữ liệu, xem Brickell and Shmatikov (2008) , Ohm (2010) , Wu (2013) , Reiter (2012) , và Goroff (2015) . Để xem đổi này áp dụng cho dữ liệu thực tế từ các khóa học trực tuyến ồ ạt mở (MOOCs), xem Daries et al. (2014) và Angiuli, Blitzstein, and Waldo (2015) .

Riêng tư khác biệt cũng cung cấp một phương pháp thay thế có thể kết hợp cả hai lợi ích cao cho xã hội và rủi ro thấp cho người tham gia, xem Dwork and Roth (2014) và Narayanan, Huey, and Felten (2016) .

Để biết thêm về các khái niệm về thông tin nhận diện cá nhân (PII), mà là trung tâm của nhiều quy định về đạo đức nghiên cứu, xem Narayanan and Shmatikov (2010) và Schwartz and Solove (2011) . Để biết thêm về các dữ liệu là khả năng nhạy cảm, xem Ohm (2015) .

Trong phần này, tôi đã miêu tả sự liên kết của các bộ dữ liệu khác nhau như một cái gì đó có thể dẫn đến nguy cơ thông tin. Tuy nhiên, nó cũng có thể tạo ra những cơ hội mới cho việc nghiên cứu, như lập luận trong Currie (2013) .

Để biết thêm về năm két, xem Desai, Ritchie, and Welpton (2016) . Đối với một ví dụ về cách kết quả đầu ra có thể được xác định, xem Brownstein, Cassa, and Mandl (2006) , trong đó cho thấy làm thế nào các bản đồ có tỷ lệ nhiễm bệnh có thể được xác định. Dwork et al. (2017) cũng cho rằng các cuộc tấn công chống lại các dữ liệu tổng hợp, chẳng hạn như thống kê về bao nhiêu cá nhân có một bệnh nào đó.

Bảo mật (Mục 6.6.3)

Warren and Brandeis (1890) là một bài pháp mang tính bước ngoặt về sự riêng tư, và bài viết có liên quan nhất với ý tưởng rằng bảo mật là một quyền được ở một mình. Gần đây phương pháp điều trị chiều dài cuốn sách riêng tư mà tôi muốn giới thiệu bao gồm Solove (2010) và Nissenbaum (2010) .

Để xem lại các nghiên cứu thực nghiệm về cách mọi người nghĩ về bảo mật, xem Acquisti, Brandimarte, and Loewenstein (2015) . Tạp chí Khoa học xuất bản một vấn đề đặc biệt mang tên "The End of Privacy", trong đó đề cập đến những vấn đề riêng tư và rủi ro thông tin từ nhiều quan điểm khác nhau; cho một bản tóm tắt thấy Enserink and Chin (2015) . Calo (2011) cung cấp một khuôn khổ cho việc suy nghĩ về tác hại đến từ hành vi vi phạm quyền riêng tư. Một ví dụ về các mối quan tâm về bảo mật trong các khởi đầu của thời đại kỹ thuật số là Packard (1964) .

Quyết định không chắc chắn (mục 6.6.4)

Một thách thức khi cố gắng áp dụng các tiêu chuẩn tối thiểu nguy cơ là nó không phải là rõ ràng mà cuộc sống hàng ngày là được sử dụng cho điểm chuẩn (Council 2014) . Ví dụ, những người vô gia cư có mức độ cao hơn của sự khó chịu trong cuộc sống hàng ngày của họ. Nhưng, điều đó không có nghĩa rằng nó là đạo đức cho phép để lộ những người vô gia cư để nghiên cứu nguy cơ cao hơn. Vì lý do này, dường như có một sự đồng thuận ngày càng tăng rằng nguy cơ tối thiểu nên được làm chuẩn đối với một tiêu chuẩn dân số nói chung, không phải là một tiêu chuẩn dân số cụ thể. Trong khi tôi thường đồng ý với ý tưởng của một tiêu chuẩn dân số nói chung, tôi nghĩ rằng đối với các nền tảng trực tuyến lớn như Facebook, một quần thể chuẩn cụ thể là hợp lý. Đó là, khi xem xét Contagion tình cảm, tôi nghĩ rằng nó là hợp lý để chuẩn chống lại nguy cơ hàng ngày trên Facebook. Một quần thể chuẩn cụ thể trong trường hợp này là dễ dàng hơn nhiều để đánh giá và khó có khả năng xung đột với các nguyên tắc của công lý, mà tìm cách ngăn chặn những gánh nặng của nghiên cứu không công bằng đối với các nhóm thiệt thòi (ví dụ, các tù nhân và trẻ mồ côi).

Lời khuyên thiết thực (Phần 6.7)

Các học giả khác cũng đã kêu gọi các giấy tờ hơn để bao gồm các phụ lục đạo đức (Schultze and Mason 2012; Kosinski et al. 2015) . King and Sands (2015) cũng cung cấp lời khuyên thiết thực.