4.5.1.1 môi trường Sử dụng hiện có

Bạn có thể chạy các thí nghiệm trong môi trường hiện tại, mà không được mã hóa hoặc hợp tác.

Hậu cần, cách dễ nhất để làm thí nghiệm kỹ thuật số là để che phủ thử nghiệm của bạn trên đầu trang của một môi trường hiện tại, cho phép bạn chạy thử nghiệm lĩnh vực kỹ thuật số. Những thí nghiệm này có thể được chạy ở một quy mô hợp lý lớn và không đòi hỏi sự hợp tác với một công ty hoặc phát triển phần mềm mở rộng.

Ví dụ, Jennifer Doleac và Luke Stein (2013) đã tận dụng được thị trường trực tuyến (ví dụ, craigslist) để chạy thử nghiệm đo phân biệt chủng tộc. Doleac và Stein được quảng cáo hàng ngàn máy nghe nhạc iPod, và bởi hệ thống khác nhau đặc điểm của người bán, họ đã có thể nghiên cứu tác động của cuộc đua trên các giao dịch kinh tế. Hơn nữa, Doleac và Stein sử dụng quy mô thí nghiệm của họ để ước tính thời hiệu quả là lớn hơn (không đồng nhất của hiệu quả điều trị) và cung cấp một số ý tưởng về lý do tại sao các hiệu ứng có thể xảy ra (cơ chế).

Trước khi nghiên cứu về Doleac và Stein, đã có hai phương pháp chính để đo lường thực nghiệm phân biệt đối xử. Trong thư từ nghiên cứu các nhà nghiên cứu tạo ra hồ sơ của những người hư cấu của các chủng tộc khác nhau và sử dụng các hồ sơ, ví dụ, áp dụng cho các công việc khác nhau. Bertrand và Mullainathan của (2004) giấy với danh hiệu đáng nhớ "là Emily và Greg tuyển dụng Hơn Lakisha và Jamal? Một thí nghiệm thực địa về thị trường lao động phân biệt đối xử "là một minh họa tuyệt vời của một nghiên cứu tương ứng. nghiên cứu sự tương ứng có chi phí tương đối thấp cho mỗi quan sát, cho phép một nhà nghiên cứu duy nhất để thu thập hàng ngàn quan sát trong một nghiên cứu điển hình. Nhưng, các nghiên cứu tương ứng của phân biệt chủng tộc đã bị thẩm vấn vì cái tên có khả năng báo hiệu nhiều điều ngoài cuộc đua của người nộp đơn. Đó là, những cái tên như Greg, Emily, Lakisha, và Jamal có thể báo hiệu lớp xã hội ngoài cuộc đua. Vì vậy, bất kỳ sự khác biệt trong điều trị cho sơ yếu lý lịch của Greg và Jamal của có thể là do nhiều hơn sự khác biệt chủng tộc đoán về các ứng viên. Nghiên cứu kiểm toán, mặt khác, liên quan đến việc thuê diễn viên thuộc các chủng tộc khác nhau để nộp đơn trực tiếp cho công việc. Mặc dù các nghiên cứu kiểm toán cung cấp một tín hiệu rõ ràng của cuộc đua đơn, họ là cực kỳ đắt tiền mỗi quan sát, có nghĩa là họ thường chỉ có hàng trăm quan sát.

Trong thí nghiệm lĩnh vực kỹ thuật số của họ, Doleac và Stein đã có thể tạo ra một lai hấp dẫn. Họ đã có thể thu thập dữ liệu với chi phí tương đối thấp cho mỗi quan sát-kết quả là hàng ngàn quan sát (như trong một nghiên cứu tương ứng) -và họ đã có thể báo hiệu cuộc đua sử dụng hình ảnh, kết quả là một tín hiệu rõ ràng uncounfounded chủng tộc (như trong một nghiên cứu kiểm toán ). Như vậy, môi trường trực tuyến đôi khi cho phép các nhà nghiên cứu để tạo ra phương pháp điều trị mới có đặc tính mà khó để xây dựng khác.

Các quảng cáo iPod của Doleac và Stein thay đổi dọc theo ba kích thước chính. Đầu tiên, họ thay đổi các đặc tính của người bán, mà đã được báo hiệu bởi các tay chụp ảnh giữ iPod [màu trắng, đen, trắng với hình xăm] (Hình 4.12). Thứ hai, họ thay đổi yêu cầu mức giá [90 $, $ 110, $ 130]. Thứ ba, họ thay đổi chất lượng của văn bản quảng cáo [chất lượng cao và chất lượng thấp (ví dụ, lỗi vốn hóa và các lỗi spelin)]. Do đó, các tác giả đã có một thiết kế 3 X 3 X 2 được triển khai trên hơn 300 thị trường địa phương khác nhau, từ các thị trấn (ví dụ, Kokomo, IN và Bắc Platte, NE) đến thành phố lớn (ví dụ, New York và Los Angeles).

Hình 4.12: Hands dùng trong thí nghiệm của Doleac và Stein (2013). máy nghe nhạc iPod đã được bán bởi người bán hàng với các đặc tính khác nhau để đo lường phân biệt đối xử trong một thị trường trực tuyến.

Hình 4.12: Hands dùng trong thí nghiệm của Doleac and Stein (2013) . máy nghe nhạc iPod đã được bán bởi người bán hàng với các đặc tính khác nhau để đo lường phân biệt đối xử trong một thị trường trực tuyến.

Trung bình trên tất cả các điều kiện, kết quả là tốt hơn cho người bán trắng hơn người bán màu đen, với người bán xăm có kết quả trung gian. Ví dụ, người bán hàng trắng nhận thêm dịch vụ và có giá bán cuối cùng cao hơn. Ngoài những tác động trung bình, Doleac và Stein ước tính không đồng nhất của hiệu ứng. Ví dụ, một trong những dự đoán từ lý thuyết trước đó là phân biệt đối xử sẽ ít hơn trong những thị trường cạnh tranh hơn. Sử dụng số Mời nhận như là một proxy cho thị trường cạnh tranh, các tác giả thấy rằng người bán hàng màu đen trên thực tế cũng nhận được khuyến tồi tệ hơn trong những thị trường có mức độ cạnh tranh thấp. Hơn nữa, bằng cách so sánh kết quả cho quảng cáo với chất lượng cao và các văn bản chất lượng thấp, Doleac và Stein thấy rằng chất lượng quảng cáo không tác động bất lợi đối mặt bởi người bán hàng màu đen và hình xăm. Cuối cùng, lợi dụng thực tế là quảng cáo được đặt tại hơn 300 thị trường, các tác giả thấy rằng người bán hàng đen là hoàn cảnh khó khăn tại các thành phố có tỷ lệ tội phạm cao và phân biệt chủng tộc dân cư cao. Không ai trong số các kết quả này cung cấp cho chúng ta một sự hiểu biết chính xác về chính xác lý do tại sao người bán hàng màu đen có kết quả tồi tệ hơn, nhưng khi kết hợp với kết quả của các nghiên cứu khác, họ có thể bắt đầu để thông báo cho các lý thuyết về nguyên nhân của sự phân biệt chủng tộc trong các loại khác nhau của các giao dịch kinh tế.

Một ví dụ cho thấy khả năng của các nhà nghiên cứu đã tiến hành thí nghiệm kỹ thuật số trong các hệ thống hiện tại là nghiên cứu của Arnout van de Rijt và đồng nghiệp (2014) về chìa khóa thành công. Trong nhiều khía cạnh của cuộc sống, những người có vẻ tương tự như kết thúc với kết quả rất khác nhau. Một lời giải thích có thể cho mô hình này là nhỏ và cơ bản ngẫu nhiên lợi thế có thể lock-in và phát triển theo thời gian, một quá trình mà các nhà nghiên cứu gọi lợi thế tích lũy. Để xác định liệu những thành công ban đầu nhỏ lock-in hoặc mờ dần, van de Rijt và các cộng sự (2014) đã can thiệp thành bốn hệ thống khác nhau ban tặng cho thành công trên người được lựa chọn ngẫu nhiên, và sau đó đo các tác động lâu dài của thành công tùy tiện này.

Cụ thể hơn, van de Rijt và các đồng nghiệp 1) cam kết tiền để lựa chọn ngẫu nhiên các dự án trên kickstarter.com , một trang web gây quỹ quần chúng; 2) đánh giá tích cực đánh giá lựa chọn ngẫu nhiên trên trang web epinions ; 3) đã cho giải thưởng để chọn ngẫu nhiên những người đóng góp cho Wikipedia ; và 4) đã ký được lựa chọn ngẫu nhiên kiến nghị về change.org . Các nhà nghiên cứu tìm thấy kết quả tương tự như trên tất cả bốn hệ thống: trong mỗi trường hợp, các đại biểu đã được đưa ra một cách ngẫu nhiên một số thành công ban đầu đã đi vào để có thành công sau hơn các đồng nghiệp khác hoàn toàn không thể phân biệt của họ (Hình 4.13). Thực tế là các mô hình tương tự xuất hiện trong nhiều hệ thống làm tăng giá trị bên ngoài của các kết quả này vì nó làm giảm cơ hội mà mô hình này là một tạo tác của bất kỳ hệ thống cụ thể.

Hình 4.13: Ảnh hưởng lâu dài của thành công ban tặng ngẫu nhiên trong bốn hệ thống xã hội khác nhau. Arnout van de Rijt và các cộng sự (2014) 1) cam kết tiền để lựa chọn ngẫu nhiên các dự án trên kickstarter.com, một trang web gây quỹ quần chúng; 2) đánh giá tích cực đánh giá được lựa chọn ngẫu nhiên trên epinions website; 3) đã cho giải thưởng để chọn ngẫu nhiên những người đóng góp cho Wikipedia; và 4) đã ký được lựa chọn ngẫu nhiên kiến ​​nghị về change.org.

Hình 4.13: Ảnh hưởng lâu dài của thành công ban tặng ngẫu nhiên trong bốn hệ thống xã hội khác nhau. Arnout van de Rijt và các cộng sự (2014) 1) cam kết tiền để lựa chọn ngẫu nhiên các dự án trên kickstarter.com , một trang web gây quỹ quần chúng; 2) đánh giá tích cực đánh giá lựa chọn ngẫu nhiên trên trang web epinions ; 3) đã cho giải thưởng để chọn ngẫu nhiên những người đóng góp cho Wikipedia ; và 4) đã ký được lựa chọn ngẫu nhiên kiến nghị về change.org .

Cùng với nhau, hai ví dụ này cho thấy rằng các nhà nghiên cứu có thể tiến hành các thí nghiệm kỹ thuật số mà không cần phải hợp tác với các công ty hoặc cần thiết phải xây dựng hệ thống kỹ thuật số phức tạp. Hơn nữa, Bảng 4.2 cung cấp nhiều hơn ví dụ cho thấy phạm vi của những gì có thể khi các nhà nghiên cứu sử dụng các cơ sở hạ tầng của hệ thống hiện có để cung cấp kết quả điều trị và / hoặc biện pháp. Những thí nghiệm này là tương đối rẻ cho các nhà nghiên cứu và họ cung cấp một mức độ cao của chủ nghĩa hiện thực. Tuy nhiên, các thí nghiệm cung cấp các nhà nghiên cứu kiểm soát hạn chế trong những người tham gia, phương pháp điều trị, và kết quả phải đo. Hơn nữa, đối với các thí nghiệm diễn ra chỉ trong một hệ thống, các nhà nghiên cứu cần phải được quan tâm rằng những tác động có thể được thúc đẩy bởi động lực hệ thống cụ thể (ví dụ, cách mà Kickstarter xếp các dự án hay là cách mà change.org đứng đơn; để biết thêm thông tin, xem thảo luận về nhiễu thuật toán trong chương 2). Cuối cùng, khi các nhà nghiên cứu can thiệp vào hệ thống làm việc, vấn đề đạo đức khó khăn nổi lên về tác hại có thể tham gia, không tham gia, và hệ thống. Chúng tôi sẽ xem xét những câu hỏi đạo đức chi tiết hơn trong Chương 6, và có một cuộc thảo luận tuyệt vời của chúng trong các phụ lục của van de Rijt (2014) . Các đánh đổi đi kèm với làm việc trong một hệ thống hiện tại không phải là lý tưởng cho mọi dự án, và vì lý do đó một số nhà nghiên cứu xây dựng hệ thống thí nghiệm riêng của họ, chủ đề của phần tiếp theo.

Bảng 4.2: Ví dụ về các thí nghiệm trong các hệ thống hiện có. Những thí nghiệm này dường như rơi vào ba loại chính, và việc phân loại này có thể giúp bạn nhận thấy những cơ hội bổ sung cho các nghiên cứu của riêng bạn. Đầu tiên, đó là các thí nghiệm liên quan đến việc bán hoặc mua một cái gì đó (ví dụ, Doleac and Stein (2013) ). Thứ hai, có các thí nghiệm liên quan đến việc cung cấp một điều trị cho người tham gia cụ thể (ví dụ như, Restivo and Rijt (2012) ). Cuối cùng, có những thí nghiệm có liên quan đến phương pháp điều trị cung cấp cho các đối tượng cụ thể như kiến nghị (ví dụ, Vaillant et al. (2015) ).
Đề tài Trích dẫn
Ảnh hưởng của barnstars về những đóng góp cho Wikipedia Restivo and Rijt (2012) ; Restivo and Rijt (2014) ; Rijt et al. (2014)
Ảnh hưởng của thông điệp chống quấy rối trên tweets phân biệt chủng tộc Munger (2016)
Ảnh hưởng của phương pháp đấu giá trên giá bán Lucking-Reiley (1999)
Ảnh hưởng của uy tín về giá trong các cuộc đấu giá trực tuyến Resnick et al. (2006)
Ảnh hưởng của chủng tộc của người bán bán thẻ bóng chày trên eBay Ayres, Banaji, and Jolls (2015)
Ảnh hưởng của chủng tộc của người bán bán máy nghe nhạc iPod Doleac and Stein (2013)
Ảnh hưởng của cuộc đua của khách trên thuê Airbnb Edelman, Luca, and Svirsky (2016)
Ảnh hưởng của sự đóng góp vào sự thành công của các dự án trên Kickstarter Rijt et al. (2014)
Ảnh hưởng của chủng tộc và dân tộc trên cho thuê nhà ở Hogan and Berry (2011)
Ảnh hưởng của đánh giá tích cực về xếp hạng trong tương lai trên epinions Rijt et al. (2014)
Ảnh hưởng của các chữ ký trên sự thành công của các kiến ​​nghị Vaillant et al. (2015) ; Rijt et al. (2014)