4.2 thí nghiệm là gì?

Bản dịch này đã được tạo ra bởi một máy tính. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

4.2 thí nghiệm là gì?

Thí nghiệm ngẫu nhiên có bốn thành phần chính: tuyển dụng người tham gia, ngẫu nhiên điều trị, giao hàng điều trị, và đo lường kết quả.

thí nghiệm ngẫu nhiên có thể có nhiều hình thức và có thể được sử dụng để nghiên cứu nhiều loại hành vi. Tuy nhiên, tại cốt lõi của họ, những thử nghiệm ngẫu nhiên có bốn thành phần chính: tuyển dụng người tham gia, ngẫu nhiên điều trị, giao hàng điều trị, và đo lường kết quả. Các đại kỹ thuật số không thay đổi tính chất cơ bản của thí nghiệm, nhưng nó làm cho họ dễ dàng hơn về hậu cần. Ví dụ, trong quá khứ nó có thể được khó khăn để đo lường hành vi của hàng triệu người, nhưng mà bây giờ thường xuyên xảy ra trong nhiều hệ thống kỹ thuật số. Các nhà nghiên cứu có thể tìm ra cách để khai thác những cơ hội mới sẽ có thể chạy các thí nghiệm là không thể trước đó.

Để làm điều này tất cả một chút bê tông cả hơn những gì đã ở lại cùng và những gì đã thay đổi-chúng ta hãy xem xét Michael Restivo và Arnout van de Rijt của (2012) . Các nhà nghiên cứu muốn tìm hiểu tác động của phần thưởng đẳng thức trên những đóng góp biên tập để Wikipedia. Đặc biệt, họ đã nghiên cứu ảnh hưởng của barnstars, một giải thưởng mà bất kỳ Wikipedian có thể cung cấp cho bất kỳ Wikipedian khác để thừa nhận công việc khó khăn và sự tích cực. Restivo và van de Rijt đã barnstars 100 Wikipedians xứng đáng. Sau đó, Restivo và van de Rijt theo dõi đóng góp tiếp theo của người nhận để Wikipedia trong 90 ngày tiếp theo. Nhiều bất ngờ của họ, những người mà họ trao barnstars có xu hướng thực hiện chỉnh sửa ít hơn sau khi nhận được một. Nói cách khác, các barnstars dường như được khuyến khích hơn là khuyến khích đóng góp.

May mắn thay, Restivo và van de Rijt đã không chạy một "xáo trộn và quan sát" thí nghiệm; họ đã chạy một thử nghiệm ngẫu nhiên có kiểm soát. Vì vậy, ngoài việc lựa chọn 100 tác viên hàng đầu để nhận barnstar, họ cũng chọn ra 100 người đóng góp hàng đầu cho những người mà họ không đưa ra một barnstar. Những trăm phục vụ như là một nhóm kiểm soát, và những người có một barnstar và những người không được xác định một cách ngẫu nhiên. Khi Restivo và van de Rijt nhìn vào nhóm kiểm soát họ thấy rằng nó đã giảm mạnh trong những đóng góp quá. Cuối cùng, khi các nhà nghiên cứu so sánh những người trong nhóm điều trị (ví dụ, nhận barnstars) và những người trong nhóm kiểm soát, họ phát hiện ra rằng barnstar do biên tập viên để đóng góp nhiều hơn khoảng 60%. Nhưng, sự gia tăng này trong những đóng góp đã được diễn ra như một phần của một sự suy giảm chung trong cả hai nhóm.

Khi nghiên cứu này cho thấy, các nhóm kiểm soát trong các thí nghiệm là rất quan trọng trong một cách mà có phần nghịch lý. Để đo chính xác hiệu quả của barnstars, Restivo và van der Rijt cần thiết để quan sát những người mà không nhận được barnstars. Nhiều lần các nhà nghiên cứu, những người không quen thuộc với các thí nghiệm không đánh giá cao giá trị đáng kinh ngạc của các nhóm kiểm soát. Nếu Restivo và van de Rijt đã không có một nhóm kiểm soát, họ sẽ rút ra chính xác những kết luận sai lầm. Nhóm kiểm soát là rất quan trọng mà các giám đốc điều hành của một công ty sòng bạc lớn đã nói rằng chỉ có ba cách mà nhân viên có thể bị sa thải từ công ty của ông: trộm cắp, quấy rối tình dục, và chạy thử nghiệm mà không có một nhóm kiểm soát (Schrage 2011) .

Restivo và của van de Rijt nghiên cứu minh họa bốn thành phần chính của một thí nghiệm: tuyển dụng, ngẫu nhiên, sự can thiệp, và kết quả. Cùng với nhau, những bốn thành phần cho phép các nhà khoa học để vượt qua mối tương quan và đo lường hiệu quả nhân quả của phương pháp điều trị. Cụ thể, lấy ngẫu nhiên có nghĩa là khi bạn so sánh kết quả với các nhóm điều trị và kiểm soát bạn có được một ước tính của tác nhân quả của sự can thiệp đó cho tập hợp những người tham gia. Nói cách khác, với một thí nghiệm kiểm soát ngẫu nhiên bạn có thể chắc chắn rằng bất kỳ sự khác biệt trong kết quả được gây ra bởi sự can thiệp và không phải là một confounder, một tuyên bố rằng tôi thực hiện chính xác trong các Phụ lục kỹ thuật sử dụng khuôn khổ kết quả tiềm năng.

Ngoài việc là một minh họa tốt đẹp của các cơ chế thí nghiệm, Restivo và của van de Rijt nghiên cứu cũng cho thấy rằng các hậu cần của các thí nghiệm kỹ thuật số có thể hoàn toàn khác nhau từ các thí nghiệm tương tự. Trong Restivo và thử nghiệm van de Rijt, nó đã được dễ dàng để cung cấp cho các barnstar cho bất cứ ai trên thế giới và thật dễ dàng để theo dõi kết quả, số lần sửa đổi, qua một thời gian dài của thời gian (vì lịch sử sửa đổi được tự động ghi lại bởi Wikipedia). Khả năng này để cung cấp phương pháp điều trị và đo lường kết quả tại không có chi phí là chất lượng không giống như các thí nghiệm trong quá khứ. Mặc dù thí nghiệm này liên quan đến 200 người, nó có thể đã được chạy với 2.000 hay 20.000 người. Điều chính ngăn cản các nhà nghiên cứu từ mở rộng quy mô thí nghiệm của họ bởi một yếu tố của 100 được không chi phí, đó là đạo đức. Đó là, Restivo và van de Rijt đã không muốn cho barnstars cho biên tập viên không xứng đáng và họ không muốn thí nghiệm của mình để phá vỡ các cộng đồng Wikipedia (Restivo and Rijt 2012; Restivo and Rijt 2014) . Vì vậy, mặc dù các thí nghiệm của Restivo và van de Rijt là tương đối đơn giản, rõ ràng cho thấy rằng một số điều về các thí nghiệm đã ở lại cùng và một số đã thay đổi. Đặc biệt, logic cơ bản của thí nghiệm là như nhau, nhưng các hậu cần đã thay đổi. Tiếp theo, để cô lập rõ ràng hơn những cơ hội được tạo ra bởi sự thay đổi này, tôi sẽ so sánh các thí nghiệm mà các nhà nghiên cứu có thể làm bây giờ để các loại thí nghiệm đã được thực hiện trong quá khứ.