5.3.4 Kết luận

Mở các cuộc gọi để cho nhiều chuyên gia và các chuyên gia không đề xuất các giải pháp cho những vấn đề mà giải pháp này là dễ dàng hơn để kiểm tra hơn tạo ra.

Trong cả ba dự án-Netflix gọi mở thưởng, Foldit, Peer-to-Patent-nhà nghiên cứu đặt ra câu hỏi của một hình thức cụ thể, gạ giải pháp, và sau đó chọn các giải pháp tốt nhất. Các nhà nghiên cứu thậm chí không cần phải biết các chuyên gia tốt nhất để hỏi, và đôi khi những ý tưởng tốt đến từ những nơi không ngờ.

Bây giờ tôi cũng có thể làm nổi bật hai sự khác biệt quan trọng giữa các dự án kêu gọi mở và các dự án tính toán của con người. Thứ nhất, trong các dự án kêu gọi mở các nhà nghiên cứu xác định một mục tiêu (ví dụ, dự đoán xếp hạng phim) trong khi trong tính toán của con người nghiên cứu xác định một tác vụ vi (ví dụ, phân loại một thiên hà). Thứ hai, trong các cuộc gọi mở các nhà nghiên cứu muốn đóng góp, các thuật toán tốt nhất tốt nhất để dự đoán xếp hạng phim, cấu hình thấp nhất năng lượng của một loại protein, hoặc các mảnh liên quan nhất trước khi nghệ thuật không phải một số loại kết hợp đơn giản của tất cả các đóng góp.

Với mẫu chung cho các cuộc gọi mở và ba ví dụ sau đây, những vấn đề gì trong nghiên cứu xã hội có thể phù hợp với phương pháp này? Tại thời điểm này, tôi nên thừa nhận rằng đã có không được nhiều ví dụ thành công chưa (vì những lý do mà tôi sẽ giải thích trong một thời điểm). Trong điều kiện tương tự trực tiếp, người ta có thể tưởng tượng rằng một dự án kiểu Peer-to-Bằng sáng chế đang được sử dụng bởi một nhà nghiên cứu lịch sử tìm kiếm các tài liệu sớm nhất đề cập đến một người hay một ý tưởng cụ thể. Một cách tiếp cận cuộc gọi mở cho các loại vấn đề có thể là đặc biệt có giá trị khi các văn bản có liên quan không được thu thập trong một kho lưu trữ duy nhất nhưng được phân phối rộng rãi.

Tổng quát hơn, nhiều chính phủ có vấn đề có thể được tuân theo để mở các cuộc gọi bởi vì họ là về việc tạo ra dự đoán rằng có thể được sử dụng để hướng dẫn hành động (Kleinberg et al. 2015) . Ví dụ, chỉ cần như Netflix muốn dự đoán xếp hạng trên các bộ phim, các chính phủ có thể muốn để dự đoán kết quả như những nhà hàng mà có nhiều khả năng có vi phạm luật y tế để phân bổ nguồn lực kiểm tra hiệu quả hơn. Thúc đẩy bởi các loại vấn đề, Glaeser et al. (2016) đã sử dụng một cuộc gọi mở để giúp thành phố Boston dự đoán hành vi vi phạm vệ sinh nhà hàng và vệ sinh môi trường dựa trên dữ liệu từ Yelp đánh giá và kiểm tra dữ liệu lịch sử. Glaeser và các đồng nghiệp ước tính rằng các mô hình dự đoán rằng chiến thắng các cuộc gọi mở sẽ cải thiện năng suất của thanh tra nhà hàng khoảng 50%. Các doanh nghiệp cũng có vấn đề với một cấu trúc tương tự như dự đoán khách hàng rời mạng (Provost and Fawcett 2013) .

Cuối cùng, ngoài việc mở các cuộc gọi liên quan đến kết quả đó đã xảy ra trong một bộ dữ liệu cụ thể (ví dụ, dự đoán vi phạm luật y tế sử dụng dữ liệu về vi phạm luật sức khỏe vừa qua), người ta có thể tưởng tượng dự đoán kết quả đó đã chưa xảy ra cho bất cứ ai trong tập dữ liệu . Ví dụ, các gia đình mong manh và nghiên cứu Wellbeing trẻ em đã theo dõi khoảng 5.000 trẻ em từ khi mới sinh tại 20 thành phố của Mỹ khác nhau (Reichman et al. 2001) . Các nhà nghiên cứu đã thu thập dữ liệu về những trẻ em, gia đình của họ, và môi trường rộng lớn hơn của họ khi sinh và ở lứa tuổi từ 1, 3, 5, 9, và 15. Với tất cả các thông tin về các trẻ này, như thế nào có thể các nhà nghiên cứu dự đoán kết quả như những người sẽ tốt nghiệp đại học? Hoặc, bày tỏ trong một cách mà sẽ thú vị hơn nhiều nhà nghiên cứu, trong đó dữ liệu và lý thuyết sẽ có hiệu quả nhất trong việc dự đoán những kết quả này? Kể từ khi không ai trong số những đứa trẻ này hiện đã đủ tuổi để đi học đại học, đây sẽ là một dự đoán đúng tương lai và có rất nhiều chiến lược khác nhau mà các nhà nghiên cứu có thể sử dụng. Một nhà nghiên cứu người tin rằng các khu phố rất quan trọng trong việc định hình kết quả cuộc sống có thể mất một cách tiếp cận trong khi một nhà nghiên cứu người tập trung vào các gia đình có thể làm một cái gì đó hoàn toàn khác nhau. Những cách tiếp cận này sẽ làm việc tốt hơn? Chúng tôi không biết, và trong quá trình tìm ra chúng ta có thể học được điều gì quan trọng về gia đình, khu phố, giáo dục, và bất bình đẳng xã hội. Hơn nữa, những dự đoán này có thể được sử dụng để hướng dẫn thu thập dữ liệu trong tương lai. Hãy tưởng tượng rằng có một số lượng nhỏ các sinh viên tốt nghiệp đại học mà không được dự báo tốt nghiệp của bất kỳ của các mô hình; những người này sẽ là ứng cử viên lý tưởng cho các cuộc phỏng vấn định tính theo dõi và quan sát dân tộc học. Vì vậy, trong các loại hình cuộc gọi mở, những dự đoán không phải là cuối cùng; đúng hơn, họ cung cấp một cách thức mới để so sánh, làm giàu, và kết hợp truyền thống lý thuyết khác nhau. Kiểu này gọi mở không phải là cụ thể để sử dụng dữ liệu từ các gia đình mong manh để dự đoán ai sẽ đi học đại học; nó có thể được sử dụng để dự đoán bất kỳ kết quả cuối cùng sẽ được thu thập trong bất kỳ bộ dữ liệu xã hội theo chiều dọc.

Như tôi đã viết trước đó trong phần này, đã có không được nhiều ví dụ của các nhà nghiên cứu xã hội sử dụng mở các cuộc gọi. Tôi nghĩ rằng điều này là vì các cuộc gọi mở chưa được phù hợp với cách mà các nhà khoa học xã hội thường đóng khung câu hỏi của họ. Quay trở lại với giải thưởng Netflix, các nhà khoa học xã hội sẽ không thường hỏi về dự đoán thị hiếu, họ sẽ hỏi về làm thế nào và tại sao thị hiếu văn hóa khác nhau cho những người từ tầng lớp xã hội khác nhau (Bourdieu 1987) . Như "làm thế nào" và "tại sao" Câu hỏi không dẫn đến dễ dàng để xác minh các giải pháp, và do đó có vẻ kém phù hợp để mở các cuộc gọi. Như vậy, có vẻ như mở các cuộc gọi là thuận lợi hơn cho câu hỏi dự đoán hơn câu hỏi của lời giải thích; để biết thêm về sự khác biệt giữa dự báo và giải thích thấy Breiman (2001) . Lý thuyết gần đây, tuy nhiên, đã kêu gọi các nhà khoa học xã hội để xem xét lại sự phân đôi giữa lời giải thích và dự đoán (Watts 2014) . Theo dòng giữa dự báo và giải thích mờ, tôi hy vọng rằng các cuộc thi mở sẽ trở nên ngày càng phổ biến trong các ngành khoa học xã hội.