5.4 thu thập dữ liệu phân tán

Cộng tác đại chúng cũng có thể giúp thu thập dữ liệu, nhưng nó là khó khăn để đảm bảo chất lượng dữ liệu và phương pháp tiếp cận có hệ thống để lấy mẫu.

Ngoài việc tạo ra tính toán con người và các dự án cuộc gọi mở, các nhà nghiên cứu cũng có thể tạo ra các dự án thu thập dữ liệu phân tán. Trên thực tế, phần lớn khoa học xã hội định lượng đã dựa vào việc thu thập dữ liệu phân tán bằng cách sử dụng nhân viên có lương. Ví dụ, để thu thập dữ liệu cho Khảo sát Xã hội Chung, một công ty thuê người phỏng vấn để thu thập thông tin từ người trả lời. Nhưng, nếu chúng ta bằng cách nào đó có thể tranh thủ tình nguyện viên như người thu thập dữ liệu?

Như các ví dụ dưới đây - từ nghiên cứu về khoa học và máy tính - cho thấy, thu thập dữ liệu phân tán cho phép các nhà nghiên cứu thu thập dữ liệu thường xuyên hơn và ở nhiều nơi hơn so với trước đây. Hơn nữa, với các giao thức thích hợp, các dữ liệu này có thể đủ tin cậy để sử dụng cho nghiên cứu khoa học. Trong thực tế, đối với một số câu hỏi nghiên cứu, thu thập dữ liệu phân tán tốt hơn bất kỳ thứ gì có thể thực tế với người thu thập dữ liệu trả tiền.