5.4.1 eBird

eBird thu thập dữ liệu về các loài chim từ birders; tình nguyện viên có thể cung cấp quy mô địa lý mà không có nhóm nghiên cứu có thể phù hợp.

Chim có ở khắp nơi, và điểu cầm học muốn biết nơi mà các loài chim là tại mỗi thời điểm. Do đó một bộ dữ liệu hoàn hảo, nhà điểu cầm học có thể giải quyết nhiều vấn đề cơ bản của lĩnh vực của họ. Tất nhiên, việc thu thập dữ liệu này nằm ngoài phạm vi của bất kỳ nhà nghiên cứu cụ thể. Đồng thời là nhà điểu cầm học mong muốn dữ liệu phong phú hơn và hoàn thiện hơn, "birders" -people người đi xem chim cho vui-liên tục quan sát các loài chim và ghi lại những gì họ nhìn thấy. Hai cộng đồng có một lịch sử lâu dài của cộng tác, nhưng bây giờ hợp tác này đã được biến đổi bởi các đại kỹ thuật số. eBird là một dự án thu thập dữ liệu phân tán truy tìm thông tin từ birders khắp thế giới, và nó đã nhận được hơn 260 triệu nhìn thấy con chim từ 250.000 người tham gia (Kelling et al. 2015) .

Trước sự ra mắt của eBird, nhiều các dữ liệu được tạo ra bởi birders là không có sẵn cho các nhà nghiên cứu:

"Trong hàng ngàn closets quanh thế giới ngày nay nói dối vô số máy tính xách tay, thẻ chỉ mục, bản danh sách chú thích, và nhật ký. Những người trong chúng tham gia với các tổ chức birding biết rõ sự thất vọng khi nghe hơn và hơn nữa về 'ghi chú chim quá cố của tôi' Chúng tôi biết làm thế nào giá trị mà họ có thể được. Đáng buồn thay, chúng tôi cũng biết chúng ta không thể sử dụng chúng. " (Fitzpatrick et al. 2002)

Thay vì có dữ liệu quý giá này ngồi không sử dụng, cho phép eBird birders để tải nó lên một tập trung, cơ sở dữ liệu kỹ thuật số. Dữ liệu được tải lên eBird chứa sáu lĩnh vực chủ chốt: ai, ở đâu, khi nào, những gì loài, bao nhiêu, và nỗ lực. Đối với người đọc không phải birding, "nỗ lực" đề cập đến phương pháp sử dụng trong khi làm cho các quan sát. kiểm tra chất lượng dữ liệu bắt đầu ngay cả trước khi dữ liệu được tải lên. Birders cố gắng để nộp báo cáo, chẳng hạn bất thường như các báo cáo của các loài rất hiếm, số lượng rất cao, hoặc ra khỏi mùa báo cáo-được gắn cờ, và các trang web tự động yêu cầu thêm thông tin, chẳng hạn như hình ảnh. Sau khi thu thập thông tin bổ sung này, các báo cáo gắn cờ được gửi đến một trong hàng trăm chuyên gia tình nguyện trong khu vực để xem xét thêm. Sau khi điều tra bởi các thư bổ sung có thể chuyên gia, bao gồm cả khu vực với birder-báo cáo gắn cờ hoặc là bỏ đi như không đáng tin cậy hoặc chúng được nhập vào cơ sở dữ liệu eBird (Kelling et al. 2012) . Cơ sở dữ liệu này quan sát được sàng lọc sau đó được tạo sẵn cho bất cứ ai trên thế giới có kết nối Internet, và cho đến nay, gần 100 ấn phẩm peer-xem xét lại đã sử dụng nó (Bonney et al. 2014) . eBird rõ ràng cho thấy rằng birders tình nguyện viên có thể thu thập dữ liệu đó là hữu ích cho việc nghiên cứu điểu cầm học thực sự.

Một trong những nét đẹp của eBird là nó bắt "làm việc" đó đang xảy ra trong trường hợp này, birding. Tính năng này cho phép các dự án để đạt được quy mô to lớn. Tuy nhiên, "công việc" thực hiện bởi birders không chính xác phù hợp với các dữ liệu cần thiết bởi nhà điểu cầm học. Ví dụ, trong eBird, thu thập dữ liệu được xác định bởi vị trí của birders không phải là vị trí của các loài chim. Điều này có nghĩa rằng, ví dụ, hầu hết các quan sát xu hướng xảy ra gần đường giao thông (Kelling et al. 2012; Kelling et al. 2015) . Ngoài việc phân phối không đồng đều này nỗ lực trong không gian, quan sát thực tế được thực hiện bởi birders không phải lúc nào lý tưởng. Ví dụ, một số birders chỉ tải lên thông tin về các loài mà họ cho là thú vị hơn là tải lên thông tin về tất cả các loài mà họ quan sát.

các nhà nghiên cứu eBird có hai giải pháp chính để các vấn đề chất lượng dữ liệu, các vấn đề phát sinh trong nhiều dự án thu thập dữ liệu phân phối khác. Đầu tiên, các nhà nghiên cứu eBird không ngừng cố gắng để nâng cấp chất lượng của dữ liệu do birders. Ví dụ, eBird cung cấp giáo dục cho người tham gia, và nó đã tạo ra hình tượng của dữ liệu của từng người tham gia mà, theo thiết kế của họ, khuyến khích birders tải thông tin về tất cả các loài mà họ quan sát, không chỉ là một tập hợp con (Wood et al. 2011; Wiggins 2011) . Thứ hai, các nhà nghiên cứu sử dụng mô hình thống kê eBird mà cố gắng để sửa chữa cho tính chất ồn ào và không đồng nhất của các dữ liệu thô. Đó là chưa rõ ràng nếu các mô hình thống kê hoàn toàn loại bỏ những thành kiến ​​từ các dữ liệu, nhưng nhà điểu cầm học có đủ tự tin về chất lượng của dữ liệu eBird điều chỉnh đó, như đã được đề cập trước đó, nó đã được sử dụng trong gần 100 ấn phẩm khoa học peer-xem xét lại.

Nhiều phi điểu cầm học ban đầu là vô cùng hoài nghi khi họ nghe về eBird cho lần đầu tiên. Trong quan điểm của tôi, một phần của sự hoài nghi này xuất phát từ suy nghĩ về eBird một cách sai lầm. Nhiều người bắt đầu nghĩ rằng "Là các dữ liệu eBird hoàn hảo?", Và câu trả lời là hoàn toàn không. Tuy nhiên, đó không phải là câu hỏi đúng. Các câu hỏi đúng là: "Đối với câu hỏi nghiên cứu nhất định, tốt hơn là các dữ liệu eBird hơn dữ liệu điểu học hiện hành?" Đối với câu hỏi mà câu trả lời chắc chắn là có, một phần vì nhiều câu hỏi quan tâm không có thay thế thực tế để thu thập dữ liệu phân tán.

Các dự án eBird chứng minh rằng nó có thể liên quan đến các tình nguyện viên trong bộ sưu tập của các dữ liệu khoa học quan trọng. Tuy nhiên, eBird, và liên quan đến dự án, cho thấy những thách thức liên quan đến lấy mẫu và chất lượng dữ liệu là mối quan tâm đối với các dự án thu thập dữ liệu phân tán. Như chúng ta sẽ thấy trong phần tiếp theo, tuy nhiên, với thiết kế thông minh và công nghệ những quan ngại này có thể được giảm thiểu trong một số cài đặt.