5.4.1 eBird

eBird збирає дані про птахів з птахів; волонтери можуть надати масштаб, який не може збігатися жодна дослідницька група.

Птахи скрізь, і орнитологи хотіли б знати, де кожен птах на кожному моменті. Враховуючи такий ідеальний набір даних, орнитологи могли б вирішувати багато основних питань у своїй галузі. Звичайно, збір цих даних виходить за межі будь-якого конкретного дослідника. Одночасно, що орнитологи прагнуть до багатших та більш повних даних, "байдарці" - люди, які йдуть на птахи, спостерігають за розвагою, - постійно спостерігають птахи та документують те, що вони бачать. Ці дві громади мають довгу історію співпраці, але зараз ці співробітництва були трансформовані цифровою епохою. eBird - це проект з розподіленої передачі даних, в якому запитує інформацію від морських піхотинців по всьому світу, і вже отримала понад 260 мільйонів спостережень з 250 000 учасників (Kelling, Fink, et al. 2015) .

До запуску eBird більшість даних, створених китобоїдами, недоступні для дослідників:

"У тисячах шафі по всьому світу сьогодні лежать незліченні ноутбуки, індексні картки, анотовані контрольні списки та щоденники. Ті з нас, що беруть участь у закладах птахівництва, добре знають фрустрацію слухання знову і знову про "птахів мого пізнього дядька" [sic] Ми знаємо, наскільки цінні вони можуть бути. На жаль, ми також знаємо, що ми не можемо їх використовувати " (Fitzpatrick et al. 2002)

Замість того, щоб ці цінні дані залишалися невикористаними, eBird дозволяє баварцям завантажувати їх у централізовану цифрову базу даних. Дані, завантажені на eBird, містять шість ключових полів: хто, де, коли, які види, скільки і зусиль. Для читачів, які не птахають, "зусилля" стосуються методів, що використовуються при проведенні спостережень. Перевірка якості даних починається ще до того, як дані завантажуються. Птахи, які намагаються надіслати незвичні звіти, такі як звіти про дуже рідкісні види, дуже високі чи позашкільні звіти, позначаються, і веб-сайт автоматично запитує додаткову інформацію, таку як фотографії. Після збору такої додаткової інформації звіти, що позначаються, надсилаються одній із сотень волонтерських регіональних експертів для подальшого розгляду. Після дослідження регіонального експерта, у тому числі можлива додаткова кореспонденція з берегом, позначені повідомлення відмовляються як ненадійні або вводяться в базу даних eBird (Kelling et al. 2012) Kelling (Kelling et al. 2012) . Дана база даних екранованих спостережень стає доступною для всіх користувачів у світі з використанням Інтернет-з'єднання, і до цих пір це було використано майже 100 рецензованих публікацій (Bonney et al. 2014) . eBird чітко показує, що волонтери-птахів здатні збирати дані, корисні для реальних досліджень орнитології.

Одна з красунь eBird полягає в тому, що вона фіксує "роботу", яка вже відбувається - у цьому випадку, птахівництво. Ця функція дозволяє проекту досягти величезного масштабу. Однак "робота", проведена китобоїдами, не зовсім відповідає даних, необхідних орнитологам. Наприклад, в eBird, збір даних визначається місцем розташування птахів, а не місцем розташування птахів. Це означає, що, наприклад, більшість спостережень зазвичай наближаються до доріг (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Окрім цього нерівномірного розподілу зусиль над простором, фактичні спостереження, зроблені китобоїдами, не завжди ідеальні. Наприклад, деякі кияни завантажують інформацію про види, які вони вважають цікавими, а не інформацію про всі види, які вони спостерігали.

Дослідники eBird мають два основних рішення для цих питань якості даних - рішення, які можуть бути корисними для інших проектів з розподіленими даними. По-перше, дослідники eBird постійно намагаються покращити якість даних, наданих birders. Наприклад, eBird пропонує освіту учасникам, і він створив візуалізацію даних кожного учасника, які за своїм дизайном заохочують кияків завантажувати інформацію про всі види, які вони спостерігали, не тільки самим цікавим (Wood et al. 2011; Wiggins 2011) По-друге, дослідники eBird використовують статистичні моделі, які намагаються виправити шумний та неоднорідний характер вихідних даних (Fink et al. 2010; Hurlbert and Liang 2012) . Ще незрозуміло, чи ці статистичні моделі повністю вилучають відхилення від даних, але орнитологи досить впевнені в якості відкоригованих даних eBird, що, як було зазначено раніше, ці дані використовувались у майже 100 рецензованих наукових публікаціях.

Багато неорнітологів спочатку дуже скептично ставляться до них, коли вони вперше чують про eBird. На мій погляд, частина цього скептицизму пов'язана з думкою про eBird неправильним способом. Багато людей спочатку думає: "Чи є ідеями eBird ідеальним?", І відповідь "абсолютно не є". Проте це не є правильним питанням. Правильний питання: "Для деяких дослідницьких питань дані про eBird краще, ніж існуючі дані орнітології?" На це питання відповідь "напевно", частково тому, що для багатьох питань, що представляють інтерес, такі як питання про великомасштабну сезонну міграцію - немає реальних альтернатив розподіленому збору даних.

Проект eBird демонструє, що можна залучити волонтерів до збору важливих наукових даних. Проте eByr та пов'язані з нею проекти вказують на те, що проблеми, пов'язані з вибіркою та якістю даних, є проблемами для проектів з розподіленими даними. Як ми побачимо в наступному розділі, однак, з розумним дизайном і технологією, ці проблеми можуть бути мінімізовані в деяких налаштуваннях.