5.4.1 eBird

eBird збирає дані про птахів з птахоловів; добровольці можуть забезпечити географічний масштаб , що ні одна дослідницька група не може зрівнятися.

Птахи всюди, і орнітологи хотів би знати, де кожен птах в кожен момент часу. З огляду на такий досконалий набір даних, орнітологи може вирішити багато фундаментальних питань своєї області. Звичайно, збір цих даних виходить за рамки будь-якого конкретного дослідника. У той же час, що орнітологи бажати багатшими і більш повні дані, "орнітологів" -Люди, які йдуть спостереження за птахами за задоволення постійно спостерігати птахів і документування того, що вони бачать. Ці дві громади мають довгу історію співпраці, але тепер ці спільні роботи були перетворені в цифрову епоху. eBird є розподілений проект збору даних , яка обмінюється інформацією з птахоловів по всьому світу, і він вже отримав більш 260 мільйонів фотополювання від 250000 учасників (Kelling et al. 2015) і (Kelling et al. 2015) .

До запуску eBird, велика частина даних, створених птахоловів був недоступний для дослідників:

"У тисячах шафах по всьому світі сьогодні лежать незліченні записники, каталожні картки, анотовані контрольні переліки та щоденників. Ті з нас, хто займається з птахами установ добре знають розчарування слуху знову і знову про "записи птах мого покійного дядька" Ми знаємо, наскільки цінним вони могли б бути. До жаль, ми також знаємо , що ми не можемо використовувати їх ". (Fitzpatrick et al. 2002) і (Fitzpatrick et al. 2002) , (Fitzpatrick et al. 2002)

Замість того, щоб мати ці цінні дані сидять невикористані, eBird дозволяє Birders завантажити його на централізовану базу даних, цифровий. Дані, завантажені в eBird містить шість ключових полів: хто, де, коли, які види, скільки і зусиль. Для читачів, які не спостереження за птахами, "зусилля" відноситься до методів, що використовуються під час проведення спостережень. перевірки якості даних починаються ще до того, як дані завантажені. Birders намагаються представити незвичайні звіти, такі як звіти дуже рідкісних видів, дуже великої кількості помилок, або поза сезоном звітів, позначені, і сайт автоматично може вимагати додаткової інформації, наприклад, фотографії. Після збору цієї додаткової інформації, марковані звіти направляються в один із сотень добровольців регіональних експертів для подальшого розгляду. Після розслідування регіональної експертної, включаючи можливе додаткове відповідність з птицелов-маркованих звітів або відкидаються як ненадійні або вони вводяться в базу даних eBird (Kelling et al. 2012) і (Kelling et al. 2012) . Ця база даних екранованих спостережень стає доступним будь-якому в світі з підключенням до Інтернету, і до сих пір, майже 100 рецензованих видань використовували його (Bonney et al. 2014) і (Bonney et al. 2014) . eBird ясно показує, що добровольчі орнітологів можуть збирати дані, які корисні для дослідження реального орнітології.

Одна з красунь eBird є те, що вона захоплює "роботу", яка вже має місце в даному випадку, птахами. Ця функція дозволяє проект домогтися величезного масштабу. Проте, "робота" зроблено птахоловів точно не збігаються з даними, необхідні орнітологами. Наприклад, в eBird, збір даних визначається місцем розташування птахоловів а не розташування птахів. Це означає , що, наприклад, більшість спостережень , як правило, розташовані близько до доріг (Kelling et al. 2012; Kelling et al. 2015) і (Kelling et al. 2012; Kelling et al. 2015) і (Kelling et al. 2012; Kelling et al. 2015) . На додаток до цього нерівномірного розподілу зусиль по простору, фактичні спостереження, зроблені птахоловів не завжди ідеальні. Наприклад, деякі птахолови тільки завантажити інформацію про видах, які вони вважають цікавим, а не завантажувати інформацію про всі видів, які вони спостерігали.

Дослідники eBird є два основних шляхи вирішення цих проблем з якістю даних, проблеми, які виникають у багатьох інших розподілених проектів зі збору даних. По-перше, дослідники eBird постійно намагаються підвищити якість даних, представлених птахоловів. Наприклад, eBird пропонує навчання для учасників, і вона створила візуалізацію даних кожного учасника , що, на їхню конструкції, заохочують Birders завантажувати інформацію про всі видів , які вони спостерігали, а не тільки підмножина (Wood et al. 2011; Wiggins 2011) і (Wood et al. 2011; Wiggins 2011) , По-друге, дослідники eBird використовують статистичні моделі, які намагаються виправити для галасливої ​​і гетерогенний характер вихідних даних. Поки ще не ясно, якщо ці статистичні моделі повністю видалити ухили з даних, але орнітологи досить впевнені в якості скоригованих даних eBird, що, як уже згадувалося раніше, вона була використана в майже 100 рецензованих наукових публікацій.

Багато хто не-орнітологи спочатку досить скептично, коли вони чують про eBird вперше. На мій погляд, частина цього скептицизму приходить від думок про eBird в неправильному напрямку. Багато людей спочатку думають "Чи є дані eBird досконалим?", І відповідь на нього абсолютно немає. Тим не менш, це не правильне запитання. Правильне питання: "Для деяких питань дослідження, це дані eBird краще, ніж існуючі дані орнітології?» Для цього питання відповідь, безумовно, так, почасти тому, що з багатьох питань, що становлять інтерес немає реальної альтернативи розподіленої збору даних.

Проект eBird демонструє, що можна залучити добровольців в зборі важливих наукових даних. Проте, eBird, і пов'язані з ним проекти, показують, що проблеми, пов'язані з відбором проб та якості даних є проблеми для розподілених проектів зі збору даних. Як ми побачимо в наступному розділі, однак, з продуманим дизайном і технологією ці проблеми можуть бути зведені до мінімуму в деяких ситуаціях.