5.4.1 eBird

eBird събира данни за птиците от птици; доброволците могат да предоставят скала, която нито един изследователски екип не може да постигне.

Птиците са навсякъде и орнитолозите биха искали да знаят къде са във всеки един момент всяка птица. Като се има предвид такъв перфектен набор от данни, орнитолозите биха могли да отговорят на много основни въпроси в своята област. Разбира се, събирането на тези данни е извън обхвата на конкретен изследовател. В същото време, че орнитолозите желаят по-богати и по-пълни данни, "birders" - хора, които гледат на птиците за забавление - непрекъснато наблюдават птици и документират това, което виждат. Тези две общности имат дълга история на сътрудничество, но сега тези сътрудничества се трансформират от дигиталната епоха. eBird е проект за разпределено събиране на данни, който изисква информация от птици от цял ​​свят и вече е получил над 260 милиона наблюдения на птици от 250 000 участници (Kelling, Fink, et al. 2015) .

Преди пускането на eBird, повечето от данните, създадени от birders, не бяха на разположение на изследователите:

"В хиляди килери по света днес са безброй преносими компютри, индексни карти, анотирани списъци за проверка и дневници. Онези от нас, занимаващи се с птичи институти, знаят добре разочарованието от слушане отново и отново за "записите на птиците ми от късния чичо" [sic] Знаем колко ценни биха били те. За съжаление, ние също така знаем, че не можем да ги използваме " (Fitzpatrick et al. 2002)

Вместо да използват тези ценни данни, eBird позволява на птиците да ги качат в централизирана, цифрова база данни. Данните, качени в eBird, съдържат шест ключови полета: кой, къде, кога, какъв вид, колко и какви усилия. За нечовешки читатели "усилие" се отнася до използваните методи при извършване на наблюдения. Проверките за качество на данните започват дори преди качването на данните. Птиците, които се опитват да подадат необичайни съобщения - например съобщения за много редки видове, много високи стойности или доклади извън сезона - са маркирани и сайтът автоматично изисква допълнителна информация, например снимки. След като съберат тази допълнителна информация, докладите с флагман се изпращат на една от стотиците регионални експерти доброволци за по-нататъшен преглед. След разследване от регионалния експерт, включително евентуална допълнителна кореспонденция с корабостроителя, докладите с флагче се изхвърлят като ненадеждни или се въвеждат в базата данни eBird (Kelling et al. 2012) . Тази база данни от скрининг наблюдения след това се предоставя на всеки в света с интернет връзка и досега са го използвали почти 100 партньорски публикации (Bonney et al. 2014) . eBird ясно показва, че доброволците птици са в състояние да събират данни, които са полезни за реални орнитологични изследвания.

Едно от красотите на eBird е, че той улавя "работа", която вече се случва - в този случай, птици. Тази функция позволява на проекта да постигне огромен мащаб. Въпреки това, "работата", извършена от birders, не съвпада точно с данните, необходими на орнитолозите. Например, в eBird, събирането на данни се определя от местонахождението на птици, а не от местонахождението на птиците. Това означава, че например повечето наблюдения обикновено се срещат близо до пътищата (Kelling et al. 2012; Kelling, Fink, et al. 2015) . В допълнение към това неравномерно разпределение на усилията върху пространството, действителните наблюдения, направени от birders, невинаги са идеални. Например някои наблюдатели на птици качват само информация за видовете, които смятат за интересни, а не информация за всички видове, които са наблюдавали.

Изследователите на eBird имат две основни решения на тези проблеми с качеството на данните - решения, които могат да бъдат полезни и в други проекти за разпределено събиране на данни. Първо, изследователите на eBird непрекъснато се опитват да подобрят качеството на данните, подадени от birders. Например, eBird предлага обучение на участниците и е създало визуализации на данните на всеки участник, които по свой дизайн насърчават птиците да качват информация за всички видове, които те наблюдават, не само най-интересните (Wood et al. 2011; Wiggins 2011) . Второ, изследователите на eBird използват статистически модели, които се опитват да коригират шумна и хетерогенна природа на необработените данни (Fink et al. 2010; Hurlbert and Liang 2012) . Все още не е ясно дали тези статистически модели напълно премахват отклоненията от данните, но орнитолозите са достатъчно уверени в качеството на коригираните данни за eBird, които, както беше споменато по-горе, са използвани в почти 100 партньорски научни публикации.

Много не-орнитолози първоначално са изключително скептични, когато чуят за eBird за първи път. Според мен част от този скептицизъм идва от мисленето за eBird по грешен начин. Много хора първо смятат, че "Данните eBird са идеални ли са?", А отговорът е "абсолютно не". Това обаче не е правилният въпрос. Правилният въпрос е "За някои изследователски въпроси ли са данните на eBird по-добри от съществуващите данни за орнитологията?" За този въпрос отговорът е "определено да", отчасти защото за много въпроси от интерес - като въпроси за мащабната сезонна миграция - няма реалистични алтернативи на събирането на разпределени данни.

Проектът eBird показва, че е възможно доброволците да бъдат включени в събирането на важни научни данни. Проектите eBird и свързаните с тях проекти обаче показват, че предизвикателствата, свързани с вземането на проби и качеството на данните, представляват опасения за проектите за разпределено събиране на данни. Както ще видим в следващия раздел обаче, с интелигентен дизайн и технология тези опасения могат да бъдат сведени до минимум в някои настройки.