5.4.1 eBird

Az eBird adatokat gyűjt a madarakról származó madarakról; az önkéntesek olyan skálát adhatnak, amelyet egyetlen kutatócsoport sem tud összeilleszteni.

A madarak mindenütt megtalálhatók, és az ornitológusok szeretnék tudni, hol minden madár minden pillanatban. Az ilyen tökéletes adattárak miatt az ornitológusok számos alapvető kérdést érinthetnek a saját területén. Természetesen ezeknek az adatoknak a gyűjtése nem tartozik semmiféle kutató körébe. Ugyanakkor, hogy az ornitológusok vágyakoznak gazdagabb és teljesebb adatokkal, a "madármegfigyelők" - akik szórakozásról madármegfigyelnek - folyamatosan megfigyelik a madarakat és dokumentálják azt, amit látnak. Ez a két közösség már régóta működik együtt, de most ezek a kapcsolatok a digitális korszakban alakultak át. Az eBird egy elosztott adatgyűjtési projekt, amely a madárinformációkról szerte a világon nyújt információt, és 250 000 résztvevőből több mint 260 millió madár észlelést kapott (Kelling, Fink, et al. 2015) .

Az eBird elindítása előtt a madárinformációk által létrehozott adatok nagy része nem állt rendelkezésre a kutatók számára:

"A több ezer szekrény világszerte ma számtalan notebook, index kártya, jegyzetelt ellenőrző lista és napló található. Azok, akik a madárintézményekkel foglalkoznak, jól ismeri a hallás újra és újra meghallgatását a "nagybátyám madárrekordjairól" [sic] Tudjuk, mennyire értékesek lehetnek. Sajnos tudjuk, hogy nem tudjuk használni őket. " (Fitzpatrick et al. 2002)

Ahelyett, hogy ezeket az értékes adatokat kihasználnánk, az eBird lehetővé teszi a madármegosztók számára, hogy feltöltsék őket egy központosított, digitális adatbázisba. Az eBirdre feltöltött adatok hat kulcsfontosságú területet tartalmaznak: ki, hol, mikor, milyen faj, hány, és erőfeszítés. A nem-birding olvasók esetében az "erőfeszítés" a megfigyelések során alkalmazott módszerekre vonatkozik. Az adatok minőségének ellenőrzése az adatok feltöltése előtt is megkezdődik. A szokatlan jelentéseket próbálják bemutatni - például nagyon ritka fajokról szóló jelentések, nagyon magas számlálás vagy szezonon kívüli jelentések - vannak megjelölve, és a weboldal automatikusan további információkat kér, például fényképeket. A kiegészítő információk összegyűjtése után a megjelölt jelentéseket több száz önkéntes regionális szakértőhöz továbbítják további ellenőrzés céljából. Miután a regionális szakértő - köztük a birderrel történő esetleges további levelezést - vizsgálatot végzett, a megjelölt jelentéseket vagy megbízhatatlanná váltak, vagy az eBird adatbázishoz (Kelling et al. 2012) . Ezeket az átvilágított megfigyelések adatbázisa az interneten bárki számára hozzáférhetővé válik, és eddig közel 100 szakértői publikáció használta (Bonney et al. 2014) . Az eBird egyértelműen azt mutatja, hogy az önkéntes madármegfigyelők képesek arra, hogy adatokat gyűjtsenek, amelyek hasznosak a valódi ornitológiai kutatásokhoz.

Az eBird egyik szépsége az, hogy megragadja a már létező "munkát" - ebben az esetben a madárvilágot. Ez a funkció lehetővé teszi a projekt számára, hogy hatalmas léptéket érjen el. A madármegfigyelők "munkája" azonban nem felel meg pontosan az ornitológusok által szükséges adatoknak. Például az eBird-ben az adatgyűjtést a madárászok helye határozza meg, nem pedig a madarak elhelyezkedését. Ez azt jelenti, hogy például a legtöbb megfigyelés általában közel jár az utakhoz (Kelling et al. 2012; Kelling, Fink, et al. 2015) . A térbeli egyenlőtlen terjesztés mellett a madármegfigyelők tényleges megfigyelései nem mindig ideálisak. Például egyes madárászok csak olyan fajokról töltenek fel információkat, amelyeket érdekesnek tartanak, nem pedig az összes megfigyelt fajról.

Az eBird kutatóknak két fő megoldása van ezeknek az adatminőségi kérdéseknek - olyan megoldások, amelyek hasznosak lehetnek más elosztott adatgyűjtési projektekben is. Először is, az eBird kutatói folyamatosan próbálják frissíteni a madárászok által benyújtott adatok minőségét. Például az eBird biztosítja a résztvevők oktatását, és létrehozta az egyes résztvevők adatainak vizualizációit, amelyek tervezésük alapján ösztönzik a madárászokat, hogy töltsék fel az összes megfigyelt fajról szóló információt, nem csak a legérdekesebbeket (Wood et al. 2011; Wiggins 2011) . Másodszor, az eBird kutatók olyan statisztikai modelleket használnak, amelyek megpróbálják korrigálni a nyers adatok zajos és heterogén jellegét (Fink et al. 2010; Hurlbert and Liang 2012) . Még nem tisztázott, hogy ezek a statisztikai modellek teljes mértékben eltávolítják-e az adatoktól az elfogultságot, de az ornitológusok eléggé magabiztosak a korrigált eBird adatok minőségében, amint azt már korábban említettük, ezeket az adatokat közel 100 szakértői tudományos publikációban használták fel.

Sok nem-ornitológus kezdetben nagyon szkeptikus, amikor először hallják az eBirdt. Véleményem szerint ennek a szkepticizmusnak egy része rosszul gondolkodik az eBirdről. Sokan először azt gondolják: "Az eBird adatok tökéletesek?", És a válasz "teljesen nem". Ez azonban nem a megfelelő kérdés. A helyes kérdés a következő: "Bizonyos kutatási kérdésekben az eBird adatai jobbak a meglévő ornitológiai adatoknál?" A kérdésre a válasz "feltétlenül igen", részben azért, mert sok érdekes kérdésre - például a nagyszabású szezonális migrációra - az elosztott adatgyűjtésre nincs reális alternatíva.

Az eBird projekt bemutatja, hogy az önkéntesek bevonhatók a fontos tudományos adatok gyűjteményébe. Mindazonáltal az eBird és a kapcsolódó projektek azt mutatják, hogy a mintavételhez és az adatok minőségéhez kapcsolódó kihívások az elosztott adatgyűjtési projektekre vonatkoznak. Amint azt a következő részben látni fogjuk, az okos formatervezés és technológia miatt ezek az aggályok bizonyos körülmények között minimálisra csökkenthetők.