5.4.1 eBird

eBird verzamelt gegevens over vogels uit vogelaars; vrijwilligers kunnen geografische schaal dat er geen onderzoek team kan evenaren bieden.

Vogels zijn overal, en ornithologen zou graag willen weten waar elke vogel is op elk moment. Gegeven zo'n perfecte dataset, kon ornithologen veel fundamentele vragen van hun vakgebied aan te pakken. Natuurlijk, het verzamelen van deze informatie buiten het bereik van een bepaald onderzoeker. Op hetzelfde moment dat ornithologen willen rijker en meer volledige gegevens, "vogelaars" -mensen die gaan vogels kijken voor de lol-voortdurend observeren van vogels en het documenteren van wat ze zien. Deze twee gemeenschappen hebben een lange geschiedenis van samenwerkende, maar nu deze samenwerkingen zijn gerekruteerd door het digitale tijdperk. eBird is een gedistribueerde data verzamelen project die informatie gevraagd naar uit vogelaars over de hele wereld, en het is al meer dan 260 miljoen observaties ontvangen van 250.000 deelnemers (Kelling et al. 2015) .

Voorafgaand aan de lancering van eBird, een groot deel van de gegevens die door vogelaars was niet beschikbaar voor onderzoekers:

"In duizenden kasten rond de wereld van vandaag liggen talloze notebooks, steekkaarten, geannoteerde checklists, en dagboeken. Die van ons betrokken bij vogelen instellingen goed kent de frustratie van het horen over en weer over 'mijn overleden oom vogel platen' Wij weten hoe waardevol ze kunnen zijn. Helaas, we weten ook dat we kunnen ze niet gebruiken. " (Fitzpatrick et al. 2002)

In plaats van deze waardevolle gegevens zitten ongebruikt, eBird stelt vogelaars te uploaden naar een centrale, digitale database. Gegevens geüpload naar eBird bevat zes belangrijke gebieden: wie, waar, wanneer, welke soort, hoeveel, en inspanning. Voor niet-lezers vogels, "werk" verwijst naar het gebruik tijdens het maken observaties methoden. datakwaliteit controles beginnen nog voordat de gegevens worden geladen. Vogelaars proberen te leggen ongebruikelijke rapporten-zoals rapporten van zeer zeldzame soorten, zeer hoge tellingen, of buiten het seizoen rapporten-worden gemarkeerd, en de website vraagt ​​automatisch aanvullende informatie, zoals foto's. Na het verzamelen van deze aanvullende informatie, wordt de vlag rapporten verstuurd naar een van de honderden vrijwilligers regionale experts voor verdere beoordeling. Na onderzoek door de regionale-expert met inbegrip van eventuele aanvullende correspondentie met de vogelaar-de vlag rapporten zijn ofwel verworpen als onbetrouwbaar of ze worden in eBird databank opgenomen (Kelling et al. 2012) . Deze database van gescreende waarnemingen wordt vervolgens ter beschikking gesteld aan iedereen in de wereld met een internetverbinding, en tot nu toe hebben bijna 100 peer-reviewed publicaties vroeger (Bonney et al. 2014) . eBird toont duidelijk aan dat vrijwilligerswerk vogelaars in staat zijn om gegevens die nuttig zijn voor echte ornithologie onderzoek te verzamelen.

Een van de schoonheden van eBird is dat het 'werk' dat al gebeurt, in dit geval, vogels vangt. Deze functie maakt het mogelijk het project om enorme omvang te bereiken. Echter, de "werk" gedaan door vogelaars niet exact overeenkomen met de gegevens die nodig zijn door ornithologen. Bijvoorbeeld, in eBird, gegevensverzameling wordt bepaald door de locatie van vogelaars niet de locatie van vogels. Dit betekent dat, bijvoorbeeld, de meeste waarnemingen neiging om zich in de buurt van wegen (Kelling et al. 2012; Kelling et al. 2015) . Naast deze ongelijke verdeling van de inspanning in de ruimte, de werkelijke opmerkingen van vogelaars niet altijd ideaal. Bijvoorbeeld, sommige vogelaars alleen voor upload informatie over de soorten die zij interessant vinden in plaats van het uploaden van informatie over alle soorten die ze waargenomen.

eBird onderzoekers hebben twee belangrijke oplossingen voor deze problemen met de gegevenskwaliteit, problemen die zich voordoen in veel andere gedistribueerde het verzamelen van gegevens projecten. Eerst worden eBird onderzoekers constant bezig om de kwaliteit van de door birders verstrekte gegevens upgraden. Bijvoorbeeld, eBird biedt onderwijs aan de deelnemers, en het heeft visualisaties van de gegevens van elke deelnemer die, door hun ontwerp, vogelaars te moedigen gemaakt om informatie te uploaden over alle soorten die ze geobserveerd, en niet alleen een subset (Wood et al. 2011; Wiggins 2011) . Ten tweede, eBird onderzoekers gebruik van statistische modellen die proberen te corrigeren voor de luidruchtige en heterogene karakter van de ruwe data. Het is nog niet duidelijk of deze statistische modellen volledig vooroordelen uit de gegevens te verwijderen, maar ornithologen zijn ervan overtuigd genoeg in de kwaliteit van het aangepast eBird gegevens die, zoals was eerder vermeld, is het gebruikt in bijna 100 peer-reviewed wetenschappelijke publicaties.

Veel niet-ornithologen zijn aanvankelijk zeer sceptisch toen ze horen over eBird voor de eerste keer. Naar mijn mening, een deel van deze scepsis komt voort uit het denken over eBird op de verkeerde manier. Veel mensen eerst denken "Is de eBird data perfect?", En het antwoord is absoluut niet. Maar dat is niet de juiste vraag. De juiste vraag is: "Voor bepaalde onderzoeksvragen, is de eBird data beter dan de bestaande ornithologie data? 'Om die vraag het antwoord is duidelijk ja, voor een deel omdat voor veel vragen van belang is er geen realistisch alternatief voor gedistribueerde het verzamelen van gegevens.

De eBird project toont aan dat het mogelijk is om vrijwilligers in het verzamelen van belangrijke wetenschappelijke gegevens te betrekken. Echter, eBird, en aanverwante projecten, geven aan dat de uitdagingen met betrekking tot de bemonstering en de kwaliteit van de gegevens zijn zorgen voor gedistribueerde het verzamelen van gegevens projecten. Zoals we zullen zien in de volgende sectie, echter, met slimme design en technologie deze problemen kunnen worden geminimaliseerd in een aantal instellingen.