5.4.1 eBird

eBird samler data om fugler fra birders; Frivillige kan gi en skala som ingen forskerteam kan matche.

Fugler er overalt, og ornitologer vil gjerne vite hvor hver fugl er i hvert øyeblikk. Gitt et slikt perfekt datasett, kunne ornitologer adressere mange grunnleggende spørsmål i deres felt. Selvfølgelig er det ikke mulig å samle disse dataene utenfor en bestemt forsker. Samtidig som ornitologer ønsker rikere og mer komplette data, "birders" -personer som går på fugletitting for moro - overvåker stadig fugler og dokumenterer hva de ser. Disse to samfunnene har en lang historie med samarbeid, men nå har disse samarbeidene blitt forvandlet av den digitale tidsalderen. eBird er et distribuert datainsamlingsprosjekt som krever informasjon fra fuglefuglere over hele verden, og den har allerede mottatt over 260 millioner fugleobservasjoner fra 250.000 deltakere (Kelling, Fink, et al. 2015) .

Før lanseringen av eBird ble de fleste dataene som ble opprettet av birders, utilgjengelige for forskere:

"I tusenvis av skap rundt om i verden ligger i dag utallige notatbøker, indekskort, merket sjekklister og dagbøker. De av oss som er involvert med fugleinstitusjoner, vet godt frustrasjonen av å høre igjen og igjen om «min onkels fuglrekord». Vi vet hvor verdifulle de kan være. Dessverre vet vi også at vi ikke kan bruke dem. " (Fitzpatrick et al. 2002)

I stedet for å ha disse verdifulle dataene ubrukt, gjør eBird det mulig for birders å laste dem opp til en sentralisert digital database. Data lastet opp til eBird inneholder seks nøkkelfelt: hvem, hvor, når, hvilke arter, hvor mange og innsats. For ikke-birding lesere, refererer "innsats" til metodene som brukes mens du gjør observasjoner. Datakvalitetskontrollene begynner selv før dataene lastes opp. Fuglere som forsøker å sende uvanlige rapporter, for eksempel rapporter om svært sjeldne arter, svært høye teller, eller utenom sesongrapporter, flagges, og nettsiden krever automatisk tilleggsinformasjon, for eksempel fotografier. Etter å ha samlet denne tilleggsinformasjonen, sendes de flaggede rapportene til en av hundrevis av frivillige regionale eksperter for videre gjennomgang. Etter undersøkelse av den regionale ekspert-inkludert mulig tilleggskorrespondanse med birderen-de flaggede rapportene blir enten kassert som upålitelige eller inngått i eBird-databasen (Kelling et al. 2012) . Denne databasen med avskjermede observasjoner blir da gjort tilgjengelig for alle i verden med en Internett-tilkobling, og så langt har nesten 100 peer-reviewed publikasjoner brukt det (Bonney et al. 2014) . eBird viser tydelig at frivillige birders er i stand til å samle inn data som er nyttige for ekte ornitologisk forskning.

En av skjønnhetene til eBird er at den fanger "arbeid" som allerede skjer - i dette tilfellet, fuglekikking. Denne funksjonen gjør det mulig for prosjektet å oppnå en enorm skala. Men "arbeidet" gjort av birders stemmer ikke akkurat med dataene som trengs av ornitologer. For eksempel, i eBird, er datainnsamling bestemt av plasseringen av birders, ikke plasseringen av fuglene. Dette betyr at de fleste observasjoner for eksempel pleier å forekomme nær veier (Kelling et al. 2012; Kelling, Fink, et al. 2015) . I tillegg til denne ulik fordeling av innsats over rom, er de faktiske observasjonene som er gjort av birders ikke alltid ideelle. For eksempel, noen birders bare laste opp informasjon om arter som de anser interessante, i stedet for informasjon om alle arter som de observert.

eBirdforskere har to hovedløsninger for disse datakvalitetsproblemene - løsninger som kan være nyttige i andre distribuerte datainnsamlingsprosjekter også. For det første prøver eBirdforskere å oppgradere kvaliteten på dataene som er levert av birders. For eksempel tilbyr eBird utdanning til deltakerne, og det har skapt visualiseringer av hver deltakeres data som ved deres design oppfordrer fuglere til å laste opp informasjon om alle arter de observerte, ikke bare de mest interessante (Wood et al. 2011; Wiggins 2011) . For det andre bruker eBird-forskere statistiske modeller som forsøker å korrigere for de støyende og heterogene egenskapene til rådataene (Fink et al. 2010; Hurlbert and Liang 2012) . Det er ennå ikke klart om disse statistiske modellene fullt ut fjerner biaser fra dataene, men ornitologene er sikre nok i kvaliteten på justerte eBird-data som, som tidligere nevnt, har blitt brukt i nesten 100 peer-reviewed vitenskapelige publikasjoner.

Mange ikke-ornitologer er i utgangspunktet ekstremt skeptiske når de hører om eBird for første gang. Etter min mening kommer en del av denne skepsis fra å tenke på eBird på feil måte. Mange tror først "Er eBird-dataene perfekte?", Og svaret er "absolutt ikke". Det er imidlertid ikke det rette spørsmålet. Det rette spørsmålet er "For visse forskningsspørsmål er eBird-dataene bedre enn eksisterende ornitologidata?" For det spørsmålet er svaret "definitivt ja", delvis fordi det for mange spørsmål av interesse - for eksempel spørsmål om storskala sesongbasert migrasjon -Det er ingen realistiske alternativer til distribuert datainnsamling.

EBird-prosjektet demonstrerer at det er mulig å involvere frivillige i innsamling av viktige vitenskapelige data. Imidlertid viser eBird og relaterte prosjekter at utfordringer knyttet til prøvetaking og datakvalitet er bekymringer for distribuerte datainnsamlingsprosjekter. Som vi vil se i neste avsnitt, men med smart design og teknologi, kan disse bekymringene bli minimert i enkelte innstillinger.