5.4.1 eBird

eBird samler inn data om fugler fra birders; frivillige kan gi geografisk skala som ingen forskerteam kan matche.

Fugler er overalt, og ornitologer ønsker å vite hvor alle fugler er i hvert øyeblikk. Gitt en slik perfekt datasett, kan ornitologer løse mange grunnleggende spørsmål om sitt felt. Selvfølgelig, samle disse dataene er utenfor omfanget av noen bestemt forsker. Samtidig som ornitologer ønsker rikere og mer komplette data, "birders" -Folk som går fugletitting for moro-er stadig å observere fugler og dokumentere det de ser. Disse to miljøer har en lang historie med samarbeidende, men nå disse avtalene har blitt forvandlet av den digitale tidsalder. eBird er et distribuert datainnsamling prosjekt som forsøker å verve informasjon fra det nye Mallorca rundt om i verden, og det har allerede mottatt over 260 millioner fugl observasjoner fra 250.000 deltakere (Kelling et al. 2015) .

Før lanseringen av eBird, mye av dataene som er opprettet av det nye Mallorca var utilgjengelig for forskere:

"I tusenvis av skap rundt om i verden i dag ligge utallige notatbøker, kartotekkort, kommenterte sjekklister, og dagbøker. De av oss som er involvert med ornitologi institusjoner kjenner godt frustrasjonen av å høre om og om igjen om 'min avdøde onkels fugl poster "Vi vet hvor verdifulle de kunne være. Dessverre, vi vet også at vi ikke kan bruke dem. " (Fitzpatrick et al. 2002)

Snarere enn å ha dette verdifulle data sitte ubrukt, gjør eBird birders å laste det opp til en sentralisert, digital database. Data lastes opp til eBird inneholder seks sentrale felt: hvem, hvor, når, hva arter, hvor mange, og innsats. For ikke-ornitologi lesere, "innsats" refererer til de metoder som brukes mens du gjør observasjoner. Data kvalitetskontroller begynne med før dataene er lastet opp. Birders prøver å sende uvanlige rapporter, for eksempel rapporter om svært sjeldne arter, svært høye teller, eller ut av sesongen rapporter-er flagget, og nettstedet ber automatisk tilleggsinformasjon, for eksempel fotografier. Etter å ha samlet denne tilleggsinformasjonen, blir flagget rapportene sendt til en av hundrevis av frivillige regionale eksperter for videre vurdering. Etter etterforskning av den regionale ekspert inkludert mulig ytterligere korrespondanse med birder-flagget rapportene er enten kassert som upålitelig eller de er inngått eBird database (Kelling et al. 2012) . Denne databasen av skjermede observasjoner blir deretter gjort tilgjengelig for hvem som helst i verden med en Internett-tilkobling, og så langt har nesten 100 fagfellevurderte publikasjoner brukt det (Bonney et al. 2014) . eBird viser tydelig at frivillige nye Mallorca er i stand til å samle inn data som er nyttig for ekte ornitologi forskning.

En av beauties av eBird er at den fanger "arbeid" som allerede skjer i dette tilfellet, fuglekikking. Denne funksjonen gjør det mulig for prosjektet å oppnå enorm skala. Imidlertid ikke "arbeid" gjort av det nye Mallorca ikke helt overens med dataene som trengs av ornitologer. For eksempel, i eBird, blir datainnsamlingen bestemmes av plasseringen av birders ikke plasseringen av fugler. Dette betyr at, for eksempel, de fleste observasjoner har en tendens til å oppstå i nærheten av veiene (Kelling et al. 2012; Kelling et al. 2015) . I tillegg til dette ulik fordeling av innsats over plass, den faktiske observasjoner gjort av nye Mallorca er ikke alltid ideelt. For eksempel har noen nye Mallorca bare laste opp informasjon om arter som de anser interessant i stedet for å laste opp informasjon om alle arter som de observerte.

eBird forskere har to hoved løsninger på disse data kvalitet problemer, problemer som oppstår i mange andre distribuerte datainnsamlingsprosjekter. Først blir eBird forskere stadig prøver å oppgradere kvaliteten på data innsendt av nye Mallorca. For eksempel, eBird tilbyr utdanning til deltakerne, og det har skapt visualiseringer av hver deltakers data som ved sin utforming, oppmuntre birders å laste opp informasjon om alle arter som de observerte, ikke bare en undergruppe (Wood et al. 2011; Wiggins 2011) . For det andre, eBird forskere bruker statistiske modeller som forsøker å korrigere for bråkete og heterogene natur rådata. Det er ennå ikke klart om disse statistiske modeller fullstendig fjerne skjevheter fra dataene, men ornitologer er trygg nok i kvaliteten på justert eBird data som, som hadde blitt nevnt tidligere, har det vært brukt i nesten 100 fagfellevurderte vitenskapelige publikasjoner.

Mange ikke-ornitologer er i utgangspunktet svært skeptisk når de hører om eBird for første gang. Etter min mening, en del av denne skepsisen kommer fra å tenke på eBird på feil måte. Mange folk først tenker "Er perfekt til eBird data?", Og svaret er absolutt ikke. Men det er ikke det rette spørsmålet. Det riktige spørsmålet er: "For enkelte forskningsspørsmål, er eBird data bedre enn eksisterende ornitologi data?" For det spørsmålet er svaret definitivt ja, delvis fordi for mange spørsmål av interesse er det ingen realistisk alternativ til distribuerte datainnsamlingen.

Den eBird prosjektet viser at det er mulig å involvere frivillige i innsamling av viktige vitenskapelige data. Men eBird, og relaterte prosjekter, tyder på at utfordringene knyttet til prøvetaking og datakvalitet er bekymringer for distribuerte datainnsamling prosjekter. Som vi vil se i neste avsnitt, men med smart design og teknologi disse bekymringene kan minimeres i noen settinger.