5.4.1 eBird

eBird recolle datos sobre aves de birders; Os voluntarios poden proporcionar unha escala que ningún equipo de investigación pode combinar.

Os paxaros están en todas partes e os ornitólogos queren saber onde está cada paxaro en cada momento. Dado un conxunto de datos tan perfecto, os ornitólogos poderían abordar moitas preguntas fundamentais no seu campo. Por suposto, a recollida destes datos está fóra do alcance de calquera investigador en particular. Ao mesmo tempo que os ornitólogos desexan datos máis completos e máis completos, os "observadores de aves" (persoas que buscan a diversión) observan constantemente as aves e documentan o que ven. Estas dúas comunidades teñen unha longa historia de colaboración, pero agora estas colaboracións foron transformadas pola era dixital. eBird é un proxecto de recollida de datos distribuído que solicita información de observadores de aves en todo o mundo e xa recibiu máis de 260 millóns de avistamentos de aves de 250.000 participantes (Kelling, Fink, et al. 2015) .

Antes do lanzamento de eBird, a maioría dos datos creados por birders non estaban dispoñibles para os investigadores:

"En miles de armarios arredor do mundo hai moitos cadernos de notas, tarxetas de índice, listas de verificación anotadas e diarios. Os que estamos involucrados nas institucións de observación de aves saben ben a frustración de escoitar unha e outra vez sobre "os rexistros de aves do meu tío avó" [sic] Sabemos o valioso que poden ser. Desafortunadamente, tamén sabemos que non podemos usalos " (Fitzpatrick et al. 2002)

En vez de ter estes datos valiosos sen ser utilizados, eBird permite aos birders subilos a unha base de datos centralizada e dixital. Os datos cargados a eBird conteñen seis campos clave: quen, onde, cando, cal especie, cantos e esforzo. Para os lectores non avistados, o "esforzo" refírese aos métodos empregados ao facer observacións. Os cheques de calidade de datos comezan mesmo antes de que se carguen os datos. Os aves que intentan enviar informes pouco comúns -como informes de especies moi raras, conteos moi altos ou informes fóra de tempada- son marcados, eo sitio web solicita automáticamente información adicional, como fotografías. Despois de recompilar esta información adicional, os informes marcados envíanse a un centenar de expertos rexionais voluntarios para unha posterior análise. Despois da investigación do experto rexional -incluída a posible correspondencia adicional co birder-, os informes marcados descartáronse como non fiables ou inseridos na base de datos eBird (Kelling et al. 2012) . Esta base de datos de observacións seleccionadas ponse a disposición de calquera persoa do mundo cunha conexión a Internet e, ata agora, case 100 publicacións revisadas por pares (Bonney et al. 2014) . eBird mostra claramente que os birders voluntarios son capaces de recolectar datos que son útiles para unha investigación de ornitoloxía real.

Unha das belezas de eBird é que captura o "traballo" que xa está a suceder -neste caso, birding. Esta característica permite que o proxecto alcance unha enorme escala. Non obstante, o "traballo" feito por birders non coincide exactamente cos datos que necesitan os ornitólogos. Por exemplo, en eBird, a recollida de datos vén determinada pola localización dos birders, e non pola localización dos paxaros. Isto significa que, por exemplo, a maioría das observacións adoitan ocorrer preto das estradas (Kelling et al. 2012; Kelling, Fink, et al. 2015) . Ademais desta distribución desigual do esforzo sobre o espazo, as observacións reais feitas polos birders non sempre son ideais. Por exemplo, algúns birders só cargar información sobre as especies que consideran interesantes, en vez de información sobre todas as especies que observaron.

Os investigadores de eBird teñen dúas solucións principais a estes problemas de calidade de datos: solucións que tamén poden ser útiles noutros proxectos de recollida de datos distribuídos. En primeiro lugar, os investigadores de eBird están tentando constantemente mellorar a calidade dos datos presentados polos observadores. Por exemplo, eBird ofrece educación aos participantes e creou visualizaciones dos datos de cada participante que, polo seu deseño, incentivan aos birders a cargar información sobre todas as especies que observaron, non só o máis interesante (Wood et al. 2011; Wiggins 2011) . En segundo lugar, os investigadores de eBird utilizan modelos estatísticos que intentan corrixir a natureza ruidosa e heteroxénea dos datos brutos (Fink et al. 2010; Hurlbert and Liang 2012) . Aínda non está claro se estes modelos estatísticos eliminan totalmente os prexuízos dos datos, pero os ornitólogos confían o suficiente na calidade dos datos eBird axustados que, como se mencionou anteriormente, estes datos foron utilizados en case 100 publicacións científicas revisadas por pares.

Moitos non ornitólogos son inicialmente moi escépticos cando escoitan falar de eBird por primeira vez. Na miña opinión, parte deste escepticismo provén do pensamento de eBird do xeito incorrecto. Moitas persoas pensan primeiro "¿Son perfectos os datos de eBird?", E a resposta é "absolutamente non". Con todo, esa non é a pregunta correcta. A pregunta correcta é "Para determinadas preguntas de investigación, os datos de eBird son mellores que os datos de ornitoloxía existentes?". Para esa pregunta, a resposta é "definitivamente si", en parte porque moitas cuestións de interese, como preguntas sobre a migración estacional a gran escala -Non hai alternativas realistas para a recopilación de datos distribuídos.

O proxecto eBird demostra que é posible involucrar voluntarios na recollida de datos científicos importantes. Non obstante, eBird e proxectos relacionados indican que os problemas relacionados coa mostraxe e a calidade de datos son problemas para os proxectos de recollida de datos distribuídos. Como veremos na seguinte sección, con todo, cun deseño e tecnoloxía intelixentes, estas preocupacións pódense minimizar nalgunhas configuracións.