5.4.1 eBird

eBird는 새들의 새에 대한 데이터를 수집합니다. 자원 봉사자는 연구 팀이 일치시킬 수없는 규모를 제공 할 수 있습니다.

조류가 도처에 있으며, 조류 학자들은 모든 조류가 매 순간 어디에 있는지 알고 싶어합니다. 완벽한 데이터 세트가 주어지면 조류 학자들은 자신의 분야에서 많은 근본적인 문제를 해결할 수 있습니다. 물론 이러한 데이터를 수집하는 것은 특정 연구원의 범위를 벗어납니다. 조류 학자들이보다 풍부하고 완전한 데이터를 원할 때, 재미있게 조류 관찰을하는 "조류 사육자들"은 끊임없이 조류를 관찰하고 그들이 보는 것을 문서화합니다. 이 두 커뮤니티는 오랜 협력의 역사를 가지고 있지만, 이제 이러한 협력은 디지털 시대에 의해 변화되었습니다. 이 버드 (eBird)는 전 세계의 새의 정보를 수집하는 분산 데이터 수집 프로젝트이며 이미 250,000 명의 참가자로부터 2 억 6 천만 건의 새 관찰을 받았습니다 (Kelling, Fink, et al. 2015) .

eBird가 출시되기 전에 새터민이 만든 대부분의 데이터는 연구자가 이용할 수 없었습니다.

"전 세계의 수천 개의 옷장에는 수많은 노트북, 색인 카드, 주석이 달린 체크리스트 및 일기가 있습니다. 새 관찰 기관에 종사하는 사람들은 '삼촌의 새 새 기록'에 대해 계속해서 듣는 좌절감을 잘 알고 있습니다. [sic] 우리는 그들이 얼마나 소중한 지 알 것입니다. 슬프게도, 우리는 그것들을 사용할 수 없다는 것도 알고 있습니다. " (Fitzpatrick et al. 2002)

소중한 데이터를 사용하지 않고 eBird를 사용하면 새 사용자가 중앙화 된 디지털 데이터베이스에 업로드 할 수 있습니다. eBird에 업로드 된 데이터에는 누가, 어디서, 언제, 어떤 종, 얼마나 많은 수 및 노력 등 6 개의 주요 필드가 있습니다. 비 birding 독자 들어, "노력"은 관찰을하는 동안 사용되는 방법을 말합니다. 데이터가 업로드되기 전에도 데이터 품질 검사가 시작됩니다. 매우 희귀 한 종의보고, 매우 많은 조사 또는 계절에 따른 보고서와 같은 비정상적인 보고서를 제출하려고하는 새들이 신고되고 웹 사이트는 자동으로 사진과 같은 추가 정보를 요청합니다. 이 추가 정보를 수집 한 후 신고 된 보고서는 추가 검토를 위해 수백 명의 자원 봉사 지역 전문가 중 한 사람에게 보냅니다. 지역 전문가가 조사를 한 후, 신고 된 보고서는 신뢰할 수없는 것으로 폐기되거나 eBird 데이터베이스에 입력됩니다 (Kelling et al. 2012) . 인터넷을 통해 전 세계 모든 사람들이이 상영 된 관찰 결과 데이터베이스를 이용할 수있게되었으며, 지금까지 거의 100여 개의 동료 검토 논문이이를 사용했습니다 (Bonney et al. 2014) . eBird는 자원 봉사자 사육자가 실제 조류 연구에 유용한 자료를 수집 할 수 있음을 분명히 보여줍니다.

eBird의 아름다움 중 하나는 이미 발생하고있는 "일"을 포착한다는 것입니다.이 경우에는 새소리입니다. 이 기능을 통해 프로젝트는 엄청난 규모를 달성 할 수 있습니다. 그러나 조류 사육사가 수행 한 "작업"은 조류 학자들이 필요로하는 데이터와 정확하게 일치하지 않습니다. 예를 들어, eBird에서 데이터 수집은 새의 위치가 아니라 새들의 위치에 따라 결정됩니다. 예를 들어, 대부분의 관측은 도로 근처에서 발생하는 경향이 있음을 의미합니다 (Kelling et al. 2012; Kelling, Fink, et al. 2015) . 공간에 대한 이러한 노력의 불평등 한 분배에 더하여, 새 관찰자에 의한 실제 관찰은 항상 이상적인 것은 아닙니다. 예를 들어, 일부 새 소식통은 관찰 한 모든 종에 대한 정보가 아니라 관심있는 종에 대한 정보 만 업로드합니다.

eBird 연구원은 이러한 데이터 품질 문제에 대한 두 가지 주요 솔루션을 제공합니다.이 솔루션은 다른 분산 데이터 수집 프로젝트에서도 도움이 될 수 있습니다. 첫째, e 버드 (eBird) 연구자들은 새가 제출 한 데이터의 품질을 지속적으로 업그레이드하려고 노력하고 있습니다. 예를 들어, eBird는 참가자들에게 교육을 제공하고 각 참가자 데이터의 시각화를 작성하여 설계자가 가장 흥미로운 것뿐만 아니라 관찰 한 모든 종에 대한 정보를 새 사용자에게 업로드하도록 권장합니다 (Wood et al. 2011; Wiggins 2011) . 둘째, eBird 연구원은 원시 데이터의 잡음이 많고 이질적인 특성을 수정하려는 통계 모델을 사용합니다 (Fink et al. 2010; Hurlbert and Liang 2012) . 이러한 통계 모델로 인해 데이터에서 편향 요소가 완전히 제거되었는지는 아직 확실하지 않지만 조류 학자들은 조정 된 eBird 데이터의 품질에 확신이 있습니다. 이전에 언급했듯이 이러한 데이터는 거의 100 개 이상의 동료 검토 과학 출판물에서 사용되었습니다.

많은 조류 학자가 처음에는 eBird에 대해 처음 듣는 순간 매우 회의적입니다. 내 의견으로는,이 회의론의 일부는 잘못된 방식으로 eBird를 생각하는 데서 오는 것입니다. 많은 사람들이 처음에 "eBird 데이터가 완벽합니까?"라고 대답하고 대답은 "절대적으로 아닙니다"라고 생각합니다. 그러나 그것은 올바른 질문이 아닙니다. 올바른 질문은 "특정 연구 질문에 대해서는 eBird 데이터가 기존 조류 학 데이터보다 나은가?"라는 질문에 대한 답은 "분명히 그렇습니다"부분적으로는 대규모 계절 이동에 관한 질문 - 분산 데이터 수집에 대한 현실적인 대안이 없습니다.

eBird 프로젝트는 중요한 과학 데이터 수집에 자원 봉사자를 참여시키는 것이 가능함을 보여줍니다. 그러나 eBird 및 관련 프로젝트에 따르면 샘플링 및 데이터 품질과 관련된 문제는 분산 데이터 수집 프로젝트에 대한 우려 사항입니다. 그러나 다음 섹션에서 볼 수 있듯이 영리한 디자인과 기술로 인해 이러한 우려는 일부 설정에서 최소화 될 수 있습니다.