5.4.3 결론

분산 데이터 수집이 가능하고, 향후 예상 기술 및 수동 참여를 포함 할 것이다.

eBird이 입증 된 바와 같이, 분산 데이터 수집 과학 연구에 사용될 수있다. 또한, PhotoCity은 샘플링 및 데이터 품질에 관한 문제를 풀 수있는 가능성을 보여준다.

어떻게 사회 연구를위한 데이터 수집 작업을 분산 할 수 있습니까? 멋진 예는 수잔 왓킨스와 말라위 저널 프로젝트에 그녀의 동료의 작품에서 온다 (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . 이 프로젝트에서, 22 지역, 기록 상세 "대화 저널"-kept "기자들에게"주민들이 소위, 당시 그들은 보통 사람들의 일상 생활에서 AIDS에 대한 엿 대화가 (프로젝트가 시작 성인의 약 15 % 말라위에서 HIV에 감염되었다 (Bello, Chipeta, and Aberle-Grasse 2006) ). 때문에 자신의 내부 상태의,이 기자는 내가 자신의 질량 공동 프로젝트를 설계에 대한 조언을 제공 할 때 (I 나중에 장에서 이것의 윤리 논의 할 것이다 수잔 왓킨스와 그녀의 서양의 연구 협력자에 액세스 할 수 없게되었을 수 있습니다 대화를 도청 할 수 있었다 ). 말라위 저널 프로젝트의 데이터는 중요한 연구 결과의 수를 주도하고있다. 프로젝트가 시작되기 전에 예를 들어, 많은 외부인은 사하라 사막 이남의 아프리카에서 에이즈에 대한 침묵가 있다고 생각하지만, 저널이 명확하지 않는 경우임을 입증 : 기자 장례식 등 다양한 장소에서, 주제에 대한 대화의 수백을 엿 , 바, 교회. 또한, 이들의 특성 대화 연구자들은 더 콘돔 사용에 대한 저항의 일부를 이해하는 데 도움; 콘돔 사용은 공중 보건의 메시지 프레임되었다는 방법은 일상 생활에서 논의 된 방식과 일치했다 (Tavory and Swidler 2009) .

물론, eBird의 데이터처럼, 말라위 저널 프로젝트의 데이터는, 왓킨스와 동료에 의해 상세히 설명 문제가 완벽하지 않습니다. 예를 들어, 녹음 된 대화가 가능한 모든 대화의 무작위 표본 수 없습니다. 오히려, 그들은 AIDS에 대한 대화의 불완전한 인구 조사이다. 데이터 품질의 관점에서, 연구자들은 저널 내에 저널 걸쳐 일관성 의해 입증 그들의 기자 고품질 기자 있다고 믿는다. 충분한 기자가 작은만큼 설정에 배치되고 보고서가 특정 주제에 초점을 맞춘 때 또한, 중복 데이터 품질에 대한 신뢰를 증가하는 것이 가능하게되었다. 예를 들어, "스텔라"라는 이름의 성 노동자는 네 가지 저널의 저널에 여러 번 나타났다 (Watkins and Swidler 2009) . 이 PhotoCity 있다는 리던던시의 이용은 평가 분산 데이터 수집 프로젝트 데이터 품질을 보장하기위한 중요한 원칙이다. 더 당신의 직관을 구축하기 위해, 표 5.3 사회 연구를위한 분산 데이터 수집의 다른 예를 보여줍니다.

표 5.3 : 사회 연구에 분산 된 데이터 수집 프로젝트의 예.
데이터 수집 소환
말라위의 HIV / AIDS에 대한 토론 Watkins and Swidler (2009) , Kaler, Watkins, and Angotti (2015)
스트리트는 런던에서 구걸 Purdam (2014)
동부 콩고에서 충돌 이벤트 Windt and Humphreys (2016)
나이지리아, 라이베리아의 경제 활동 Blumenstock, Keleher, and Reisinger (2016)
인플루엔자 감시 Noort et al. (2015)

이 절에서 설명하는 모든 예제는 적극적인 참여를 포함했다 : 기자들이 듣고 대화를 전사; 새 사냥꾼은 들새 관찰 체크리스트를 업로드; 또는 플레이어는 자신의 사진을 업로드했습니다. 그러나 참여는 무엇 자동이었고, 제출 특정 기술이나 시간이 필요하지 않은 경우? 이것은 "참여 감지"또는 제공하는 약속입니다 "사람 중심의 감지."예를 들어, 깊은 구멍 순찰, MIT의 과학자에 의해 프로젝트가, 보스턴 지역에서 일곱 택시 택시 내부에 GPS를 장착 가속도계를 장착 (Eriksson et al. 2008) . 깊은 구멍을 통해 구동하는 이동 택시의 내부에 배치 별개의 가속도 신호, 이러한 장치를 나뭇잎 때문에, 보스턴의 깊은 구멍지도를 만들 수 있습니다. 물론, 택시 임의로 도로를 샘플링하지 않지만, 충분히 택시 주어, 그들이 도시의 많은 부분에 대한 정보를 제공하기에 충분한 범위가있을 수 있습니다. 기술에 의존하는 수동적 인 시스템의 두 번째 이점은 그들이 드 기술 데이터를 기여하는 과정 : 그것은 (안정적 조류 종을 식별 할 수 있어야하기 때문에) eBird에 기여하는 기술이 필요하지만, 그것이에 특별한 기술을 필요로하지 않는다 깊은 구멍 순찰에 기여한다.

앞으로 나는 많은 분산 데이터 수집 프로젝트는 이미 전 세계 수십억의 사람들에 의해 수행되는 휴대 전화의 기능을 활용하기 시작합니다 용의자. 이러한 전화는 이미 마이크로폰, 카메라, GPS 장치, 및 시계 등의 측정에 중요한 센서의 수가 많다. 또한,이 휴대 전화는 연구자에게 기본 데이터 수집 프로토콜을 통해 약간의 제어를 가능하게 타사 응용 프로그램을 지원합니다. 마지막으로, 이러한 휴대폰 가능 그들이 수집 한 데이터를 오프 -로드 할 수있게 인터넷 접속이있다. 가 제한된 배터리 수명에 대한 부정확 한 센서들로부터 다양한 기술적 문제가 있지만, 기술이 개발됨에 따라 이러한 문제가 예상 시간을 통해 감소 할 것이다. 기술 개발로 개인 정보 보호 및 윤리에 관한 문제, 다른 한편으로는, 더 복잡 얻을 수 있습니다; 나는 자신의 질량 협력을 설계에 대한 조언을 제공 할 때 윤리의 질문에 돌아갑니다.

분산 데이터 수집 프로젝트에서 자원 봉사자들은 세계에 대한 데이터를 기여한다. 이러한 접근 방법은 이미 성공적으로 사용되었으며, 향후 이용 가능성 샘플링 데이터 품질 문제를 해결해야한다. 다행스럽게도, 이러한 PhotoCity과 깊은 구멍 순찰 등의 기존 프로젝트는 이러한 문제에 대한 해결책을 제시한다. 더 많은 프로젝트는 크게 단순히 과거의 한계를 떠났다 데이터를 수집하기 위해 연구를 가능하게 규모 증가해야 데이터 수집 프로젝트 드 숙련 및 수동 참여를 가능하게 기술을 이용, 분산을 걸릴.