5.4.3まとめ

分散したデータ収集が可能であり、将来的には技術と受動的な参加が必要となるでしょう。

eBirdが示すように、分散データ収集は科学研究に使用できます。さらに、PhotoCityは、サンプリングとデータ品質に関連する問題が解決可能であることを示しています。社会的研究のための分散データ収集の仕組みは? 1つの例は、マラウイジャーナルプロジェクト(Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015)のSusan Watkinsと彼女の同僚の仕事から来ています。このプロジェクトでは、「ジャーナリスト」と呼ばれる22人の地元住民が、一般の人々の日常生活の中でエイズについて聞いた会話を詳細に記録した「会話型ジャーナル」を控えています(プロジェクト開始時、マラウイではHIVに感染していた(Bello, Chipeta, and Aberle-Grasse 2006) )。彼らのインサイダーの地位のために、これらのジャーナリストは、ワトキンスと西洋の研究協力者がアクセスできない会話を耳にすることができました(私自身の大量共同研究プロジェクトの設計に関するアドバイスを受けた後のこの倫理について議論します) 。マラウイ・ジャーナル・プロジェクトのデータは、いくつかの重要な知見をもたらしました。例えば、プロジェクトが始まる前に、サハラ以南のアフリカではエイズに関する沈黙があると多くの外部から信じられていましたが、会話ジャーナルでは明らかにそうではないことが示されました。ジャーナリストは、葬儀場、バー、教会などがあります。さらに、これらの会話の性質は、研究者がコンドーム使用に対する抵抗のいくつかをよりよく理解する助けとなった。コンドームの使用が公衆衛生のメッセージで枠に入れられた方法は、それが日常生活で議論された方法と矛盾していました(Tavory and Swidler 2009)

もちろん、eBirdのデータのように、マラウイジャーナルプロジェクトのデータは完全ではありません。ワトキンスとその同僚によって詳細に議論された問題です。たとえば、記録された会話は、すべての可能な会話のランダムなサンプルではありません。むしろ、彼らはエイズに関する会話の不完全な国勢調査です。研究者は、データ品質に関して、ジャーナル内およびジャーナル全体の一貫性によって証明されたように、ジャーナリストが高品質の記者であると信じていました。つまり、充分なジャーナリストが十分な規模で配置され、特定のトピックに重点を置いているため、冗長性を使用してデータの品質を評価し保証することが可能でした。たとえば、4人のジャーナリスト(Watkins and Swidler 2009)の雑誌に「Stella」という性別の労働者が数回(Watkins and Swidler 2009) 。あなたの直感をさらに深めるために、社会的研究のための分散データ収集の他の例を表5.3に示します。

表5.3:社会調査における分散データ収集プロジェクトの例
収集されたデータ 参照
マラウイでのHIV /エイズに関する議論 Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
ロンドンでストリートを乞う Purdam (2014)
東部コンゴの紛争事件 Windt and Humphreys (2016)
ナイジェリアとリベリアの経済活動 Blumenstock, Keleher, and Reisinger (2016)
インフルエンザの監視 Noort et al. (2015)

このセクションで説明されているすべての例は、積極的に参加しています。ジャーナリストは、聞いた会話を転記しました。鳥獣飼育者は野鳥のチェックリストをアップロードした。またはプレーヤーが写真をアップロードした。しかし、参加が自動で、特定のスキルや提出時間を必要としない場合はどうなりますか?たとえば、MITの科学者によるプロジェクトであるPothole Patrolは、ボストン地区の7つのタクシーにGPS搭載の加速度計を搭載しました(Eriksson et al. 2008) 。穴を開けると、加速度センサーの信号が得られるため、移動するタクシーの中に置かれると、ボストンの穴の地図を作成することができます。もちろん、タクシーは無作為に道路をサンプリングするのではありませんが、十分なタクシーがあれば、都市の大部分についての情報を提供するのに十分なカバレッジがあるかもしれません。技術に依存する受動的システムの第2の利点は、データの寄与プロセスを熟知していることです。eBirdに貢献するスキルが必要ですが(鳥の種を確実に識別できる必要があるため)、特別なスキルは必要ありません。 Pothole Patrolに貢献する

今後は、世界中の数十億人の人々がすでに携行している携帯電話の機能を、多くの分散データ収集プロジェクトが利用し始めると考えられます。これらの電話機には、すでに、マイクロホン、カメラ、GPSデバイス、時計など、計測に重要な多数のセンサがあります。さらに、サードパーティのアプリケーションをサポートしているため、研究者は基礎となるデータ収集プロトコルをある程度制御することができます。最後に、インターネットに接続することで、収集したデータの負荷を軽減することができます。不正確なセンサーからバッテリーの寿命に至るまで、数多くの技術的課題がありますが、これらの問題は、技術の進展に伴って時間の経過とともに減少する可能性があります。一方、プライバシーと倫理に関連する問題は、より複雑になる可能性があります。私はあなた自身の大量の共同作業を設計するためのアドバイスを提供するとき、倫理の問題に戻ります。

分散データ収集プロジェクトでは、ボランティアは世界中のデータを寄稿します。このアプローチはすでに成功裡に使用されており、今後の使用ではサンプリングやデータ品質の問題に対処する必要があります。幸運なことに、PhotoCityやPothole Patrolなどの既存のプロジェクトは、これらの問題に対する解決策を提案しています。熟練していない受動的な参加を可能にする技術が増えるにつれて、分散型データ収集プロジェクトは劇的に拡大し、研究者は過去には限界に達していないデータを収集することができます。