5.4.3 Kesimpulan

Pengumpulan data terdistribusi adalah mungkin, dan di masa depan kemungkinan akan melibatkan teknologi dan partisipasi pasif.

Seperti yang ditunjukkan oleh eBird, pengumpulan data terdistribusi dapat digunakan untuk penelitian ilmiah. Selanjutnya, PhotoCity menunjukkan bahwa masalah yang terkait dengan pengambilan sampel dan kualitas data berpotensi terpecahkan. Bagaimana cara kerja pengumpulan data terdistribusi untuk penelitian sosial? Salah satu contoh berasal dari karya Susan Watkins dan rekan-rekannya di Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Dalam proyek ini, 22 penduduk lokal — disebut “wartawan” —menulis “jurnal percakapan” yang merekam, secara detail, percakapan yang mereka dengar tentang AIDS dalam kehidupan sehari-hari orang biasa (pada saat proyek dimulai, sekitar 15% orang dewasa di Malawi terinfeksi HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Karena status orang dalam mereka, jurnalis ini dapat mendengar percakapan yang mungkin tidak dapat diakses oleh Watkins dan kolaborator penelitian Baratnya (saya akan membahas etika ini nanti di bab ketika saya menawarkan saran tentang merancang proyek kolaborasi massal Anda sendiri) . Data dari Malawi Journals Project telah menghasilkan sejumlah temuan penting. Misalnya, sebelum proyek dimulai, banyak orang luar percaya bahwa ada keheningan tentang AIDS di Afrika sub-Sahara, tetapi jurnal percakapan menunjukkan bahwa ini jelas tidak terjadi: wartawan mendengar ratusan diskusi tentang topik tersebut, di lokasi yang beragam seperti pemakaman, bar, dan gereja. Lebih lanjut, sifat percakapan ini membantu peneliti lebih memahami beberapa resistensi terhadap penggunaan kondom; cara penggunaan kondom dibingkai dalam pesan kesehatan masyarakat tidak konsisten dengan cara yang dibahas dalam kehidupan sehari-hari (Tavory and Swidler 2009) .

Tentu saja, seperti data dari eBird, data dari Proyek Jurnal Malawi tidak sempurna, masalah yang dibahas secara rinci oleh Watkins dan rekan-rekannya. Misalnya, percakapan yang direkam bukanlah sampel acak dari semua kemungkinan percakapan. Sebaliknya, mereka adalah sensus percakapan tentang AIDS yang tidak lengkap. Dalam hal kualitas data, para peneliti percaya bahwa wartawan mereka adalah wartawan berkualitas tinggi, sebagaimana dibuktikan oleh konsistensi dalam jurnal dan jurnal. Yaitu, karena cukup banyak wartawan yang ditempatkan dalam lingkungan yang cukup kecil dan terfokus pada topik tertentu, adalah mungkin untuk menggunakan redundansi untuk menilai dan memastikan kualitas data. Misalnya, seorang pekerja seks bernama "Stella" muncul beberapa kali di jurnal empat wartawan yang berbeda (Watkins and Swidler 2009) . Untuk lebih membangun intuisi Anda, tabel 5.3 menunjukkan contoh lain dari pengumpulan data terdistribusi untuk penelitian sosial.

Tabel 5.3: Contoh Proyek Pengumpulan Data Terdistribusi dalam Penelitian Sosial
Data dikumpulkan Referensi
Diskusi tentang HIV / AIDS di Malawi Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015)
Jalan mengemis di London Purdam (2014)
Peristiwa konflik di Kongo Timur Windt and Humphreys (2016)
Kegiatan ekonomi di Nigeria dan Liberia Blumenstock, Keleher, and Reisinger (2016)
Pengawasan influenza Noort et al. (2015)

Semua contoh yang dijelaskan di bagian ini telah melibatkan partisipasi aktif: wartawan mentranskripsikan percakapan yang mereka dengar; birders mengunggah daftar periksa birding mereka; atau pemain mengunggah foto mereka. Tetapi bagaimana jika partisipasi itu otomatis dan tidak memerlukan keterampilan khusus atau waktu untuk menyerahkan? Ini adalah janji yang ditawarkan oleh "penginderaan partisipatif" atau "penginderaan berpusat pada manusia." Sebagai contoh, Patroli Pothole, sebuah proyek oleh para ilmuwan di MIT, memasang alat percepatan yang dilengkapi GPS di dalam tujuh taksi di daerah Boston (Eriksson et al. 2008) . Karena mengemudi di atas lubang berlubang meninggalkan sinyal akselerometer yang berbeda, perangkat ini, ketika ditempatkan di dalam taksi yang bergerak, dapat membuat peta berlubang di Boston. Tentu saja, taksi tidak secara acak mengambil sampel jalan, tetapi, dengan cukup taksi, mungkin ada cakupan yang cukup untuk memberikan informasi tentang sebagian besar dari mereka kota. Manfaat kedua dari sistem pasif yang bergantung pada teknologi adalah bahwa mereka menghilangkan keterampilan proses kontribusi data: sementara itu membutuhkan keterampilan untuk berkontribusi pada eBird (karena Anda harus dapat mengidentifikasi spesies burung dengan andal), itu tidak memerlukan keahlian khusus untuk berkontribusi pada Pothole Patrol.

Ke depan, saya menduga bahwa banyak proyek pengumpulan data terdistribusi akan mulai memanfaatkan kemampuan telepon seluler yang sudah dibawa oleh miliaran orang di seluruh dunia. Ponsel ini sudah memiliki sejumlah besar sensor penting untuk pengukuran, seperti mikrofon, kamera, perangkat GPS, dan jam. Lebih lanjut, mereka mendukung aplikasi pihak ketiga yang memungkinkan para peneliti mengendalikan protokol pengumpulan data yang mendasarinya. Akhirnya, mereka memiliki konektivitas internet, sehingga memungkinkan mereka untuk mem-off-load data yang mereka kumpulkan. Ada banyak tantangan teknis, mulai dari sensor yang tidak akurat hingga masa pakai baterai yang terbatas, tetapi masalah ini kemungkinan akan berkurang seiring berjalannya waktu seiring perkembangan teknologi. Masalah yang terkait dengan privasi dan etika, di sisi lain, mungkin menjadi lebih rumit; Saya akan kembali ke pertanyaan etika ketika saya menawarkan saran tentang merancang kolaborasi massa Anda sendiri.

Dalam proyek pengumpulan data terdistribusi, relawan menyumbangkan data tentang dunia. Pendekatan ini telah berhasil digunakan, dan penggunaan di masa depan kemungkinan harus mengatasi masalah sampling dan kualitas data. Untungnya, proyek-proyek yang ada seperti PhotoCity dan Pothole Patrol menyarankan solusi untuk masalah ini. Karena semakin banyak proyek memanfaatkan teknologi yang memungkinkan partisipasi de-terampil dan pasif, proyek pengumpulan data terdistribusi harus secara dramatis meningkatkan skala, memungkinkan para peneliti untuk mengumpulkan data yang hanya terlarang di masa lalu.