Kata pengantar

Buku ini dimulai pada tahun 2005 di ruang bawah tanah di Universitas Columbia. Pada saat itu, saya adalah seorang mahasiswa pascasarjana, dan saya menjalankan eksperimen online yang akhirnya akan menjadi disertasi saya. Saya akan memberi tahu Anda semua tentang bagian-bagian ilmiah dari eksperimen itu di bab 4, tetapi sekarang saya akan memberi tahu Anda tentang sesuatu yang tidak ada dalam disertasi saya atau di salah satu makalah saya. Dan itu adalah sesuatu yang secara fundamental mengubah cara saya berpikir tentang penelitian. Suatu pagi, ketika saya datang ke kantor ruang bawah tanah saya, saya menemukan bahwa bermalam sekitar 100 orang dari Brasil telah berpartisipasi dalam percobaan saya. Pengalaman sederhana ini memiliki efek yang mendalam pada saya. Pada saat itu, saya punya teman yang menjalankan eksperimen laboratorium tradisional, dan saya tahu betapa sulitnya mereka bekerja untuk merekrut, mengawasi, dan membayar orang untuk berpartisipasi dalam eksperimen ini; jika mereka dapat menjalankan 10 orang dalam satu hari, itu adalah kemajuan yang bagus. Namun, dengan eksperimen daring saya, 100 orang berpartisipasi saat saya sedang tidur . Melakukan riset saat Anda tidur mungkin terdengar terlalu bagus untuk menjadi kenyataan, tetapi sebenarnya tidak. Perubahan teknologi — khususnya transisi dari era analog ke era digital — berarti bahwa kita sekarang dapat mengumpulkan dan menganalisis data sosial dengan cara-cara baru. Buku ini adalah tentang melakukan penelitian sosial dengan cara-cara baru ini.

Buku ini ditujukan untuk ilmuwan sosial yang ingin melakukan lebih banyak ilmu data, ilmuwan data yang ingin melakukan lebih banyak ilmu sosial, dan siapa pun yang tertarik dengan hibrida dari dua bidang ini. Mengingat siapa buku ini, harus pergi tanpa mengatakan bahwa itu bukan hanya untuk siswa dan profesor. Meskipun, saya saat ini bekerja di universitas (Princeton), saya juga bekerja di pemerintahan (di Biro Sensus AS) dan di industri teknologi (di Microsoft Research) jadi saya tahu bahwa ada banyak penelitian menarik yang terjadi di luar universitas. Jika Anda memikirkan apa yang Anda lakukan sebagai penelitian sosial, maka buku ini adalah untuk Anda, di mana pun Anda bekerja atau teknik apa yang Anda gunakan saat ini.

Seperti yang Anda ketahui, nada buku ini sedikit berbeda dari banyak buku akademis lainnya. Itu disengaja. Buku ini muncul dari sebuah seminar pascasarjana tentang ilmu sosial komputasi yang telah saya ajarkan di Princeton di Departemen Sosiologi sejak 2007, dan saya ingin mengabadikan sebagian energi dan kegembiraan dari seminar itu. Secara khusus, saya ingin buku ini memiliki tiga karakteristik: Saya ingin itu membantu, berorientasi masa depan, dan optimis.

Bermanfaat : Tujuan saya adalah menulis buku yang bermanfaat untuk Anda. Oleh karena itu, saya akan menulis dengan gaya terbuka, informal, dan berdasarkan contoh. Itu karena hal terpenting yang ingin saya sampaikan adalah cara berpikir tertentu tentang penelitian sosial. Dan, pengalaman saya menunjukkan bahwa cara terbaik untuk menyampaikan cara berpikir ini adalah secara informal dan dengan banyak contoh. Juga, di akhir setiap bab, saya memiliki bagian yang disebut "Apa yang harus dibaca berikutnya" yang akan membantu Anda beralih ke pembacaan yang lebih rinci dan teknis pada banyak topik yang saya perkenalkan. Pada akhirnya, saya harap buku ini akan membantu Anda melakukan penelitian dan mengevaluasi penelitian orang lain.

Berorientasi masa depan : Buku ini akan membantu Anda melakukan penelitian sosial menggunakan sistem digital yang ada saat ini dan yang akan dibuat di masa depan. Saya mulai melakukan penelitian semacam ini pada tahun 2004, dan sejak itu saya telah melihat banyak perubahan, dan saya yakin bahwa selama karier Anda, Anda akan melihat banyak perubahan juga. Trik untuk tetap relevan dalam menghadapi perubahan adalah abstraksi . Misalnya, ini tidak akan menjadi buku yang mengajarkan Anda bagaimana menggunakan API Twitter sebagaimana adanya saat ini; alih-alih, ini akan mengajari Anda cara belajar dari sumber data besar (Bab 2). Ini tidak akan menjadi buku yang memberi Anda petunjuk langkah demi langkah untuk menjalankan eksperimen di Amazon Mechanical Turk; alih-alih, ini akan mengajarkan Anda bagaimana merancang dan menafsirkan eksperimen yang bergantung pada infrastruktur usia digital (Bab 4). Melalui penggunaan abstraksi, saya berharap ini akan menjadi buku abadi pada topik yang tepat waktu.

Optimis : Dua komunitas yang terlibat dalam buku ini — ilmuwan sosial dan ilmuwan data — memiliki latar belakang dan minat yang sangat berbeda. Selain perbedaan yang berkaitan dengan sains ini, yang saya bicarakan dalam buku ini, saya juga memperhatikan bahwa kedua komunitas ini memiliki gaya yang berbeda. Para ilmuwan data umumnya bersemangat; mereka cenderung melihat gelas setengah penuh. Para ilmuwan sosial, di sisi lain, pada umumnya lebih kritis; mereka cenderung melihat gelas itu setengah kosong. Dalam buku ini, saya akan mengadopsi nada optimis dari seorang ilmuwan data. Jadi, ketika saya menyajikan contoh, saya akan memberi tahu Anda apa yang saya sukai tentang contoh-contoh ini. Dan, ketika saya menunjukkan masalah dengan contoh-contoh — dan saya akan melakukannya karena tidak ada riset yang sempurna — saya akan mencoba menunjukkan masalah-masalah ini dengan cara yang positif dan optimis. Saya tidak akan kritis demi menjadi kritis — saya akan bersikap kritis sehingga saya dapat membantu Anda membuat penelitian yang lebih baik.

Kami masih berada di masa awal penelitian sosial di era digital, tetapi saya telah melihat beberapa kesalahpahaman yang sangat umum sehingga masuk akal bagi saya untuk mengalaminya di sini, di kata pengantar. Dari para ilmuwan data, saya telah melihat dua kesalahpahaman umum. Yang pertama adalah berpikir bahwa lebih banyak data secara otomatis memecahkan masalah. Namun, untuk penelitian sosial, itu belum menjadi pengalaman saya. Bahkan, untuk penelitian sosial, data yang lebih baik — dibandingkan dengan lebih banyak data — tampaknya lebih bermanfaat. Kesalahpahaman kedua yang pernah saya lihat dari para ilmuwan data adalah berpikir bahwa ilmu sosial hanyalah sekumpulan obrolan mewah yang melilit akal sehat. Tentu saja, sebagai ilmuwan sosial — lebih khusus sebagai sosiolog — saya tidak setuju dengan itu. Orang pintar telah bekerja keras untuk memahami perilaku manusia untuk waktu yang lama, dan tampaknya tidak bijaksana untuk mengabaikan kebijaksanaan yang telah terkumpul dari upaya ini. Harapan saya adalah buku ini akan menawarkan Anda beberapa kebijaksanaan itu dengan cara yang mudah dimengerti.

Dari para ilmuwan sosial, saya juga melihat dua kesalahpahaman umum. Pertama, saya telah melihat beberapa orang menghapus seluruh gagasan penelitian sosial menggunakan alat-alat zaman digital karena beberapa makalah buruk. Jika Anda membaca buku ini, Anda mungkin sudah membaca banyak makalah yang menggunakan data media sosial dengan cara yang dangkal atau salah (atau keduanya). Aku juga punya. Namun, akan menjadi kesalahan serius untuk menyimpulkan dari contoh-contoh ini bahwa semua penelitian sosial zaman digital buruk. Bahkan, Anda mungkin juga membaca banyak makalah yang menggunakan data survei dengan cara yang dangkal atau salah, tetapi Anda tidak menghapus semua penelitian menggunakan survei. Itu karena Anda tahu bahwa ada penelitian hebat yang dilakukan dengan data survei, dan dalam buku ini saya akan menunjukkan kepada Anda bahwa ada juga penelitian hebat yang dilakukan dengan alat-alat zaman digital.

Kesalahpahaman umum kedua yang pernah saya lihat dari para ilmuwan sosial adalah membingungkan masa kini dengan masa depan. Ketika kami menilai penelitian sosial di era digital — penelitian yang akan saya gambarkan — penting bagi kami untuk mengajukan dua pertanyaan berbeda: “Seberapa baik gaya penelitian ini bekerja saat ini?” Dan “Seberapa baik gaya ini pekerjaan penelitian di masa depan? ”Para peneliti dilatih untuk menjawab pertanyaan pertama, tetapi untuk buku ini saya pikir pertanyaan kedua lebih penting. Artinya, meskipun penelitian sosial di era digital belum menghasilkan kontribusi intelektual yang besar, yang mengubah paradigma, tingkat peningkatan penelitian era digital sangat cepat. Tingkat perubahan inilah — lebih dari level saat ini — yang membuat penelitian era digital begitu menarik bagi saya.

Meskipun paragraf terakhir itu mungkin menawarkan Anda kekayaan potensial pada waktu yang tidak ditentukan di masa depan, tujuan saya adalah tidak menjual Anda pada jenis riset tertentu. Saya pribadi tidak memiliki saham di Twitter, Facebook, Google, Microsoft, Apple, atau perusahaan teknologi lainnya (meskipun, demi pengungkapan penuh, saya harus menyebutkan bahwa saya telah bekerja di, atau menerima dana penelitian dari, Microsoft, Google, dan Facebook). Sepanjang buku, oleh karena itu, tujuan saya adalah untuk tetap menjadi narator yang kredibel, memberi tahu Anda tentang semua hal baru yang menarik yang mungkin, sambil memandu Anda menjauh dari beberapa jebakan yang saya lihat orang lain jatuh ke dalam (dan kadang-kadang jatuh ke dalam diri saya sendiri) .

Persimpangan ilmu sosial dan ilmu data kadang-kadang disebut ilmu sosial komputasional. Beberapa orang menganggap ini sebagai bidang teknis, tetapi ini tidak akan menjadi buku teknis dalam pengertian tradisional. Misalnya, tidak ada persamaan dalam teks utama. Saya memilih untuk menulis buku ini karena saya ingin memberikan pandangan yang komprehensif tentang penelitian sosial di era digital, termasuk sumber data besar, survei, eksperimen, kolaborasi massa, dan etika. Ternyata tidak mungkin untuk mencakup semua topik ini dan memberikan rincian teknis tentang masing-masing topik. Sebaliknya, petunjuk untuk materi yang lebih teknis diberikan di bagian “Apa yang harus dibaca berikutnya” di akhir setiap bab. Dengan kata lain, buku ini tidak dirancang untuk mengajarkan Anda cara melakukan perhitungan tertentu; melainkan dirancang untuk mengubah cara Anda berpikir tentang penelitian sosial.

Cara menggunakan buku ini dalam kursus

Seperti yang saya katakan sebelumnya, buku ini muncul sebagian dari sebuah seminar pascasarjana tentang ilmu sosial komputasional yang saya ajarkan sejak 2007 di Princeton. Karena Anda mungkin berpikir tentang menggunakan buku ini untuk mengajar kursus, saya pikir mungkin akan membantu bagi saya untuk menjelaskan bagaimana hal itu tumbuh dari kursus saya dan bagaimana saya membayangkan itu digunakan dalam kursus lain.

Selama beberapa tahun, saya mengajar mata kuliah saya tanpa buku; Saya baru saja menugaskan koleksi artikel. Sementara para siswa dapat belajar dari artikel-artikel ini, artikel-artikel itu sendiri tidak mengarah pada perubahan konseptual yang saya harap dapat ciptakan. Jadi saya akan menghabiskan sebagian besar waktu di kelas untuk memberikan perspektif, konteks, dan saran untuk membantu siswa melihat gambaran besar. Buku ini adalah upaya saya untuk menuliskan semua perspektif, konteks, dan saran itu dengan cara yang tidak memiliki prasyarat — dalam hal ilmu sosial atau ilmu data.

Dalam kursus semester panjang, saya akan merekomendasikan memasangkan buku ini dengan berbagai bacaan tambahan. Misalnya, kursus semacam itu mungkin menghabiskan dua minggu untuk percobaan, dan Anda dapat memasangkan bab 4 dengan pembacaan pada topik-topik seperti peran informasi pra-perawatan dalam desain dan analisis eksperimen; masalah statistik dan komputasi yang diangkat oleh pengujian A / B skala besar di perusahaan; desain eksperimen khusus difokuskan pada mekanisme; dan isu-isu praktis, ilmiah, dan etis yang terkait dengan penggunaan peserta dari pasar tenaga kerja online, seperti Amazon Mechanical Turk. Itu juga bisa dipasangkan dengan pembacaan dan kegiatan yang berhubungan dengan pemrograman. Pilihan yang tepat antara banyak pasangan yang mungkin tergantung pada siswa dalam program studi Anda (misalnya, sarjana, master, atau PhD), latar belakang mereka, dan tujuan mereka.

Sebuah kursus semester panjang juga bisa mencakup set masalah mingguan. Setiap bab memiliki berbagai kegiatan yang diberi label oleh tingkat kesulitan: mudah ( mudah ), medium ( medium ), keras ( keras ), dan sangat keras ( sangat keras ). Juga, saya telah memberi label setiap masalah dengan keterampilan yang dibutuhkan: matematika ( membutuhkan matematika ), coding ( membutuhkan pengkodean ), dan pengumpulan data ( pengumpulan data ). Akhirnya, saya telah memberi label beberapa kegiatan yang menjadi favorit pribadi saya ( kesukaanku ). Saya harap dalam beragam koleksi kegiatan ini, Anda akan menemukan beberapa yang sesuai untuk siswa Anda.

Untuk membantu orang menggunakan buku ini dalam kursus, saya telah memulai koleksi bahan ajar seperti silabus, slide, pasangan yang direkomendasikan untuk setiap bab, dan solusi untuk beberapa kegiatan. Anda dapat menemukan bahan-bahan ini — dan berkontribusi kepada mereka — di http://www.bitbybitbook.com.