kata pengantar

Buku ini bermula pada tahun 2005 di ruang bawah tanah di Columbia University. Pada masa itu, saya adalah pelajar siswazah, dan saya menjalankan eksperimen dalam talian yang akhirnya akan menjadi disertasi saya. Saya akan memberitahu anda tentang bahagian saintifik percubaan dalam bab 4, tetapi sekarang saya akan memberitahu anda tentang sesuatu yang tidak dalam disertasi saya atau di mana-mana kertas saya. Dan ini sesuatu yang secara asasnya mengubah bagaimana saya berfikir tentang penyelidikan. Suatu pagi, ketika saya masuk ke pejabat bawah tanah saya, saya mendapati bahawa kira-kira 100 orang dari Brazil telah mengambil bahagian dalam eksperimen saya. Pengalaman mudah ini mempunyai kesan mendalam kepada saya. Pada masa itu, saya mempunyai kawan yang menjalankan eksperimen percubaan tradisional, dan saya tahu betapa sukarnya mereka bekerja untuk merekrut, mengawasi, dan membayar orang untuk mengambil bahagian dalam eksperimen ini; jika mereka boleh menjalankan 10 orang dalam satu hari, itu adalah kemajuan yang baik. Walau bagaimanapun, dengan eksperimen dalam talian saya, 100 orang menyertai semasa saya sedang tidur . Melakukan penyelidikan anda semasa anda tidur mungkin terdengar terlalu baik untuk menjadi kenyataan, tetapi tidak. Perubahan dalam teknologi-khususnya peralihan dari zaman analog ke zaman digital-bermakna kita kini boleh mengumpul dan menganalisis data sosial dengan cara yang baru. Buku ini adalah tentang melakukan penyelidikan sosial dengan cara-cara baru ini.

Buku ini adalah untuk saintis sosial yang ingin melakukan lebih banyak sains data, saintis data yang ingin melakukan lebih banyak sains sosial, dan sesiapa yang berminat dalam hibrid kedua bidang ini. Memandangkan siapa buku ini, ia harus pergi tanpa mengatakan bahawa ia bukan hanya untuk pelajar dan profesor. Walaupun saya sedang bekerja di sebuah universiti (Princeton), saya juga pernah bekerja di kerajaan (di Biro Banci Amerika Syarikat) dan di industri teknologi (di Microsoft Research) jadi saya tahu ada banyak penyelidikan menarik yang berlaku di luar universiti. Jika anda berfikir tentang apa yang anda lakukan sebagai penyelidikan sosial, maka buku ini adalah untuk anda, tidak kira di mana anda bekerja atau jenis teknik yang anda gunakan sekarang.

Seperti yang mungkin anda perhatikan, nada buku ini agak berbeza daripada banyak buku akademik lain. Itu disengajakan. Buku ini muncul daripada seminar siswazah mengenai sains sosial pengkomputeran yang saya ajarkan di Princeton di Jabatan Sosiologi sejak tahun 2007, dan saya ingin menangkap beberapa tenaga dan keseronokan dari seminar itu. Khususnya, saya mahu buku ini mempunyai tiga ciri: Saya mahu ia menjadi berguna, berorientasikan masa depan, dan optimis.

Bermanfaat : Matlamat saya ialah menulis buku yang berguna untuk anda. Oleh itu, saya akan menulis dalam gaya terbuka, tidak formal dan didorong contoh. Itulah sebab perkara yang paling penting yang saya ingin sampaikan adalah cara berfikir tentang penyelidikan sosial. Dan, pengalaman saya menunjukkan bahawa cara terbaik untuk menyampaikan cara pemikiran ini secara tidak rasmi dan dengan banyak contoh. Juga, pada akhir setiap bab, saya mempunyai bahagian yang dipanggil "Apa yang perlu dibaca seterusnya" yang akan membantu anda beralih ke pembacaan yang lebih terperinci dan teknikal pada banyak topik yang saya perkenalkan. Akhirnya, saya harap buku ini akan membantu anda berdua melakukan penyelidikan dan menilai penyelidikan orang lain.

Berorientasikan masa depan : Buku ini akan membantu anda melakukan penyelidikan sosial menggunakan sistem digital yang ada sekarang dan yang akan diwujudkan pada masa akan datang. Saya mula melakukan penyelidikan semacam ini pada 2004, dan sejak itu saya telah melihat banyak perubahan, dan saya yakin sepanjang karier anda, anda akan melihat banyak perubahan juga. Caranya untuk kekal relevan dalam menghadapi perubahan ialah abstraksi . Contohnya, ini tidak akan menjadi buku yang mengajar anda tepat bagaimana menggunakan API Twitter kerana ia wujud hari ini; Sebaliknya, ia akan mengajar anda cara belajar dari sumber data besar (bab 2). Ini tidak akan menjadi buku yang memberi anda petunjuk langkah demi langkah untuk menjalankan eksperimen pada Amazon Mechanical Turk; Sebaliknya, ia akan mengajar anda bagaimana untuk merekabentuk dan mentafsir eksperimen yang bergantung kepada infrastruktur umur digital (bab 4). Melalui penggunaan abstraksi, saya harap ini akan menjadi buku abadi pada topik yang tepat pada masanya.

Optimis : Dua komuniti yang terlibat dalam buku ini-saintis sosial dan saintis data-mempunyai latar belakang dan minat yang sangat berbeza. Di samping perbezaan-perbezaan berkaitan sains yang saya ceritakan dalam buku ini, saya juga menyedari bahawa kedua-dua komuniti ini mempunyai gaya yang berbeza. Para saintis data pada umumnya teruja; mereka cenderung melihat kaca sebagai setengah penuh. Ahli sains sosial, sebaliknya, secara amnya lebih kritikal; mereka cenderung melihat kaca sebagai kosong. Dalam buku ini, saya akan mengamalkan nada optimistik seorang saintis data. Oleh itu, apabila saya memberikan contoh, saya akan memberitahu anda apa yang saya sukai tentang contoh-contoh ini. Dan, apabila saya menunjukkan masalah dengan contoh-contohnya-dan saya akan melakukannya kerana tiada penyelidikan yang sempurna-saya akan cuba untuk menunjukkan masalah ini dengan cara yang positif dan optimis. Saya tidak akan kritikal kerana kritikal-saya akan menjadi kritikal supaya saya boleh membantu anda membuat penyelidikan yang lebih baik.

Kami masih berada di peringkat awal penyelidikan sosial dalam era digital, tetapi saya telah melihat beberapa salah faham yang begitu biasa sehingga masuk akal bagi saya untuk mengatasinya di sini, dalam kata pengantar. Dari saintis data, saya telah melihat dua kesalahpahaman yang biasa. Yang pertama adalah memikirkan bahawa lebih banyak data secara automatik menyelesaikan masalah. Walau bagaimanapun, untuk penyelidikan sosial, itu bukan pengalaman saya. Malah, untuk penyelidikan sosial, data yang lebih baik-yang bertentangan dengan lebih banyak data-kelihatan lebih bermanfaat. Kesalahpahaman kedua yang saya lihat dari para saintis data berfikir bahawa sains sosial hanyalah sekumpulan ceramah mewah yang dibeli di sekitar akal. Sudah tentu, sebagai ahli sains sosial-lebih khusus sebagai ahli sosiologi-saya tidak bersetuju dengan itu. Orang pintar telah bekerja keras untuk memahami tingkah laku manusia untuk jangka masa yang panjang, dan nampaknya tidak bijak untuk mengabaikan kebijaksanaan yang telah terkumpul dari usaha ini. Harapan saya adalah bahawa buku ini akan memberikan anda beberapa kebijaksanaan itu dengan cara yang mudah difahami.

Dari saintis sosial, saya juga melihat dua kesalahpahaman yang biasa. Pertama, saya telah melihat beberapa orang menuliskan keseluruhan idea penyelidikan sosial menggunakan alat-alat zaman digital kerana beberapa kertas buruk. Jika anda membaca buku ini, anda mungkin sudah membaca sekumpulan kertas kerja yang menggunakan data media sosial dengan cara yang cet atau salah (atau kedua-duanya). Saya juga. Walau bagaimanapun, ia akan menjadi satu kesilapan serius untuk membuat kesimpulan dari contoh-contoh ini bahawa semua penyelidikan sosial umur digital adalah buruk. Malah, anda mungkin juga membaca sekumpulan kertas kerja yang menggunakan data tinjauan dengan cara yang tidak berperikemanusiaan atau salah, tetapi anda tidak melupuskan semua penyelidikan menggunakan tinjauan. Itu kerana anda tahu bahawa terdapat penyelidikan yang hebat dilakukan dengan data tinjauan, dan dalam buku ini saya akan menunjukkan kepada anda bahawa terdapat penyelidikan yang hebat juga dilakukan dengan alat-alat zaman digital.

Kesalahpahaman umum kedua yang saya lihat dari saintis sosial adalah untuk mengelirukan masa kini dengan masa depan. Apabila kita menilai penyelidikan sosial dalam era digital-penyelidikan yang saya akan huraikan-penting bahawa kita meminta dua soalan yang berbeza: "Seberapa baik gaya penyelidikan ini berfungsi sekarang?" Dan "Seberapa baik gaya ini kerja penyelidikan di masa depan? "Penyelidik dilatih untuk menjawab soalan pertama, tetapi untuk buku ini saya fikir soalan kedua lebih penting. Iaitu, walaupun penyelidikan sosial dalam era digital belum menghasilkan sumbangan intelektual yang berubah-ubah secara paradigma, kadar penambahbaikan penyelidikan digital telah sangat pesat. Ia adalah kadar perubahan ini-lebih daripada tahap semasa-yang membuat penelitian digital-umur sangat menarik untuk saya.

Walaupun perenggan terakhir ini mungkin memberikan anda potensi kekayaan pada masa yang tidak ditentukan di masa depan, matlamat saya adalah tidak menjual anda pada jenis penyelidikan tertentu. Saya tidak mempunyai saham sendiri di Twitter, Facebook, Google, Microsoft, Apple, atau mana-mana syarikat teknologi lain (walaupun, demi pendedahan penuh, saya harus menyatakan bahawa saya telah bekerja di, atau menerima dana penyelidikan dari, Microsoft, Google, dan Facebook). Sepanjang buku ini, matlamat saya adalah untuk tetap menjadi penyampai yang boleh dipercayai, memberitahu anda tentang semua perkara baru yang menarik yang mungkin, sambil membimbing anda dari beberapa perangkap yang saya lihat orang lain jatuh (dan kadang-kadang jatuh ke dalam diri saya) .

Persimpangan sains sosial dan sains data kadangkala dikenali sebagai sains sosial komputasi. Sesetengah menganggap ini sebagai bidang teknikal, tetapi ini tidak akan menjadi buku teknikal dalam pengertian tradisional. Sebagai contoh, tidak ada persamaan dalam teks utama. Saya memilih untuk menulis buku ini dengan cara ini kerana saya ingin memberikan pandangan komprehensif penyelidikan sosial dalam era digital, termasuk sumber data besar, kaji selidik, eksperimen, kolaborasi massa, dan etika. Ternyata tidak mungkin untuk merangkumi semua topik ini dan memberikan butiran teknikal tentang setiap satu. Sebaliknya, petunjuk kepada bahan yang lebih teknikal diberikan dalam bahagian "Apa yang hendak dibaca seterusnya" di hujung setiap bab. Dalam erti kata lain, buku ini tidak direka untuk mengajar anda cara melakukan pengiraan tertentu; Sebaliknya, ia direka untuk mengubah cara anda berfikir tentang penyelidikan sosial.

Cara menggunakan buku ini dalam kursus

Seperti yang saya katakan sebelum ini, buku ini muncul sebahagian daripada seminar siswazah mengenai sains sosial komputasi yang saya ajar sejak tahun 2007 di Princeton. Oleh kerana anda mungkin berfikir tentang menggunakan buku ini untuk mengajar kursus, saya fikir ia berguna bagi saya untuk menerangkan bagaimana ia berkembang dari kursus saya dan bagaimana saya membayangkan ia digunakan dalam kursus lain.

Selama beberapa tahun, saya mengajar kursus saya tanpa buku; Saya baru sahaja menyerahkan koleksi artikel. Walaupun pelajar dapat belajar dari artikel ini, artikel sahaja tidak membawa perubahan konseptual yang saya harapkan. Oleh itu, saya akan menghabiskan sebahagian besar masa dalam kelas yang memberikan perspektif, konteks, dan nasihat untuk membantu pelajar melihat gambaran besar. Buku ini adalah percubaan saya untuk menulis semua perspektif, konteks, dan nasihat dengan cara yang tidak mempunyai prasyarat - dari segi sains sosial atau sains data.

Dalam kursus semester, saya akan mengesyorkan pasangan buku ini dengan pelbagai pembacaan tambahan. Sebagai contoh, kursus semacam itu mungkin menghabiskan masa dua minggu pada eksperimen, dan anda boleh memasangkan bab 4 dengan bacaan mengenai topik seperti peranan maklumat pra-rawatan dalam reka bentuk dan analisis eksperimen; isu statistik dan pengiraan yang dibangkitkan oleh ujian A / B berskala besar di syarikat; reka bentuk eksperimen khusus memberi tumpuan kepada mekanisme; dan isu praktikal, saintifik, dan etika yang berkaitan dengan penggunaan peserta dari pasaran buruh dalam talian, seperti Amazon Mechanical Turk. Ia juga boleh dipasangkan dengan pembacaan dan aktiviti yang berkaitan dengan pengaturcaraan. Pilihan yang sesuai antara pasangan berpasangan ini bergantung kepada pelajar dalam kursus anda (misalnya, sarjana, master atau PhD), latar belakang mereka, dan matlamat mereka.

Kursus semester panjang juga boleh termasuk set soal mingguan. Setiap bab mempunyai pelbagai aktiviti yang dilabelkan oleh tahap kesukaran: mudah ( mudah ), sederhana ( sederhana ), keras ( keras ), dan sangat keras ( sangat susah ). Juga, saya telah melabelkan setiap masalah dengan kemahiran yang diperlukannya: matematik ( memerlukan matematik ), pengekodan ( memerlukan pengekodan ), dan pengumpulan data ( pengumpulan data ). Akhirnya, saya telah melabelkan beberapa aktiviti yang merupakan kegemaran peribadi saya ( kegemaran saya ). Saya berharap dalam pengumpulan aktiviti yang pelbagai ini, anda akan dapati beberapa yang sesuai untuk pelajar anda.

Untuk membantu orang menggunakan buku ini dalam kursus, saya telah memulakan koleksi bahan pengajaran seperti silabus, slaid, pasangan yang disyorkan untuk setiap bab, dan penyelesaian kepada beberapa aktiviti. Anda boleh mencari bahan-bahan ini dan menyumbang kepada mereka-di http://www.bitbybitbook.com.