Predgovor

Ova knjiga započela je 2005. godine u podrumu na Sveučilištu Columbia. U to sam vrijeme bio diplomirani student i vodio sam on-line eksperiment koji bi naposljetku postao moja disertacija. Reći ću vam sve o znanstvenim dijelovima tog eksperimenta u 4. poglavlju, ali sad ću vam reći o nečemu što nije u mojoj disertaciji ili u bilo kojem od mojih radova. I to je nešto što je temeljito promijenilo kako razmišljam o istraživanju. Jednog jutra, kad sam došla u podrumski ured, otkrio sam da preko noći oko 100 ljudi iz Brazila sudjeluje u mojem eksperimentu. Ovo jednostavno iskustvo imalo je dubok utjecaj na mene. U to sam vrijeme imao prijatelje koji su vodili tradicionalne laboratorijske eksperimente, a znao sam koliko su morali raditi za zapošljavanje, nadzor i plaćanje ljudi da sudjeluju u tim eksperimentima; ako bi mogli izvoditi 10 ljudi u jednom danu, to je bio dobar napredak. Međutim, s mojim mrežnim eksperimentom, 100 osoba je sudjelovalo dok sam spavao . Provođenje vašeg istraživanja dok spavate može zvučati previše dobro da bude istina, ali to nije. Promjene u tehnologiji - posebice prijelaz iz analogne dobi u digitalno doba - znači da sada možemo prikupljati i analizirati društvene podatke na nove načine. Ova se knjiga bavi društvenim istraživanjem na ovim novim načinima.

Ova knjiga namijenjena je društvenim znanstvenicima koji žele raditi više znanosti o podacima, znanstvenici koji žele raditi više društvene znanosti i svi zainteresirani za hibrid ovih dviju područja. S obzirom na to tko je za ovu knjigu, valja reći da to nije samo za studente i profesore. Iako trenutno radim na sveučilištu (Princeton), također sam radio u državnoj službi (u US Census Bureauu) iu tehnološkoj industriji (u Microsoft Researchu) pa znam da postoji mnogo uzbudljivih istraživanja koja se događaju izvan sveučilišta. Ako mislite o onome što radite kao društveno istraživanje, onda je ova knjiga za vas, bez obzira gdje radite ili kakve tehnike trenutačno upotrebljavate.

Kao što ste možda već primijetili, ton ove knjige malo se razlikuje od mnogih drugih akademskih knjiga. To je namjerno. Ova je knjiga proizašla iz poslijediplomskog seminara o računalnoj društvenoj znanosti koju sam predavao na Princetonu na Odsjeku za sociologiju od 2007., a volio bih da zahvati dio energije i uzbuđenja na tom seminaru. Osobito, želim da ova knjiga ima tri značajke: želim da bude korisna, usmjerena na budućnost i optimistična.

Korisno : Moj cilj je napisati knjigu koja vam je korisna. Stoga ću pisati na otvorenom, neformalnom i primjeru upravljanom stilu. To je zato što je najvažnija stvar koju želim prenijeti je određeni način razmišljanja o društvenim istraživanjima. I moje iskustvo sugerira da je najbolji način da se ovaj način razmišljanja neformalno i sa puno primjera. Također, na kraju svakog poglavlja imam odjeljak pod nazivom "Što da pročitam sljedeće" koji će vam pomoći pri prelasku na detaljnije i tehničko čitanje o mnogim temama koje uvodim. Na kraju, nadam se da će vam ova knjiga pomoći da istražite i procijenite istraživanje drugih.

Budućnost : Ova knjiga će vam pomoći da provedete društvena istraživanja pomoću digitalnih sustava koji postoje i onih koji će biti kreirani u budućnosti. Počela sam s takvim istraživanjima u 2004. i od tada sam vidjela mnoge promjene, a siguran sam da ćete tijekom karijere vidjeti i mnoge promjene. Izigrati da ostane relevantan u lice promjene jest apstrakcija . Na primjer, ovo neće biti knjiga koja vas uči točno kako koristiti Twitter API kao što postoji danas; umjesto toga, ona će vas naučiti kako naučiti iz velikih izvora podataka (2. poglavlje). Ovo neće biti knjiga koja vam daje korak-po-korak upute za pokretanje eksperimenata na Amazon Mechanical Turk; Umjesto toga, to će vas naučiti kako dizajnirati i interpretirati eksperimente koji se oslanjaju na digitalnu dobnu infrastrukturu (poglavlje 4). Korištenjem apstrakcije, nadam se da će to biti bezvremena knjiga o pravovremenoj temi.

Optimistična : Dvije zajednice koje ova knjiga bavi - društvenim znanstvenicima i znanstvenicima podataka - imaju vrlo različite pozadine i interese. Pored ovih razlika u znanosti, o kojima govorim u knjizi, primijetio sam i da ove dvije zajednice imaju različite stilove. Znanstvenici su općenito uzbuđeni; oni obično gledaju staklo kao pola punog. Društvene znanosti, s druge strane, općenito su kritičnije; oni obično gledaju staklo kao polu prazno. U ovoj ću knjizi usvojiti optimističan ton znanstvenika podataka. Dakle, kad predstavim primjere, kažem vam što volim o ovim primjerima. I kad bih istaknuo probleme s primjerima - i to ću učiniti jer nijedan znanstveni članak nije savršen - pokušat ću istaknuti te probleme na pozitivan i optimistički način. Neću biti kritičan zbog kritičnosti - bit ću kritičan da bih ti mogao pomoći da stvorite bolja istraživanja.

Još smo u ranim danima društvenih istraživanja u digitalnom dobu, ali vidio sam neke nerazumijeve koji su tako česti da imam smisla da im se ovdje obrađujem u predgovoru. Iz podataka znanstvenika, vidio sam dva uobičajena nesporazuma. Prvo je mislio da više podataka automatski rješava probleme. Međutim, za društvena istraživanja to nije bilo moje iskustvo. Zapravo, za društvena istraživanja, bolji podaci - za razliku od više podataka - čini se korisnijima. Drugi nesporazum koji sam vidio iz znanstvenika podataka misli da je društvena znanost samo hrpa fancy razgovora koji je omotan oko zdravog razuma. Naravno, kao društveni znanstvenik - konkretnije kao sociolog - ne slažem se s tim. Pametni ljudi već dugo rade na razumijevanju ljudskog ponašanja i čini se mudro ignorirati mudrost koja se nakupila iz ovog napora. Nadam se da će vam ova knjiga ponuditi neku od te mudrosti na način koji je lako razumljiv.

Od društvenih znanstvenika vidio sam i dva uobičajena nesporazuma. Prvo, vidio sam da neki ljudi otpuštaju cijelu ideju društvenog istraživanja pomoću alata digitalnog doba zbog nekoliko loših radova. Ako čitate ovu knjigu, vjerojatno ste već čitali hrpu članaka koji upotrebljavaju podatke društvenih medija na način koji su banalni ili pogrešni (ili oboje). Imam također. Međutim, bilo bi ozbiljna pogreška zaključiti iz ovih primjera da su sva društvena istraživanja digitalnog doba loša. Zapravo, vjerojatno ste pročitali hrpu članaka koji upotrebljavaju podatke ankete na načine koji su banalni ili pogrešni, ali ne brišete sva istraživanja pomoću anketama. Zato što znate da je izvrsno istraživanje provedeno s podacima ankete, a u ovoj ću knjizi pokazati da postoji i velika istraživanja koja se provode s alatom digitalnog doba.

Drugi uobičajeni nesporazum koji sam vidio od društvenih znanstvenika jest zbunjivanje sadašnjosti s budućnošću. Kad procjenjujemo društvena istraživanja u digitalnom dobu - istraživanje koje ću opisati - važno je da postavljamo dva različita pitanja: "Koliko dobro radi taj stil istraživanja?" I "Koliko dobro će taj stil istraživački rad u budućnosti? "Istraživači su osposobljeni za odgovor na prvo pitanje, ali za ovu knjigu mislim da je drugo pitanje važnije. To jest, iako društvena istraživanja u digitalnom dobu još nisu donijela masivne intelektualne doprinose koji mijenjaju paradigmu, stopa poboljšanja istraživanja digitalnog doba nevjerojatno je brza. To je stopa promjene - više od trenutne razine - što me digitalno doba istraživanje tako uzbudljivo za mene.

Iako vam ovaj posljednji odlomak može ponuditi potencijalna bogatstva u nekom neodređenom vremenu, moj cilj nije prodati vas na bilo koju vrstu istraživanja. Ne osobno posjedujem dionice na Twitteru, Facebooku, Googleu, Microsoftu, Appleu ili bilo kojoj drugoj tehnološkoj tvrtki (iako, radi potpunog objavljivanja, moram napomenuti da sam radio na Microsoftovim istraživačkim fondovima, Google i Facebook). Kroz knjigu, dakle, moj je cilj ostati vjerodostojan pripovjedač koji vam govori o svim uzbudljivim novim stvarima koje mogu, dok vas odvode daleko od nekoliko zamki koje sam vidio drugima (i povremeno sam se u nju spustio) ,

Sjecište društvene znanosti i znanosti o podacima ponekad se zove računalna društvena znanost. Neki smatraju da je to tehničko polje, ali to neće biti tehnička knjiga u tradicionalnom smislu. Na primjer, u glavnom tekstu nema jednadžbi. Odabrao sam ovu knjigu napisati na taj način jer sam želio pružiti sveobuhvatan pregled društvenih istraživanja u digitalnom dobu, uključujući velike izvore podataka, ankete, eksperimente, masovnu suradnju i etiku. Pokazalo se da je nemoguće pokriti sve te teme i dati tehničke pojedinosti o svakoj od njih. Umjesto toga, upućivanje na više tehničkih materijala nalazi se u odjeljku "Što čitati sljedeće" na kraju svakog poglavlja. Drugim riječima, ova knjiga nije osmišljena kako bi vas naučila kako napraviti bilo koji određeni izračun; Umjesto toga, dizajniran je da promijeni način na koji razmišljate o društvenim istraživanjima.

Kako koristiti ovu knjigu na tečaju

Kao što sam rekao ranije, ova je knjiga djelomično nastala na seminaru o računalnoj društvenoj znanosti koju sam predavao od 2007. godine u Princetonu. Budući da možda razmišljate o korištenju ove knjige kako biste podučavali tečaj, pomislio sam kako bi mi bilo korisno objasniti kako je izraslo iz mojega tečaja i kako sam zamisliti da se koristi na drugim tečajevima.

Već nekoliko godina podučavam tečaj bez knjige; Samo bih dodijelio zbirku članaka. Dok su učenici bili u stanju naučiti iz tih članaka, sami članci nisu doveli do konceptualnih promjena koje sam se nadao stvoriti. Zato bih provodio najveći dio vremena u razredu pružajući perspektivu, kontekst i savjete kako bih pomogao učenicima da vide veliku sliku. Ova je knjiga moj pokušaj da napišem svu tu perspektivu, kontekst i savjete na način koji nema preduvjete - u smislu bilo društvene znanosti ili znanosti o podacima.

U semestru, preporučujem uparivanje ove knjige s nizom dodatnih čitanja. Na primjer, takav tečaj mogao bi provesti dva tjedna na eksperimentima, a mogli biste upariti i četvrtu knjigu s čitanjima o temama kao što su uloga informacija o pretkripciji u izradi i analizi eksperimenata; statistička i računska pitanja koja su postavljena velikim A / B testovima u tvrtkama; dizajn eksperimenata posebno usmjerenih na mehanizme; i praktična, znanstvena i etička pitanja koja se odnose na korištenje sudionika iz online tržišta rada, kao što je Amazon Mechanical Turk. Također bi se moglo udružiti s čitanjima i aktivnostima vezanim za programiranje. Odgovarajući izbor između ovih mnogih mogućih uparivanja ovisi o studentima u vašem tečaju (npr. Preddiplomski, magistarski ili doktorski), njihove pozadine i njihove ciljeve.

Trajanje semestra moglo bi također uključivati ​​tjedne skupove problema. Svako poglavlje ima različite aktivnosti koje su označene stupnjem težine: jednostavno ( lako ), srednji ( srednji ), tvrdo ( teško ), i vrlo teško ( vrlo teško ). Također sam označio svaki problem vještinama koje zahtijeva: matematika ( zahtijeva matematiku ), kodiranje ( zahtijeva kodiranje ) i prikupljanje podataka ( prikupljanje podataka ). Konačno, označio sam neke od aktivnosti koje su moji osobni favoriti ( moj favorit ). Nadam se da ćete u ovoj raznovrsnoj zbirci aktivnosti pronaći neke koji su prikladni za vaše učenike.

Kako bih pomogao ljudima koji koriste ovu knjigu na tečajevima, pokrenuo sam zbirku nastavnih materijala kao što su nastavni planovi, slajdovi, preporučeni uparivanja za svako poglavlje i rješenja za neke aktivnosti. Te materijale možete pronaći i pridonijeti njima - na http://www.bitbybitbook.com.