Predgovor

Ta knjiga se je začela leta 2005 v kleti na univerzi Columbia. Takrat sem bil diplomant in sem vodil spletni preizkus, ki bi sčasoma postal moja disertacija. Povedal vam bom vse o znanstvenih delih tega eksperimenta v 4. poglavju, zdaj pa vam bom povedal o nečem, kar ni v moji disertaciji ali v nobenem od mojih dokumentov. In to je nekaj, kar se je temeljito spremenilo, kako razmišljam o raziskavah. Nekega jutra, ko sem prišel v mojo kletno pisarno, sem ugotovil, da je čez noči sodelovalo približno 100 ljudi iz Brazilije. Ta preprosta izkušnja je imela velik vpliv na mene. Takrat sem imel prijatelje, ki so izvajali tradicionalne laboratorijske eksperimente, in vedel sem, kako težko so morali delati, da bi zaposlili, nadzirali in plačali ljudi, da sodelujejo v teh eksperimentih; če bi v enem dnevu lahko vodili 10 ljudi, je bil to dober napredek. Vendar pa je z mojim spletnim preizkusom med spanjem sodelovalo 100 ljudi. Narediti svoje raziskave med spanjem se lahko zveni preveč dobro, da bi bilo res, vendar ni. Spremembe v tehnologiji, zlasti prehod od analogne dobe do digitalne dobe, pomeni, da lahko zdaj na nove načine zbira in analizira socialne podatke. Ta knjiga se ukvarja s socialnimi raziskavami na teh novih načinih.

Ta knjiga je za socialne znanstvenike, ki želijo storiti več podatkov o znanosti, znanstvenikih podatkov, ki želijo narediti več družbenih ved in kdorkoli zanima hibrid teh dveh področij. Glede na to, za koga je ta knjiga namenjena, bi se moralo brez besed ponoviti, da to ni samo za študente in profesorje. Čeprav trenutno delam na univerzi (Princeton), sem tudi delal v vladi (v ameriškem uradu za popise) in v tehnološki industriji (pri Microsoftovih raziskavah), zato vem, da se dogaja veliko razburljivih raziskav zunaj univerze. Če razmišljate o tem, kaj počnete kot družbeno raziskovanje, potem je ta knjiga za vas, ne glede na to, kje delate ali katere tehnike trenutno uporabljate.

Kot ste morda že opazili, se ton te knjige nekoliko razlikuje od tiste v mnogih drugih akademskih knjigah. To je namerno. Knjiga je izšla iz diplomskega seminarja o računalniških družbenih znanostih, ki sem ga leta 2007 na Oddelku za sociologijo poučeval na Princetonu, in želim, da bi s tem seminarjem zajela nekaj energije in navdušenja. Zlasti želim, da ima ta knjiga tri značilnosti: hočem, da je koristno, usmerjeno v prihodnost in optimistično.

Uporabno : Moj cilj je napisati knjigo, ki vam pomaga. Zato bom napisal v odprtem, neformalnem in primernem slogu. To je zato, ker je najpomembnejša stvar, ki jo želim prenesti, določen način razmišljanja o družbenih raziskavah. In moje izkušnje kažejo, da je najboljši način posredovanja tega načina razmišljanja neformalno in z veliko primeri. Tudi na koncu vsakega poglavja imam razdelek »Kaj naj berem naprej«, ki vam bo pomagal preiti na podrobnejše in tehnične podatke o številnih temah, ki jih predstavim. Na koncu, upam, da vam bo ta knjiga pomagal tako raziskati in oceniti raziskave drugih.

Prihodnost usmerjena : Ta knjiga vam bo pomagala pri raziskovanju s pomočjo digitalnih sistemov, ki obstajajo danes, in tistih, ki bodo ustvarjene v prihodnosti. Takšno raziskavo sem začel leta 2004 in od takrat sem videl veliko sprememb in prepričan sem, da boste v času svoje kariere videli tudi številne spremembe. Trik, da ostanejo pomembni pred spremembami, je odvzem . Na primer, to ne bo knjiga, ki vam uči, kako natančno uporabljati API za Twitter, kakršen je danes; namesto tega vas bo naučil, kako se učiti iz velikih virov podatkov (poglavje 2). To ne bo knjiga, ki vam bo dala korak za korakom navodila za izvajanje preizkusov na Amazon Mechanical Turk; namesto tega vas bo naučil, kako oblikovati in interpretirati poskuse, ki se opirajo na infrastrukturo digitalne dobe (poglavje 4). Z uporabo abstrakcije upam, da bo to brezčasna knjiga o pravočasni temi.

Optimist : Skupnost, ki jo ta knjiga ukvarja - znanstveniki s področja sociale in znanstveniki - imajo zelo različne okoliščine in zanimanja. Poleg teh znanstvenih razlik, o katerih v knjigi govorim, sem tudi opazil, da ti dve skupini imata različne stile. Podatki znanstveniki so navadno navdušeni; vidijo steklo kot pol poln. Socialni znanstveniki so na splošno bolj kritični; pogosto vidijo steklo kot pol prazno. V tej knjigi bom sprejel optimistični ton podatkovnega znanstvenika. Torej, ko predstavim primere, vam bom povedal, kaj imam rad o teh primerih. In, ko opozarjam na težave s primeri - in to bom storil, ker nobena raziskava ni popolna - poskušam te težave opozoriti na način, ki je pozitiven in optimističen. Ne bom kritičen zaradi kritičnega pomena, kritičen bom, da vam lahko pomagam ustvariti boljše raziskave.

Še vedno smo v zgodnjih dneh družbenih raziskav v digitalni dobi, vendar sem videl nekaj nesporazumov, ki so tako pogosti, da je smiselno, da jih obravnavam tukaj v predgovoru. Od znanstvenikov podatkov sem videl dve skupni nesporazumi. Prvi misli, da več podatkov samodejno rešuje težave. Vendar za socialne raziskave to ni bila moja izkušnja. Dejansko je za socialne raziskave boljše podatke - v nasprotju z več podatki - zdi, da so bolj koristne. Drugi nesporazum, ki sem ga videl od znanstvenikov, razmišlja, da je družbena znanost le kup fantastičnih pogovorov, ki so oviti na zdrav razum. Seveda kot sociologa, natančneje kot sociologa, se s tem ne strinjam. Pametni ljudje že dolgo delajo, da bi razumeli človeško vedenje in se ne bi smelo prezreti modrosti, ki se je nabrala s tem naporom. Upam, da vam bo ta knjiga ponudila nekaj te modrosti na način, ki ga je enostavno razumeti.

Od družboslovcev sem videl tudi dva pogosta nesporazuma. Najprej sem videl, da nekateri ljudje zaradi nekaj slabih papirjev odpisujejo celotno idejo o družbenih raziskavah z orodji digitalne dobe. Če berete to knjigo, ste verjetno že prebrali več člankov, ki uporabljajo podatke o družabnih medijih na načine, ki so banalni ali napačni (ali oboje). Moram. Vendar bi bila iz teh primerov resna napaka, da so vse digitalne socialne raziskave slabe. Pravzaprav ste verjetno tudi prebrali vrsto dokumentov, ki uporabljajo podatke anket o načinih, ki so banalni ali napačni, vendar ne raziskovanje vseh raziskav z anketami. To je zato, ker veste, da obstajajo velike raziskave z anketnimi podatki, v tej knjigi pa vam pokažem, da obstajajo tudi velike raziskave z orodji digitalne dobe.

Drugi pogost nesporazum, ki sem ga videl pri družboslovju, je zamenjati sedanjost s prihodnostjo. Ko ocenjujemo družbene raziskave v digitalni dobi - raziskave, ki jih bom opisal - pomembno je, da postavljamo dve različni vprašanji: »Koliko dobro deluje ta način raziskav?« In »Kako bo ta stil raziskovalno delo v prihodnosti? «Raziskovalci so usposobljeni, da odgovorijo na prvo vprašanje, vendar za to knjigo mislim, da je drugo vprašanje bolj pomembno. To pomeni, da čeprav socialne raziskave v digitalni dobi še niso ustvarile ogromnih intelektualnih prispevkov, ki spreminjajo paradigme, je hitrost izboljševanja digitalnega raziskovanja izjemno hitra. To je stopnja sprememb - več kot sedanja raven - zaradi česar so raziskave digitalne dobe tako zanimive.

Čeprav se vam zdi, da vam ta zadnji odstavek ponuja potencialno bogastvo v nekem nedoločenem času v prihodnosti, moj cilj ni, da vas prodajam na nobeni določeni vrsti raziskav. Osebno nimam lastnih deležev v Twitterju, Facebooku, Googlu, Microsoftu, Appleu ali kateri koli drugi tehnološki družbi (čeprav zaradi popolnega razkritja moram omeniti, da sem delal ali prejel sredstva za raziskave od Microsofta, Google in Facebook). Skozi celotno knjigo je moj cilj ostati verodostojni pripovedovalec, ki vam govori o vseh vznemirljivih novih stvareh, ki so možne, medtem ko vas vodijo stran od nekaj pasti, ki sem jih videl, ko so drugi (včasih pa tudi sami) .

Presečišče družboslovja in podatkovne znanosti se včasih imenuje računalniška družbena znanost. Nekateri menijo, da je to tehnično področje, vendar to v tehničnem smislu ne bo tehnična knjiga. V glavnem besedilu na primer ni enačb. Odločil sem se, da bi napisal knjigo na ta način, ker sem želel zagotoviti celovit pogled na družbene raziskave v digitalni dobi, vključno z velikimi viri podatkov, anketami, eksperimenti, množičnim sodelovanjem in etiko. Izkazalo se je, da je nemogoče pokriti vse te teme in zagotoviti tehnične podrobnosti o vsakem od njih. Namesto tega so na koncu vsakega poglavja v razdelku »Kaj je treba prebrati« navesti kazalnike za več tehničnega gradiva. Z drugimi besedami, ta knjiga ni namenjena učenju, kako narediti kakršen koli izračun; namesto tega je zasnovan tako, da spremeni način razmišljanja o družbenih raziskavah.

Kako uporabljati to knjigo v tečaju

Kot sem že omenil, se je ta knjiga deloma pojavila na diplomskem seminarju računalniških družbenih ved, ki ga poučujem od leta 2007 v Princetonu. Ker ste morda razmišljali o uporabi te knjige za učenje tečaja, sem mislil, da bi bilo morda v pomoč, če bom razložil, kako je zrasel iz mojega tečaja in kako si predstavljam, da ga uporabljam v drugih tečajih.

Že več let sem učil svoj tečaj brez knjige; Samo dodam zbirko člankov. Čeprav so se učenci lahko naučili iz teh člankov, sami članki niso vodili do konceptualnih sprememb, ki sem jih upal ustvariti. Zato bi večino časa preživljal v razredu, ki bi zagotavljal perspektivo, kontekst in nasvete, da bi učencem pomagal videti veliko sliko. Ta knjiga je moj poskus, da napišem vso to perspektivo, kontekst in nasvete na način, ki nima nobenih predpogojev - bodisi v družboslovju kot na področju znanosti o podatkih.

V semestersko dolgem tečaju bi priporočil, da se ta knjiga poveže z različnimi dodatnimi branji. Tako lahko na primer tak tečaj preživi dva tedna na poskusih in lahko v poglavju 4 seznanite z branji o temah, kot je vloga informacij o predobdelavi pri oblikovanju in analizi poskusov; statistična in računska vprašanja, ki jih povzročajo obsežni testi A / B v podjetjih; oblikovanje eksperimentov, posebej osredotočenih na mehanizme; ter praktičnih, znanstvenih in etičnih vprašanj, povezanih z uporabo udeležencev s spletnih trgov dela, kot je Amazon Mechanical Turk. Lahko je tudi seznanjen z branji in dejavnostmi, povezanimi s programiranjem. Ustrezna izbira med temi možnimi vzvodi je odvisna od študentov v vašem predmetu (npr. Dodiplomski, magistrski ali doktorski študij), njihovega ozadja in njihovih ciljev.

Trajanje semestra bi lahko vključevalo tedenske skupine problemov. Vsako poglavje ima različne dejavnosti, ki so označene s stopnjo težavnosti: enostavno ( enostavno ), srednje ( srednje ), trda ( težko ) in zelo težko ( zelo težko ). Vsako težavo sem označil tudi s spretnostmi, ki jih potrebuje: matematika ( zahteva matematiko ), kodiranje ( zahteva kodiranje ) in zbiranje podatkov ( Zbiranje podatkov ). Na koncu sem označil nekaj dejavnosti, ki so moje osebne priljubljene ( moj najljubši ). Upam, da boste v tej raznoliki zbirki dejavnosti našli nekaj primernih za vaše študente.

Za pomoč ljudem, ki uporabljajo to knjigo v tečajih, sem začel zbirko učnih gradiv, kot so učni načrti, diapozitivi, priporočeno seznanjanje za vsako poglavje in rešitve za nekatere dejavnosti. Te gradiva lahko najdete in prispevate k njim - na http://www.bitbybitbook.com.