voorwoord

Hierdie boek het in 2005 in 'n kelder by die Columbia-universiteit begin. Ek was destyds 'n gegradueerde, en ek het 'n aanlyn-eksperiment uitgevoer wat uiteindelik my proefskrif sou word. Ek sal jou alles vertel oor die wetenskaplike dele van daardie eksperiment in hoofstuk 4, maar nou gaan ek jou vertel van iets wat nie in my proefskrif of in enige van my vraestelle is nie. En dit is iets wat fundamenteel verander het hoe ek aan navorsing dink. Een oggend, toe ek by my kelderkantoor kom, het ek ontdek dat oornag ongeveer 100 mense uit Brasilië aan my eksperiment deelgeneem het. Hierdie eenvoudige ervaring het my 'n diepgaande uitwerking gehad. Op daardie tydstip het ek vriende gehad wat tradisionele laboratoriumeksperimente gehad het, en ek het geweet hoe moeilik hulle moes werk om te werf, toesig te hou en mense te betaal om aan hierdie eksperimente deel te neem. as hulle 10 mense op 'n enkele dag kon hardloop, was dit goeie vordering. Met my aanlyn-eksperiment het 100 mense egter deelgeneem terwyl ek geslaap het . Om jou navorsing te doen terwyl jy slaap, kan dalk te goed klink om waar te wees, maar dit is nie. Veranderinge in tegnologie, spesifiek die oorgang van die analoog ouderdom tot die digitale era, beteken dat ons sosiale data op nuwe maniere kan versamel en analiseer. Hierdie boek gaan oor sosiale navorsing op hierdie nuwe maniere.

Hierdie boek is vir sosiale wetenskaplikes wat meer data wetenskap, data wetenskaplikes wil doen wat meer sosiale wetenskap wil doen, en almal wat belangstel in die baster van hierdie twee velde. Gegee wie hierdie boek is, behoort dit te sê dat dit nie net vir studente en professore is nie. Alhoewel ek tans by 'n universiteit (Princeton) werk, het ek ook in die regering (by die Amerikaanse sensusburo) en in die tegnologiebedryf (by Microsoft Research) gewerk, sodat ek weet dat daar baie opwindende navorsing buite die universiteite. As jy dink aan wat jy as sosiale navorsing doen, dan is hierdie boek vir jou, maak nie saak waar jy werk of watter soort tegnieke jy tans gebruik nie.

Soos u dalk al opgemerk het, is die toon van hierdie boek 'n bietjie anders as dié van baie ander akademiese boeke. Dit is opsetlik. Hierdie boek het ontstaan ​​uit 'n gegradueerde seminaar oor rekenkundige sosiale wetenskap wat ek sedert 2007 aan Princeton in die Departement Sosiologie geleer het, en ek wil graag van die energie en opwinding van die seminaar vang. In die besonder wil ek hê dat hierdie boek drie eienskappe het: ek wil dit help, toekomsgerig en optimisties wees.

Nuttig : My doel is om 'n boek te skryf wat vir u behulpsaam is. Daarom gaan ek skryf in 'n oop, informele en voorbeeldgedrewe styl. Dit is omdat die belangrikste ding wat ek wil oordra, 'n sekere manier van dink oor sosiale navorsing is. En my ervaring dui daarop dat die beste manier om hierdie denkwyse oor te dra, informeel en met baie voorbeelde is. Verder, aan die einde van elke hoofstuk, het ek 'n gedeelte genaamd "Wat om volgende te lees" wat u sal help om oor te skakel na meer gedetailleerde en tegniese lesings oor baie van die onderwerpe wat ek stel. Uiteindelik hoop ek dat hierdie boek u sal help om navorsing te doen en die navorsing van ander te evalueer.

Toekomsgerigte : Hierdie boek sal u help om sosiale navorsing te doen deur gebruik te maak van die digitale stelsels wat vandag bestaan en diegene wat in die toekoms geskep sal word. Ek het hierdie soort navorsing in 2004 begin, en sedertdien het ek baie veranderings gesien, en ek is seker dat jy in die loop van jou loopbaan ook baie veranderings sal sien. Die truuk om relevant te bly in die gesig van verandering is abstraksie . Byvoorbeeld, dit gaan nie 'n boek wees wat jou presies leer hoe om die Twitter API te gebruik soos dit vandag bestaan ​​nie; In plaas daarvan gaan dit jou leer hoe om te leer van groot databronne (hoofstuk 2). Dit gaan nie 'n boek wees wat jou stap-vir-stap instruksies gee vir die uitvoer van eksperimente op Amazon Mechanical Turk nie; In plaas daarvan gaan dit jou leer hoe om eksperimente wat op digitale ouderdominfrastruktuur staatmaak (hoofstuk 4) te ontwerp en te interpreteer. Deur die gebruik van abstraksie hoop ek dit sal 'n tydlose boek wees oor 'n tydige onderwerp.

Optimisties : Die twee gemeenskappe wat hierdie boek betrek, sosiale wetenskaplikes en data-wetenskaplikes, het baie verskillende agtergronde en belange. Benewens hierdie wetenskapverwante verskille waaroor ek in die boek praat, het ek ook opgemerk dat hierdie twee gemeenskappe verskillende style het. Data wetenskaplikes is oor die algemeen opgewonde; Hulle is geneig om die glas halfvol te sien. Sosiale wetenskaplikes, aan die ander kant, is oor die algemeen meer kritiek; hulle is geneig om die glas as half leeg te sien. In hierdie boek gaan ek die optimistiese toon van 'n data-wetenskaplike aanneem. Dus, wanneer ek voorbeelde aanbied, gaan ek jou vertel wat ek van hierdie voorbeelde liefhet. En as ek probleme met die voorbeelde uitwys - en dit sal ek doen, want geen navorsing is perfek nie - ek gaan probeer om hierdie probleme op 'n positiewe en optimistiese wyse aan te dui. Ek gaan nie krities wees om kritiek te wees nie - ek gaan krities wees sodat ek jou kan help om beter navorsing te skep.

Ons is nog in die vroeë dae van sosiale navorsing in die digitale era, maar ek het 'n paar misverstande gesien wat so algemeen is dat dit sinvol is om hulle hier in die voorwoord aan te spreek. Uit data wetenskaplikes het ek twee algemene misverstande gesien. Die eerste is van mening dat meer data outomaties probleme oplos. Vir sosiale navorsing is dit egter nie my ervaring nie. Trouens, vir sosiale navorsing, lyk beter data - in teenstelling met meer data - meer behulpsaam. Die tweede misverstand wat ek van data wetenskaplikes gesien het, meen dat sosiale wetenskap net 'n klomp fancy praatjies is wat gesond is. Natuurlik, as 'n sosiale wetenskaplike - meer spesifiek as sosioloog - stem ek nie daarmee saam nie. Slim mense het hard gewerk om menslike gedrag vir 'n lang tyd te verstaan, en dit lyk onverstandig om die wysheid wat uit hierdie poging opgehoop het, te ignoreer. My hoop is dat hierdie boek u van die wysheid sal voorsien op 'n manier wat maklik verstaanbaar is.

Van sosiale wetenskaplikes het ek ook twee algemene misverstande gesien. Eerstens het ek gesien hoe sommige mense die hele idee van sosiale navorsing met behulp van die gereedskap van die digitale era afskryf weens 'n paar slegte vraestelle. As jy hierdie boek lees, het jy waarskynlik alreeds 'n klomp vraestelle gelees wat sosiale media-data gebruik op maniere wat verkeerd of verkeerd is (of albei). Ek het ook. Dit sal egter 'n ernstige fout wees om uit hierdie voorbeelde af te lei dat alle sosiale navorsing op die gebied van digitale ouderdom sleg is. Trouens, jy het waarskynlik ook 'n klomp vraestelle gelees wat opname data gebruik op maniere wat verkeerd is, maar jy skryf nie alle navorsing deur opnames uit nie. Dit is omdat jy weet dat daar groot navorsing gedoen is met opname data, en in hierdie boek gaan ek jou wys dat daar ook goeie navorsing gedoen word met die gereedskap van die digitale era.

Die tweede algemene misverstand wat ek van sosiale wetenskaplikes gesien het, is om die gesin met die toekoms te verwar. Wanneer ons sosiale navorsing in die digitale era evalueer - die navorsing wat ek gaan beskryf - dit is belangrik dat ons twee afsonderlike vrae vra: "Hoe goed gaan hierdie navorsingstyl nou werk?" En "Hoe goed sal hierdie styl van navorsingswerk in die toekoms? "Navorsers word opgelei om die eerste vraag te beantwoord, maar vir hierdie boek dink ek die tweede vraag is belangriker. Dit is, hoewel sosiale navorsing in die digitale era nog nie massiewe, paradigma-veranderende intellektuele bydraes opgelewer het nie, is die tempo van die verbetering van navorsing vir digitale leeftyd ongelooflik vinnig. Dit is hierdie tempo van verandering, meer as die huidige vlak, wat digitale navorsing vir my so opwindend maak.

Alhoewel die laaste paragraaf dalk jou potensiële rykdom op sommige ongespesifiseerde tyd in die toekoms kan bied, is my doel nie om jou te verkoop op enige spesifieke soort navorsing nie. Ek het nie persoonlike aandele in Twitter, Facebook, Google, Microsoft, Apple, of enige ander tegnologiemaatskappy nie (alhoewel, ter wille van volledige openbaarmaking, moet ek noem dat ek by, of navorsingsbefondsing van Microsoft, Google en Facebook). Regdeur die boek, daarom, is my doel om 'n geloofwaardige verteller te bly, wat jou vertel van al die opwindende nuwe dinge wat moontlik is, terwyl jy jou weg lei van 'n paar valle wat ek gesien het dat ander in (en soms in myself geval het) val. .

Die kruising van sosiale wetenskap en data wetenskap word soms berekenende sosiale wetenskap genoem. Sommige beskou dit as 'n tegniese veld, maar dit sal nie in die tradisionele sin 'n tegniese boek wees nie. Byvoorbeeld, daar is geen vergelykings in die hoof teks nie. Ek het gekies om die boek só te skryf omdat ek 'n omvattende siening van sosiale navorsing in die digitale era wou gee, insluitende groot databronne, opnames, eksperimente, massamewerking en etiek. Dit blyk onmoontlik om al hierdie onderwerpe te dek en tegniese inligting oor elkeen te verskaf. In plaas daarvan word aan die einde van elke hoofstuk verwys na meer tegniese materiaal in die afdeling "Wat om te lees volgende". Met ander woorde, hierdie boek is nie ontwerp om jou te leer hoe om 'n spesifieke berekening te doen nie; eerder, dit is ontwerp om die manier waarop jy aan sosiale navorsing dink, te verander.

Hoe om hierdie boek in 'n kursus te gebruik

Soos ek vroeër gesê het, het hierdie boek gedeeltelik na vore getree uit 'n gegradueerde seminaar oor rekenkundige sosiale wetenskap wat ek sedert 2007 in Princeton onderrig het. Aangesien u dalk dink oor die gebruik van hierdie boek om 'n kursus te onderrig, het ek gedink dat dit vir my nuttig kan wees om te verduidelik hoe dit uit my kursus gegroei het en hoe ek dink dat dit in ander kursusse gebruik word.

Vir jare het ek my kursus sonder 'n boek geleer; Ek wil net 'n versameling artikels toewys. Terwyl studente van hierdie artikels kon leer, het die artikels alleen nie gelei tot die konseptuele veranderinge wat ek wou skep nie. So ek sal die meeste van die tyd in die klas spandeer en perspektief, konteks en advies verskaf om die studente te help om die groot prentjie te sien. Hierdie boek is my poging om al daardie perspektief, konteks en advies neer te skryf op 'n manier wat geen voorvereistes het nie - in terme van sosiale wetenskappe of data wetenskap.

In 'n semesterlange kursus wil ek aanbeveel om hierdie boek saam te stel met 'n verskeidenheid addisionele lesings. Byvoorbeeld, so 'n kursus kan twee weke aan eksperimente spandeer, en jy kan hoofstuk 4 koppel met lesings oor onderwerpe soos die rol van voorbehandeling-inligting in die ontwerp en analise van eksperimente; statistiese en rekenaarkwessies wat deur grootskaalse A / B toetse by maatskappye gevoer word; ontwerp van eksperimente wat spesifiek op meganismes gefokus is; en praktiese, wetenskaplike en etiese kwessies rakende die gebruik van deelnemers uit aanlyn arbeidsmarkte, soos Amazon Mechanical Turk. Dit kan ook gepaard gaan met lesings en aktiwiteite wat verband hou met programmering. Die gepaste keuse tussen hierdie baie moontlike koppelings hang af van die studente in u kursus (bv. Voorgraadse, meestersgraad of PhD), hul agtergronde en hul doelwitte.

'N Semesterlengte kursus kan ook weeklikse probleemstelle insluit. Elke hoofstuk het 'n verskeidenheid aktiwiteite wat gemerk is volgens moeilikheidsgraad: maklik ( maklik ), medium ( medium ), hard ( hard ), en baie moeilik ( baie hard ). Ek het ook elke probleem gemerk deur die vaardighede wat dit benodig: wiskunde ( vereis wiskunde ), kodering ( vereis kodering ), en data-insameling ( data-insameling ). Ten slotte het ek 'n paar van die aktiwiteite genoem wat my persoonlike gunstelinge is ( my gunsteling ). Ek hoop dat binne hierdie uiteenlopende versameling aktiwiteite 'n paar wat vir jou studente geskik is, sal vind.

Om mense te help met die gebruik van hierdie boek in kursusse, het ek begin met 'n versameling onderrigmateriaal soos sillabusse, skyfies, aanbevole parings vir elke hoofstuk en oplossings vir sommige aktiwiteite. U kan hierdie materiaal vind en by hulle bydraes by http://www.bitbybitbook.com.