eessõna

See raamat algas 2005. aastal Columbia ülikooli keldris. Sel ajal olin ma kraadiõpetaja ja kasutasin veebipõhist eksperimenti, mis lõpuks sai minu väitekirja. Ma ütlen teile kõigest selle eksperimendi teaduslikest osadest 4. peatükis, kuid nüüd ma räägin sulle midagi, mis pole minu väitekirjas või mõnes minu dokumendis. Ja see on midagi, mis fundamentaalselt muutis, kuidas ma mõtlen uurimistööle. Üks hommikul, kui ma tulin oma keldrisse, avastasin, et mu eksperimendis osales üleöö umbes 100 inimest Brasiiliast. See lihtne kogemus avaldas mulle tugevat mõju. Sel ajal oli mul sõpru, kes kasutasid traditsioonilisi laborikatsetusi ja teadsin, kui raske oli neil tööle võtta, kontrollida ja maksta inimestele nendes eksperimentides osalemist; kui nad saaksid ühel päeval kümme inimest käituda, siis oli see hea edu. Kuid minu veebikatsega võtsid magamamise ajal osa 100 inimest. Uuringute tegemine magades võib tunduda liiga hea, et olla tõsi, kuid see pole nii. Tehnoloogia muudatused, täpsemalt üleminek analoogiajast digitaalajastul, tähendavad seda, et nüüd võime sotsiaalseid andmeid koguda ja analüüsida uuel viisil. See raamat käsitleb sotsiaalsete uuringute läbiviimist nendel uuel viisil.

See raamat on mõeldud sotsiaalteadlastele, kes soovivad teha rohkem andmeteadusi, andmeteadlasi, kes tahavad teha rohkem sotsiaalteaduseid ja kõiki, kes on huvitatud nende kahe valdkonna hübriidist. Arvestades, kes see raamat on mõeldud, peaks ütlematagi selgeks, et see pole mitte ainult üliõpilastele ja professoritele. Kuigi ma töötan praegu ülikoolis (Princetonis), olen töötanud ka valitsuses (Ameerika Ühendriikide Census Bureau) ja tehnoloogiatööstuses (Microsofti teadustöös), nii et ma tean, et seal on palju põnevaid teadusuuringuid väljaspool ülikoolid. Kui te arvate, mida teete sotsiaalse uurimistööga, siis on see raamat teie jaoks sõltumata sellest, kus te töötate või milliseid tehnikaid te praegu kasutate.

Nagu võis juba märganud, on selle raamatu toon mõnevõrra erinev paljudest teistest akadeemilistest raamatutest. See on tahtlik. See raamat ilmnes 2007. aastal Princetoni sotsioloogia magistriõppes sooritatud arvutussotsiaalteaduste kraadiõppeseminarist ja ma tahaksin, et sellest seminarist võetaks osa energiat ja põnevust. Eelkõige tahaksin, et sellel raamatul oleks kolm tunnust: ma tahan, et see oleks abi, tulevikku suunatud ja optimistlik.

Kasulik . Minu eesmärk on kirjutada teile kasulikku raamatut. Seetõttu kirjutan avatud, mitteametlikul ja näitepõhisel stiilil. Sellepärast, et kõige olulisem asi, mida ma tahan edastada, on sotsiaalteadusliku mõtlemise teatud viis. Minu kogemus näitab, et parim viis selle mõtteviisi edastamiseks on mitteametlik ja palju näiteid. Samuti on iga peatüki lõpus pealkiri "Mida edasi lugeda", mis aitab teil üle minna üksikasjalikumatele ja tehnilisematele lugemistele paljudes tutvustatavates teemades. Lõpuks loodan, et see raamat aitab teil mõlemaid uurida ja hinnata teiste uurimist.

Tulevikus orienteeritud : see raamat aitab teil teha sotsiaalseid uuringuid, kasutades tänapäeval olemasolevaid digitaalseid süsteeme ja neid, mis tulevikus luuakse. Ma hakkasin selliseid uuringuid tegema 2004. aastal ja sellest ajast alates olen näinud palju muudatusi ja olen kindel, et teie karjääri jooksul näete ka palju muutusi. Muutumises silma peal hoidmise trikk on abstraktsioon . Näiteks see ei ole raamat, mis õpetab täpselt, kuidas täna Twitter API-d kasutada; Selle asemel õpetab ta, kuidas õppida suurte andmeallikate kaudu (2. peatükk). See ei saa olla raamat, mis annab samm-sammult juhiseid Amazoni mehaaniliste Türkide eksperimentide käitamiseks; selle asemel õpetab teid disainima ja tõlgendama digitaalajastu infrastruktuurile tuginevaid katseid (4. peatükk). Tänu abstraktsiooni kasutamisele loodan, et see on aegumatu teema õigeaegne raamat.

Optimistlik : kaks raamatukogusse kaasatud kogukonda - sotsiaalteadlased ja andmeteadlased - omavad väga erinevat tausta ja huvisid. Lisaks nendele teadusega seotud erinevustele, millest ma räägin raamatust, olen samuti märganud, et need kaks kogukonda on erinevad stiilid. Andmeteadlased on üldjuhul põnevil; nad näevad, et klaas on pool täis. Sotsiaalteadlased on aga üldiselt kriitilisemad; nad näevad, et klaas on pool tühjaks. Selles raamatus hakkan kasutama andmeteadlaste optimistlikku tooni. Niisiis, kui esitan näiteid, siis ma ütlen sulle, mida neile näidetele meeldib. Ja kui ma viitan näidetega seotud probleemidele - ja ma teen seda, sest ükski uurimus pole täiuslik - ma püüan neid probleeme näidata positiivselt ja optimistlikult. Ma ei kavatse olla kriitilise tähtsusega, sest see on kriitiline. Olen kriitiline, et saaksin aidata teil luua paremaid teadusuuringuid.

Me oleme digitaalajastu sotsiaalsete uuringute algusjärgus, kuid ma olen näinud mõningaid arusaamatusi, mis on nii levinud, et mulle on see ebaõnnestumises käsitleda siin. Andmeteadlased on näinud kahte levinumat arusaamatust. Esimene on mõelnud, et rohkem andmeid lahendab probleemid automaatselt. Kuid sotsiaalsete uuringute jaoks pole see minu kogemus olnud. Tegelikult tundub, et sotsiaalsete uuringute jaoks on kasulikumad paremad andmed - vastandina rohkematele andmetele. Teine arusaamatus, mida ma andmetest teadlaste poolt nägin, on mõtlemine, et sotsiaalteadused on lihtsalt terve mõistuse ümberkujunenud müstiline jutte. Loomulikult, sotsiaaltöötajana - täpsemalt sotsioloogina - ma ei nõustu sellega. Intelligentsed inimesed on pikka aega mõistnud inimkäitumise mõistmist, ja tundub olevat mõistlik ignoreerida tarkust, mis on sellest pingest kogunenud. Loodan, et see raamat pakub teile mõnda sellist tarkust, mida on kerge mõista.

Sotsiaalteadlastelt nägin ka kahte levinumat arusaamatust. Esiteks olen näinud, et mõned inimesed loovad kogu sotsiaalsete uuringute idee, kasutades digitaalajastuvahendeid, kuna mõned halbad dokumendid on olemas. Kui loete seda raamatut, olete ilmselt juba lugenud hulga pabereid, mis kasutavad sotsiaalse meedia andmeid viisil, mis on banaalsed või valed (või mõlemad). Mul on ka. Nende näidete põhjal oleks siiski raske viga järeldada, et kõik digitaalajastul põhinevad sotsiaalsed uuringud on halb. Tegelikult olete arvatavasti lugenud ka hulga pabereid, mis kasutavad uuringuandmeid viisil, mis on banaalsed või valed, kuid te ei loobu uuringutest uuringute abil. Sellepärast, et teate, et uuringuandmetega on tehtud suurepäraseid uuringuid, näitan selles raamatus, et digitaalajastu tööriistadega on tehtud ka suuri teadusuuringuid.

Teine üldine väärarusaam, mida ma sotsiaalteadlastest olen näinud, on segi ajada tulevikuga. Kui hindame digitaalajastu sotsiaalseid uuringuid - seda, mida ma kirjeldan, on oluline, et me esitaksime kaks eraldi küsimust: "Kui hästi see uurimisstiil töötab kohe?" Ja "Kui hästi see stiil teadustöö tulevikus? "Teadlasi õpetatakse vastama esimesele küsimusele, kuid selle raamatu puhul arvan, et teine ​​küsimus on veelgi olulisem. See tähendab, et isegi kui digitaalajastul põhinevad sotsiaalteadused ei ole veel tohutult kaasa toonud suuri, paradigma muutuvaid intellektuaalset panust, on digitaalajastu uuringute paranemise kiirus äärmiselt kiire. See on muutuste määr, mis on rohkem kui praegune tase - see muudab digitaalajastuse uurimise nii mulle põnevaks.

Kuigi see viimane lõik võib tulevikus teile pakkuda potentsiaalset rikkust teatud ajahetkel, ei ole minu eesmärgiks mitte müüa teile mingit konkreetset tüüpi teadustööd. Ma ei ole isiklikult oma Twitteris, Facebookis, Google'is, Microsofti, Apple'is või mõnes muus techettevõttes (kuigi täieliku avalikustamise huvides peaksin mainima, et olen Microsoftiga töötanud või saanud teadustöö rahastamiseks) Google ja Facebook). Seega on kogu raamatu eesmärk jääda usaldusväärseks jutustajaks, rääkides teile kõigist võimalikest põnevatest uutest asjadest, juhtides teid eemal mõnest mõrradest, mida ma olen näinud, teised satuvad (ja mõnikord ka iseendasse) .

Sotsiaalteaduste ja andmeteaduse ristmikku nimetatakse mõnikord arvutuslikuks sotsiaalteaduseks. Mõned arvavad, et see on tehniline valdkond, kuid see ei ole traditsioonilises mõttes tehniline raamat. Näiteks põhitekstis ei ole ühtegi võrrandit. Ma otsustasin kirjutada raamatu selliselt, sest ma tahtsin anda digitaalajastul sotsiaalsete uuringute põhjaliku ülevaate, sealhulgas suured andmeallikad, uuringud, eksperimendid, massikoostöö ja eetika. Ilmselt oli võimatu kõik need teemad hõlmata ja pakkuda tehnilisi üksikasju igaühe kohta. Selle asemel on iga peatüki lõpus osa "Mida edasi lugeda" osutada tehniliste materjalide viidetele. Teisisõnu ei ole see raamat mõeldud selleks, et õpetada teile, kuidas konkreetseid arvutusi teha; Pigem on see mõeldud selleks, et muuta sotsiaalteaduslikke mõtteviise.

Kuidas seda raamatut kasutada kursusel

Nagu ma varem ütlesin, ilmus see raamat osaliselt ka Princetoni prantsuskeelsest arvutuslikust sotsiaalteadusest lõpetanud seminarist. Kuna te võite mõtlema selle raamatu kasutamisele kursuse õpetamiseks, arvasin, et minu jaoks võib olla kasulik selgitada, kuidas see mu kursusest välja sai ja kuidas ma kujutan seda, et seda kasutatakse teistes kursustes.

Mitu aastat olen õpetanud oma kurssi ilma raamatuta; Ma lihtsalt määranud artiklite kogu. Kuigi üliõpilased said neist artiklitest õppida, ei andsid need artiklid üksi kontseptuaalseid muudatusi, mida loodan luua. Nii et ma kulutan enamus ajast klassis, pakkudes perspektiive, konteksti ja nõu, et aidata õpilastel näha pilti. See raamat on minu püüdlus kirjutada kogu see perspektiiv, kontekst ja nõu selliselt, et pole eeltingimusi - nii sotsiaalteaduste kui ka andmeteaduse seisukohalt.

Semestri pikkuses kursis soovitan seda raamatut siduda mitmete täiendavate lugemistega. Näiteks võib selline kursus eksperimentidele kulutada kaks nädalat ja te saate jagada 4. peatükki lugemitega sellistes valdkondades nagu eeltöötluse teabe roll katsete kujundamisel ja analüüsimisel; suuremahuliste A / B-testidega ettevõtetes tõstatatud statistilised ja arvutuslikud küsimused; mehhanismidega spetsiaalselt keskendunud eksperimentide kavandamine; ning praktilised, teaduslikud ja eetilised küsimused, mis on seotud osalejate kasutamisega online-tööturgudel, näiteks Amazon Mehhaaniline Türk. Samuti võib see olla seotud lugemisega ja programmitööga seotud tegevustega. Sobiv valik nende paljude võimalike sidemete vahel sõltub teie kursuse üliõpilastest (nt bakalaureuse, magistri või doktorikraadi), nende taustast ja eesmärkidest.

Semester-pikkune kursus võib hõlmata ka iganädalasi probleeme. Igal peatükil on erinevaid tegevusi, mis on märgistatud raskusastmega: lihtne ( lihtne ), keskmise ( keskmine ), raske ( raske ) ja väga raske ( väga raske ) Samuti kirjeldasin ma iga probleemi vajalike oskustega: matemaatika ( nõuab matemaatikat ), kodeerimine ( vajab kodeerimist ) ja andmete kogumine ( andmete kogumine ) Lõpuks olen ma märgistanud mõned tegevused, mis on minu isiklikud lemmikud ( minu lemmik ) Loodan, et selles mitmekesises tegevuste kogumis leiad mõned, mis sobivad teie õpilastele.

Selleks, et aidata inimestel seda raamatut kursustel kasutada, olen käivitanud õppematerjalide kogumi, näiteks õppekavade, slaidide, soovitatud sidemete ja peatükkide ning mõnede tegevuste lahendused. Nende materjalide leiate ja neile kaasa antakse - aadressil http://www.bitbybitbook.com.