Daħla

Dan il-ktieb beda fl-2005 f'kantina fl-Università ta 'Columbia. Fiż-żmien, kont studju gradwat, u kont qed immexxi esperiment onlajn li eventwalment isir id-dissertazzjoni tiegħi. Ser ngħidilkom kollha dwar il-partijiet xjentifiċi ta 'dak l-esperiment fil-kapitolu 4, imma issa ser ngħidilkom dwar xi ħaġa li mhix fid-dissertazzjoni tiegħi jew f'xi karti tiegħi. U huwa xi ħaġa li biddlet b'mod fundamentali kif naħseb dwar ir-riċerka. Għada filgħodu, meta daħal fl-uffiċċju tal-kantina tiegħi, skoprejt li matul il-lejl madwar 100 persuna mill-Brażil kienu pparteċipaw fl-esperiment tiegħi. Din l-esperjenza sempliċi kellha effett profond fuqi. F'dak iż-żmien, kelli ħbieb li kienu qed imexxu esperimenti tal-laboratorju tradizzjonali, u kont naf kif kienu jaħdmu biex jirreklutaw, jissorveljaw u jħallsu lin-nies biex jipparteċipaw f'dawn l-esperimenti; jekk setgħu jmexxu 10 persuni f'ġurnata waħda, dan kien progress tajjeb. Madankollu, bl-esperiment online tiegħi, 100 persuna pparteċipaw waqt li kont torqod . Tagħmel ir-riċerka tiegħek waqt li tkun qed torqod tista 'ħoss tajjeb wisq biex tkun vera, imma mhux. Bidliet fit-teknoloġija, speċifikament it-tranżizzjoni mill-età analoga għall-era diġitali, ifissru li issa nistgħu nġabru u nanalizzaw id-dejta soċjali b'modi ġodda. Dan il-ktieb huwa dwar kif isir ir-riċerka soċjali f'dawn il-modi ġodda.

Dan il-ktieb huwa għal xjenzati soċjali li jixtiequ jagħmlu iktar xjenza tad-dejta, xjentisti tad-dejta li jixtiequ jagħmlu iktar xjenza soċjali, u kull min hu interessat fl-ibridi ta 'dawn iż-żewġ oqsma. Minħabba n-nuqqas ta 'dan il-ktieb, għandu jingħad li mhux biss għall-istudenti u għall-professuri. Għalkemm bħalissa qed taħdem f'università (Princeton), ħdimt ukoll fil-gvern (fl-Uffiċċju taċ-Ċensiment tal-Istati Uniti) u fl-industrija tat-teknoloġija (f'Microsoft Research) hekk naf li hemm ħafna riċerka eċċitanti li qed isseħħ barra universitajiet. Jekk taħseb dwar dak li qed tagħmel bħala riċerka soċjali, allura dan il-ktieb huwa għalik, irrispettivament minn fejn taħdem jew liema tip ta 'tekniki bħalissa qed tuża.

Kif jista 'jkollok innotajt diġà, it-ton ta' dan il-ktieb huwa daqsxejn differenti minn dak ta 'ħafna kotba akkademiċi oħra. Dak intenzjonat. Dan il-ktieb ħareġ minn seminar ta 'gradwat dwar ix-xjenza soċjali komputazzjonali li għedt f'Princeton fid-Dipartiment tas-Soċjoloġija mill-2007, u nixtieq qabad xi wħud mill-enerġija u l-eċċitament minn dak is-seminar. B'mod partikolari, nixtieq li dan il-ktieb ikollu tliet karatteristiċi: nixtieq li jkun ta 'għajnuna, orjentat lejn il-ġejjieni, u ottimist.

Jg in : L-għan tiegħi hu li tikteb ktieb li jkun ta 'għajnuna għalik. Għalhekk, jiena ser tikteb fi stil miftuħ, informali u mmexxi mill-eżempju. Dak għax l-iktar ħaġa importanti li nixtieq li twassal hija ċerta mod ta 'ħsieb dwar ir-riċerka soċjali. U, l-esperjenza tiegħi tissuġġerixxi li l-aħjar mod biex twassal dan il-mod ta 'ħsieb huwa informalment u b'ħafna eżempji. Ukoll, fl-aħħar ta 'kull kapitolu, għandi taqsima msejħa "X'għandek taqra li jmiss" li tgħinek taqsam f'taħriġ aktar dettaljat u tekniku fuq ħafna mis-suġġetti li nintroduċi. Fl-aħħar, nispera li dan il-ktieb jgħinek kemm tagħmel ir-riċerka kif ukoll tevalwa r-riċerka ta 'ħaddieħor.

Orjentat lejn il-ġejjieni : Dan il-ktieb jgħinek tagħmel riċerka soċjali billi tuża s-sistemi diġitali li jeżistu llum u dawk li se jinħolqu fil-futur. Bdejt nagħmel dan it-tip ta 'riċerka fl-2004, u minn dakinhar rajt bosta bidliet, u jien ċert li matul il-karriera tiegħek se tara ħafna tibdiliet ukoll. L-ispirtu li wieħed jibqa 'rilevanti fil-konfront tal-bidla huwa l- estrazzjoni . Pereżempju, dan mhux ser ikun ktieb li jgħallem eżattament kif tuża l-API ta 'Twitter kif teżisti llum; minflok, se jgħallmu kif titgħallem minn sorsi ta 'dejta kbar (kapitolu 2). Dan mhux ser ikun ktieb li jagħtik struzzjonijiet pass pass għall-esperimenti ta 'tmexxija fuq Amazon Mechanical Turk; minflok, se jgħallmu kif tfassal u tinterpreta esperimenti li jiddependu fuq l-infrastruttura tal-età diġitali (kapitolu 4). Permezz tal-użu tal-estrazzjoni, nispera li dan ikun ktieb prontezza fuq suġġett f'waqtu.

Ottimista : Iż-żewġ komunitajiet li jinvolvi dan il-ktieb - xjenzati soċjali u xjentisti tad-dejta - għandhom sfondi u interessi differenti ħafna. Minbarra dawn id-differenzi relatati max-xjenza, li nitkellmu dwarhom fil-ktieb, jien innutajt ukoll li dawn iż-żewġ komunitajiet għandhom stili differenti. Ix-xjentisti tad-dejta huma ġeneralment eċċitati; huma għandhom it-tendenza li jaraw il-ħġieġ bħala nofs sħiħ. Ix-xjenzjati soċjali, min-naħa l-oħra, ġeneralment huma iktar kritiċi; huma għandhom it-tendenza li jaraw il-ħġieġ bħala nofs vojt. F'dan il-ktieb, jien ser tadotta t-ton ottimist ta 'xjenzat tad-dejta. Allura, meta nippreżenta eżempji, jien ser ngħidlek dak li nħobb dwar dawn l-eżempji. U, meta nirrimarka l-problemi bl-eżempji - u se nagħmel dan għaliex l-ebda riċerka mhija perfetta - se nipprova nindika dawn il-problemi b'mod pożittiv u ottimist. Mhux se nkun kritiku għall-fini li tkun kritiku - Jiena se nkun kritiku sabiex nista 'ngħinuk toħloq riċerka aħjar.

Għadna fil-bidu ta 'riċerka soċjali fl-era diġitali, imma rajt xi nuqqas ta' ftehim li huma tant komuni li jagħmel sens għalija li tindirizzahom hawnhekk, fil-prefazju. Minn xjentisti tad-dejta, rajt żewġ nuqqas ta 'ftehim komuni. L-ewwel wieħed jaħseb li aktar dejta ssolvi problemi awtomatikament. Madankollu, għar-riċerka soċjali, din ma kinitx l-esperjenza tiegħi. Fil-fatt, għar-riċerka soċjali, id-dejta aħjar - għall-kuntrarju ta 'aktar dejta - tidher li hija aktar utli. It-tieni nuqqas ta 'ftehim li rajt minn xjentisti tad-dejta qed jaħseb li x-xjenza soċjali hija biss mazz ta' diskussjoni fancy imgeżwer madwar sens komuni. Naturalment, bħala xjenzat soċjali - b'mod aktar speċifiku bħala soċjologu - ma naqbilx ma 'dak. In-nies intelliġenti ilhom jaħdmu ħafna biex jifhmu l-imġieba tal-bniedem għal żmien twil, u jidher għaqli li tinjora l-għerf li akkumula minn dan l-isforz. It-tama tiegħi hi li dan il-ktieb joffrilek ftit minn dak l-għerf b'mod li jkun faċli biex tifhimha.

Minn xjenzati soċjali, rajt żewġ nuqqas ta 'ftehim komuni. L-ewwel, rajt xi nies iħassru l-idea sħiħa tar-riċerka soċjali bl-użu tal-għodod tal-era diġitali minħabba ftit karti ħżiena. Jekk qed taqra dan il-ktieb, x'aktarx diġà qrajt bukkett ta 'karti li jużaw id-dejta tal-midja soċjali f'modi li huma banali jew żbaljati (jew it-tnejn). Għandi wkoll. Madankollu, ikun żball serju li wieħed jikkonkludi minn dawn l-eżempji li r-riċerka soċjali ta 'l-età diġitali kollha hija ħażina. Fil-fatt, probabilment intom taqraw ukoll bukkett ta 'karti li jużaw data ta' stħarriġ b'modi li huma banali jew żbaljati, iżda ma tħassarx ir-riċerka kollha bl-użu ta 'stħarriġ. Dak għax taf li hemm riċerka kbira li saret b'dejta ta 'stħarriġ, u f'dan il-ktieb jien ser nuruk li hemm ukoll riċerka kbira li saret bl-għodod ta' l-era diġitali.

It-tieni nuqqas ta 'ftehim komuni li rajt minn xjenzati soċjali huwa li jħawwad il-preżent mal-futur. Meta nivvalutaw ir-riċerka soċjali fl-era diġitali - ir-riċerka li jien se niddeskrivi - huwa importanti li nitolbu żewġ mistoqsijiet distinti: "Kif tajjeb dan l-istil ta 'riċerka jaħdem issa?" U "Kemm dan l-istil ta' xogħol ta 'riċerka fil-futur? "Ir-riċerkaturi huma mħarrġa biex iwieġbu l-ewwel mistoqsija, iżda għal dan il-ktieb naħseb li t-tieni mistoqsija hija aktar importanti. Dan ifisser li, għalkemm ir-riċerka soċjali fl-era diġitali għadha ma pproduċietx kontributi intellettwali massivi u li jinbidlu minn paradigmi, ir-rata ta 'titjib tar-riċerka dwar l-età diġitali hija oerhört mgħaġġla. Hija din ir-rata ta 'bidla - aktar mill-livell attwali - li tagħmel ir-riċerka dwar l-età diġitali eċċitanti għalija.

Anke jekk dak l-aħħar paragrafu jista 'jidher li joffrilek rikkezzi potenzjali f'xi żmien mhux speċifikat fil-ġejjieni, l-għan tiegħi mhuwiex li tbigħek fuq xi tip partikolari ta' riċerka. Jiena personalment m'għandix l-ishma f'Tok Twitter, Facebook, Google, Microsoft, Apple, jew kwalunkwe kumpanija ta 'teknoloġija oħra (għalkemm, għal raġunijiet ta' żvelar sħiħ, għandi nagħmel referenza li ħdimt jew irċevejt fondi ta 'riċerka minn Microsoft, Google, u Facebook). Matul il-ktieb, għalhekk, l-għan tiegħi huwa li jibqa 'narrattur kredibbli, tgħidlek dwar l-affarijiet ġodda kollha eċċitanti li huwa possibbli, filwaqt li jiggwidawk bogħod minn ftit nases li rajt oħrajn jaqgħu (u xi kultant jidħlu fis myself) .

L-intersezzjoni tax-xjenza soċjali u x-xjenza tad-dejta kultant tissejjaħ ix-xjenza soċjali tal-komputazzjoni. Xi wħud iqisu li dan huwa qasam tekniku, iżda dan mhux se jkun ktieb tekniku fis-sens tradizzjonali. Pereżempju, m'hemmx ekwazzjonijiet fit-test prinċipali. Jien għażilt li tikteb il-ktieb b'dan il-mod għax xtaqt nipprovdi stampa komprensiva tar-riċerka soċjali fl-era diġitali, inklużi sorsi kbar ta 'dejta, stħarriġ, esperimenti, kollaborazzjoni massiva u etika. Irriżulta li huwa impossibbli li tkopri dawn is-suġġetti kollha u jipprovdi dettalji tekniċi dwar kull wieħed. Minflok, indikaturi għal aktar materjal tekniku jingħataw fis-sezzjoni "Dak li taqra li jmiss" fl-aħħar ta 'kull kapitolu. Fi kliem ieħor, dan il-ktieb mhuwiex maħsub biex jgħallmu kif għandek tagħmel xi kalkolu speċifiku; Minflok, hija mfassla biex tbiddel il-mod li taħseb dwar ir-riċerka soċjali.

Kif tuża dan il-ktieb f'xi kors

Kif diġà semmejt qabel, dan il-ktieb ħareġ parzjalment minn seminar ta 'gradwat dwar ix-xjenza soċjali komputazzjonali li kont qed ngħallem mill-2007 f'Prineton. Peress li inti tista 'tkun qed taħseb biex tuża dan il-ktieb biex tgħallem kors, ħsibt li jista' jkun utli għalija li tispjega kif ħarġet mill-kors tiegħi u kif nimmaġina li qed tintuża f'korsijiet oħra.

Għal bosta snin, għedtlek il-kors mingħajr ktieb; I'd biss tassenja ġabra ta 'artikli. Filwaqt li l-istudenti setgħu jitgħallmu minn dawn l-artikoli, l-artikoli waħedhom ma wasslux għall-bidliet kunċettwali li kont qed nippreżenta. Allura nixtieq infiq ħafna mill-ħin fil-klassi li jipprovdi perspettiva, kuntest, u pariri sabiex jgħin lill-istudenti jaraw l-istampa l-kbira. Dan il-ktieb huwa l-attentat tiegħi li nikteb dak il-perspettiva, il-kuntest u l-pariri kollha b'mod li ma jkollokx prerekwiżiti - f'termini ta 'xjenza soċjali jew ta' data science.

F'xi kors ta 'semestru, nirrakkomanda tqabbil ta' dan il-ktieb b'varjetà ta 'qari addizzjonali. Per eżempju, kors bħal dan jista 'jqatta' ġimagħtejn fuq esperimenti, u int tista 'tlibeb il-kapitolu 4 b'qari dwar suġġetti bħar-rwol ta' informazzjoni ta 'qabel it-trattament fid-disinn u l-analiżi ta' esperimenti; Kwistjonijiet statistiċi u komputazzjonali mqajma minn testijiet fuq skala kbira ta 'A / B fuq il-kumpaniji; Disinn ta 'esperimenti ffokat speċifikament fuq mekkaniżmi; u kwistjonijiet prattiċi, xjentifiċi u etiċi relatati ma 'l-użu ta' parteċipanti minn swieq tax-xogħol onlajn, bħal Amazon Mechanical Turk. Jista 'jkun imqabbad ma' qari u attivitajiet relatati mal-ipprogrammar. L-għażla xierqa bejn dawn il-ħafna pariri possibbli tiddependi fuq l-istudenti fil-kors tiegħek (eż., Undergraduate, master's jew PhD), l-isfondi tagħhom, u l-għanijiet tagħhom.

Kors ta 'sitt xhur jista' jinkludi wkoll settijiet ta 'problemi ta' kull ġimgħa. Kull kapitolu għandu varjetà ta 'attivitajiet li huma ttikkettati bi grad ta' diffikultà: faċli ( faċli ), medju ( medju ), iebsa ( iebsa ), u iebsa ħafna ( tqila ħafna ). Ukoll, stajt tikketta kull problema bil-ħiliet li teħtieġ: il-matematika ( teħtieġ matematika ), kodifikazzjoni ( jeħtieġ kodifikazzjoni ), u l-ġbir tad-data ( ġbir ta 'data ). Fl-aħħarnett, stajt tikketta ftit mill-attivitajiet li huma favoriti personali tiegħi ( Il-favorit tieghi ). Nispera li f'din il-ġabra diversa ta 'attivitajiet, għandek issib xi wħud li huma xierqa għall-istudenti tiegħek.

Sabiex jgħin lin-nies li jużaw dan il-ktieb fil-korsijiet, bdejt kollezzjoni ta 'materjal ta' tagħlim bħal sillabu, slides, pari rakkommandati għal kull kapitolu, u soluzzjonijiet għal xi attivitajiet. Tista 'ssib dawn il-materjali u tikkontribwixxi għalihom fuq http://www.bitbybitbook.com.