Hitzaurrea

Liburu hau 2005ean hasi zen Columbia Unibertsitatean. Garai hartan, graduondoko ikaslea nintzen eta nire tesian bihurtu zen online esperimentua martxan jarri nintzen. Esperientzia horren zati zientifikoak 4. kapituluan esango dizut, baina orain nire tesian edo nire paperetan ez dagoen zerbait esango dizut. Eta ikerketaren inguruan pentsatzen dudan zerbait aldatu da. Goiz batean, nire sotoko bulegoan sartu nintzenean, Brasileko 100 lagun inguru egon nintzen nire esperimentuan parte hartu nuen egunean. Esperientzia sinple honek eragin handia izan zuen niretzat. Garai hartan, laborategi esperimental tradizionalak egiten zituzten lagunak izan nituen eta esperimentu hauen parte hartzera gonbidatu, ikertu, gainbegiratu eta ordaindu egin behar izan nuen; Egun bakar batean 10 lagun izan badituzte, aurrerapen ona izan da. Hala ere, nire esperimentu online honekin, 100 lagunek lo egin zuten bitartean parte hartu nuen . Zure ikerketa egiten ari zaren bitartean, oso ona izan daiteke egia izan daiteke, baina ez da. Teknologian aldaketak, zehazki, adinaren eta adinaren analogikoaren arteko trantsizioa adierazten du datu sozialak modu berrian biltzen eta aztertzen direla. Liburu honek ikerketa soziala egiten du modu berrietan.

Liburu hau zientzialari gehiago nahi duten zientzialarientzat da, datu zientifiko gehiago egin nahi dituzten datu zientifikoak, bi zientzietako hibridoak interesa dutenak. Liburu hau nor den kontuan hartuta, ikasleei eta irakasleei ez ezik, esan beharra dago. Nahiz eta gaur egun unibertsitateko (Princeton) lanean ari naizen, Gobernuak (AEbetako Errolda Bulegoan) eta industria teknologikoan ere lan egin dut (Microsoft Research-en). Beraz, badirudi ikerketa zirraragarria egiten ari dela. unibertsitateak. Ikerketa sozial gisa zer egiten ari zaren pentsatzen baduzu, liburu hau zuretzat da, lan egiten duzun lekuan edo gaur egun erabiltzen dituzun teknikak.

Jadanik nabaritu bezala, liburu honen tonua beste liburu akademiko desberdinetakoa da. Hori nahitaezkoa da. Liburu hau zientzietako gizarte zientzietako lizentziaturiko mintegi batetik sortu zen, 2007tik Soziologia Saileko Princetongo irakaskuntzan irakatsi nuenetik eta nahi nuena mintegi horretatik energia eta ilusio batzuk ateratzea gustatuko litzaidake. Bereziki, liburu hau hiru ezaugarri izan ditut: lagungarria izan nahi dut, etorkizuneko orientazioa eta baikortasuna.

Laguntzailea : nire helburua zuretzako lagungarria den liburu bat idaztea da. Hori dela eta, modu irekian, informalean eta adibiderik gabeko estiloan idatziko dut. Hau da, transmititu nahi dudan gauzarik garrantzitsuena ikerketa sozialaren inguruko pentsaera da. Eta, nire esperientziak iradokitzen du pentsatzeko modu hori transmititzeko modurik onena informalean eta adibide asko dela. Era berean, kapitulu bakoitzaren amaieran, "Zer irakurri hurrengo" izeneko atala dut, irakurketa zehatzagoak eta teknikoak irakurtzen lagunduko dizut. Azkenean, liburu honek lagunduko dizu beste ikerketa batzuen ikerketa eta ebaluazioa egiteko.

Etorkizuneko orientazioa : liburu honek ikerketa soziala egiten lagunduko dizu, gaur egun dauden sistemak eta etorkizunean sortuko direnak erabiliz. Ikerketa mota hau hasi zen 2004an hasi nintzen, eta orduz gero aldaketa asko ikusi ditut, eta ziur nago zure karreran zehar aldaketa ugari ikusten dituzula ere. Aldaketaren aurrean garrantzitsuak izateko trikimailua abstrakzioa da . Adibidez, Twitter APIa nola erabiltzen den azaltzen duen liburu bat ez da gaur egun; Horren ordez, irakatsiko zaizu datu iturri handietatik ikasteko (2. kapitulua). Hau ez da Amazon-eko mekanikoa Turk-en esperimentuak exekutatzeko urratsa-urratsak emateko liburu bat izango; Horren ordez, azaltzen duen azpiegitura digitalaren araberako esperimentuak diseinatu eta interpretatuko ditu (4. kapitulua). Abstrakzioaren bidez, une egokia den gai bati buruzko liburu bat izango dela espero dut.

Optimistikoa : liburu honek konprometitutako bi komunitateek -sozial zientzialari eta datu zientzialariek- jatorri eta interes desberdinak dituzte. Zientziarekin erlazionatutako desberdintasun horiez gain, liburu honetan aipatzen dudanez, konturatu naiz bi komunitate horiek estilo desberdinak dituztela. Datuen zientzialariak oro har hunkituta daude; beira osoa erdi beteta ikusten dute. Gizarte zientziek, beste alde batetik, oro har kritikoak dira; edalontzi hutsa ikusten dute. Liburu honetan datu zientzialariaren tonu baikorra hartuko dut. Beraz, adibideak aurkezten baditut, adibide hauei buruz maite dut esango dizut. Eta, adibideekin arazoak nabarmentzen baditut -eta hori egingo dut ikerketa ez delako perfektua- arazo horiei aurre egiteko modu positibo eta baikorrean esaten saiatuko naiz. Ez naiz kritikoa izango kritikotzat hartzea, kritikoa izango naiz, ikerketa hobeagoa sortuko dut.

Garai hartan, oraindik ere, gizarte-ikerketan garai digitalaren garaian, baina badirudi zenbait ohitura gaizki ulertu direla, hemen aurrez aurre ditugula zentzuzkoa dela. Datu zientzialariek, bi gaizki ulertu komunak ikusi ditut. Lehenengoa datu gehiago automatikoki konpontzen diren arazoetan pentsatzen ari da. Hala ere, ikerketa sozialerako, hori ez da nire esperientzia izan. Izan ere, ikerketa sozialerako, datu hobeak, datu gehiago ez bezala, lagungarria dirudi. Datuen zientzialariek ikusi dudan bigarren gaizki ulertu hori zientzia komunaren inguruan biltzen den eztabaida sorta besterik ez da. Jakina, gizarte zientzilari gisa -esaterako, soziologo gisa- ez dut ados. Pertsona adimendunak gogor lan egin dute denbora luzez giza jokabidea ulertzeko eta zoritxarrez ahalegintzen den jakinduria ahaztu egin dela dirudi. Nire itxaropena da liburu honek zuhurtziaren batzuk eskaintzen dizkizula erraz ulertzeko modu bat.

Gizarte zientzialarien artean, bi gaizki ulertu ohikoak ere ikusi ditut. Lehenik eta behin, jende askok ideia orokorrarekin ideia berri bat idazten du, adin digitalaren tresnak erabiliz paper txarrak direla eta. Liburu hau irakurtzen ari bazara, seguruenik dagoeneko irakurri dituzu komunikabideen datuak modu banalean edo gaizki (edo bietan) erabiltzen dituzten paper sorta bat. Nik ere bai. Hala eta guztiz ere, akats larria izango litzateke adibide hauetatik ondorioztatzea digitaleko adineko gizarte ikerketa guztiak txarra dela. Izan ere, seguruenik ere inkestak datuak gaizki erabiltzearen edo inkesten bidez egiten dituzten paper sorta bat ere irakurri ahal izango duzu, baina ez duzu inkestak egiten ikasketa guztiak idazten. Inkesten datuekin egindako ikerketa handia dagoelako badakit, eta liburu honetan erakutsiko dizuet, gainera, aro digitaletako tresnetan egindako ikerketa handia ere.

Gizarte zientzialariek ikusi dudan bigarren gaizki ulertu hori etorkizunarekin nahastu behar da. Aro sozialean ikerketa soziala ebaluatzen dugunean -eta deskribatuko dudan ikerketa- garrantzitsua da bi galdera bereizi behar dugula: "Nola funtzionatzen du ikerketa mota honek orain?" Eta "Nola egingo du estilo hori? etorkizunean ikerketa lanak egiteko? ". Ikertzaileek lehenengo galdera erantzuteko prestatuta daude, baina liburu honetarako uste dut bigarren galdera garrantzitsua dela. Hau da, nahiz eta adin digitaleko ikerketa sozialak oraindik ere ez du eragin intelektual paradigmatikoa aldatzen, etorkizuneko analisi digitalaren hobekuntza tasa oso azkarra da. Aldaketa-tasa hau -egungo maila baino gehiago- digitalki adineko ikerketak hain zirraragarria iruditzen zait.

Nahiz eta azken paragrafoan aberastasun potentzialak etorkizunean zehaztutako ordu batzuetan dirudien arren, nire helburua ez da ikerketa mota jakin batean saltzea. Ez dut pertsonalki akziorik Twitter, Facebook, Google, Microsoft, Apple edo beste edozein teknologiako konpainiarekin (nahiz eta dibulgazio osoz hitz egin, aipatu behar dut lan egin dutela edo Microsoft-ek ikerketa-finantzaketa jaso duela, Google, eta Facebook). Liburu osoan, beraz, nire helburua narratzailea sinesgarria izaten jarraitzea da, ahal duzun gauza zirraragarria berriei buruz esatea, beste batzuk ikusi ditudan tranpak urruntzen zaizkizun bitartean (eta noizean behin erori naiz) .

Gizarte zientzien eta datu zientzien elkargunea batzuetan deitzen da gizarte zientzien konputazioa. Zenbaitek eremu teknikoa izan behar dute, baina hau ez da tradiziozko zentzurik liburu tekniko bat. Adibidez, testu nagusiaren ekuazioak ez daude. Liburu hau idaztea erabaki nuen, horrela, gizarte-ikerketaren ikuspegi orokorra eskaini nahi nuen adin digitalean, datu-iturri handiak, inkestak, esperimentuak, lankidetza masiboa eta etika barne. Ezinezkoa izan zen gai horiei guztiei buruzko xehetasun teknikoak ematea. Horren ordez, material tekniko gehiago erakusleak kapitulu bakoitzaren amaieran "Zer irakurri hurrengo" atalean ematen dira. Beste era batera esanda, liburu hau ez dago kalkulu jakin bat nola egin jakiteko diseinatuta; baizik eta gizarte-ikerketarako pentsatzen duzun modua aldatzeko diseinatuta dago.

Nola erabili liburu honetan ikastaro batean

Lehenago aipatu dudan bezala, liburu hau zertxobait zikloko konputazio zientzietako lizentziaduna izan zen, 2007tik Princeton-etik irakatsi dudana. Ikastaro bat irakasteko liburu hau erabiltzearen inguruan pentsatzen duzunez gero, pentsatu nuen nire ikastaroaren hazkuntzari eta beste ikastaro batzuetan erabiltzen dudala iruditzen zitzaidala.

Hainbat urtez, nire liburua irakurtzen nuen libururik gabe; Artikulu bilduma bat besterik ez nuke. Ikasleek gai hauei buruz ikasten zuten bitartean, artikuluak ez ziren sortzera animatzen nituen kontzeptual aldaketak. Horrela, klasean denbora gehien pasatuko nuke, ikuspegia, testuingurua eta aholkuak eskainiz, ikasleek irudi handiak ikusi ahal izateko. Liburu hau nire asmoa da perspektiba, testuinguru eta aholku guztiak idaztea, aurrez ezarritako moduan, bai gizarte zientzian bai datu zientzian.

Ikasturtean zehar seihilekoan zehar liburu hau lotu nuen irakurketa osagarri desberdinekin gomendatuko nuke. Adibidez, ikastaro bat bi astetan esperimentutan egin daiteke, eta kapitulu 4 irakurketak irakurketak izan ditzakezu, esate baterako, esperimentuen diseinuan eta analisietan aurre-tratamendurako informazioaren eginkizuna; Enpresen eskala handiko A / B probak planteatutako estatistika eta konputazio gaiak. esperimentuak diseinatzea, mekanismoak bereziki bideratuta; eta laneko merkatu lineako parte-hartzaileek erabiltzen dituzten gai praktikoak, zientifikoak eta etikoak, besteak beste, Amazon Mechanical Turk. Programazioarekin lotutako irakurketak eta jarduerak ere lotu daitezke. Parekatze posible hauen arteko aukera egokia zure ikastaroaren (adibidez, graduko, master edo doktoregoa) ikasleen, haien jatorrien eta haien helburuen araberakoa izango da.

A semestraturako ikastaroak astero arazo multzoak ere izan ditzake. Kapitulu bakoitzak zailtasun maila batekin etiketatuta dauden hainbat jarduera ditu: erraza ( erraza ), ertain ( medium ), gogorra ( hard ), eta oso gogorra ( Oso gogorra ). Gainera, arazo bakoitza etiketatu dut behar dituen trebetasunak: math ( Matematika eskatzen du ), kodeketa ( kodeketa eskatzen du ), eta datuen bilketa ( datuen bilketa ). Azkenean, nire gogokoenak diren jardueretako batzuk etiketatu ditut ( nire gogokoena ). Espero dut jarduera multzo desberdin honen barruan zure ikasleentzat egokia diren batzuk aurkituko dituzula.

Ikastaroetan liburu hau erabiltzen duten pertsonei laguntzeko, material didaktikoen bilduma bat hasi dut, esate baterako, programak, diapositibak, kapitulu bakoitzerako gomendatutako bikoteak eta jarduera batzuk soluzioak. Material horiek aurkitu ditzakezu eta lagundu haiek: http://www.bitbybitbook.com.