antaŭparolo

Ĉi tiu libro komencis en 2005 en kelo en Columbia University. En tiu tempo, mi estis diplomiĝinta studento, kaj mi kuradis enretan eksperimenton, kiu fine fariĝus mia disertacio. Mi rakontos al vi ĉion pri la sciencaj partoj de tiu eksperimento en ĉapitro 4, sed nun mi diros al vi pri io, kio ne estas en mia diserto aŭ en iu ajn el miaj paperoj. Kaj estas io, kiu esence ŝanĝis kiel mi pensas pri esplorado. Unu matenon, kiam mi eniris en mian kuŝejon, mi malkovris, ke dum ĉirkaŭ la nokto ĉirkaŭ 100 homoj el Brazilo partoprenis en mia eksperimento. Ĉi tiu simpla sperto havis profundan efikon sur mi. En tiu tempo, mi havis amikojn, kiuj kuradis tradiciajn labortajn eksperimentojn, kaj mi sciis, kiom malfacile ili devis labori por varbi, supervizi kaj pagi homojn partopreni en ĉi tiuj eksperimentoj; se ili povus kuraci 10 homojn en unu tago, tio estis bona progreso. Tamen, kun mia interreta eksperimento, 100 homoj partoprenis dum mi dormis . Fari vian esploradon dum vi dormas povas soni tro bonan por esti vera, sed ĝi ne estas. Ŝanĝoj en teknologio, specife la transiro de la analoga aĝo al la cifereca erara mezumo, ke ni nun povas kolekti kaj analizi sociajn datumojn per novaj manieroj. Ĉi tiu libro klopodas fari socian esploron en ĉi tiuj novaj manieroj.

Ĉi tiu libro estas por sociaj sciencistoj, kiuj volas fari pli da sciencaj datumoj, sciencaj datumoj, kiuj volas fari pli socian sciencon kaj iun ajn interesatan pri la híbrido de ĉi tiuj du kampoj. Donita, kiun ĉi tiu libro devas fari, ĝi devas iri sen diri, ke ne nur por studentoj kaj instruistoj. Kvankam mi laboras ĉe universitato (Princeton), mi ankaŭ laboris en registaro (en la Usona Censirejo) kaj en la teknologia industrio (ĉe Microsoft Research) do mi scias, ke ekzistas multaj ekscitaj esploroj okazantaj ekstere de universitatoj Se vi pensas pri tio, kion vi faras kiel socia esplorado, tiam ĉi tiu libro estas por vi, ne gravas, kie vi laboras, aŭ kiajn teknikojn vi uzas nun.

Kiel vi eble jam rimarkis, la tono de ĉi tiu libro estas iom malsama al tiu de multaj aliaj akademiaj libroj. Tio estas intenca. Ĉi tiu libro emerĝis de diplomiĝa seminario pri komputika socia scienco, kiun mi instruis ĉe Princeton en la Fako de Sociologio ekde 2007, kaj mi ŝatus ĝin kapti iom da la energio kaj ekscito de tiu seminario. En aparta, mi volas, ke ĉi tiu libro havas tri karakterizaĵojn: mi volas ke ĝi estu helpema, estonta orientita kaj optimisma.

Helpema : Mia celo estas skribi libron, kiu estas helpema por vi. Sekve, mi skribos en malferma, senkonsidera kaj ekzemplo-veturita stilo. Tio estas, ĉar la plej grava afero, kiun mi volas transdoni, estas certa maniero pensi pri socia esplorado. Kaj mia sperto sugestas, ke la plej bona maniero por transdoni ĉi tiun pensmanieron estas neformale kaj kun multaj ekzemploj. Ankaŭ ĉe la fino de ĉiu ĉapitro mi havas sekcion nomatan "Kion legi poste", kiu helpos vin transiri al pli detalaj kaj teknikaj legadoj pri multaj el la temoj, kiujn mi prezentas. Al la fino, mi esperas, ke ĉi tiu libro helpos vin kaj esploros kaj taksos la esploron de aliaj.

Estonte orientita : Ĉi tiu libro helpos vin fari socian esploron uzante la ciferecajn sistemojn, kiuj ekzistas hodiaŭ kaj tiuj, kiuj estos kreitaj en la estonteco. Mi komencis fari ĉi tiun specon de esploro en 2004, kaj ekde tiam mi vidis multajn ŝanĝojn, kaj mi certas, ke dum via kuro vi ankaŭ vidos multajn ŝanĝojn. La lertaĵo por resti grava antaŭ vizaĝo estas abstraktaĵo . Ekzemple, ĉi tio ne estos libro, kiu instruas vin precize kiel uzi la Twitter API kiel ĝi ekzistas hodiaŭ; anstataŭe, ĝi instruos vin kiel lerni el grandaj datumaj fontoj (ĉapitro 2). Ĉi tio ne estos libro, kiu donas al vi paŝojn por paŝado de eksperimentoj en Amazon Mechanical Turk; anstataŭe, ĝi instruos vin kiel desegni kaj interpreti eksperimentojn, kiuj dependas pri cifereca infrastrukturo (ĉapitro 4). Per la uzo de abstraktaĵo, mi esperas, ke ĉi tio estos senhoma libro en ĝusta temo.

Optimisma : La du komunumoj, kiujn ĉi tiu libro partoprenas-sociaj sciencistoj kaj datumoj-sciencistoj-havas tre malsamajn fonojn kaj interesojn. Krom ĉi tiuj sciencaj diferencoj, kiujn mi parolas pri en la libro, mi ankaŭ rimarkis, ke ĉi tiuj du komunumoj havas malsamajn stilojn. Faktaj sciencistoj ĝenerale ekscitiĝas; Ili emas vidi la glason kiel duonplena. Sociaj sciencistoj, aliflanke, estas ĝenerale pli kritikaj; Ili emas vidi la glason kiel duone malplena. En ĉi tiu libro mi akceptos la optimisman tondon de datuma sciencisto. Do, kiam mi prezentas ekzemplojn, mi diros al vi, kion mi amas pri ĉi tiuj ekzemploj. Kaj, kiam mi montras problemojn kun la ekzemploj - kaj mi faros tion ĉar neniu esplorado estas perfekta - mi provos montri ĉi tiujn problemojn laŭ maniero pozitiva kaj optimisma. Mi ne kritikas por esti maltrankviliga - mi fariĝos kritika por ke mi povu helpi vin krei pli bonan esploron.

Ni ankoraŭ estas en la unuaj tagoj de socia esplorado en la cifereca aĝo, sed mi vidis iujn miskomprenojn, kiuj estas tiel oftaj, ke mi sentas al mi trakti ilin ĉi tie, en la antaŭparolo. El datumaj sciencistoj mi vidis du komunajn miskomprenojn. La unua pensas, ke pli da datumoj aŭtomate solvas problemojn. Tamen por socia esplorado, tio ne estis mia sperto. Fakte, por socia esplorado, pli bonaj datumoj - kontraŭa al pli da datumoj - ŝajnas esti pli utilaj. La dua miskompreno, kiun mi vidis de datumaj scienculoj, pensas, ke socia scienco estas nur aro da fantazio-parolado ĉirkaŭita de komuna senso. Kompreneble, kiel socia scienculo - pli specife kiel sociologo - mi ne konsentas pri tio. La inteligentaj homoj laboris malfacile kompreni homan konduton dum longa tempo, kaj ŝajnas neprude ignori la saĝecon, kiu amasigis de ĉi tiu penado. Mi esperas, ke ĉi tiu libro donos al vi iom da tiu saĝeco laŭ maniero facile facila.

De sociaj sciencistoj, mi ankaŭ vidis du komunajn miskomprenojn. Unue, mi vidis iujn homojn forĵeti la tutan ideon pri socia esplorado uzante la ilojn de la cifereca aĝo pro kelkaj malbonaj paperoj. Se vi legas ĉi tiun libron, vi verŝajne jam legis multajn artikolojn, kiuj uzas sociajn amaskomunikilajn datumojn laŭ manieroj aŭ malĝojaj (aŭ ambaŭ). Mi ankaŭ havas. Tamen, estus grava eraro konkludi de ĉi tiuj ekzemploj, ke ĉiuj ciferecaj sociaj esploroj estas malbonaj. Fakte, vi verŝajne ankaŭ legis multajn artikolojn, kiuj uzas enketajn datumojn laŭ manieroj aŭ malĝojaj, sed vi ne forgesas ĉiujn esplorojn per enketoj. Jen ĉar vi scias, ke ekzistas bonega esploro kun enketaj datumoj, kaj en ĉi tiu libro mi montros al vi, ke ankaŭ ekzistas granda esplorado kun la iloj de la cifereca aĝo.

La dua komuna miskompreno, kiun mi vidis de sociaj sciencistoj, konfuzas la ĉeeston kun la estonteco. Kiam ni taksas socian esploradon en la cifereca aĝo -la esplorado, kiun mi volas priskribi- estas grave, ke ni demandu du malsamajn demandojn: "Kiel bone ĉi tiu stilo de esplorado funkcias nun?" Kaj "Kiel bone ĉi tiu stilo de esplora laboro en la estonteco? "Esploristoj estas trejnitaj por respondi la unuan demandon, sed por ĉi tiu libro mi pensas, ke la dua demando estas pli grava. Tio estas, kvankam socia esplorado en la cifereca aĝo ankoraŭ ne produktis amasajn, paradigmajn ŝanĝajn intelektajn kontribuojn, la rapideco de plibonigo de ciferecaj esploroj estas nekredeble rapida. Ĝi estas ĉi tiu imposto de ŝanĝo - pli ol la nuna nivelo - kiu faras ciferecajn esplorojn tiel ekscitaj al mi.

Kvankam tiu lasta alineo eble ŝajnas proponi al vi potencialan riĉecon en iu tempo ne specifita en la estonteco, mia celo ne vendas vin pri iu ajn specifa esplorado. Mi ne propre posedas interŝanĝojn en Twitter, Facebook, Google, Microsoft, Apple aŭ iu ajn alia teknika kompanio (kvankam, pro plena malkaŝo, mi devas mencii, ke mi laboris aŭ ricevis financajn esplorojn de Microsoft, Google kaj Facebook). Laŭlonge de la libro, mia celo estas daŭrigi kredindan rakontanton, rakontante al vi pri ĉiuj ekscitaj novaj aferoj, kiujn eblas, dum vi gvidas vin for de kelkaj kaptiloj, kiujn mi vidis aliajn falis en (kaj foje falis en mi mem) .

La intersekco de socia scienco kaj datuma scienco estas foje nomata komputika socia scienco. Iuj konsideras ke tio estas teknika kampo, sed ĉi tio ne estos teknika libro en la tradicia senso. Ekzemple, ne estas ekvacioj en la ĉefa teksto. Mi elektis skribi la libron de ĉi tiu maniero ĉar mi volis doni ampleksan vidadon pri socia esplorado en la cifereca aĝo, inkluzive de grandaj datumoj, enketoj, eksperimentoj, amaskomunikado kaj etiko. Ĝi rezultis esti neebla kovri ĉiujn ĉi tiujn temojn kaj provizi teknikajn detalojn pri ĉiu. Anstataŭe, punteroj al pli teknika materialo estas donitaj en la sekcio "Kion legi" sekva ĉe la fino de ĉiu ĉapitro. Alivorte, ĉi tiu libro ne estas desegnita por instrui vin kiel fari ajnan specifan ŝtonon; prefere, ĝi estas desegnita por ŝanĝi la vojon, kiun vi pensas pri socia esplorado.

Kiel uzi ĉi tiun libron en kurso

Kiel mi diris antaŭe, ĉi tiu libro emerĝis parte de diplomiĝa seminario pri komputika socia scienco, kiun mi instruis ekde 2007 ĉe Princeton. Ĉar vi povus pensi pri uzado de ĉi tiu libro por instrui kurson, mi pensis, ke eble mi povus helpi klarigi, kiel ĝi kreskis el mia kurso kaj kiel mi imagas, ke ĝi estas uzata en aliaj kursoj.

Dum kelkaj jaroj mi instruis mian kurson sen libro; Mi nur donus kolekton de artikoloj. Dum lernantoj povis lerni de ĉi tiuj artikoloj, nur la artikoloj ne kondukis al la konceptaj ŝanĝoj, kiujn mi esperas krei. Do mi elspezus la plej grandan parton de la tempo en klaso havigante perspektivon, kuntekston kaj konsilon por helpi la studentojn vidi la grandan bildon. Ĉi tiu libro estas mia provo skribi ĉiun perspektivon, kuntekston kaj konsilon laŭ maniero, kiu havas neniun kondiĉon - laŭ socia scienco aŭ datuma scienco.

En semestro-longa kurso, mi rekomendus kunigi ĉi tiun libron per diversaj pliaj legadoj. Ekzemple, tia kurso povus pasigi du semajnojn pri eksperimentoj, kaj vi povus parigi ĉapitron 4 kun legadoj pri temoj kiel la rolo de antaŭ-traktado de informoj en la dezajno kaj analizo de eksperimentoj; Statistikaj kaj komputikaj aferoj levitaj de grandskalaj provoj A / B ĉe kompanioj; dezajno de eksperimentoj specife enfokusigitaj al mekanismoj; kaj praktikajn, sciencajn kaj etikajn aferojn rilate al uzantoj de interretaj laborpostenoj, kiel Amazon Mechanical Turk. Ĝi ankaŭ povus esti parigita kun legadoj kaj agadoj rilate al programado. La taŭga elekto inter ĉi tiuj multaj eblaj paroj dependas de la studentoj en via kurso (ekz., Diplomado, majstro aŭ PhD), iliaj fonoj kaj iliaj celoj.

Semestro-longa kurso ankaŭ povus inkludi semajnajn problemajn arojn. Ĉiu ĉapitro havas diversajn agojn, kiuj estas etikeditaj laŭ malfacileco: facila ( facila ), meza ( meza ), malmola ( malfacile ), kaj tre malmola ( tre malfacile ). Ankaŭ mi etikedis ĉiun problemon per la kapabloj, kiujn ĝi postulas: math ( postulas matematikon ), kodigo ( postulas kodigon ), kaj datuma kolekto ( kolekto de datumoj ). Fine, mi etikedis kelkajn el la agadoj, kiuj estas miaj propraj favoritoj ( mia plej ŝatata ). Mi esperas, ke ene de ĉi tiu diversa kolekto de agadoj, vi trovos iujn taŭgajn por viaj studentoj.

Por helpi homojn uzante ĉi tiun libron en kursoj, mi komencis kolekton de instruaj materialoj kiel silaboj, diapozitivoj, rekomenditaj paroj por ĉiu ĉapitro kaj solvoj al iuj agadoj. Vi povas trovi ĉi tiujn materialojn - kaj kontribui al ili - ĉe http://www.bitbybitbook.com.