Formáli

Þessi bók byrjaði árið 2005 í kjallara við Columbia University. Á þeim tíma var ég útskrifaður nemandi, og ég var að keyra á netinu tilraun sem myndi að lokum verða ritgerð mín. Ég mun segja þér allt um vísindalegan hluta þessarar tilraunar í kafla 4, en nú ætla ég að segja þér frá einhverju sem er ekki í ritgerðinni eða í einhverjum pappíra. Og það er eitthvað sem í grundvallaratriðum breytti því hvernig ég hugsa um rannsóknir. Einn morguninn, þegar ég kom inn í kjallarahúsið mitt, komst ég að því að um 100 manns frá Brasilíu höfðu tekið þátt í tilraunum mínum á einni nóttu. Þessi einfalda reynsla hafði djúpstæð áhrif á mig. Á þeim tíma hafði ég vini sem voru að keyra hefðbundnar rannsóknarverkefni og ég vissi hversu erfitt þau þurftu að vinna til að ráða, hafa umsjón með og borga fólki að taka þátt í þessum tilraunum. ef þeir gætu keyrt 10 manns á einum degi, þá var það góður árangur. Hins vegar, með online tilrauninni, tóku 100 manns þátt í að sofa . Að gera rannsóknir þínar á meðan þú ert sofandi gæti hljómað of gott til að vera satt, en það er það ekki. Breytingar á tækni, sérstaklega umskipti frá hliðstæðu aldri til stafrænna aldurs, þýðir að við getum nú safnað og greint félagsleg gögn á nýjan hátt. Þessi bók snýst um að gera félagslega rannsóknir á þessum nýju leiðum.

Þessi bók er fyrir félagsvísindamenn sem vilja gera fleiri gagnafræði, gögn vísindamenn sem vilja gera meira félagsvísindi, og einhver sem hefur áhuga á blendingur af þessum tveimur sviðum. Miðað við hver þessi bók er fyrir, ætti það að vera án þess að segja að það sé ekki bara fyrir nemendur og prófessorar. Þó að ég starfi nú á háskólastigi (Princeton), hef ég einnig unnið í ríkisstjórn (hjá US Census Bureau) og í tækniiðnaði (við Microsoft Research) svo ég veit að það er mikið spennandi rannsókn sem gerist utan háskóla. Ef þú hugsar um það sem þú ert að gera sem félagsleg rannsókn, þá er þessi bók fyrir þig, sama hvar þú vinnur eða hvers konar tækni þú notar núna.

Eins og þú gætir hafa tekið eftir þegar er tóninn í þessari bók svolítið frábrugðin mörgum öðrum fræðilegum bókum. Það er vísvitandi. Þessi bók kom fram frá útskrifast málstofu um computational félagsvísindi sem ég hef kennt í Princeton í deild félagsfræði frá árinu 2007 og mér langar til þess að ná einhverjum orku og spennu frá því námskeiði. Sérstaklega vil ég að þessi bók hafi þrjú einkenni: Ég vil að það sé gagnlegt, framtíðarfyrirtæki og bjartsýnn.

Gagnlegt : Markmið mitt er að skrifa bók sem er gagnlegt fyrir þig. Þess vegna ætla ég að skrifa á opinn, óformlegan og dæmi-driven stíl. Það er vegna þess að það mikilvægasta sem ég vil flytja er ákveðin leið til að hugsa um félagslega rannsóknir. Og reynsla mín bendir til þess að besta leiðin til að flytja þessa hugsunarferli er óformlega og með mörgum dæmi. Einnig, í lok hvers kafla, er ég með kafla sem heitir "Hvað á að lesa næst" sem mun hjálpa þér að skipta yfir í nánari og tæknilegar lestur um mörg þau atriði sem ég kynna. Að lokum vona ég að þessi bók muni hjálpa þér að gera bæði rannsóknir og meta rannsóknir annarra.

Framundan-stilla : Þessi bók mun hjálpa þér að gera félagslega rannsóknir með því að nota stafræna kerfin sem eru til í dag og þeim sem verða til í framtíðinni. Ég byrjaði að gera þessa tegund af rannsóknum árið 2004 og síðan þá hef ég séð margar breytingar og ég er viss um að þú munt sjá margar breytingar á meðan á ferli stendur. The bragð til að vera viðeigandi í ljósi breytinga er abstrakt . Til dæmis, þetta er ekki að fara að vera bók sem kennir þér nákvæmlega hvernig á að nota Twitter API eins og það er til staðar í dag; Í staðinn, það er að fara að kenna þér hvernig á að læra af stórum gagnasöfnum (kafli 2). Þetta er ekki að fara að vera bók sem gefur þér skref fyrir skref leiðbeiningar um að keyra tilraunir á Amazon Mechanical Turk; Í staðinn, það er að fara að kenna þér hvernig á að hanna og túlka tilraunir sem treysta á stafræn aldurs innviði (kafli 4). Með því að nota abstraction, vona ég að þetta verði tímabundið bók um tímabundið efni.

Bjartsýnn : Tveir samfélögin sem þessi bók tekur þátt í, félagsvísindamenn og gögn vísindamenn-hafa mjög mismunandi bakgrunn og hagsmuni. Til viðbótar þessum vísindatengdum munum, sem ég tala um í bókinni, hef ég líka tekið eftir því að þessi tvö samfélög hafa mismunandi stíl. Gögn vísindamenn eru almennt spenntir; Þeir hafa tilhneigingu til að sjá glerið sem hálf fullt. Samfélagsfræðingar, hins vegar, eru almennt mikilvægari; Þeir hafa tilhneigingu til að sjá glerið sem hálf tómt. Í þessari bók ætla ég að samþykkja bjartsýnn tón gagna vísindamannsins. Svo þegar ég kynna dæmi, ætla ég að segja þér hvað ég elska um þessi dæmi. Og þegar ég bendi á vandamál með dæmunum - og ég mun gera það vegna þess að engin rannsókn er fullkomin - ég ætla að reyna að benda á þessi vandamál á jákvæðan og bjartsýnn hátt. Ég ætla ekki að vera gagnrýninn vegna þess að vera gagnrýninn - ég ætla að vera gagnrýninn þannig að ég geti hjálpað þér að búa til betri rannsóknir.

Við erum enn á fyrstu dögum samfélagsrannsókna á stafrænu aldri, en ég hef séð nokkra misskilning sem er svo algeng að það er skynsamlegt fyrir mig að takast á við þau hér, í formáli. Frá gögnum vísindamönnum, hef ég séð tvær algengar misskilningar. Fyrst er að hugsa um að fleiri gögn leysi sjálfkrafa vandamál. Hins vegar, fyrir félagslega rannsóknir, það hefur ekki verið reynsla mín. Í staðreynd, fyrir félagslegar rannsóknir, virðast betur gögn - öfugt við fleiri gögn - vera hjálpsamari. Annað misskilningur sem ég hef séð frá gögnum vísindamönnum er að hugsa um að félagsvísindi séu bara fullt af ímynda sér talað um heilbrigða skynsemi. Auðvitað, sem félagsvísindamaður - sérstaklega sem félagsfræðingur - er ég ekki sammála því. Smart fólk hefur unnið erfitt að skilja mannlegan hegðun í langan tíma, og það virðist óljóst að hunsa þá visku sem hefur safnast frá þessari vinnu. Ég vona að þessi bók muni bjóða þér nokkrar af þeim visku á þann hátt sem auðvelt er að skilja.

Frá félagsvísindamönnum, hef ég líka séð tvo algenga misskilning. Í fyrsta lagi hef ég séð nokkrar afskriftir af öllu hugmyndinni um félagslega rannsóknir með því að nota verkfæri stafrænna tíðna vegna nokkurra slæma pappíra. Ef þú ert að lesa þessa bók hefur þú sennilega þegar lesið fullt af pappírum sem nota félagsleg gögn á þann hátt sem eru banal eða rangt (eða báðar). Ég hef líka. Hins vegar myndi það vera alvarleg mistök að álykta frá þessum dæmum að öll samfélagsleg rannsóknir á stafrænu aldri séu slæm. Reyndar hefur þú sennilega líka lesið fullt af pappírum sem nota könnunargögn á þann hátt sem er banal eða rangt, en þú skrifar ekki af öllum rannsóknum með könnunum. Það er vegna þess að þú veist að mikil rannsóknir eru gerðar með könnunargögnum og í þessari bók ætla ég að sýna þér að það er líka mikill rannsókn sem gerður er á verkfærum stafrænnar aldurs.

Annað sameiginlegt misskilningur sem ég hef séð frá félagsvísindamönnum er að rugla saman nútíðina í framtíðinni. Þegar við metum félagslegar rannsóknir á stafrænu aldri - þær rannsóknir sem ég ætla að lýsa - það er mikilvægt að við biðjum um tvær mismunandi spurningar: "Hversu vel virkar þessi rannsóknarstíll núna?" Og "Hversu vel mun þessi stíll af rannsóknir í framtíðinni? "Vísindamenn eru þjálfaðir til að svara fyrstu spurningunni, en fyrir þessa bók held ég að annarri spurningin sé mikilvægari. Það er þó að félagslegar rannsóknir á stafrænni aldri hafi ekki enn framleitt gríðarlegar breytingar á hugmyndafræðilegum hugmyndum, að batna rannsóknir á stafrænni aldri er ótrúlega hröð. Það er þetta breytingartíðni - meira en núverandi stig - sem gerir rannsóknir á stafrænni aldri svo spennandi fyrir mig.

Jafnvel þó að síðasta málsgrein kann að bjóða þér möguleika á auðlindum á tilteknum ótímabærum tíma í framtíðinni, markmið mitt er ekki að selja þig á neinum ákveðnum tegundum rannsókna. Ég á ekki persónulega hluti í Twitter, Facebook, Google, Microsoft, Apple eða öðrum tæknibúnaði (þó að ég ætti að nefna að ég hef unnið við eða fengið rannsóknarstyrk frá Microsoft vegna fullrar birtingar, Google og Facebook). Í bókinni er því markmið mitt að vera trúverðugur sögumaður og segja þér frá öllum spennandi nýju efni sem er mögulegt, en leiða þig í burtu frá nokkrum gildrum sem ég hef séð aðra falla í (og stundum fallið í mig) .

Skurðpunktur félagsvísinda og gagnavinnu er stundum kallaður computational félagsvísindi. Sumir telja þetta vera tæknilegur reitur, en þetta mun ekki vera tæknibækur í hefðbundnum skilningi. Til dæmis eru engar jöfnur í aðaltextanum. Ég valdi að skrifa bókina með þessum hætti vegna þess að ég vildi veita alhliða sýn á félagslegum rannsóknum á stafrænu aldri, þar á meðal stórum gögnum, könnunum, tilraunum, samvinnu og siðfræði. Það virtist vera ómögulegt að ná yfir öll þessi efni og veita tæknilegar upplýsingar um hvert og eitt. Í staðinn eru vísbendingar um fleiri tæknilega efni í kaflanum "Hvað á að lesa næst" í lok hvers kafla. Með öðrum orðum, þessi bók er ekki hönnuð til að kenna þér hvernig á að gera tiltekna útreikninga; heldur er það ætlað að breyta því hvernig þú hugsar um félagslega rannsóknir.

Hvernig á að nota þennan bók í námskeiðinu

Eins og ég sagði áður, kom þessi bók að hluta til út frá háskólasamfélagi um tölvunarfræði sem ég hef kennt frá 2007 í Princeton. Þar sem þú gætir hugsað þér að nota þessa bók til að kenna námskeiði, hugsaði ég að það gæti verið gagnlegt fyrir mig að útskýra hvernig það óx úr námskeiði mínu og hvernig ég hélt að það væri notað í öðrum námskeiðum.

Fyrir nokkrum árum kenndi ég námskeiðið mitt án bókar; Ég myndi bara úthluta safn greinar. Þó að nemendur hafi getað lært af þessum greinum, þá voru greinar einir ekki til hugmyndafræðilegra breytinga sem ég vildi vonast til að búa til. Þannig að ég myndi eyða mestum tíma í bekknum og veita sjónarhorni, samhengi og ráðgjöf til að hjálpa nemendum að sjá stóra myndina. Þessi bók er tilraun mín til að skrifa niður allt sjónarhorni, samhengi og ráðleggingar á þann hátt sem engin forsenda er, bæði hvað varðar félagsvísindi eða gagnafræði.

Á önn löng námskeið, myndi ég mæla með að pörun þessari bók með ýmsum viðbótarmælingum. Til dæmis gæti slík námskeið eytt tveimur vikum á tilraunir og þú gætir parað kafla 4 með lestri um efni eins og hlutverk formeðferðarupplýsinga við hönnun og greiningu á tilraunum; tölfræðilegar og computational málefni víðtækar A / B prófanir hjá fyrirtækjum; Hönnun tilrauna sem sérstaklega beinast að aðferðum; og hagnýt, vísindaleg og siðferðileg mál sem tengjast notkun þátttakenda á netinu vinnumarkaði, svo sem Amazon Mechanical Turk. Það gæti líka verið parað við lestur og starfsemi sem tengist forritun. Valið á milli þessara margra mögulegra parings fer eftir nemendum í námskeiðinu þínu (td grunnnámi, meistaranámi eða doktorsgráðu), bakgrunn þeirra og markmiðum þeirra.

Námslengd námskeiðs gæti einnig falið í sér vikulega vandamál. Hver kafli hefur ýmsar aðgerðir sem eru merktir með erfiðleikum: auðvelt ( auðvelt ), miðlungs ( miðlungs ), erfitt ( erfitt ), og mjög erfitt ( mjög erfitt ). Einnig hef ég merkt hvert vandamál með þeim færni sem það krefst: stærðfræði ( krefst stærðfræði ), kóðun ( krefst kóðunar ) og gagnasöfnun ( gagnasafn ). Að lokum hef ég merkt nokkrar af þeim verkefnum sem eru persónuleg eftirlæti mitt ( uppáhaldið mitt ). Ég vona að innan þessarar fjölbreyttu safn af starfsemi finnur þú nokkrar sem eru viðeigandi fyrir nemendur þínar.

Til þess að hjálpa fólki að nota þennan bók í námskeiðum hef ég byrjað að safna kennsluefni eins og námskrám, skyggnur, ráðleggingar fyrir hverja kafla og lausnir við tiltekna starfsemi. Þú getur fundið þessi efni - og stuðlað að þeim - á http://www.bitbybitbook.com.