parathënie

Ky libër filloi në vitin 2005 në një bodrum në Universitetin Kolumbia. Në atë kohë, unë isha një student i diplomuar dhe po drejtoja një eksperiment në internet, i cili përfundimisht do të bëhej disertacioni im. Do t'ju tregoj të gjitha pjesët shkencore të atij eksperimenti në kapitullin 4, por tani do t'ju tregoj për diçka që nuk është në disertacionin tim ose në ndonjë nga letrat e mia. Dhe kjo është diçka që ndryshoi rrënjësisht se si mendoj për hulumtime. Një mëngjes, kur hyra në zyrën time të bodrumit, zbulova se gjatë natës rreth 100 njerëz nga Brazili kishin marrë pjesë në eksperimentin tim. Kjo përvojë e thjeshtë pati një ndikim të thellë tek unë. Në atë kohë kisha miq që po zhvillonin eksperimente laboratorike tradicionale dhe e dija se sa vështirë duhej të punonin për rekrutimin, mbikëqyrjen dhe pagimin e njerëzve për të marrë pjesë në këto eksperimente; nëse ata mund të drejtonin 10 vetë në një ditë të vetme, ky ishte përparim i mirë. Sidoqoftë, me eksperimentin tim në internet, 100 njerëz morën pjesë ndërsa po flija . Bërja e hulumtimit tuaj gjatë kohës që jeni duke fjetur mund të tingëllojë shumë mirë për të qenë e vërtetë, por jo. Ndryshimet në teknologji - në mënyrë specifike kalimi nga epoka analoge në moshën dixhitale - do të thotë që ne tani mund të mbledhim dhe analizojmë të dhënat sociale në mënyra të reja. Ky libër është për të bërë kërkime sociale në këto mënyra të reja.

Ky libër është për shkencëtarët socialë që duan të bëjnë më shumë shkenca të të dhënave, shkencëtarë të të dhënave që duan të bëjnë më shumë shkencë shoqërore dhe të gjithë të interesuarit në hibridin e këtyre dy fushave. Duke pasur parasysh se kush është ky libër, duhet të thuhet që nuk është vetëm për studentët dhe profesorët. Edhe pse aktualisht punoj në një universitet (Princeton), unë kam punuar edhe në qeveri (në Zyrën e Regjistrimit të SHBA-ve) dhe në industrinë e teknologjisë (në Microsoft Research) kështu që unë e di se ka shumë hulumtime emocionuese që ndodhin jashtë universitete. Nëse mendoni për atë që po bëni si kërkime sociale, atëherë ky libër është për ju, pa marrë parasysh se ku punoni ose çfarë lloj teknikash që përdorni aktualisht.

Siç mund ta keni vënë re tashmë, toni i këtij libri është pak më ndryshe nga ai i shumë librave të tjerë akademikë. Kjo është e qëllimshme. Ky libër doli nga një seminar i diplomuar mbi shkencën shoqërore kompjuterike që kam mësuar në Princeton në Departamentin e Sociologjisë që nga viti 2007 dhe do të doja që ajo të kapte disa nga energjia dhe emocionet nga ai seminar. Në veçanti, dua që ky libër të ketë tre karakteristika: dua që ajo të jetë e dobishme, e orientuar drejt së ardhmes dhe optimiste.

Dobishme : Qëllimi im është të shkruaj një libër që është i dobishëm për ty. Prandaj, unë do të shkruaj në një stil të hapur, joformal dhe shembull-drejtuar. Kjo për shkak se gjëja më e rëndësishme që unë dua të përcjell është një mënyrë e caktuar për të menduar rreth kërkimit shoqëror. Dhe, përvoja ime sugjeron se mënyra më e mirë për të përcjellë këtë mënyrë të të menduarit është joformalisht dhe me shumë shembuj. Gjithashtu, në fund të secilit kapitull, kam një seksion të quajtur "Çfarë duhet lexuar më pas", që do t'ju ndihmojë të kaloni në lexime më të detajuara dhe teknike në shumë nga temat që prezantoj. Në fund shpresoj se ky libër do t'ju ndihmojë të bëni hulumtime dhe vlerësoni hulumtimin e të tjerëve.

Orientimi i ardhshëm : Ky libër do t'ju ndihmojë të bëni hulumtime sociale duke përdorur sistemet dixhitale që ekzistojnë sot dhe atyre që do të krijohen në të ardhmen. Unë fillova të bëj këtë hulumtim në vitin 2004 dhe që atëherë kam parë shumë ndryshime dhe jam i sigurt se gjatë karrierës suaj do të shihni shumë ndryshime. Mashtrimi për të qëndruar i rëndësishëm në fytyrën e ndryshimit është abstraksion . Për shembull, kjo nuk do të jetë një libër që të mëson saktësisht se si të përdorësh Twitter API-në siç ekziston sot; përkundrazi, ajo do t'ju mësojë se si të mësoni nga burimet e mëdha të të dhënave (kapitulli 2). Kjo nuk do të jetë një libër që ju jep udhëzime hap pas hapi për drejtimin e eksperimenteve në Amazon Mechanical Turk; Përkundrazi, ajo do t'ju mësojë se si të dizajnoni dhe interpretoni eksperimente që mbështeten në infrastrukturën e moshës digjitale (kapitulli 4). Nëpërmjet përdorimit të abstraksionit, shpresoj se kjo do të jetë një libër i përjetshëm në një kohë.

Optimist : Të dy komunitetet që ky libër angazhohet - shkencëtarë socialë dhe shkencëtarë të të dhënave - kanë prejardhje dhe interesa shumë të ndryshme. Përveç këtyre dallimeve që lidhen me shkencën, për të cilën flas në librin, kam vërejtur gjithashtu se këto dy komunitete kanë stile të ndryshme. Shkencëtarët e të dhënave në përgjithësi janë të ngazëllyer; ata kanë tendencë për të parë xhami si gjysma e plotë. Shkencëtarët socialë, nga ana tjetër, në përgjithësi janë më kritike; ata kanë tendencë për të parë xhami si gjysmë bosh. Në këtë libër, unë do të miratoj ton optimist të një shkencëtari të dhënash. Pra, kur të paraqes shembuj, do t'ju tregoj atë që unë dua për këto shembuj. Dhe, kur nxjerr në pah problemet me shembujt - dhe unë do ta bëj këtë, sepse asnjë hulumtim nuk është i përsosur - unë do të përpiqem të theksoj këto probleme në një mënyrë që është pozitive dhe optimiste. Unë nuk do të jem kritik për hir të të qenit kritik - unë do të jem kritik në mënyrë që të mund t'ju ndihmoj të krijoni kërkime më të mira.

Jemi ende në ditët e para të kërkimit shoqëror në epokën dixhitale, por kam parë disa keqkuptime që janë kaq të zakonshme saqë ka kuptim për mua që t'i drejtoj këtu këtu, në parathënie. Nga shkencëtarët e të dhënave, kam parë dy keqkuptime të zakonshme. E para është duke menduar se më shumë të dhëna automatikisht zgjidh problemet. Megjithatë, për hulumtimet sociale, kjo nuk ka qenë përvoja ime. Në fakt, për hulumtime sociale, të dhënat më të mira, në krahasim me më shumë të dhëna, duket të jenë më të dobishme. Keqkuptimi i dytë që kam parë nga shkencëtarët e të dhënave është të mendosh që shkenca shoqërore është vetëm një grup bisedimesh të zbukuruara rreth kuptimit të përbashkët. Natyrisht, si një shkencëtar social - më saktësisht si sociolog - nuk pajtohem me këtë. Njerëzit e zgjuar kanë punuar shumë për të kuptuar sjelljen njerëzore për një kohë të gjatë dhe duket e pamend të injorosh mençurinë që ka grumbulluar nga kjo përpjekje. Shpresa ime është që ky libër do t'ju ofrojë disa nga kjo urtësi në një mënyrë që është e lehtë për t'u kuptuar.

Nga shkencëtarët social, kam parë edhe dy keqkuptime të zakonshme. Së pari, unë kam parë disa njerëz të shkruajnë të gjithë idenë e hulumtimit social duke përdorur mjetet e epokës digjitale për shkak të disa letrave të këqija. Nëse po e lexoni këtë libër, ndoshta keni lexuar tashmë një bandë letrash që përdorin të dhënat e medias sociale në mënyra që janë banale ose të gabuara (ose të dyja). Unë kam shumë. Sidoqoftë, do të ishte një gabim serioz të konkludohej nga këta shembuj se gjithë kërkimi social i moshës digjitale është i keq. Në të vërtetë, ndoshta keni lexuar edhe një numër letrash që përdorin të dhënat e studimit në mënyra që janë banale apo të gabuara, por nuk i shkruani të gjitha hulumtimet duke përdorur sondazhe. Kjo për shkak se ju e dini se ka bërë hulumtime të mëdha me të dhënat e sondazhit, dhe në këtë libër do t'ju tregoj se ka edhe kërkime të mëdha të bëra me mjetet e epokës digjitale.

Keqkuptimi i dytë i zakonshëm që kam parë nga shkencëtarët social është të ngatërroj të tashmen me të ardhmen. Kur e vlerësojmë hulumtimin shoqëror në epokën dixhitale - hulumtimi që unë do ta përshkruaj - është e rëndësishme që të bëjmë dy pyetje të dallueshme: "Sa mirë funksionon ky stil hulumtimi tani?" Dhe "Sa mirë do të jetë ky stil i punë hulumtuese në të ardhmen? "Hulumtuesit janë trajnuar për t'iu përgjigjur pyetjes së parë, por për këtë libër mendoj se pyetja e dytë është më e rëndësishme. Kjo është, megjithëse kërkimet shoqërore në epokën dixhitale nuk kanë prodhuar akoma kontribute intelektuale që ndryshojnë paradigmë, shkalla e përmirësimit të hulumtimit të moshës digjitale është jashtëzakonisht e shpejtë. Është kjo shkalla e ndryshimit - më shumë se niveli aktual - që e bën hulumtimin e moshës digjitale aq emocionuese për mua.

Megjithëse ky paragraf i fundit mund të duket se ju ofron pasuritë e mundshme në një kohë të paspecifikuar në të ardhmen, qëllimi im nuk është t'ju shesë në ndonjë lloj kërkimi të veçantë. Nuk posedoj personalisht aksione në Twitter, Facebook, Google, Microsoft, Apple, ose ndonjë kompani tjetër të teknologjisë (megjithëse, për shkak të zbulimit të plotë, duhet të përmend se kam punuar apo marrë fonde nga Microsoft, Google dhe Facebook). Gjatë gjithë librit, qëllimi im është që të mbetet një transmetues i besueshëm, t'ju tregoj për të gjitha gjërat e mrekullueshme të reja që janë të mundshme, duke ju udhëzuar larg nga disa kurthe që i kam parë të tjerët të bien (dhe herë pas here rënë në veten time) .

Kryqëzimi i shkencës sociale dhe shkencës së të dhënave nganjëherë quhet shkenca shoqërore kompjuterike. Disa e konsiderojnë këtë si një fushë teknike, por kjo nuk do të jetë një libër teknik në kuptimin tradicional. Për shembull, në tekstin kryesor nuk ka ekuacione. Unë zgjodha të shkruaja librin në këtë mënyrë sepse donte të jepja një pamje gjithëpërfshirëse të hulumtimeve sociale në epokën digjitale, duke përfshirë burime të mëdha të të dhënave, sondazhe, eksperimente, bashkëpunim masiv dhe etikë. Doli të jetë e pamundur të mbulojë të gjitha këto tema dhe të japë detaje teknike për secilën prej tyre. Në vend të kësaj, në fund të secilit kapitull jepen udhëzime për material më teknik, në seksionin "Çfarë duhet lexuar më pas". Me fjalë të tjera, ky libër nuk është i dizajnuar për t'ju mësuar si të bëni ndonjë llogaritje specifike; Përkundrazi, ai është projektuar për të ndryshuar mënyrën se si mendoni për kërkimet sociale.

Si ta përdorni këtë libër në një kurs

Siç thashë më parë, ky libër doli pjesërisht nga një seminar i diplomuar mbi shkencën shoqërore kompjuterike që unë kam mësuar që nga viti 2007 në Princeton. Meqë mund të mendoni të përdorni këtë libër për të mësuar një kurs, mendova se mund të jetë e dobishme për mua që të shpjegoj se si u rrit nga rruga ime dhe si e imagjinoj që ajo të përdoret në kurse të tjera.

Për disa vite kam mësuar kursin tim pa një libër; Do të caktova një koleksion artikujsh. Ndërsa studentët ishin në gjendje të mësonin nga këto artikuj, vetëm artikujt nuk po çonin në ndryshimet konceptuale që po shpresoja për të krijuar. Kështu që unë do të kaloj shumicën e kohës në klasë duke ofruar perspektivë, kontekst dhe këshilla për të ndihmuar studentët të shohin pamjen e madhe. Ky libër është përpjekja ime për të shënuar të gjithë këtë perspektivë, kontekst dhe këshilla në një mënyrë që nuk ka parakushte - në aspektin e shkencës shoqërore apo shkencës së të dhënave.

Në një kurs të gjatë semestër, unë do të rekomandoja bashkimin e këtij libri me një sërë leximi shtesë. Për shembull, një kurs i tillë mund të kalojë dy javë në eksperimente dhe ju mund të çiftoni kapitullin 4 me lexime mbi tema të tilla si roli i informacionit të para-trajtimit në hartimin dhe analizën e eksperimenteve; çështjet statistikore dhe kompjuterike të ngritura nga testet A / B në shkallë të gjerë në kompani; hartimi i eksperimenteve të fokusuara në mekanizma; dhe çështjet praktike, shkencore dhe etike në lidhje me përdorimin e pjesëmarrësve nga tregjet e punës në internet, si Amazon Mechanical Turk. Mund të shoqërohet gjithashtu me lexime dhe aktivitete që lidhen me programimin. Zgjedhja e duhur midis këtyre dyfishimeve të mundshme varet nga studentët në kursin tuaj (p.sh., universiteti, masteri ose dokumenti), prejardhjet e tyre dhe qëllimet e tyre.

Një kurs i gjatësisë së semestrit mund të përfshijë edhe grupe problemesh javore. Çdo kapitull ka një sërë aktivitetesh që janë të etiketuara sipas shkallës së vështirësisë: lehtë ( i lehtë ), medium ( medium ), e vështirë ( i vështirë ), dhe shumë e vështirë ( shume e veshtire ). Gjithashtu, unë kam etiketuar çdo problem me aftësitë që kërkon: matematikë ( kërkon matematikë ), kodim ( kërkon kodim ), dhe grumbullimi i të dhënave ( Mbledhja e të dhënave ). Së fundi, unë kam etiketuar disa nga aktivitetet që janë preferuarat e mia personale ( my favorite ). Shpresoj që brenda këtij koleksioni të aktiviteteve të ndryshme, do të gjeni disa që janë të përshtatshme për studentët tuaj.

Për të ndihmuar njerëzit që e përdorin këtë libër në kurse, kam filluar një koleksion materialesh mësimore, të tilla si programet, slides, pairings rekomanduar për çdo kapitull, dhe zgjidhjet për disa aktivitete. Ju mund t'i gjeni këto materiale dhe t'i kontribuoni atyre në http://www.bitbybitbook.com.