Prefaţă

Această carte a început în 2005 într-un subsol la Universitatea Columbia. În acel moment, eram un student absolvent, iar eu conduceam un experiment online care în cele din urmă va deveni disertația mea. Vă voi spune totul despre părțile științifice ale acelui experiment din capitolul 4, dar acum vă voi spune despre ceva care nu este în disertația mea sau în niciuna dintre lucrările mele. Și este ceva care a schimbat fundamental modul în care mă gândesc la cercetare. Într-o dimineață, când am intrat în biroul meu de la subsol, am descoperit că peste noapte, peste 100 de persoane din Brazilia au participat la experimentul meu. Această experiență simplă a avut un efect profund asupra mea. În acel moment, am avut prieteni care desfășurau experimente de laborator tradiționale și știam cât de greu trebuiau să lucreze pentru a recruta, supraveghea și plăti oamenii pentru a participa la aceste experimente; dacă ar putea conduce 10 persoane într-o singură zi, a fost un progres bun. Cu toate acestea, în cadrul experimentului meu online, au participat 100 de persoane în timpul somnului . A face cercetarea în timp ce dormi ar putea suna prea bine pentru a fi adevărat, dar nu este. Schimbările tehnologice - în special trecerea de la epoca analogică la epoca digitală - înseamnă că acum putem colecta și analiza date sociale în moduri noi. Această carte este despre a face cercetare socială în aceste noi moduri.

Această carte este destinată oamenilor de știință socială care doresc să facă mai multă știință a datelor, oameni de știință care doresc să facă mai multe științe sociale și orice persoană interesată de hibridul acestor două domenii. Având în vedere cine este această carte, ar trebui să se înțeleagă că nu este vorba doar de studenți și de profesori. Deși lucrez în prezent la o universitate (Princeton), am lucrat de asemenea în guvern (la Biroul de recensământ al SUA) și în industria de tehnologie (de la Microsoft Research), așa că știu că există multe cercetări interesante care se petrec în afara universități. Dacă vă gândiți la ceea ce faceți ca cercetare socială, atunci această carte este pentru dvs., indiferent unde lucrați sau ce fel de tehnici utilizați în prezent.

Așa cum ați fi observat deja, tonul acestei cărți este puțin diferit de cel al multor alte cărți academice. Asta e intenționat. Această carte a apărut dintr-un seminar absolvent despre știința socială computațională pe care am predat-o la Princeton în cadrul Departamentului de Sociologie din 2007 și aș vrea să surprindă o parte din energia și entuziasmul din acest seminar. În special, vreau ca această carte să aibă trei caracteristici: vreau să fie utilă, orientată spre viitor și optimistă.

Ajutor : Scopul meu este să scriu o carte care să vă ajute. Prin urmare, o să scriu într-un stil deschis, informal și exemplar. Asta pentru că cel mai important lucru pe care vreau să-l transmit este un anumit mod de a gândi despre cercetarea socială. Și experiența mea sugerează că cel mai bun mod de a transmite acest mod de gândire este informal și cu multe exemple. De asemenea, la sfârșitul fiecărui capitol, am o secțiune numită "Ce să citesc în continuare", care vă va ajuta să treceți în citiri mai detaliate și tehnice pe multe dintre subiectele pe care le introduc. În cele din urmă, sper că această carte vă va ajuta atât să faceți cercetare, cât și să evaluați cercetarea altora.

Orientat spre viitor : această carte vă va ajuta să faceți cercetări sociale folosind sistemele digitale existente astăzi și cele care vor fi create în viitor. Am început să fac acest tip de cercetare în 2004 și de atunci am văzut multe schimbări și sunt sigur că în cursul carierei dvs. veți vedea și multe schimbări. Trucul de a rămâne relevant în fața schimbării este abstractizarea . De exemplu, aceasta nu va fi o carte care vă învață exact cum să utilizați API-ul Twitter așa cum există astăzi; în schimb, vă va învăța cum să învățați din surse mari de date (capitolul 2). Aceasta nu va fi o carte care vă oferă instrucțiuni pas cu pas pentru a rula experimente pe Amazon Mechanical Turk; în schimb, vă va învăța cum să proiectați și să interpretați experimente care se bazează pe infrastructura digitală a vârstei (capitolul 4). Prin utilizarea abstractizării, sper că aceasta va fi o carte pe timp nedeterminată.

Optimist : cele două comunități care se ocupă de această carte - oamenii de știință sociali și oamenii de știință din domeniul datelor - au o experiență și interese foarte diferite. Pe lângă aceste diferențe legate de știință, despre care vorbesc în cartea, am observat, de asemenea, că aceste două comunități au stiluri diferite. Cercetătorii de date sunt, în general, entuziasmați; au tendința de a vedea paharul pe jumătate plin. Cercetătorii sociali, pe de altă parte, sunt, în general, mai critici; au tendința să vadă geamul ca fiind pe jumătate gol. În această carte, voi adopta tonul optimist al unui cercetător de date. Deci, când prezint exemple, îți voi spune ce-mi place despre aceste exemple. Și când voi arăta probleme cu exemplele - și o voi face pentru că nici o cercetare nu este perfectă - voi încerca să subliniez aceste probleme într-un mod pozitiv și optimist. Nu voi fi critică din motive de a fi critică - voi fi critică pentru a vă ajuta să creați o cercetare mai bună.

Suntem încă în primele zile ale cercetării sociale în epoca digitală, dar am văzut câteva neînțelegeri care sunt atât de frecvente încât mi-a fost logic să le adresez aici, în prefață. De la cercetătorii de date, am văzut două neînțelegeri comune. Primul gândește că mai multe date rezolvă automat problemele. Cu toate acestea, pentru cercetarea socială, aceasta nu a fost experiența mea. De fapt, pentru cercetarea socială, date mai bune - spre deosebire de mai multe date - par să fie mai utile. Cea de-a doua neînțelegere pe care am văzut-o de la oamenii de știință de date se gândește că știința socială este doar o grămadă de discuții fantastice înfășurate în jurul bunului simț. Desigur, ca om de știință socială - mai exact ca sociolog - nu sunt de acord cu asta. Oamenii inteligenți au muncit din greu pentru a înțelege comportamentul uman de multă vreme și nu pare înțelept să ignorăm înțelepciunea care sa acumulat din acest efort. Speranța mea este că această carte vă va oferi o parte din acea înțelepciune într-un mod ușor de înțeles.

De la oamenii de știință socială, am văzut și două neînțelegeri comune. În primul rând, am văzut că unii oameni scriu întreaga idee a cercetării sociale folosind instrumentele din epoca digitală din cauza câtorva lucrări proaste. Dacă citiți această carte, probabil că ați citit deja o grămadă de lucrări care utilizează date media sociale în moduri banale sau greșite (sau ambele). Am, de asemenea. Cu toate acestea, ar fi o greșeală serioasă să deducem din aceste exemple că toate cercetările sociale de vârstă digitală sunt rele. De fapt, probabil că ați citit, de asemenea, o grămadă de lucrări care utilizează datele din sondaj în moduri banale sau greșite, dar nu renunțați la toate cercetările folosind sondaje. Asta pentru că știi că există mari cercetări făcute cu datele sondajului și în această carte îți voi arăta că există și o mare cercetare făcută cu ajutorul instrumentelor din epoca digitală.

Cea de-a doua neînțelegere comună pe care am văzut-o de la oamenii de știință socială este aceea de a confunda prezentul cu viitorul. Atunci când evaluăm cercetarea socială în era digitală - cercetarea pe care o voi descrie - este important să punem două întrebări distincte: "Cât de bine funcționează acest stil de cercetare chiar acum?" Și "cât de bine va fi acest stil de munca de cercetare în viitor? "Cercetătorii sunt instruiți să răspundă la prima întrebare, dar pentru această carte cred că a doua întrebare este mai importantă. Adică, chiar dacă cercetarea socială din epoca digitală nu a produs încă contribuții intelectuale masive, în schimbare de paradigmă, rata de îmbunătățire a cercetării privind vârsta digitală este incredibil de rapidă. Este această rată de schimbare - mai mult decât nivelul actual - care face cercetarea digitală a vârstei atât de interesantă pentru mine.

Chiar dacă acest ultim paragraf pare să vă ofere bogății potențiale la un moment nespecificat în viitor, scopul meu nu este de a vă vinde pe un anumit tip de cercetare. Nu dețin în mod personal acțiuni pe Twitter, Facebook, Google, Microsoft, Apple sau orice altă companie de tehnologie (deși, pentru a vă dezvălui complet, trebuie să menționez că am lucrat la Microsoft sau am primit finanțare din partea Microsoft, Google și Facebook). De-a lungul cărții, prin urmare, obiectivul meu este să rămân un narator credibil, spunându-vă despre toate lucrurile noi interesante care sunt posibile, în timp ce vă îndrumați departe de câteva capcane pe care le-am văzut pe alții căzând în (și, uneori, căzut în mine) .

Intersecția dintre știința socială și știința datelor este uneori numită știință socială computațională. Unii consideră că acest lucru este un domeniu tehnic, dar aceasta nu va fi o carte tehnică în sensul tradițional. De exemplu, în textul principal nu există ecuații. Am ales să scriu această carte pentru că am vrut să ofer o viziune cuprinzătoare asupra cercetării sociale în era digitală, incluzând mari surse de date, sondaje, experimente, colaborare în masă și etică. Sa dovedit a fi imposibil să se acopere toate aceste subiecte și să se ofere detalii tehnice despre fiecare. În schimb, indicațiile privind mai multe materiale tehnice sunt furnizate în secțiunea "Ce trebuie citit în continuare" la sfârșitul fiecărui capitol. Cu alte cuvinte, această carte nu este concepută pentru a vă învăța cum să efectuați un anumit calcul; mai degrabă, este proiectat să schimbe modul în care vă gândiți la cercetarea socială.

Cum să folosiți această carte într-un curs

Așa cum am spus mai devreme, această carte a apărut în parte dintr-un seminar absolvent despre știința socială computațională pe care l-am învățat din 2007 la Princeton. Deoarece ați putea să vă gândiți să folosiți această carte pentru a preda un curs, m-am gândit că ar fi util să vă explic cum a crescut din cursul meu și cum îmi imaginez că este folosit în alte cursuri.

De câțiva ani, am învățat cursul fără o carte; Aș atribui o colecție de articole. În timp ce elevii au putut să învețe din aceste articole, numai articolele nu au condus la schimbările conceptuale pe care speram să le creeze. Așadar, am petrecut mai mult timp în clasă oferind perspectivă, context și sfaturi pentru a ajuta elevii să vadă imaginea de ansamblu. Această carte este încercarea mea de a scrie toate acea perspectivă, context și sfaturi într-un mod care nu are condiții prealabile - în ceea ce privește știința socială sau știința datelor.

Într-un curs de semestru, aș recomanda împerecherea acestei cărți cu o varietate de citiri suplimentare. De exemplu, un astfel de curs ar putea să petreacă două săptămâni pe experimente și ați putea alinia capitolul 4 cu citiri pe teme precum rolul informațiilor de pre-tratament în proiectarea și analiza experimentelor; probleme statistice și computaționale ridicate de testele A / B la scară largă la companii; proiectarea de experimente axate în special pe mecanisme; și aspecte practice, științifice și etice legate de utilizarea participanților de pe piețele forței de muncă online, cum ar fi Amazon Mechanical Turk. De asemenea, ar putea fi asociat cu citirile și activitățile legate de programare. Alegerea potrivită între aceste numeroase posibilități de împerechere depinde de studenții din cursul dvs. (de exemplu, de licență, de masterat sau de doctorat), mediile lor și obiectivele acestora.

Un curs de semestru ar putea include și seturi de probleme săptămânale. Fiecare capitol are o varietate de activități care sunt etichetate după gradul de dificultate: ușor ( uşor ), mediu ( mediu ), greu ( greu ) și foarte greu ( foarte greu ). De asemenea, am etichetat fiecare problemă prin abilitățile pe care le solicită: matematică ( necesită matematică ), codificarea ( necesită codificare ) și colectarea de date ( colectare de date ). În cele din urmă, am etichetat câteva dintre activitățile care sunt favoritele mele personale ( preferatul meu ). Sper că, în cadrul acestei colecții diverse de activități, veți găsi unele care sunt potrivite pentru studenții dvs.

Pentru a ajuta persoanele care folosesc această carte în cursuri, am început o colecție de materiale didactice, cum ar fi programele, diapozitivele, recomandările de împerechere pentru fiecare capitol și soluțiile la anumite activități. Puteți găsi aceste materiale - și contribuiți la ele - la http://www.bitbybitbook.com.