Predslov

Táto kniha sa začala v roku 2005 v suteréne na Columbia University. V tej dobe som bol absolventom študentského štúdia, a ja som absolvoval on-line experiment, ktorý sa nakoniec stal mojou dizertačnou prácou. Poviem vám všetko o vedeckých častiach tohto experimentu v kapitole 4, ale teraz vám poviem niečo, čo nie je v mojej dizertačnej práci alebo v žiadnom z mojich článkov. A to je niečo, čo zásadne zmenilo myšlienky výskumu. Jedného rána, keď som prišiel do môjho suterénneho úradu, zistil som, že cez deň som sa zúčastnil asi 100 ľudí z Brazílie. Táto jednoduchá skúsenosť mala na mňa hlboký vplyv. V tej dobe som mal priateľov, ktorí prevádzkujú tradičné laboratórne experimenty, a vedel som, ako ťažko musia pracovať na nábor, dohľad a platenie ľudí, aby sa zúčastnili na týchto pokusoch; ak by mohli spravovať 10 ľudí za jeden deň, to bol dobrý pokrok. Pri mojom online experimente sa však počas spánku zúčastnilo 100 ľudí. Robiť svoj výskum počas spánku môže znieť príliš dobre, aby to bola pravda, ale nie je. Zmeny v technológii - konkrétne prechod z analógového veku na digitálny vek - znamenajú, že teraz môžeme novými spôsobmi zhromažďovať a analyzovať sociálne údaje. Táto kniha sa zaoberá sociálnym výskumom v týchto nových spôsoboch.

Táto kniha je určená pre spoločenských vedcov, ktorí chcú robiť viac vedy o údajoch, vedeckých pracovníkov, ktorí chcú robiť viac spoločenských vied a záujemcov o hybrid týchto dvoch oblastí. Vzhľadom na to, kto je táto kniha určená, malo by byť samozrejmé, že to nie je len pre študentov a profesorov. Aj keď v súčasnosti pracujem na univerzite (Princeton), pracoval som aj vo vláde (v US Census Bureau) a v technickom priemysle (v spoločnosti Microsoft Research), takže viem, že existuje veľa zaujímavého výskumu, univerzít. Ak si myslíte, čo robíte ako spoločenský výskum, potom táto kniha je pre vás, bez ohľadu na to, kde pracujete alebo aké techniky používate v súčasnosti.

Ako ste si už mohli všimnúť, tón tejto knihy je trochu odlišný od tónu mnohých iných akademických kníh. To je zámerné. Táto kniha vyšla z absolventského seminára o výpočtových spoločenských vedách, ktorý som od roku 2007 vyučoval v Princetone na oddelení sociológie a ja by som rád zachytil energiu a vzrušenie z tohto seminára. Predovšetkým chcem, aby táto kniha mala tri charakteristiky: Chcem, aby bola užitočná, orientovaná na budúcnosť a optimistická.

Užitočné : Mojim cieľom je napísať knihu, ktorá vám pomôže. Preto budem písať v otvorenom, neformálnom a príkladom riadenom štýle. To preto, že najdôležitejšou vecou, ​​ktorú chcem vyjadriť, je určitý spôsob myslenia o sociálnom výskume. A moje skúsenosti naznačujú, že najlepší spôsob, ako sprostredkovať tento spôsob myslenia, je neformálne as mnohými príkladmi. Taktiež na konci každej kapitoly mám sekciu s názvom Čo čítať ďalej, ktorá vám pomôže prechod na podrobnejšie a technickejšie čítanie mnohých tém, ktoré predstavujem. Na záver dúfam, že táto kniha vám pomôže urobiť výskum a zhodnotiť výskum iných.

Orientované na budúcnosť : Táto kniha vám pomôže uskutočniť spoločenský výskum pomocou digitálnych systémov, ktoré existujú dnes a tých, ktoré budú vytvorené v budúcnosti. Začal som robiť tento druh výskumu v roku 2004 a odvtedy som videl veľa zmien a som si istý, že v priebehu svojej kariéry uvidíte aj mnohé zmeny. Trik, že zostane dôležitý tvárou v tvár zmene, je abstrakcia . Napríklad to nebude kniha, ktorá vás naučí presne, ako používať API Twitter, ako je dnes. namiesto toho vás naučí učiť sa z veľkých zdrojov údajov (kapitola 2). Nebude to kniha, ktorá vám poskytne podrobný návod na spustenie experimentov na Amazon Mechanical Turk; namiesto toho vás naučí, ako navrhnúť a interpretovať experimenty, ktoré sa spoliehajú na infraštruktúru digitálneho veku (kapitola 4). Prostredníctvom abstrakcie dúfam, že to bude nadčasová kniha o aktuálnej téme.

Optimistické : Obe spoločenstvá, ktorých sa táto kniha zaoberá - sociálni vedci a vedeckí pracovníci - majú veľmi odlišné zázemie a záujmy. Okrem týchto rozdielov v oblasti vedy, o ktorých hovorím v knihe, som si tiež všimol, že tieto dve komunity majú rôzne štýly. Vedci v oblasti údajov sú vo všeobecnosti nadšení; majú tendenciu vidieť sklo ako napoly plné. Sociálni vedci sú na druhej strane všeobecne kritickejší; majú sklon vidieť sklo ako polovicu prázdne. V tejto knihe budem prijímať optimistický tón vedeckého pracovníka v oblasti údajov. Keď predstavím príklady, poviem vám, čo milujem o týchto príkladoch. A keď poukážu na problémy s príkladmi - a ja to urobím, pretože žiadny výskum nie je dokonalý - budem sa snažiť tieto problémy poukázať tak, aby boli pozitívne a optimistické. Nebudem byť kritický kvôli tomu, aby som bol kritický - budem kritický, aby som vám mohol pomôcť vytvoriť lepší výskum.

Stále sme v prvých dňoch sociálneho výskumu v digitálnom veku, ale videl som nejaké nedorozumenia, ktoré sú také bežné, že je pre mňa rozumné, aby som sa s nimi venoval v predslovoch. Od vedcov údajov som videl dve bežné nedorozumenia. Prvým z nich je, že viac údajov automaticky rieši problémy. Pre sociálny výskum to však nebolo mojej skúsenosti. V skutočnosti, pokiaľ ide o sociálny výskum, lepšie údaje - na rozdiel od väčšieho množstva údajov - sa zdajú byť užitočnejšie. Druhé nedorozumenie, ktoré som videl od vedcov údajov, si myslí, že sociálna veda je len veľa fantazijných hovorov zabalených okolo zdravého rozumu. Samozrejme, ako sociálny vedec - konkrétnejšie ako sociológ - s tým nesúhlasím. Inteligentní ľudia už dávno pracovali na tom, aby pochopili ľudské správanie a zdá sa byť nerozumné ignorovať múdrosť, ktorá sa z tohto úsilia nahromadila. Mojou nádejou je, že táto kniha vám ponúkne niečo z tejto múdrosti spôsobom, ktorý je ľahko pochopiteľný.

Od spoločenských vedcov som tiež videl dve bežné nedorozumenia. Po prvé, videl som niekoľko ľudí, ktorí odpísali celú myšlienku sociálneho výskumu pomocou nástrojov digitálneho veku kvôli niekoľkým chybným dokumentom. Ak čítate túto knihu, pravdepodobne už ste čítali veľa dokumentov, ktoré používajú údaje sociálnych médií spôsobom, ktorý je banálny alebo nesprávny (alebo obaja). Mám tiež. Bolo by však veľmi ťažké vyvodiť z týchto príkladov, že všetok sociálny výskum digitálneho veku je zlý. Pravdepodobne ste pravdepodobne tiež prečítali veľa papierov, ktoré používajú údaje z prieskumov spôsobom, ktorý je banálny alebo zle, ale nepoužívate všetky výskumy pomocou prieskumov. Je to preto, lebo viete, že je vykonaný veľký prieskum s údajmi z prieskumov a v tejto knihe vám ukážem, že existuje aj veľký výskum, ktorý sa uskutočnil pomocou nástrojov digitálneho veku.

Druhé spoločné nedorozumenie, ktoré som videl od sociálnych vedcov, je zamieňať prítomnosť s budúcnosťou. Keď zhodnotíme sociálny výskum v digitálnom veku - výskum, ktorý budem opísať - je dôležité, aby sme položili dve odlišné otázky: "Ako dobre tento štýl výskumu funguje práve teraz?" A "Ako dobre tento štýl výskumné práce v budúcnosti? "Výskumníci sú vyškolení odpovedať na prvú otázku, ale pre túto knihu si myslím, že druhá otázka je dôležitejšia. To znamená, že aj keď sociálny výskum v digitálnom veku ešte nevytvoril masívne intelektuálne príspevky, ktoré menia paradigma, rýchlosť zlepšenia výskumu digitálneho veku je neuveriteľne rýchla. Táto miera zmeny - viac ako súčasná úroveň - spôsobuje, že výskum digitálneho veku je pre mňa taký vzrušujúci.

Aj keď sa zdá, že tento posledný odsek vám ponúka potenciálne bohatstvo v nejakom neurčenom čase v budúcnosti, mojim cieľom nie je predať vás na žiadnom konkrétnom type výskumu. Nie som osobne vlastníkom akcií v službe Twitter, Facebook, Google, Microsoft, Apple alebo inej technickej spoločnosti (aj keď v záujme úplného zverejnenia by som mal spomenúť, že som pracoval na spoločnosti Microsoft, Google a Facebook). V celej knihe preto môžem zostať dôveryhodným vypravovateľom, ktorý vám povie o všetkých vzrušujúcich nových veciach, ktoré sú možné, a zároveň vás odvádzať od niekoľkých pascí, ktoré som videl, že ľudia spadajú do (a občas padli do seba) ,

Priesečník spoločenských vied a vedy o údajoch sa niekedy nazýva výpočtová spoločenská veda. Niektorí to považujú za technickú oblasť, ale v tradičnom zmysle to nebude technická kniha. Napríklad v hlavnom texte neexistujú žiadne rovnice. Rozhodla som sa knihu napísať týmto spôsobom, pretože som chcel poskytnúť komplexný pohľad na sociálny výskum v digitálnom veku vrátane veľkých zdrojov údajov, prieskumov, experimentov, masovej spolupráce a etiky. Ukázalo sa, že je nemožné pokryť všetky tieto témy a poskytnúť technické podrobnosti o každom z nich. Namiesto toho ukazovatele na technickejší materiál sú uvedené v časti "Čo čítať ďalej" na konci každej kapitoly. Inými slovami, táto kniha nie je určená na to, aby vás naučila robiť akékoľvek konkrétne výpočty. skôr je navrhnutý tak, aby zmenil spôsob, akým premýšľate o sociálnom výskume.

Ako používať túto knihu v kurze

Ako som už povedal, táto kniha sa objavila čiastočne z absolventského seminára o výpočtových spoločenských vedách, ktorý som od roku 2007 vyučoval v Princetone. Pretože by ste mohli premýšľať nad používaním tejto knihy na výučbu kurzu, myslel som si, že by bolo pre mňa užitočné vysvetliť, ako vyrastalo z môjho kurzu a ako si predstavujem, že sa používa v iných kurzoch.

Už niekoľko rokov som učil svoj kurz bez knihy; Práve som priradila zbierku článkov. Zatiaľ čo sa študenti mohli učiť z týchto článkov, samotné články nevedú k koncepčným zmenám, ktoré som dúfal, že vytvoria. Takže by som trávil väčšinu času v triede poskytujúc perspektívu, kontext a rady, aby som pomohol študentom vidieť veľký obraz. Táto kniha je môj pokus napísať všetku túto perspektívu, kontext a radu spôsobom, ktorý nemá žiadne predpoklady - z hľadiska sociálnej vedy alebo vedy o údajoch.

V semestrálnom kurze by som odporučil párovanie tejto knihy s rôznymi dodatočnými údajmi. Napríklad, takýto kurz by mohol stráviť dva týždne na pokusoch a môžete spárovať kapitolu 4 s údajmi o témach, ako je úloha informácií o predbežnej liečbe pri navrhovaní a analýze pokusov; štatistické a výpočtové otázky vznikajúce rozsiahlymi testami A / B v spoločnostiach; návrh experimentov špecificky zameraných na mechanizmy; a praktické, vedecké a etické otázky súvisiace s používaním účastníkov z online trhov práce, ako je napríklad Amazon Mechanical Turk. Mohlo by sa spárovať aj s čítaním a aktivitami súvisiacimi s programovaním. Vhodná voľba medzi týmito mnohými možnými párovaniami závisí od študentov vo vašom kurze (napr. Vysokoškolské, magisterské alebo doktorandské), ich zázemie a ciele.

Semestrálny kurz by mohol zahŕňať aj týždenné sady problémov. Každá kapitola obsahuje rôzne aktivity označené podľa stupňa obtiažnosti: jednoduché ( jednoduchý ), stredná ( stredná ), tvrdé ( usilovne ) a veľmi ťažké ( veľmi ťažké ). Tiež som označil každý problém zručnosťami, ktoré vyžaduje: matematika ( vyžaduje matematiku ), kódovanie ( vyžaduje kódovanie ) a zber údajov ( zber dát ). Nakoniec som označil niekoľko aktivít, ktoré sú moje osobné obľúbené ( môj obľúbený ). Dúfam, že v rámci tejto rôznorodej zbierky aktivít nájdete niektoré, ktoré sú vhodné pre vašich študentov.

Aby som pomohol ľuďom používať túto knihu v kurzoch, začal som zbierku učebných materiálov, ako sú osnovy, diapozitívy, odporúčané párovania pre každú kapitolu a riešenia niektorých aktivít. Tieto materiály môžete nájsť - a prispieť k nim - na http://www.bitbybitbook.com.