Предговор

Оваа книга започна во 2005 година во подрумот на Универзитетот Колумбија. Во тоа време бев дипломиран студент, и јас бев водење на онлајн експеримент кој на крајот ќе ми стане дисертација. Ќе ви кажам за научните делови на тој експеримент во поглавје 4, но сега ќе ви кажам за нешто што не е во мојата дисертација или во некој мој труд. И тоа е нешто што фундаментално се промени како мислам на истражување. Едно утро, кога дојдов во мојата подрумска канцеларија, открив дека преку ноќ околу 100 луѓе од Бразил учествуваа во мојот експеримент. Ова едноставно искуство имаше големо влијание врз мене. Во тоа време имав пријатели кои водеа традиционални лабораториски експерименти, и знаев колку напорно тие мораа да работат за регрутирање, надгледување и плаќање луѓе да учествуваат во овие експерименти; ако тие може да се кандидира 10 луѓе во еден ден, тоа беше добар напредок. Сепак, со мојот онлајн експеримент, учествуваа 100 луѓе додека спиев . Вршењето на вашето истражување додека спиеш може да звучи премногу добро за да биде вистина, но тоа не е така. Промените во технологијата - конкретно транзицијата од аналогната возраст до дигиталната ера - значи дека сега можеме да ги собираме и анализираме социјалните податоци на нови начини. Оваа книга е за правење социјални истражувања на овие нови начини.

Оваа книга е за општествените научници кои сакаат да направат повеќе податоци за науката, научниците за податоци кои сакаат да направат повеќе општествени науки и сите заинтересирани за хибрид на овие две полиња. Со оглед на тоа за кого е оваа книга, треба да се каже дека не е само за учениците и професорите. Иако во моментов работам на универзитет (Принстон), работев и во владата (во Бирото за попис на САД) и во технолошката индустрија (во "Мајкрософт"), па знам дека има многу возбудливи истражувања што се случуваат надвор од универзитети. Ако мислите на она што го правите како социјално истражување, тогаш оваа книга е за вас, без разлика каде работите или какви техники во моментов ги користите.

Како што можеби веќе сте забележале, тонот на оваа книга е малку поинаков од оној на многу други академски книги. Тоа е намерно. Оваа книга произлезе од постдипломски семинар за компјутерската општествена наука што го подучував во Принстон на Катедрата за социологија од 2007 година и би сакал да фати дел од енергијата и возбудата од тој семинар. Особено, сакам оваа книга да има три карактеристики: сакам да биде корисна, ориентирана кон иднината и оптимистична.

Корисно : Мојата цел е да напишете книга која е корисна за вас. Затоа, ќе одам да пишувам во отворен, неформален и стилски пример. Тоа е затоа што најважното нешто што сакам да го пренесам е одреден начин на размислување за општествените истражувања. И моето искуство сугерира дека најдобриот начин да се пренесе овој начин на размислување е неформално и со многу примери. Исто така, на крајот од секое поглавје, имам дел наречен "Што да прочитам следно", кој ќе ви помогне да преминете во подетални и технички читања за многу теми кои ги воведувам. На крајот, се надевам дека оваа книга ќе ви помогне да направите истражување и да ги оцените истражувањата на другите.

Ориентирана кон иднината : Оваа книга ќе ви помогне да направите социјални истражувања користејќи ги дигиталните системи што постојат денес и оние кои ќе бидат создадени во иднина. Почнав да го направам ова истражување во 2004 година, и оттогаш видов многу промени, и сигурен сум дека во текот на вашата кариера ќе видите многу промени. Трикот да остане релевантен во лицето на промените е апстракција . На пример, ова нема да биде книга што ве учи точно како да го користите API на Twitter како што постои денес; Наместо тоа, ќе ве научи како да научите од големи извори на податоци (поглавје 2). Ова нема да биде книга која ви дава чекор-по-чекор инструкции за водење експерименти на Amazon Mechanical Turk; Наместо тоа, ќе ве научи како да ги дизајнирате и интерпретирате експериментите кои се потпираат на инфраструктурата на дигиталната ера (поглавје 4). Преку употреба на апстракција, се надевам дека ова ќе биде безвременска книга за навремена тема.

Оптимистички : Двете заедници во кои оваа книга се ангажира - научници од општеството и научници за податоци - имаат многу различни потекла и интереси. Освен овие разлики поврзани со науката, за кои зборувам во книгата, јас исто така забележав дека овие две заедници имаат различни стилови. Научниците за податоци се генерално возбудени; тие имаат тенденција да го видат стаклото како половина полна. Социјалните научници, од друга страна, главно се критични; тие имаат тенденција да го видат стаклото како полупразна. Во оваа книга, ќе го прифатам оптимистичкиот тон на научникот за податоци. Значи, кога ќе презентирам примери, ќе ви кажам што сакам за овие примери. И кога ќе ги посочам проблемите со примерите - и јас ќе го сторам тоа, бидејќи ниедно истражување не е совршено - ќе се обидам да ги посочам овие проблеми на начин кој е позитивен и оптимист. Јас нема да бидам критичен за да бидам критичен - ќе бидам критичен, за да можам да ви помогнам да креирате подобро истражување.

Сè уште сме во првите денови на социјални истражувања во дигиталното доба, но видов некои недоразбирања кои се толку чести што им е смирено да се обратам овде, во предговорот. Од податоците научници, сум видел две заеднички недоразбирања. Првиот мисли дека повеќе податоци автоматски ги решаваат проблемите. Сепак, за социјални истражувања, тоа не беше моето искуство. Всушност, за социјалните истражувања, подобри податоци - за разлика од повеќе податоци - изгледаат поповолни. Второто недоразбирање што сум го видел од научниците за податоци мисли дека општествената наука е само еден куп фантастичен разговор зависен од здравиот разум. Се разбира, како социјален научник, поточно како социолог, не се согласувам со тоа. Паметни луѓе напорно работат за да го разберат човековото однесување долго време, и не е паметно да се игнорира мудроста што се акумулирала од овој напор. Мојата надеж е дека оваа книга ќе ви понуди некои од таа мудрост на начин кој е лесно да се разбере.

Од општествените научници, исто така, видов две заеднички недоразбирања. Прво, видов дека некои луѓе ја отпишуваат целата идеја за социјални истражувања користејќи ги алатките на дигиталното доба поради неколку лоши документи. Ако ја читате оваа книга, најверојатно веќе сте прочитале голем број трудови кои ги користат податоците на социјалните медиуми на начин што се банални или погрешни (или и двете). И јас имам. Сепак, би било сериозна грешка да се заклучи од овие примери дека сите социјални истражувања во дигиталната ера се лоши. Всушност, веројатно, исто така, прочитате повеќе трудови кои ги користат податоците за анкетите на начин банални или погрешни, но не ги запишувате сите истражувања користејќи анкети. Тоа е затоа што знаете дека има големи истражувања направени со податоците од истражувањето, а во оваа книга ќе ви покажам дека има и големи истражувања направени со алатките на дигиталната ера.

Второто вообичаено недоразбирање што го видов од општествените научници е да го збуни сегашноста со иднината. Кога ќе ги процениме социјалните истражувања во дигиталната ера - истражувањето што ќе го опишам - важно е да поставуваме две различни прашања: "Колку добро овој стил на истражувања функционира токму сега?" И "Колку добро овој стил на истражувачка работа во иднина? "Истражувачите се обучени да одговорат на првото прашање, но за оваа книга мислам дека второто прашање е поважно. Тоа е, иако социјалните истражувања во дигиталната ера сè уште не создале масовен интелектуален придонес за промена на парадигмата, стапката на подобрување на истражувањето за дигитална возраст е неверојатно брза. Токму оваа промена на стапката - повеќе од сегашното ниво - што го прави дигиталното доба толку возбудливо за мене.

И покрај тоа што изгледа дека последниот пасус може да ви понуди потенцијално богатство во некое неодредено време во иднина, мојата цел не е да ве продадам на некој конкретен тип на истражување. Јас лично не поседувам акции на Твитер, Фејсбук, Гугл, Мајкрософт, Епл или било која друга технолошка компанија (иако, заради целосно објавување, треба да спомнам дека сум работел или, Google и Фејсбук). Затоа, низ целата книга, мојата цел е да останам веродостоен раскажувач, да ви кажувам за сите возбудливи нови работи што е можно, додека ве водиме подалеку од неколку замки што ги видов другите (и повремено паднати во мене) .

Пресекот на општествените науки и науката за податоци понекогаш се нарекува пресметковна општествена наука. Некои сметаат дека ова е техничко поле, но ова нема да биде техничка книга во традиционална смисла. На пример, во главниот текст нема равенки. Избрав да ја напишам книгата на овој начин, бидејќи сакав да дадам сеопфатен поглед на социјалните истражувања во дигиталната ера, вклучувајќи ги и големите извори на податоци, истражувања, експерименти, масовна соработка и етика. Се покажало дека е невозможно да се покријат сите овие теми и да се обезбедат технички детали за секој од нив. Наместо тоа, упатствата на повеќе технички материјали се дадени во делот "Што да прочитате следно" на крајот од секое поглавје. Со други зборови, оваа книга не е дизајнирана да ве научи како да направите некоја специфична пресметка; Напротив, тој е дизајниран да го промени начинот на кој размислувате за општествените истражувања.

Како да ја користите оваа книга во текот на курсот

Како што реков претходно, оваа книга се појави делумно од дипломиран семинар за компјутерската општествена наука што го предавам од 2007 година во Принстон. Бидејќи можеби размислувате да ја користите оваа книга за да предавате курс, мислев дека би било корисно за мене да објаснам како излегло од мојот курс и како мислите дека се користи во други курсеви.

Веќе неколку години го научив мојот курс без книга; Јас само ќе доделите колекција на статии. Додека учениците можеа да учат од овие статии, само статиите не водеа кон концептуални промени за кои се надевав да создадам. Значи, јас би го поминал поголемиот дел од времето во класа обезбедување на перспектива, контекст и совети со цел да им помогне на студентите да ја видат големата слика. Оваа книга е мој обид да ја запишам целата таа перспектива, контекст и совети на начин кој нема предуслови - во однос на социјалната наука или науката за податоци.

Во текот на еден семестар, јас препорачувам да ја спарите оваа книга со различни дополнителни читања. На пример, таков курс би можел да помине две недели на експерименти, и може да го спарите поглавјето 4 со читања за теми како што се улогата на информациите за предтретман во дизајнот и анализата на експериментите; статистички и пресметковни прашања покренати од големите А / Б тестови во компаниите; дизајн на експерименти специјално фокусирани на механизми; и практични, научни и етички прашања поврзани со користење на учесници од онлајн пазари на трудот, како што е Amazon Mechanical Turk. Исто така, може да биде поврзано со читања и активности поврзани со програмирање. Соодветен избор помеѓу овие многу можни спарувања зависи од учениците во вашиот курс (на пример, додипломски, магистерски или докторски), нивното потекло и нивните цели.

Се разбира, должина разбира, исто така, може да вклучува неделни проблеми множества. Секое поглавје има различни активности кои се обележани со степен на тежина: лесно ( лесно ), медиум ( медиум ), тешко ( тешко ), и многу тешко ( многу тешко ). Исто така, јас го етикетирав секој проблем од вештините што ги бара: математика ( бара математика ), кодирање ( бара кодирање ) и собирање на податоци ( собирање на податоци ). Конечно, јас сум етикетирани неколку од активностите кои се мои лични омилени ( мојот омилен ). Се надевам дека во рамките на оваа разновидна колекција на активности, ќе најдете некои кои се соодветни за вашите ученици.

Со цел да им помогнам на луѓето кои ја користат оваа книга во курсеви, започнав со збирка наставни материјали како што се наставни планови, слајдови, препорачани спари за секое поглавје и решенија за некои активности. Овие материјали можете да ги најдете - и да придонесете за нив - на http://www.bitbybitbook.com.