предговор

Тази книга започва през 2005 г. в сутерен в Колумбийския университет. По това време бях студент и бях провел онлайн експеримент, който в крайна сметка щеше да стане моята дисертация. Ще ви разкажа всичко за научните части на този експеримент в глава 4, но сега ще ви разкажа за нещо, което не е в моята дисертация или във всеки от моите документи. И това е нещо, което основно промени начина, по който мисля за научните изследвания. Една сутрин, когато влязох в мазето ми, открих, че в моя експеримент участвахме около 100 души от Бразилия. Това просто преживяване имаше дълбок ефект върху мен. По това време имах приятели, които провеждаха традиционни лабораторни експерименти и знаех колко трудно трябва да работят, за да наемат, да наблюдават и да плащат на хората да участват в тези експерименти; ако те можеха да управляват 10 души за един ден, това беше добър напредък. Въпреки това, с моя онлайн експеримент, 100 души участваха докато бях спяла . Извършването на изследвания, докато спите, може да звучи твърде добре, за да е истина, но не е така. Промените в технологиите - особено преходът от аналоговата епоха към цифровата ера - означават, че сега можем да събираме и анализираме социалните данни по нови начини. Тази книга е за извършване на социални изследвания по тези нови начини.

Тази книга е предназначена за социални учени, които искат да направят повече наука за данни, учени, които искат да направят повече социални науки, и всеки, който се интересува от хибрида на тези две области. Като се има предвид кой е тази книга, трябва да се каже, че не е само за студенти и професори. Въпреки че понастоящем работя в университет (Принстън), аз също съм работил в правителството (в Бюрото за преброяване на населението в САЩ) и в техническата индустрия (в Microsoft Research), така че знам, че има много вълнуващи изследвания, които се случват извън университетите. Ако мислите за това, което правите като социално изследване, тогава тази книга е за вас, без значение къде работите или какви техники използвате в момента.

Както вече сте забелязали, тонът на тази книга е малко по-различен от този на много други академични книги. Това е умишлено. Тази книга се появи от завършен семинар по компютърни социални науки, който съм преподавал в Принстън в катедра "Социология" от 2007 г. насам и бих искал да заснеме част от енергията и възбудата от този семинар. По-конкретно, искам тази книга да има три характеристики: искам тя да бъде полезна, ориентирана към бъдещето и оптимистична.

Полезно : Моята цел е да напиша книга, която е полезна за вас. Затова ще пиша в открит, неформален и примерен стил. Това е така, защото най-важното нещо, което искам да изразя, е някакъв начин да мисля за социалните изследвания. И моят опит показва, че най-добрият начин да се предаде този начин на мислене е неофициално и с много примери. Също така в края на всяка глава имам раздел "Какво да прочета след това", който ще ви помогне да преминете към по-подробни и технически показания по много от темите, които представям. Накрая, надявам се тази книга да ви помогне да направите изследвания и да оценявате изследванията на другите.

Ориентирана към бъдещето : Тази книга ще ви помогне да направите социални изследвания, използвайки цифровите системи, които съществуват днес, и тези, които ще бъдат създадени в бъдеще. Започнах да правя такива изследвания през 2004 г. и оттогава съм виждал много промени и съм сигурен, че в хода на кариерата си ще видите и много промени. Трикът да останеш подходящ в лицето на промяната е абстракция . Например, това няма да бъде книга, която ви учи точно как да използвате API на Twitter, както съществува днес; вместо това ще ви научи как да се научите от големи източници на данни (глава 2). Това няма да бъде книга, която ви дава инструкции стъпка по стъпка за провеждане на експерименти с Amazon Mechanical Turk; вместо това ще ви научи как да проектирате и интерпретирате експерименти, които разчитат на инфраструктурата на цифровата епоха (глава 4). Чрез използването на абстракция, надявам се това да е вечна книга за навременна тема.

Оптимистично : Двете общности, които тази книга ангажира - социални учени и изследователи на данни - имат много различен произход и интереси. В допълнение към тези разлики, свързани с науката, за които говорим в книгата, също забелязах, че тези две общности имат различни стилове. Учените обикновено са развълнувани; те са склонни да видят чашата като полупълна. Социалните учители, от друга страна, обикновено са по-критични; те са склонни да видят чашата като полу празна. В тази книга ще възприема оптимистичния тон на учен по данни. Така че, когато представям примери, ще ви кажа какво обичам за тези примери. И когато посочвам проблемите с примерите - и аз ще го направя, защото никакво проучване не е перфектно - ще се опитам да посоча тези проблеми по начин, който е положителен и оптимистичен. Няма да бъда критичен, за да бъда критичен - ще бъда критичен, за да ви помогна да създадете по-добри изследвания.

Ние все още сме в първите дни на социалните изследвания в дигиталната епоха, но съм виждал някои недоразумения, които са толкова често, че има смисъл да се обърна към тях тук, в предговора. От учените по данни, видях две общи недоразумения. Първият е, че повече данни автоматично решават проблеми. Но за социални изследвания това не е моят опит. Всъщност, за социалните изследвания, по-добрите данни - за разлика от повече данни - изглеждат по-полезни. Второто погрешно разбиране, което съм виждал от изследователите на данни, е, че социалната наука е просто един куп фантастичен разговор, обвит около здравия разум. Разбира се, като социолог - по-конкретно като социолог - не съм съгласен с това. Умните хора са работили усилено, за да разбират човешкото поведение отдавна и изглежда неразумно да игнорират мъдростта, натрупана от това усилие. Надявам се, че тази книга ще ви предложи някои от тази мъдрост по начин, който е лесен за разбиране.

От социални учени също видях две общи недоразумения. Първо, видях някои хора да отпишат цялата идея за социални изследвания, използвайки инструментите на дигиталната епоха, заради няколко лоши статии. Ако четете тази книга, вероятно вече сте чели куп документи, които използват данни за социални медии по начини, които са банални или неправилни (или и двете). Аз също. Би било обаче сериозна грешка да се заключи от тези примери, че всички изследвания в областта на цифровите технологии са лоши. Всъщност вероятно сте прочели също и куп документи, които използват данни от проучвания по начини, които са банални или неточни, но не можете да отпишете всички изследвания, като използвате проучвания. Това е така, защото знаете, че има голямо изследване, направено с данните от проучванията, и в тази книга ще ви покажа, че има също така голямо изследване, направено с инструментите на дигиталната епоха.

Второто общо недоразумение, което съм виждал от социалните учени, е да объркам настоящето с бъдещето. Когато оценяваме социалните изследвания в дигиталната ера - изследванията, които ще опиша - важно е да зададем два отделни въпроса: "Доколко този стил на изследване работи точно сега?" И "Доколко този стил на научна работа в бъдеще? "Изследователите са обучени да отговорят на първия въпрос, но за тази книга мисля, че вторият въпрос е по-важен. Това означава, че въпреки че социалните изследвания в дигиталната ера все още не са довели до масивни интерактивни вноски, променящи парадигмата, степента на подобрение на изследванията в областта на цифровите технологии е невероятно бърза. Това е скоростта на промяна - повече от сегашното ниво - което прави проучването на дигиталната възраст толкова вълнуващо за мен.

Макар че последният абзац може да ви предложи потенциални богатства в някакъв неопределен момент в бъдеще, моята цел не е да ви продам за определен вид изследване. Аз лично не притежавам акции в Twitter, Facebook, Google, Microsoft, Apple или друга технологична компания (въпреки че за да бъдат разкрити напълно, трябва да спомена, че съм работил или получих финансиране от Microsoft, Google и Facebook). По тази причина целта на моята книга е да остана един надежден разказвач, който ви разказва за всички вълнуващи нови неща, които са възможни, като ви води далеч от няколко капана, които съм виждал да попаднат (и понякога паднаха в себе си) ,

Пресечната точка на социалната наука и науката за данните понякога се нарича изчислителна социална наука. Някои считат това за техническа област, но това няма да бъде техническа книга в традиционния смисъл на думата. Например в основния текст няма уравнения. Аз избрах да напиша книгата по този начин, защото исках да дам изчерпателна представа за социалните изследвания в дигиталната епоха, включително големи източници на данни, проучвания, експерименти, масово сътрудничество и етика. Оказа се, че е невъзможно да се обхванат всички тези теми и да се предоставят технически подробности за всеки един от тях. Вместо това, указанията за по-технически материали са дадени в раздела "Какво да прочетете следващия" в края на всяка глава. С други думи, тази книга не е предназначена да ви научи как да направите каквото и да е конкретно изчисление; по-скоро, тя е предназначена да промени начина, по който мислите за социалните изследвания.

Как да използвате тази книга в курс

Както казах по-рано, тази книга се появи отчасти от семинар за завършили компютърни социални науки, който преподавах от 2007 г. в Принстън. Тъй като може би си мислите да използвате тази книга, за да преподавате курс, мислех, че би било полезно за мен да обясня как е израснал от курса ми и как си представям, че се използва в други курсове.

В продължение на няколко години преподавах курса без книга; Току-що присвоих колекция от статии. Докато учениците успяха да се поучат от тези статии, само статиите не водеха до концептуалните промени, които се надявах да създам. Така че ще прекарвам по-голямата част от времето в клас, предоставяйки перспектива, контекст и съвети, за да помогна на учениците да видят голямата картина. Тази книга е моят опит да запиша цялата тази перспектива, контекст и съвети по начин, който няма никакви предпоставки - по отношение на социалната наука или науката на данните.

В курс по семестър, бих препоръчал да се съчетае тази книга с множество допълнителни показания. Например, такъв курс може да прекара две седмици в експерименти и можете да сдвоите глава 4 с показания по теми като ролята на информацията за предварителната обработка при проектирането и анализа на експериментите; статистически и изчислителни въпроси, повдигнати от мащабни A / B тестове в компаниите; проектиране на експерименти, специално насочени към механизмите; и практически, научни и етични въпроси, свързани с използването на участници от онлайн пазарите на труда, като Amazon Mechanical Turk. Тя може да бъде съчетана с отчитания и дейности, свързани с програмирането. Подходящият избор между тези много възможни сдвоявания зависи от обучаемите във вашия курс (напр. Бакалавър, магистър или доктор), техния произход и целите им.

Курсът за семестър може да включва ежеседмични серии от проблеми. Всяка глава има различни дейности, които са обозначени със степен на трудност: лесно ( лесно ), средна ( среда ), твърд ( твърд ) и много трудно ( много трудно ). Също така, аз съм отбелязал всеки проблем с уменията, които изисква: математика ( изисква математика ), кодиране ( изисква кодиране ) и събиране на данни ( събиране на данни ). И накрая, аз съм нарекъл някои от дейностите, които са мои лични предпочитания ( Моят фаворит ). Надявам се, че в тази разнообразна колекция от дейности ще намерите някои, които са подходящи за вашите студенти.

За да помогна на хората, които използват тази книга в курсовете, започнах да събирам учебни материали като учебни програми, слайдове, препоръчвани сдвоявания за всяка глава и решения за някои дейности. Можете да намерите тези материали и да допринесете за тях - на http://www.bitbybitbook.com.