Vorwort

Dieses Buch begann 2005 in einem Keller der Columbia University. Zu der Zeit war ich ein Doktorand, und ich führte ein Online-Experiment, das schließlich meine Dissertation werden würde. Ich werde Ihnen alles über die wissenschaftlichen Teile dieses Experiments in Kapitel 4 erzählen, aber jetzt werde ich Ihnen etwas erzählen, das nicht in meiner Dissertation oder in irgendeiner meiner Arbeiten enthalten ist. Und es hat etwas grundlegend verändert, was ich über Forschung denke. Eines Morgens, als ich in mein Kellerbüro kam, entdeckte ich, dass über 100 Leute aus Brasilien über Nacht an meinem Experiment teilgenommen hatten. Diese einfache Erfahrung hatte tiefe Auswirkungen auf mich. Zu dieser Zeit hatte ich Freunde, die traditionelle Laborexperimente führten, und ich wusste, wie schwer sie arbeiten mussten, um Leute zu rekrutieren, zu beaufsichtigen und zu bezahlen, um an diesen Experimenten teilzunehmen; Wenn sie 10 Leute an einem einzigen Tag laufen könnten, wäre das ein guter Fortschritt. Bei meinem Online-Experiment haben jedoch 100 Personen teilgenommen, während ich geschlafen habe . Wenn du während des Schlafens forschst, mag es zu gut klingen, um wahr zu sein, aber das ist es nicht. Veränderungen in der Technologie - insbesondere der Übergang vom analogen Zeitalter zum digitalen Zeitalter - bedeuten, dass wir nun soziale Daten auf neue Weise sammeln und analysieren können. In diesem Buch geht es um soziale Forschung auf diese neue Art und Weise.

Dieses Buch richtet sich an Sozialwissenschaftler, die mehr Datenwissenschaft betreiben wollen, an Datenwissenschaftler, die mehr Sozialwissenschaften betreiben wollen, und an alle, die sich für die Hybridisierung dieser beiden Bereiche interessieren. In Anbetracht dessen, wer dieses Buch ist, sollte es selbstverständlich sein, dass es nicht nur für Studenten und Professoren ist. Obwohl ich derzeit an einer Universität (Princeton) arbeite, habe ich auch in der Regierung (beim US Census Bureau) und in der Tech-Industrie (bei Microsoft Research) gearbeitet, so dass ich weiß, dass es außerhalb von Universitäten. Wenn Sie daran denken, was Sie als soziale Forschung tun, dann ist dieses Buch für Sie, egal, wo Sie arbeiten oder welche Techniken Sie gerade anwenden.

Wie Sie vielleicht schon bemerkt haben, ist der Ton dieses Buches ein wenig anders als in vielen anderen akademischen Büchern. Das ist Absicht. Dieses Buch entstand aus einem Seminar über Computer-Sozialwissenschaften, das ich seit 2007 in Princeton in der Abteilung für Soziologie gelehrt habe, und ich möchte, dass es etwas von der Energie und der Aufregung dieses Seminars einfängt. Insbesondere möchte ich, dass dieses Buch drei Merkmale aufweist: Ich möchte, dass es hilfreich, zukunftsorientiert und optimistisch ist.

Hilfreiche : Mein Ziel ist es, ein Buch zu schreiben, das für Sie hilfreich ist. Daher schreibe ich in einem offenen, informellen und beispielorientierten Stil. Denn das Wichtigste, was ich vermitteln möchte, ist eine bestimmte Art, über Sozialforschung nachzudenken. Und meine Erfahrung zeigt, dass diese Art des Denkens am besten informell und mit vielen Beispielen vermittelt wird. Außerdem habe ich am Ende jedes Kapitels einen Abschnitt mit dem Titel "Was ich als nächstes lesen soll", der Ihnen helfen wird, detailliertere und technische Lesungen zu vielen der von mir vorgestellten Themen durchzuführen. Am Ende hoffe ich, dass dieses Buch Ihnen helfen wird, die Forschung anderer zu erforschen und zu bewerten.

Zukunftsorientiert : Dieses Buch wird Ihnen helfen, soziale Forschung mit den digitalen Systemen zu betreiben, die es heute gibt und die in der Zukunft entstehen werden. Ich habe 2004 angefangen, diese Art von Forschung zu betreiben, und seitdem habe ich viele Veränderungen gesehen, und ich bin mir sicher, dass Sie im Laufe Ihrer Karriere auch viele Veränderungen sehen werden. Der Trick, um angesichts von Veränderungen relevant zu bleiben, ist Abstraktion . Zum Beispiel wird dies kein Buch sein, das Ihnen genau beibringt, wie Sie die Twitter-API, wie sie heute existiert, verwenden können; Stattdessen lernen Sie, wie Sie aus großen Datenquellen lernen können (Kapitel 2). Dies wird kein Buch sein, das Ihnen Schritt-für-Schritt-Anleitungen zum Ausführen von Experimenten auf Amazon Mechanical Turk gibt; Stattdessen wird es Ihnen beibringen, wie Sie Experimente entwerfen und interpretieren, die sich auf die Infrastruktur des digitalen Zeitalters stützen (Kapitel 4). Durch die Verwendung von Abstraktion hoffe ich, dass dies ein zeitloses Buch über ein zeitgemäßes Thema sein wird.

Optimistisch : Die zwei Gemeinschaften, die dieses Buch einbezieht - Sozialwissenschaftler und Datenwissenschaftler - haben sehr unterschiedliche Hintergründe und Interessen. Zusätzlich zu diesen naturwissenschaftlichen Unterschieden, über die ich im Buch spreche, habe ich auch bemerkt, dass diese beiden Gemeinschaften unterschiedliche Stile haben. Datenwissenschaftler sind im Allgemeinen aufgeregt; Sie neigen dazu, das Glas als halb voll zu sehen. Sozialwissenschaftler hingegen sind in der Regel kritischer; Sie neigen dazu, das Glas als halb leer zu sehen. In diesem Buch werde ich den optimistischen Ton eines Datenwissenschaftlers annehmen. Wenn ich Beispiele vorstelle, werde ich Ihnen sagen, was ich an diesen Beispielen liebe. Und wenn ich auf Probleme mit den Beispielen aufmerksam mache - und das werde ich tun, weil keine Forschung perfekt ist -, werde ich versuchen, diese Probleme positiv und optimistisch aufzuzeigen. Ich werde nicht kritisch sein, um kritisch zu sein - ich werde kritisch sein, damit ich Ihnen helfen kann, bessere Forschungsergebnisse zu erstellen.

Wir sind immer noch in den Anfängen der Sozialforschung im digitalen Zeitalter, aber ich habe einige Missverständnisse gesehen, die so häufig sind, dass es für mich Sinn macht, sie hier im Vorwort anzusprechen. Von Datenwissenschaftlern habe ich zwei häufige Missverständnisse gesehen. Der erste denkt, dass mehr Daten automatisch Probleme lösen. Für die Sozialforschung war das jedoch nicht meine Erfahrung. Für die Sozialforschung scheinen bessere Daten - im Gegensatz zu mehr Daten - hilfreicher zu sein. Das zweite Missverständnis, das ich von Datenwissenschaftlern gesehen habe, ist, dass die Sozialwissenschaft nur eine Ansammlung von phantastischen Reden über den gesunden Menschenverstand ist. Natürlich bin ich als Sozialwissenschaftler, genauer gesagt als Soziologe, damit nicht einverstanden. Intelligente Menschen haben lange daran gearbeitet, menschliches Verhalten zu verstehen, und es scheint unklug, die Weisheit zu ignorieren, die sich aus dieser Anstrengung angesammelt hat. Ich hoffe, dass Ihnen dieses Buch einige dieser Weisheiten auf leicht verständliche Weise bietet.

Von Sozialwissenschaftlern habe ich auch zwei häufige Missverständnisse gesehen. Erstens habe ich gesehen, wie einige Leute die gesamte Idee der Sozialforschung abgeschrieben haben, indem sie die Werkzeuge des digitalen Zeitalters wegen ein paar schlechten Papieren benutzt haben. Wenn Sie dieses Buch lesen, haben Sie wahrscheinlich schon eine Reihe von Papieren gelesen, die Social-Media-Daten auf banale oder falsche Weise (oder beides) verwenden. Ich muss. Es wäre jedoch ein schwerer Fehler, aus diesen Beispielen zu schließen, dass die gesamte Sozialforschung im digitalen Zeitalter schlecht ist. In der Tat haben Sie wahrscheinlich auch eine Reihe von Papieren gelesen, die Umfragedaten auf banale oder falsche Weise verwenden, aber Sie schreiben nicht alle Untersuchungen mit Umfragen ab. Das liegt daran, dass Sie wissen, dass mit Umfragedaten großartige Forschung betrieben wird, und in diesem Buch werde ich Ihnen zeigen, dass es auch großartige Forschung mit den Werkzeugen des digitalen Zeitalters gibt.

Das zweite häufige Missverständnis, das ich von Sozialwissenschaftlern gesehen habe, ist, die Gegenwart mit der Zukunft zu verwechseln. Wenn wir soziale Forschung im digitalen Zeitalter bewerten - die Forschung, die ich beschreiben werde -, ist es wichtig, dass wir zwei unterschiedliche Fragen stellen: "Wie gut funktioniert dieser Forschungsstil gerade?" Und "Wie gut wird dieser Stil von Forschungsarbeiten in der Zukunft? "Die Forscher sind darauf vorbereitet, die erste Frage zu beantworten, aber für dieses Buch halte ich die zweite Frage für wichtiger. Das heißt, obwohl die Sozialforschung im digitalen Zeitalter noch keine massiven, Paradigmen verändernden intellektuellen Beiträge hervorgebracht hat, ist die Geschwindigkeit der Verbesserung der digitalen Altersforschung unglaublich schnell. Es ist diese Änderungsrate - mehr als das aktuelle Niveau -, die die digitale Altersforschung für mich so spannend macht.

Auch wenn dieser letzte Absatz Ihnen möglicherweise in naher Zukunft unmöglichen Zeitreichtum zu bieten scheint, ist es mein Ziel, Ihnen keine bestimmte Art von Forschung zu verkaufen. Ich besitze keine Anteile an Twitter, Facebook, Google, Microsoft, Apple oder einem anderen Technologieunternehmen (obwohl ich aus Gründen der vollständigen Offenlegung erwähnen sollte, dass ich bei Microsoft gearbeitet oder Forschungsfinanzierung von Microsoft erhalten habe, Google und Facebook). Im gesamten Buch ist es daher mein Ziel, ein glaubwürdiger Erzähler zu bleiben, der Ihnen von all den aufregenden neuen Dingen erzählt, die möglich sind, während Sie weg von ein paar Fallen führt, in die andere hineinfallen (und gelegentlich in mich fallen). .

Die Schnittstelle von Sozialwissenschaft und Datenwissenschaft wird manchmal als computational social science bezeichnet. Einige halten dies für ein technisches Gebiet, aber dies wird kein technisches Buch im herkömmlichen Sinne sein. Zum Beispiel gibt es keine Gleichungen im Haupttext. Ich entschied mich, das Buch so zu schreiben, weil ich einen umfassenden Überblick über die Sozialforschung im digitalen Zeitalter geben wollte, einschließlich großer Datenquellen, Umfragen, Experimenten, Massenzusammenarbeit und Ethik. Es stellte sich heraus, dass es unmöglich war, all diese Themen zu behandeln und technische Details zu jedem Thema bereitzustellen. Stattdessen finden Sie im Abschnitt "Was Sie weiter lesen sollten" am Ende jedes Kapitels Hinweise zu mehr technischem Material. Mit anderen Worten, dieses Buch soll Ihnen nicht beibringen, wie Sie eine bestimmte Berechnung durchführen. Vielmehr soll es die Art, wie Sie über soziale Forschung denken, verändern.

Wie man dieses Buch in einem Kurs verwendet

Wie ich bereits erwähnt habe, ist dieses Buch zum Teil aus einem Seminar über Computer-Sozialwissenschaften hervorgegangen, das ich seit 2007 in Princeton unterrichtet habe. Da Sie vielleicht darüber nachdenken, dieses Buch zu benutzen, um einen Kurs zu unterrichten, dachte ich, dass es für mich hilfreich sein könnte zu erklären, wie es aus meinem Kurs heraus entstanden ist und wie ich es mir in anderen Kursen vorstellen kann.

Mehrere Jahre lang habe ich meinen Kurs ohne Buch unterrichtet; Ich würde nur eine Sammlung von Artikeln zuweisen. Während die Schüler von diesen Artikeln lernen konnten, führten die Artikel allein nicht zu den konzeptionellen Veränderungen, die ich zu schaffen hoffte. Daher verbrachte ich die meiste Zeit im Unterricht mit Perspektive, Kontext und Ratschlägen, um den Schülern zu helfen, das Gesamtbild zu sehen. Dieses Buch ist mein Versuch, all diese Perspektive, den Kontext und den Rat auf eine Art und Weise niederzuschreiben, die keine Vorraussetzungen hat - weder in den Sozialwissenschaften noch in den Datenwissenschaften.

In einem Semester-Kurs würde ich empfehlen, dieses Buch mit einer Vielzahl von zusätzlichen Lesungen zu kombinieren. Ein solcher Kurs könnte beispielsweise zwei Wochen für Experimente dauern, und Sie könnten Kapitel 4 mit Lesungen zu Themen wie der Rolle von Vorbehandlungsinformationen bei der Entwicklung und Analyse von Experimenten verknüpfen. statistische und rechnerische Probleme, die durch groß angelegte A / B-Tests in Unternehmen aufgeworfen werden; Design von Experimenten speziell auf Mechanismen ausgerichtet; und praktische, wissenschaftliche und ethische Fragen im Zusammenhang mit der Nutzung von Teilnehmern aus Online-Arbeitsmärkten wie Amazon Mechanical Turk. Es könnte auch mit Lesungen und Aktivitäten im Zusammenhang mit der Programmierung gepaart werden. Die geeignete Wahl zwischen diesen vielen möglichen Paarungen hängt von den Studenten in Ihrem Kurs ab (z. B. Grundstudium, Master oder PhD), deren Hintergründe und Ziele.

Ein Semesterkurs könnte auch wöchentliche Problemsätze beinhalten. Jedes Kapitel hat eine Vielzahl von Aktivitäten, die nach Schwierigkeitsgrad gekennzeichnet sind: einfach ( einfach ), Mittel ( Mittel ), hart ( hart ) und sehr hart ( sehr schwer ). Außerdem habe ich jedes Problem nach den Fähigkeiten benannt, die es benötigt: Mathe ( erfordert Mathematik ), Codierung ( erfordert Codierung ) und Datenerhebung ( Datensammlung ). Zu guter Letzt habe ich ein paar der Aktivitäten benannt, die meine persönlichen Favoriten sind ( mein Liebling ). Ich hoffe, dass Sie in dieser vielfältigen Sammlung von Aktivitäten einige finden, die für Ihre Schüler geeignet sind.

Um Menschen, die dieses Buch in Kursen verwenden, zu helfen, habe ich eine Sammlung von Lehrmaterialien wie Lehrpläne, Folien, empfohlene Paarungen für jedes Kapitel und Lösungen für einige Aktivitäten gestartet. Sie finden diese Materialien - und leisten Sie einen Beitrag dazu - unter http://www.bitbybitbook.com.