2.5 Conclusie

Big data is overal, maar het gebruik ervan en andere vormen van observationele gegevens voor sociaal-wetenschappelijk onderzoek is moeilijk. In mijn ervaring is er zoiets als een gratis lunch geen onroerend goed onderzoek: als je niet in een hoop werk het verzamelen van gegevens zet doen, dan bent u waarschijnlijk gaat te hebben in een hoop werk analyseren van uw gegevens of in het denken over te zetten wat in een interessante vraag te stellen van de data. Op basis van de ideeën in dit hoofdstuk, ik denk dat er drie belangrijke manieren die grote gegevensbronnen het meest waardevol voor sociaal-wetenschappelijk onderzoek zijn:

  • empirisch rechtsprekende tussen concurrerende theoretische voorspellingen. Voorbeelden van dit soort werk omvatten Farber (2015) (New York Taxichauffeurs) en King, Pan, and Roberts (2013) (Censuur in China)
  • betere sociale meting voor het beleid door middel van nowcasting. Een voorbeeld van dit soort werk Ginsberg et al. (2009) (Google Flu Trends).
  • het schatten van causale effecten met natuurlijke experimenten en matching. Voorbeelden van dit soort werk. Mas and Moretti (2009) (peer-effect op de productiviteit) en Einav et al. (2015) (effect van de startprijs op veilingen op eBay).

Veel belangrijke vragen in het sociaal-wetenschappelijk onderzoek kan worden uitgedrukt als een van deze drie. Echter, deze methoden vereisen meestal veel onderzoekers om de gegevens te brengen. Wat Farber (2015) interessant is de theoretische motivatie voor de meting. Deze theoretische motivatie komt van buiten de gegevens. Dus, voor degenen die goed zijn in te vragen bepaalde soorten onderzoek vragen, big data bronnen kan zeer vruchtbaar zijn.

Tot slot, in plaats van theorie-driven empirisch onderzoek (waarin de focus op dit hoofdstuk is geweest), kunnen we het script spiegelen en het creëren van empirisch-driven theoretiseren. Dat wil zeggen, door de zorgvuldige opbouw van empirische feiten, patronen, en puzzels, kunnen we nieuwe theorieën te bouwen.

Dit alternatief, data-first aanpak van de theorie is niet nieuw, en het was het meest krachtig verwoord door Glaser and Strauss (1967) met hun roep om grounded theorie. Deze data-eerste benadering echter niet betekent "eind theorie" zoals door veel van de journalistiek rond onderzoek in het digitale tijdperk volgens (Anderson 2008) . Integendeel, als de gegevens omgeving verandert, moeten we een nieuw evenwicht in de relatie tussen theorie en data verwachten. In een wereld waar het verzamelen van gegevens was duur, is het zinvol om alleen de gegevens die theorieën suggereren de meest nuttig zijn te verzamelen. Maar in een wereld waar enorme hoeveelheden gegevens zijn reeds beschikbaar voor gratis, is het zinvol om ook proberen een data-eerste benadering (Goldberg 2015) .

Zoals ik in dit hoofdstuk hebben laten zien, kunnen onderzoekers veel leren door te kijken naar de mensen. In de volgende drie hoofdstukken, zal ik beschrijven hoe we meer en andere dingen kunnen leren als we stemmen onze gegevens verzamelen en te communiceren met de mensen meer rechtstreeks vragen te stellen (hoofdstuk 3), het uitvoeren van experimenten (hoofdstuk 4), en zelfs hen te betrekken in het onderzoeksproces direct (hoofdstuk 5).