2.5 Konklúzje

Big gegevens is oeral, mar mei help fan it en oare foarmen fan feiten 't waarnimming foar sosjale ûndersyk is dreech. Yn myn ûnderfining is der wat as in gjin frije lunch eigendom foar ûndersyk: as jo net yn in soad wurk it sammeljen fan gegevens, dan binne jo nei alle gedachten gean om te setten yn in soad wurk it analysearjen fan jo gegevens of yn it tinken oer wat is yn in ynteressante fraach om freegje fan 'e gegevens. Basearre op de ideeën yn dit haadstik, ik tink dat der trije wichtichste wizen dat grutte gegevens boarnen sille wêze meast weardefol foar sosjale ûndersyk:

empirically adjudicating tusken konkurrearjende teoretyske foarsizzings. Foarbylden fan dit soarte fan wurk binne Farber (2015) (New York Taxi drivers) en King, Pan, and Roberts (2013) (sensuer yn Sina)
ferbettere sosjale mjitting foar belied fia nowcasting. In foarbyld fan dit soarte fan wurk is Ginsberg et al. (2009) (Google Flu Trends).
rûzing kausale effekten mei natuerlike eksperiminten en bypassende. Foarbylden fan dit soarte fan wurk. Mas and Moretti (2009) (peer effekten op produktiviteit) en Einav et al. (2015) (effekt fan begjinpunt priis op ferkeapingen by eBay).

In protte wichtige fragen yn sosjale ûndersyk koe wurde útdrukt as ien fan dizze trije. Mar, dizze oanpak algemien nedich ûndersikers te bringen in soad oan 'e gegevens. Wat makket Farber (2015) nijsgjirrich is de teoretyske motivaasje foar de mjitting. Dit teoretyske motivaasje komt fan bûten de gegevens. Sa, foar dyjingen dy't goed by freegjen beskate soarten ûndersyk fragen, grutte gegevens boarnen kin wêze tige fruchtber.

Ta beslút, earder as teory-dreaun empirysk ûndersyk (dat hat west de fokus op dit haadstik), kinne wy flip it skript en meitsje empirically-oandreaune theorizing. Dat is, troch it soarchfâldige opgarjen fan empiryske feiten, patroanen, en puzels, kinne wy bouwe nije teoryen.

Dit alternatyf, data-earste oanpak fan teory is net nij, en dat wie it meast krêftich ûnder wurden brocht troch Glaser and Strauss (1967) mei har oprop foar grûn teory. Dizze data-earste oanpak, lykwols, hat net automatysk "de ein fan teory," sa't is opeaske troch in grut part fan de sjoernalistyk om ûndersyk yn de digitale leeftyd (Anderson 2008) . Leaver, as de gegevens omjouwing feroaret, wy moatte ferwachtsje in re-balancing yn 'e relaasje tusken teory en gegevens. Yn in wrâld dêr't gegevens samling wie djoer, it makket sin om allinne sammelje de gegevens dy't teoryen suggest sil wêze it meast brûkber. Mar, yn in wrâld dêr't enoarme bedraggen fan gegevens binne al beskikber fergees, it makket sin om ek besykje in data-earste oanpak (Goldberg 2015) .

As ik sjen litten yn dit haadstik, ûndersikers kinne leare in soad by watching minsken. Yn de folgjende trije haadstikken, ik beskriuwe hoe't wy kinne leare mear en oare dingen as wy ôfstimme ús gegevens kolleksje en ynteraksje mei minsken mear direkt troch freegjen harren fragen (haadstik 3), running eksperiminten (haadstik 4), en sels wêrby't se yn it ûndersyk proses direkt (haadstik 5).