2.5 Konklusyon

Big data ay lahat ng dako, ngunit ang paggamit nito at iba pang anyo ng pagmamatyag ng data para sa mga social pananaliksik ay mahirap. Sa aking karanasan doon ay isang bagay tulad ng isang walang libreng tanghalian ari-arian para sa pananaliksik: kung hindi mo na ilagay sa isang pulutong ng mga trabaho sa pagkolekta ng data, at pagkatapos ay marahil ikaw ay pagpunta sa may sa ilagay sa isang pulutong ng mga trabaho ng pagsusuri ng iyong data o sa pag-iisip tungkol kung ano ang sa isang nakawiwiling katanungan na magtanong ng data. Batay sa mga ideya sa kabanatang ito, sa tingin ko na may mga tatlong pangunahing mga paraan na malaki pinagkukunan ng data ay magiging pinaka-mahalagang para sa mga social pananaliksik:

  • empirically adjudicating sa pagitan ng kakumpetensyang panteorya paghuhula. Mga halimbawa ng ganitong uri ng trabaho ay kinabibilangan ng Farber (2015) (New York Taxi driver) at King, Pan, and Roberts (2013) (Censorship sa Tsina)
  • pinabuting mga social pagsukat para sa patakaran sa pamamagitan nowcasting. Ang isang halimbawa ng ganitong uri ng trabaho ay Ginsberg et al. (2009) (Google Flu Trends).
  • estimating pananahilan epekto sa natural na mga eksperimento at matching. Mga halimbawa ng ganitong uri ng trabaho. Mas and Moretti (2009) (peer epekto sa pagiging produktibo) at Einav et al. (2015) (epekto ng panimulang presyo sa auction sa eBay).

Maraming mga mahahalagang katanungan sa social pananaliksik ay maaaring ipinahayag bilang isa sa mga tatlong. Subalit, ang mga pamamaraang sa pangkalahatan ay nangangailangan mananaliksik upang magdala ng maraming sa data. Ano ang pagkaiba ng Farber (2015) na interesante ay ang manilay-nilay pag-uudyok para sa pagsukat. Ito panteorya pagganyak ay mula sa labas ng data. Kaya, para sa mga taong ang mga magandang sa humihingi ng ilang mga uri ng mga katanungan pananaliksik, malaking pinagkukunan ng data ay maaaring maging lubhang kapaki-pakinabang.

Sa wakas, sa halip na teorya-driven empirical pananaliksik (na kung saan ay ang focus sa kabanatang ito), maaari naming i-flip ang script at lumikha empirically-driven theorizing. Iyon ay, sa pamamagitan ng maingat na akumulasyon ng mula sa obserbasyon katotohanan, pattern, at mga palaisipan, maaari naming bumuo ng mga bagong theories.

Ito alternatibo, data-unang diskarte sa teorya ay hindi bago, at ito ay pinaka-papilit articulated sa pamamagitan Glaser and Strauss (1967) sa kanilang mga tawag para sa grawnded teorya. Ito data-unang diskarte, gayunpaman, ay hindi nagpapahiwatig "sa dulo ng teorya," bilang ay inaangkin ng marami ng journalism sa paligid ng pananaliksik sa mga digital na edad (Anderson 2008) . Sa halip, bilang ang data ng mga pagbabago sa kapaligiran, kailangan naming umasa sa isang re-balancing sa relasyon sa pagitan ng teorya at data. Sa isang mundo kung saan pagkolekta ng data ay mahal, ito ang akma upang mangolekta lamang ang data na theories magmungkahi ang magiging pinaka-kapaki-pakinabang. Ngunit, sa isang mundo kung saan malaking halaga ng data ay magagamit para sa libre, ito ang akma na ring subukan ang isang data-unang diskarte (Goldberg 2015) .

Bilang ako ay may ipinapakita sa kabanatang ito, mga mananaliksik ay maaaring malaman ng isang pulutong sa pamamagitan ng panonood ng mga tao. Sa susunod na tatlong kabanata, makikita ko ilarawan kung paano namin maaaring matuto nang higit pa at iba't ibang mga bagay-bagay kung maiangkop namin ang aming data collection at makihalubilo sa mga tao mas direkta sa pamamagitan ng pagtatanong sa kanila na katanungan (kabanata 3), tumatakbo eksperimento (kabanata 4), at kahit kinasasangkutan ng mga ito sa proseso ng pananaliksik direkta (kabanata 5).