2.5 Konkludo

Big data ĉie, sed uzas ĝin kaj aliajn formojn de observaj datumoj por sociaj esploroj estas malfacila. En mia sperto estas io kiel neniu libera lunĉo proprieto por esplorado: se vi ne metas en multa laboro kolekti datumojn, tiam vi probable tuj devos meti en multa laboro analizanta viajn datumojn aŭ en pensante pri kio estas en interesa demando demandi de la datumoj. Bazita sur la ideoj de tiu ĉapitro, mi kredas ke estas tri ĉefaj manieroj kiuj grandaj datumoj fontoj estos plej valoraj por sociaj esploroj:

  • empirie adjudicating inter konkurantaj teoriaj antaŭdiroj. Ekzemploj de ĉi tiu speco de laboro inkludas Farber (2015) (Novjorko Taksiistoj) kaj King, Pan, and Roberts (2013) (Cenzuro en Ĉinio)
  • plibonigita socia mezurado por politiko tra nowcasting. Ekzemplo de ĉi tiu tipo de laboro estas Ginsberg et al. (2009) (Google Flu Trends).
  • taksanta kaŭza efektoj kun natura eksperimentoj kaj trafaj. Ekzemploj de ĉi tiu tipo de laboro. Mas and Moretti (2009) (fiksrigardi efikoj sur productividad) kaj Einav et al. (2015) (efekto de komenca prezo sur aŭkcioj ĉe eBay).

Multaj gravaj demandoj en socia esploro povus esti esprimita kiel unu el tiuj tri. Tamen, tiuj aliroj ĝenerale postulas esploristoj alporti tre al la datumoj. Kion faras Farber (2015) interesa estas la teoria motivado por la mezurado. Tiu teoria instigo venas de ekster la datumoj. Tiel, Por tiuj kiu estas bonkapabla pri petante iujn tipojn de esplorado demandoj, grandaj datumoj fontoj povas esti tre fruktodona.

Fine, anstataŭ teorio tirataj empiriaj esploroj (kiuj estis la fokuso sur tiu ĉapitro), ni povas klaki la skripto kaj krei empirie tirataj teorización. Kiu, tra la zorgema amasiĝo de empiriaj faktoj, ŝablonoj kaj enigmoj, ni povas konstrui novajn teoriojn.

Tiu alternativo, datumoj-unua alproksimiĝo al teorio ne estas nova, kaj ĝi estis plej forte artikitaj de Glaser and Strauss (1967) kun lia nomita por fundamentita teorio. Tiu datumo-unua alproksimiĝo tamen ne implicas "la fino de teorio," kiel estis postulita fare multe de la ĵurnalismo ĉirkaŭ esploron en la cifereca erao (Anderson 2008) . Prefere, kiel la datumoj medio ŝanĝojn, ni devas atendi re-balancadon en la rilato inter teorio kaj datumoj. En mondo kie datenkolektado estis multekosta, ĝi havas sencon nur kolekti la datumojn kiuj teorioj sugestas estos la plej utila. Sed, en mondo kie enormajn kvantojn de datumoj estas jam disponebla senpage, ĝi havas sencon ankaŭ provi datumoj-unua alproksimiĝo (Goldberg 2015) .

Kiel mi montris en ĉi tiu ĉapitro, esploristoj povas lerni tre de rigardanta homojn. En la sekvaj tri ĉapitroj, mi priskribus kiel ni povas lerni pli kaj malsamaj aferoj se ni adapti niajn datenkolektado kaj interagi kun homoj pli rekte por demandi al ili demandojn (Ĉapitro 3), kurante eksperimentoj (Ĉapitro 4), kaj eĉ engaĝante ilin en la esploro procezo rekte (Ĉapitro 5).