2.2 Big nga data

Big datos sa gibuhat ug nga nakolekta sa mga gobyerno alang sa mga katuyoan sa uban nga kay sa research. Pinaagi sa paggamit niini nga mga datos alang sa research, Busa, nagkinahanglan repurposing.

Usa ka gipakaaydol panglantaw sa social research gihanduraw ang usa ka siyentista nga may usa ka ideya ug dayon sa pagkolekta sa data sa pagsulay nga ideya. Kini nga estilo sa research modala ngadto sa usa ka hugot nga angay sa taliwala sa research pangutana ug impormasyon, apan kini mao ang limitado tungod kay sa usa ka indibidwal nga tigdukiduki sa kasagaran dili sa mga kapanguhaan nga gikinahanglan sa pagkolekta sa mga datos nga ilang gikinahanglan, sama sa dako, dato, ug sa nasud-representante sa data. Busa, sa usa ka daghan sa social research sa nangagi nga gigamit sa dako nga-scale sosyal nga survey, sama sa General Social Survey (GSS), ang American National Election sa Pagtuon (ANES), ug Panel Pagtuon sa Income Dynamics (PSID). Kini nga mga dako nga-scale survey sa kinatibuk modagan sa usa ka grupo sa mga tigdukiduki ug sila gidisenyo sa paghimo sa data nga mahimong gamiton sa daghang mga tigdukiduki. Tungod sa mga tumong niini nga mga dako nga-scale survey, dakung pag-atiman ang gibutang sa pagdesinyo sa koleksyon data ug sa pag-andam sa mga resulta sa mga datos alang sa paggamit sa mga tigdukiduki. Kini nga mga data sa mga tigdukiduki ug alang sa mga tigdukiduki.

Kadaghanan sa mga social research gamit ang digital tinubdan edad, bisan pa niana, mao ang lahi. Imbes nga sa paggamit sa data nga nakolekta sa mga tigdukiduki, ug alang sa mga tigdukiduki, kini naggamit tinubdan sa data nga gibuhat ug nakolekta sa mga negosyo ug mga gobyerno alang sa ilang kaugalingong mga katuyoan sama sa paghimo sa usa ka kapuslanan, sa paghatag sa usa ka pag-alagad, o sa pagpangalagad sa usa ka balaod. Kini nga mga negosyo ug sa gobyerno tinubdan sa data mianhi sa gitawag nga dagkong mga data. Ang pagbuhat sa research sa dagkong mga datos lahi kay sa pagbuhat sa research sa mga datos nga sa sinugdan alang sa research. Itandi, alang sa panig-ingnan, usa ka social media website, sama sa Twitter, uban sa usa ka tradisyonal nga opinyon sa publiko survey sama sa General Social Survey (GSS). nag-unang mga tumong sa Twitter ang mga sa paghatag og usa ka pag-alagad sa mga tiggamit niini ug sa paghimo sa usa ka kapuslanan. Sa proseso sa pagkab-ot niini nga mga tumong, Twitter nagmugna sa data nga mahimong mapuslanon alang sa pagtuon sa pipila ka bahin sa opinyon sa publiko. Apan, dili sama sa General Social Survey (GSS), Twitter dili una sa naka-focus sa social research.

Ang termino dako nga data frustratingly klaro, ug kini nga mga grupo sa tingub sa daghang lain-laing mga butang. Kay ang mga katuyoan sa social research, sa akong hunahuna nga kini mao ang makatabang sa pag-ila tali sa duha ka matang sa dagkong tinubdan sa data. Gobyerno rekord sa administratibo ug negosyo rekord sa administratibo nga Government administratibo nga mga talaan ang mga data nga gibuhat man sa mga gobyerno ingong bahin sa ilang naandan nga mga kalihokan. Kini nga mga matang sa mga talaan nga gigamit sa mga tigdukiduki sa nangagi-sama sa demograpo pagtuon sa pagkatawo, kaminyoon, ug kamatayon mga rekord-apan mga gobyerno mas pagkolekta ug pagpagawas detalyado nga mga rekord sa analyzable mga porma. Kay sa panig-ingnan, ang gobyerno sa New York City-instalar digital metros sa sulod sa matag taxi sa siyudad. Kini nga mga metros pagrekord sa tanan nga mga matang sa mga impormasyon mahitungod sa matag biyahe sa taxi lakip na ang drayber, ang panahon sa pagsugod ug lugar, ang paghunong sa panahon ug dapit, ug ang pamasahe. Sa usa ka pagtuon nga sultihan ko sa ulahi sa niini nga kapitulo, si Henry Farber (2015) repurposed niini nga mga data sa pagsulbad sa usa ka hinungdanong debate sa labor economics mahitungod sa relasyon tali sa hourly suhol ug ang gidaghanon sa mga oras nagtrabaho.

Ang ikaduha nga nag-unang matang sa dako nga datos alang sa sosyal nga research mao ang negosyo sa mga rekord administratibo. Kini mao ang mga data nga negosyo sa paghimo ug sa pagkolekta sa ingon nga bahin sa ilang naandan nga mga kalihokan. Kini nga mga negosyo rekord sa administratibo nga sagad gitawag nga digital mga timailhan, ug naglakip sa mga butang sama sa pangutana logs search engine, sa social media haligi, ug sa pagtawag sa mga rekord gikan sa mobile phone. Kritikal, kini nga mga negosyo nga mga rekord administratibo dili lang mahitungod sa online nga kinaiya. Kay sa panig-ingnan, tindahan nga paggamit sa check-gikan sa scanner ang pagmugna sa tinuod nga-time nga mga lakang sa worker sa produksyon. Sa usa ka pagtuon nga ako mosulti kaninyo mahitungod sa ulahi niini nga kapitulo, si Alexandre Mas ug Enrico Moretti (2009) repurposed niini nga supermarket check-gikan sa mga data sa pagtuon kon sa unsang paagi sa produksyon sa usa ka mamumuo ang epekto sa produksyon sa ilang mga higala.

Ingon nga ang duha niini nga mga panig-ingnan-ilustrar, ang ideya sa repurposing sukaranan sa pagkat-on gikan sa daku nga impormasyon. Sa akong kasinatian, sa sosyal nga mga siyentipiko ug data siyentipiko moduol niini nga repurposing kaayo sa lahi nga paagi. Social siyentipiko, nga naanad sa pagtrabaho uban sa mga datos nga gidisenyo alang sa research, dali sa pagtudlo sa mga problema uban sa repurposed nga data samtang wala magtagad sa iyang mga kalig-on. Sa laing bahin, data siyentipiko dali sa pagtudlo sa mga benepisyo sa repurposed nga data samtang wala magtagad sa iyang mga kahuyang. Natural lang, ang labing maayo nga nga paagi nga ang usa ka hybrid. Nga mao, ang mga tigdukiduki kinahanglan nga makasabut sa kinaiya sa niini nga mga bag-o nga mga tinubdan sa data-maayo ug dautan-ug dayon sulbaron kon unsaon sa pagkat-on gikan kanila. Ug, nga mao ang plano alang sa nahibilin sa niini nga kapitulo. Sunod, ako paghulagway sa napulo ka komon nga mga kinaiya sa negosyo ug sa gobyerno administratibo nga data. Human niana, ako paghulagway sa tulo ka pamaagi sa panukiduki nga mahimong gamiton uban sa niini nga mga data, mga pamaagi nga maayo ang angay sa mga kinaiya sa niini nga mga data.