2.2 Big datuak

Big datuak sortzen dira eta gobernuek bildutako ikerketa baino beste helburuetarako. Datu hau erabiliz ikerketa egiteko, beraz, repurposing eskatzen.

ikerketa sozialaren ikuspegi idealizatua An zientzialaria ideia bat izatea eta, ondoren, ideia hori probatzeko datuak biltzeko imajinatzen. ikerketa estilo hori ikerketa-galdera eta datuak arteko fit estu bat dakar, baina mugatua delako banakako ikertzaile askotan ez dute behar diren datuak, besteak beste, datu handiak, aberatsak, eta nazio-ordezkari gisa biltzeko beharrezko baliabideak. Hori dela eta, ikerketa sozial iraganean asko erabili ditu eskala handiko gizarte inkestak, hala nola, Gizarte Inkesta General (GSS), American National Hauteskunde Study (ANES), eta Panel Study Errenta Dinamika (PSID) gisa. eskala handiko Inkesta hauek, oro har ikertzaile-talde bat zuzentzen du eta hori ikertzaile askok erabil daiteke datuak sortzeko diseinatuta daude. eskala handiko Inkesta horiek helburuetako denez, kontu handia da datu bilketa diseinatzen eta sortutako datu prestatzen erabiltzeko ikertzaileek jarri. Datuok ikertzaileek eta ikertzaileentzat dira.

gizarte ikerketa gehienek adin digital iturri erabiliz, ordea, erabat ezberdintzen da. Horren ordez ikertzaileek eta ikertzaileek bildutako datuak erabiliz, sortu eta enpresen eta gobernuen bildutako bere hala nola, irabaziak egiteko, zerbitzua emateko, edo lege bat administratzeko bezala helburu propioa ziren datu-iturri erabiltzen ditu. Enpresa eta gobernu datuak iturri horiek Etorri big datuak deitu behar da. ikerketa Baliteke datuak big zen jatorriz ikerketa sortutako datuak dituzten ikerketa egiten baino desberdina da. Konparatu, adibidez, a social media webgune, Twitter, adibidez, hala nola, Gizarte Inkesta General (GSS) gisa iritzi publikoa inkestaren tradizional batekin. Twitter-en helburu nagusiak hauek dira bere erabiltzaileei zerbitzu bat eskaintzea eta irabazi egin behar. Helburu horiek lortzeko prozesuan, Twitter, iritzi publikoari zenbait alderdi aztertzeko baliagarria izan liteke datuak sortzen. Baina, Gizarte Inkesta General (GSS) ez bezala, Twitter ez da nagusiki ikerketa sozial baten mesedetan.

Epe big datuak frustratingly vague, eta hainbat gauza elkarrekin talde hura. Gizarte ikerketaren helburuetarako, uste dut lagungarria bi datu iturri big mota bereiziko da:. Gobernu erregistro administratiboak eta enpresa erregistro administratiboak Jaurlaritzako erregistro administratiboak direla haien ohiko jarduera zati gobernuek sortutako datuak. Erregistro mota horiek aukeratu dituzte ikertzaileek erabilitako iragan-hala nola, jaiotza, ezkontza, heriotza eta erregistro-baina gobernuek gero eta gehiago dira biltzeko eta erregistro zehatza askatuz forma analizagarria ikasten demografo bezala. Esate baterako, New York City gobernuak Hiriko taxi bakoitzaren barruan metro digital instalatu. metro hauek taxi ride bakoitzaren gidaria, ordua eta kokapena, geldialdia denbora eta kokapena, eta tarifa barne buruzko datu-mota guztiak grabatzeko. Azterketa bat geroago esango dizut kapitulu honetan ere, Henry Farber (2015) repurposed datu horiek soldatak hourly eta lan egindako ordu kopuruaren arteko harremanari buruzko lan-ekonomia funtsezko eztabaida bat aurre egiteko.

The big datuak Bigarren mota nagusiak ikerketa sozialerako enpresa erregistro administratiboak da. Hauek dira enpresa sortu eta biltzeko bere jarduera errutina zati gisa datuak. Enpresa erregistro administratibo hauek dira sarritan aztarnak digital, eta bilatzailea kontsulta egunkariak, social media mezu bezalako gauzak, eta dei erregistroak, telefono mugikorrean. Kritikoan, enpresa administrazio-erregistro horiek ez dira online portaera buruz. Esate baterako, check-out eskanerra erabiltzen dituzten dendak dira denbora errealean, langilearen produktibitatea neurriak sortzeko. Azterketa bat duzula dut kapitulu honetan geroago buruz esango ere, Alexandre Mas eta Enrico Moretti (2009) repurposed supermerkatu honetan check-out datuak nola langileen produktibitatea da beren kideekin produktibitatea eragin aztertzeko.

Adibide horiek biak ilustratzeko bezala, repurposing ideia datuak big ikastea funtsezkoa da. Nire esperientzia, gizarte zientzialari eta datuak zientzialari honek oso modu ezberdinean repurposing hurbiltzeko. Gizarte zientzialariek, nor ikerketa diseinatu datuekin lan egiten ohituak, azkarra izango repurposed datuak dituzten arazoak bitartean jaramonik bere indarguneak dira. Bestalde, datuak zientzialari azkarra izango repurposed datuak onurak bitartean jaramonik bere ahuleziak dira. Jakina, onena hurbilketa hibrido bat izango litzateke. Hau da, ikertzaile datuak-bai onak eta txarrak-eta, ondoren, irudikatu nola haiengandik ikasteko iturri berri horien ezaugarriak ulertu behar. Eta, atal honetako gainerako plana da. Hurrengoa, hamar enpresa eta gobernu administrazio-datuak, ezaugarri komunak azalduko dut. Ondoren, datu horiek, planteamendu hori ongi datuak honen ezaugarrietara egokitzen dira erabili ahal izango dira hiru ikerketa ikuspegiak azalduko dut.