2.1 Sarrera

analogikoa aroan, datuak jaso portaera-nork zer denean-zen garestia, eta, beraz, nahiko arraroa. Orain, aro digitalean, milioika pertsonak portaerak erregistratzen dira, gordeta, eta analizagarria. Adibidez, aldi bakoitzean klik eginez gero, webgune batean, zure telefono dei bat egiteko, edo zure kreditu-txartelarekin zerbait ordaindu, zure portaera erregistro digitala sortzen da eta enpresa bat gordetzen. Datu horiek delako pertsonen eguneko ekintzak behin-produktu bat dira, sarritan deitzen aztarnak digital. enpresek ospatu aztarnak horiez gain, gobernuek ere izan bai pertsona eta enpresei buruzko datuak oso aberatsa da, hau da, askotan, digitalizatu eta analizagarria datuak. Together enpresa eta gobernu erregistro horiek sarritan big datuak deitzen dira.

inoiz-goranzko datuak big uholde esan nahi du mundu batetik bestera pasatu non jokabide datuak mundu bat non jokabide datuak ugaria den urriak zen. Baina, mota datu horiek nahiko berriak dira, zeren, ikerketa-kopuru bat Penagarria horiek erabiliz zientzialari blindly eskuragarri datuak ohitura itxura. Kapitulu honetan, ordez, printzipio hurbilketa bat eskaintzen du datu iturri ezberdinak ulertzeko eta nola erabili ahal izango dute. aberatsagoa ulertzeko Hau zure ikerketa galdera hobeto dator datu-iturri egokia den lagunduko luke. Edo, esaterako iturri falta bada, konbentzitu zeure datuak biltzeko ideiak erabiliz etorkizunean kapituluetan.

Datu big ikasten den lehen urratsa da datuen kategoria zabalago bat izan da ikerketa gizarte erabilitako urte askotan parte dela konturatzen den: behaketa-datuak. Gutxi gorabehera, behaketa-datuak duten gizarte sistema bat errespetatuz nolabait esku hartzeko beharrik gabe ateratzen den edozein datu da. modu gordin pentsatu da behaketa-datuak erabiltzen ez duen jende-(adibidez, inkestak, 3. kapituluko gaia) edo pertsonen inguruneak (adibidez, esperimentuak, 4. kapituluko gaia) aldatzen hizketan dena da. Horrela, enpresa eta gobernu erregistro gain, behaketa-datuak ere iritzi artikuluak eta satelite bidezko argazkiak testuan bezalako gauzak dira.

Kapitulu honek hiru zati ditu. Lehenengoa, 2.2 atalean, big datuak azalduko ditut xehetasun gehiago eta, eta hori, oro har, izan da ikerketa gizarte iraganean erabilitako datuen arteko aldea funtsezko bat argitzeko. Ondoren, 2.3 atalean, hamar datuak iturri big ezaugarri komunak azalduko ditut. ezaugarri horiek ulertzea ahalbidetzen digu azkar aitortu indarguneak eta dauden iturri ahuleziak eta hori etorkizunean sortuko iturri berriak ustiatzeko lagunduko digute. kontatuta gauzak, aurreikuspena gauzak, eta esperimentu bat hurbiltzen: Azkenik, 2.4 atalean, hori datuak behaketa ikasteko erabili ahal izango dituzu hiru nagusia ikerketa estrategiak azalduko ditut.