2.3.2.2 Helezina

Enpresen eta gobernuen Datu zaila da ikertzaile sartzeko dira.

2014ko maiatzean, US National Security Agenda datuak zentro bat landa Utah direla, Adimen Erkidegoko Integrala Ziber Nazionala Initiative Data Center baldar izen bat du ireki. Hala ere, datu-zentro hau, eta horrek Utah Data Center bezala ezaguna iritsi da, du da harrigarria gaitasunak izatea. txosten batek salatu Utah Data Center duten gordetzeko eta komunikazio modu guztiak "emailak edukia pribatuan osoa, telefono deiak, eta Google bilaketak barne, baita datu pertsonalak ibilbide-parking ordainagiri, bidaia ibilbide mota guztiak prozesatu ahal da , liburu-denda erosketak, eta beste digital `poltsikoan zaborrik '" (Bamford 2012) . Datu big harrapatu informazioa, eta horrek gehiago beherago azalduko dira askoz izaera sentikorra buruzko raising kezka gain, Utah Data Center datuak iturri aberatsa dela ikertzaile eskuraezinak adibide muturreko bat da. Orokorkiago, big datuak iturri asko erabilgarria izango litzateke ikertzaile kontrolatu eta gobernuek (adibidez, zerga datuen eta hezkuntza datuak) eta enpresek mugatuta daude (adibidez, bilatu kontsultak motor eta telefono dei meta-datuak). Beraz, datu horiek ezin izango dira berehala ikertzaileen eskura unibertsitateetan, eta gehienak ez dira, nahiz eta gobernuek edo enpresek ere ikertzaileen eskura izan.

Nire esperientzia, unibertsitateetan oinarritutako ikertzaile asko helezintasun honen testua ondo ulertu. Datu hauek ez dira eskuraezinak enpresek eta gobernuek at pertsona ergelak, alferra, edo uncaring daudelako. Izan ere, ez dira larriak legal, tekniko, enpresa, eta oztopoak etiko datuak sarbidea eragozten duten. Adibidez, terms-of-zerbitzu webgune akordioak batzuk datuen langile erabiliko duen edo zerbitzua hobetzeko bakarrik baimendu. Beraz, datuak partekatzeko zenbait forma enpresek busti lezake bezeroen demanden zilegia da. Badira ere enpresa nabarmenak partekatzea datuak inplikatutako enpresei arriskuak. Saiatu nola publikoari bilaketa pertsonala datuak ustekabean bada leaked out Google unibertsitateko ikerketa proiektu baten parte gisa erantzuteko imajinatzea. Horrelako datuak ez betetzeagatik, muturreko bada, nahiz eta agian enpresaren arrisku existentzial bat izan. Beraz, Google-eta gehien handiak oso arrisku-averse ikertzaile batekin partekatzen buruz enpresak-an.

Izan ere, ia denek duten jarrera bat da, kopuru handiak eskuratzeko aukera eskaintzea datuak Abdur Chowdhury istorioa daki. 2006 urtean, AOL ikerketa-burua izan zen, nahita kaleratu zuen zer anonimoki ziren bilaketa-kontsultak 650.000 AOL ikerketa komunitateari erabiltzaileen pentsatu zuen. Orain arte bezala esan dudan bezala, Chowdhury eta AOL ikertzaileek asmo ona izan eta hori datuak anonimoki izan zutela uste zuten. Baina, oker ziren. Azkar aurkitu zuten hori datuak ez ziren anonimo ikertzaileek pentsatu bezala, eta New York Times erreportari pertsona identifikatzeko multzoaren ere erraztasunez gai izan ziren (Barbaro and Zeller Jr 2006) . Behin arazo hauek aurkitu ziren, Chowdhury AOL web orritik datuak kendu, baina beranduegi zen. Datu hauek izan dira beste webgune birbidali, eta berau izango da ziurrenik jarraituko dute liburu hau irakurtzen ari zaren. Bere saiakera ikerketa komunitatearekin datuak partekatzeko delako, Chowdhury bota, eta AOL-en buruzagi teknologia ofizial dimisioa (Hafner 2006) . Adibide honek erakusten duen bezala, pertsona jakin enpresen datuak sarbidea errazteko barruan onurak nahiko txikiak dira eta kasurik txarrenean terrible da.

Ikerketa daiteke, ordea, datuak sartzeko erabiltzen da, publiko orokorrari eskuraezinak irabazteko. Gobernuek duten ikertzaile sarbidea eskatzeko jarraitu ahal prozedurak, eta adibide geroago Atal honetan bezala, ikertzaileek noizean behin korporazio datuak sar daiteke. Adibidez, Einav et al. (2015) eBay ikertzailea arrasto digitala aztertzeko online enkanteak elkartu ziren. Ikerketaren geroago kapituluan (2.4.3.2 atala) lankidetza horretatik zetorren buruz gehiago hitz egingo dut, baina orain aipatu dut osagai guztiak ikusi nuen lankidetzak arrakasta ere lau izan delako: ikertzaileak interes, ikertzaile gaitasuna, enpresaren interesa, eta enpresa gaitasuna. Beste era batera esanda, Einav eta lankide izan ziren interesa eta online enkanteak ikertzeko gai. Eta, eBay ere izan zen. Hala ere, ikusi dut askotan posible lankidetza huts bai ikertzailearen edo enpresa osagai hauetako bat falta izan delako.

Zara lankidetza bat garatzeko enpresa batekin, ordea gai badut ere, ez duzu downsides batzuk dira. Lehenengoa, galdera litekeena da mugatzen dituzten datuekin duzula eskatu daiteke; enpresek nekez ikerketa hori txarra itxura horiek ezin baimendu dira. Bigarren, ziurrenik izango duzu ez beste ikertzaileek, eta horrek esan nahi du, beste ikertzaileek ezin izango dira egiaztatu eta emaitzak zabaltzeko gai zure datuak partekatu ahal izateko. Aurrerago, kolaborazio horiek gutxienez interes, non jendeak zure emaitzak, zure lankidetzak eraginda ari dela pentsa dezakete gatazka baten itxura sortu dezakezu. downsides horiek guztiak jorratzen daiteke, baina garrantzitsua da argi izan behar dela, ez da guztion eskura datuekin lan hori bai upsides eta downsides izan.

Laburbilduz, datuak handi asko ikertzaile eskuraezinak da. Badira larriak legal, tekniko, enpresa, eta oztopoak etiko datuak sarbidea eragozten duten, eta oztopo horiek ez irteteko. Gobernuek, oro har, ezarri dituzte, datu sarbidea ahalbidetzen prozedurak, baina prozesua izan daiteke gehiago ad hoc egoera eta tokiko mailetan. Era berean, zenbait kasutan, ikertzaileek ahal enpresekin bazkide datuak sarbidea lortzeko, baina hau ikertzaileentzat arazo ezberdinak sor dezake.