2.3.2.2 անհասանելի

Տվյալների կողմից անցկացված բիզնեսների եւ կառավարությունների են դժվար է հետազոտողները մուտք գործել:

2014 թ. Մայիսին, իսկ ԱՄՆ Ազգային անվտանգության օրակարգի բացել է տվյալների կենտրոն գյուղական Յուտայում, որ ունի անհարմար անունը, հետախուզական համապարփակ ազգային Cybersecurity նախաձեռնություն Data Center. Սակայն, այս տվյալները կենտրոն, որը եկել է հայտնի է որպես Յուտայի ​​տվյալների կենտրոնում, հաղորդում է ունենալ ապշեցուցիչ հնարավորությունները. Մեկ զեկույցը պնդում է, որ Յուտա Տվյալների կենտրոն կարող է պահել, եւ մշակել բոլոր ձեւերը կապի, այդ թվում, «ամբողջական բովանդակությունը մասնավոր նամակներով, բջջային հեռախոսազանգերի եւ Google որոնումները, ինչպես նաեւ բոլոր տեսակի անձնական տվյալների արահետներով Ավտոկանգառ մուտքերի, ճանապարհորդական itineraries , գրախանութ գնումները, եւ այլ թվային `գրպանի ծին» » (Bamford 2012) : Ի լրումն մտահոգություն զգայուն շատ տեղեկությունների գրավել մեծ տվյալների, որը պետք է նկարագրված ավելի ցածր է, Յուտա Data Center ծայրահեղ օրինակ է հարուստ տվյալների աղբյուր, որը անհասանելի հետազոտողների. Ընդհանուր առմամբ, շատ աղբյուրներ մեծ տվյալների, որոնք օգտակար կլինի հետազոտողների վերահսկվում են եւ սահմանափակված է կառավարությունների (օրինակ, հարկային տվյալների եւ կրթական տվյալները) եւ ընկերությունների (օրինակ, հարցումներ որոնման շարժիչների եւ հեռախոսազանգ meta տվյալները): Հետեւաբար, այս տվյալները չեն լինի անմիջապես հասանելի է հետազոտողների բուհերում, եւ առավել չի էլ կարող լինել հասանելի է հետազոտողների կառավարությունների կամ կազմակերպությունների:

Իմ փորձից, շատ հետազոտողներ հիմնված համալսարաններում թյուրըմբռնել աղբյուր այս անհասանելիության: Այս տվյալները չեն անհասանելի է, քանի որ մարդիկ ընկերությունների եւ կառավարությունների հիմար, ծույլ կամ ունցարինգ. Փոխարենը, կան լուրջ իրավական, տեխնիկական, բիզնես, եւ էթիկական խոչընդոտներ, որոնք կանխել տվյալների մուտք. Օրինակ, որոշ պայմանները-of-service համաձայնագրեր կայքերում միայն թույլ է տալիս տվյալներ է օգտագործվում է աշխատողների կամ բարելավել ծառայությունը: Այնպես որ, որոշ ձեւեր տվյալների փոխանակման կարող ենթարկում ընկերություններին օրինական դատական ​​հայցերի հաճախորդներին. Կան նաեւ էական բիզնես ռիսկերը զբաղվող ընկերությունների փոխանակման տվյալները: Փորձեք պատկերացնել, թե ինչպես է հասարակությունը կարձագանքի, եթե անձնական խուզարկության տվյալները պատահաբար արտահոսող դուրս Google- ից, որպես հետազոտական ​​ծրագրի. Նման տվյալների խախտում, եթե ծայրահեղ, կարող է լինել նույնիսկ գոյատեւման ռիսկը ընկերության համար: Այնպես որ, Google- ը եւ առավել խոշոր ընկերությունները, շատ ռիսկի հեռացած մասին կիսելու տվյալների հետազոտողների.

Ի դեպ, գրեթե բոլորը, ովքեր ի վիճակի են ապահովել մուտք դեպի մեծ քանակությամբ տվյալների գիտի, պատմությունը Աբդուռ Chowdhury: 2006 թ., Երբ նա եղել է ղեկավար AOL հետազոտությունների, նա միտումնավոր ազատ է արձակվել, թե ինչ է նա կարծում է, եղել չբացահայտվող որոնման հարցումները 650,000 AOL օգտվողներին հետազոտական ​​համայնքին: Որքանով ես կարող եմ ասել, Chowdhury եւ հետազոտողները AOL բարի մտադրություններ, եւ նրանք կարծում էին, որ իրենք անանուն տվյալները. Սակայն, նրանք սխալ: Այն արագ հայտնաբերել են, որ տվյալները չեն եղել, քանի որ անանուն, քանի որ հետազոտողները կարծում էին, եւ լրագրողները են New York Times- ի կարողացան բացահայտել է մարդկանց dataset հետ, հեշտությամբ (Barbaro and Zeller Jr 2006) : Հենց այդ խնդիրները հայտնաբերվել են, Chowdhury հանել տվյալները AOL ի կայքում, սակայն արդեն ուշ էր: Տվյալները էին վստահեցրեց այլ կայքերում, եւ դա հավանաբար դեռ պետք է հասանելի է, երբ դուք կարդում այս գիրքը: Քանի որ իր փորձի կիսել տվյալների հետ գիտահետազոտական ​​համայնքի, Chowdhury էր կրակում, եւ AOL գլխավոր տեխնոլոգ հրաժարական է տվել (Hafner 2006) : Քանի որ այս օրինակը ցույց է տալիս, որ օգուտները կոնկրետ անհատների ներսում ընկերությունների հեշտացնել տվյալների հասանելիությունը են բավականին փոքր է, եւ ամենավատ սցենարն է սարսափելի.

Հետազոտությունը կարող, սակայն, մուտքն տվյալների, որը անհասանելի է հանրությանը: Կառավարությունները պետք է ընթացակարգեր, որոնք հետազոտողները կարող հետեւել է դիմել մուտքի եւ քանի որ օրինակները ավելի ուշ այս գլխի շոուի, հետազոտողները կարող է երբեմն մուտքն կորպորատիվ տվյալների: Օրինակ, Einav et al. (2015) Համագործակցում է գիտաշխատող eBay ուսումնասիրելու թվային հետքերը օնլայն աճուրդների Ես խոսում ավելի մոտ հետազոտության, որ եկել է այդ համագործակցության ավելի ուշ գլխի (բաժին 2.4.3.2), բայց ես նշել այն հիմա, քանի որ այն ունի բոլոր չորս բաղադրիչների, որ ես տեսնում հաջող գործընկերության գիտաշխատող հետաքրքրություն, հետազոտող կարողությամբ, ընկերությունը հետաքրքրությունը, եւ ընկերությունը կարողությունները: Այլ կերպ ասած, Einav եւ գործընկերները հետաքրքրված էին եւ ունակ ուսումնասիրելով առցանց աճուրդների. Եվ, eBay էր նաեւ: Սակայն, ես տեսել եմ շատ հնարավոր համագործակցությունը հաջողվի, քանի որ կամ հետազոտողը կամ ընկերությունը չուներ մեկը այս բաղադրիչների.

Նույնիսկ եթե դուք ի վիճակի են զարգացնել գործընկերային հետ բիզնեսով, սակայն, կան որոշ downsides ձեզ համար. Նախ, այն հարցերը, որոնք դուք կարող եք հարցնել, ինչպես նաեւ տվյալների հետ, ամենայն հավանականությամբ, պետք է սահմանափակվի. ընկերությունները քիչ հավանական է թույլ տալ, հետազոտություն, որը կարող է դարձնել նրանց նայելու վատ. Երկրորդ, դուք, ամենայն հավանականությամբ, չի կարողանա կիսել ձեր տվյալները այլ հետազոտողների, ինչը նշանակում է, որ այլ հետազոտողներ չի կարողանա ստուգել եւ ընդլայնել ձեր արդյունքները. Բացի այդ, այդ համագործակցությունը կարող է ստեղծել առնվազն տեսքը շահերի բախման, որտեղ մարդիկ կարող են մտածել, որ ձեր արդյունքներ են ազդել ձեր գործընկերությունների. Բոլոր այս downsides կարելի է դիմել, բայց դա կարեւոր է, որ պարզ է, որ աշխատում է տվյալները, որոնք հասանելի չեն բոլորին ունեցել երկու upsides եւ downsides.

Ամփոփելով, շատ մեծ տվյալների անհասանելի է հետազոտողների համար: Կան լուրջ իրավական, տեխնիկական, բիզնես, եւ էթիկական խոչընդոտներ, որոնք կանխել տվյալների հասանելիության, եւ այդ արգելքները չի հեռու գնալ: Ազգային կառավարությունները, ընդհանուր առմամբ, պետք է սահմանված կարգով համար բարենպաստ տվյալների հասանելիության, սակայն այդ գործընթացը կարող է լինել ավելի ժամանակավոր է պետական ​​եւ տեղական մակարդակներում: Բացի այդ, որոշ դեպքերում, հետազոտողները կարող գործընկեր կազմակերպությունների հետ ստանալ տվյալների հասանելիության, սակայն դա կարող է ստեղծել մի շարք խնդիրների համար հետազոտողների.