2.3.2.2 Қолжеткізбейді

Бизнес және үкімет өткізетін деректер зерттеушілер қол жеткізу үшін қиын болып табылады.

2014 жылдың мамыр айында, АҚШ-тың ұлттық қауіпсіздік күн тәртібі ебдейсіз аты бар ауылдық Юта деректер орталығы, Intelligence Қауымдастық кешенді Ұлттық Cybersecurity бастамасы деректер орталығы ашылды. Алайда, Юта Data Center ретінде белгілі болуы келді бұл деректер орталығы, керемет мүмкіндіктері бар хабарланады. Бір есеп, Юта Data Center Жеке электрондық пошта, ұялы телефон қоңыраулары және Google іздеу, сондай-ақ, жеке деректерді трассалар-автотұрақ қолхаттарын барлық түрлерін толық мазмұнын «қоса алғанда, байланыстың барлық нысандарын сақтау және өңдеуге қабілетті дейді Ержан Досмұхамедов саяхаттық бағдар , кітап сатып алу, сондай-ақ басқа да сандық `қалта қоқыс« (Bamford 2012) . Көп төменде сипатталған болады Big Data басып ақпарат, көп сезімтал табиғаты туралы арттыру алаңдаушылыққа Сонымен қатар, Юта Data Center зерттеушілер үшін жетпейтін бай деректер көзі төтенше үлгісі болып табылады. Тұтастай алғанда, зерттеушілер үшін пайдалы болар еді үлкен деректер көптеген көздері үкімет (мысалы, салық деректер және білім беру деректер) мен компаниялардың (мысалы, сұраулар қозғалтқыштар және телефон қоңырауы мета-деректерді іздеу үшін) басқарылады және шектелген. Сондықтан, бұл деректер университеттерінде зерттеушілер дереу қол жетімсіз болады, және ең тіпті үкімет немесе компаниялардағы зерттеушілер үшін қол жетімді болмайды.

Менің тәжірибесі, жоғары оқу орындарының негізінде көптеген зерттеушілер осы қолжетпейтін көзін керісінше түсінеді. компаниялар мен үкімет адамдар, ақымақ еріншек, немесе бейтарап болып табылады, өйткені, бұл деректер қол жетімсіз емес. Керісінше, ауыр құқықтық, техникалық, бизнес, және деректер кіруді болдырмау этикалық кедергілер бар. Мысалы, веб-сайттар үшін кейбір терминдер-ақ қызмет көрсету жөніндегі келісімдермен ғана деректер қызметкерлері пайдаланылуы тиіс немесе қызметті жақсарту үшін мүмкіндік береді. Сондықтан деректер алмасу белгілі бір нысандары клиенттерден заңды сот процестерінің компанияларға әсеріне мүмкін. бөлісу деректер айналысатын компанияларға елеулі бизнес тәуекелдер де бар. жеке іздеу деректер кездейсоқ университет ғылыми-зерттеу жобасы аясында Google шығып ағып, егер қоғамдық жауап еді қалай елестету көріңіз. Мұндай деректер бұзу, төтенше жағдайда, тіпті, фирма үшін өмір сүруіне қауіп тудыруы мүмкін. Сондықтан Google-мен ең ірі өте тәуекелді бағу зерттеушілер деректерді ортақтастырған туралы компаниялар болып табылады.

Шын мәнінде, үлкен мөлшерде деректердің қол жеткізуді қамтамасыз ету үшін жағдайы болып табылады дерлік әркім Абдур Чоудхури тарихын біледі. ол AOL Зерттеу басшысы болған кезде 2006 жылы, ол әдейі ол ойлаған шығарды зерттеу қоғамдастыққа 650,000 AOL пайдаланушылардан іздеу сұраулар анонимді болды. Қаншалықты менің айта аламын, Чоудхури және AOL кезінде зерттеушілер жақсы ниетін болды және олар деректерді анонимді деп ойлаған. Бірақ, олар дұрыс болды. Ол тез деректер зерттеушілер ойладым сияқты анонимдік емес екенін тауып, және Нью-Йорк Таймс тілшілері оңай деректер адамдарды анықтау үшін алдық (Barbaro and Zeller Jr 2006) . Бұл проблемалар анықталды кейін, Чоудхури AOL-сайтында деректерді жойылады, бірақ ол тым кеш еді. деректер басқа сайттарда жіберілді болды, және сіз осы кітапты оқыған кезде ол, бәлкім, әлі де қол жетімді болады. Себебі ғылыми-зерттеу қоғамдастықпен деректерді ортақ оның әрекет, Чоудхури оқ атқан болатын, және AOL ның бас техникалық директоры отставкаға (Hafner 2006) . Бұл мысал көрсеткендей, деректер қолжетімділікті жеңілдету үшін компаниялардың ішіндегі нақты жеке тұлғаларға арналған жәрдемақы өте аз және нашар сценарий қорқынышты.

Ғылыми-зерттеу, алайда, қалың жұртшылық үшін қол жетімсіз деректерге қол жеткізу мүмкін. Үкіметтер зерттеушілер қол жеткізу үшін қолдануға болады ұстануға, және кейінірек осы тарауда шоу мысал ретінде, зерттеушілер кейде корпоративтік деректерге қол жеткізу мүмкін процедуралар бар. Мысалы, Einav et al. (2015) Онлайн аукциондар сандық іздері оқуға Банкноталардың коллекционерлерi кезінде зерттеуші серіктесі. , Зерттеуші қызығушылық, зерттеуші мүмкіндігі: Мен кейінірек тараудың (Бөлім 2.4.3.2) осы ынтымақтастық келіп зерттеулер туралы көбірек айтатын боламыз, бірақ ол маған табысты әріптестік қараңыз ингредиенттер барлық төрт болды, өйткені мен оны қазір еске компания пайыздық және компания мүмкіндігі. Басқаша айтқанда, Einav және әріптестер мүдделі және онлайн аукциондар зерделеу қабілетті болды. Ал, Ebay сондай-ақ болды. Алайда, мен зерттеуші немесе компания немесе осы ингредиенттер бірін жетпей, өйткені көптеген ықтимал бірлесіп жұмыс істеу сәтсіздікке көрдім.

Егер сіз бизнеспен әріптестік дамытуға қабілетті болса да, алайда, сіз үшін кейбір кемшіліктер бар. Біріншіден, сіз, бәлкім, бар деректермен сұрай аласыз сұрақтар шектеулі болуы; компаниялар олардың нашар көрінуі алар еді зерттеулер мүмкіндік береді екіталай. Екіншіден, Сіз, бәлкім, басқа да зерттеушілер сіздің нәтижелерін тексеру және ұзартуға мүмкін болмайды дегенді білдіреді, ол басқа зерттеушілер бар деректеріңізді бөлісуге мүмкін болмайды. Бұдан әрі, осы серіктестік адамдар сіздің нәтижелері сіздің серіктестік әсер еткен деп ойлаймын мүмкін мүдделер қақтығысы кем дегенде көрінісін жасауға болады. Осы кемшіліктерді Барлық шешілуі мүмкін, бірақ ол деректермен жұмыс баршаға қолжетімді емес екенін айқын болуы маңызды болып табылады арттыру және төмендету екеуі болды.

Қысқаша айтқанда, үлкен деректер көп зерттеушілер қол жетімді. Онда деректер кіруді болдырмау ауыр, құқықтық, техникалық, бизнес, және этикалық кедергілер болып табылады, және осы тосқауылдарды кетеді емес. Ұлттық үкіметтер, әдетте, деректер қол жеткізуді мүмкіндік беретін шаралар белгіленген, бірақ процесс мемлекеттік және жергілікті деңгейлерде көп арнайы болуы мүмкін. Сондай-ақ, кейбір жағдайларда, зерттеушілер деректерге қол алуға компаниялармен серіктес болады, бірақ бұл зерттеушілер үшін бірқатар проблемаларды жасауға болады.