2.2 Big Data

Big Data зерттеулер басқа мақсаттар үшін үкімет құрылған және жиналады. Зерттеу үшін осы деректерді пайдалана отырып, сондықтан, repurposing талап етеді.

әлеуметтік зерттеулер идеализированном көрінісі ғалым идеясын бар, содан кейін бұл идеяны тексеру үшін деректерді жинау елестетеді. Зерттеудің Бұл стиль зерттеу мәселесіне және деректер арасындағы тығыз жарамды әкеледі, бірақ олар жеке зерттеуші жиі осындай ірі бай, және ұлттық-өкілі деректер ретінде, олар қажет деректерді жинау үшін қажетті ресурстар бар, өйткені ол шектеулі болып табылады. Сондықтан, өткен әлеуметтік зерттеулер көп, мұндай бас социологиялық зерттеулерді (GSS), Американдық ұлттық сайлау зерттеу (ANES) және табыс динамикасы тақтасы зерттеу (PSID) сияқты ірі ауқымды әлеуметтік зерттеулер, пайдаланды. Бұл кең ауқымды зерттеу, әдетте, зерттеушілер командасы арқылы іске және олар көптеген зерттеушілер пайдалануға болады деректер жасау үшін арналған. Себебі, бұл кең ауқымды зерттеулер мақсаттарының, үлкен Күтім деректер жинау жобалау және зерттеушілер пайдалану нәтижесінде деректер дайындау енгізіледі. Бұл деректер зерттеушілер мен зерттеушілер үшін болып табылады.

сандық жасы көздерін пайдалана отырып, басым бөлігі әлеуметтік зерттеу, алайда, мүлдем өзгеше болып табылады. Оның орнына зерттеушілер мен зерттеушілер үшін жиналған деректерді пайдалана отырып, ол осындай, пайда қабылдау қызметті ұсыну немесе заң басқару сияқты өз мақсаттары үшін бизнес және үкімет құрылған және жиналған деректер көздерін пайдаланады. Бұл бизнес және мемлекеттік деректер көздері үлкен деректер деп аталатын келді. үлкен деректермен Ізденгеніміз бастапқыда зерттеу үшін құрылған деректермен ізденген қарағанда өзгеше. Мұндай бас социологиялық зерттеулерді (GSS) ретінде дәстүрлі қоғамдық пікірге сәйкес, мысалы, осындай Twitter сияқты әлеуметтік медиа веб-сайтты, салыстырыңыз. Twitter-дің негізгі міндеттері, оның пайдаланушыларға қызмет көрсетуге және пайда болып табылады. Осы мақсаттарға қол жеткізу барысында, Twitter қоғамдық пікірді кейбір аспектілерін зерттеу үшін пайдалы болуы мүмкін деректер жасайды. Бірақ, Бас әлеуметтік зерттеу (GSS) айырмашылығы, ең алдымен Twitter әлеуметтік зерттеулер бағытталған жоқ.

мерзімді Big Data Қолайсыздықтар көмескі болып табылады, және ол топтар бірге көптеген түрлі заттар. Әлеуметтік зерттеулер мақсаттары үшін, менің ойымша, бұл үлкен деректер көздерінің екі түрі ажырата пайдалы деп ойлаймын:. Үкімет әкімшілік жазбалар және бизнес әкімшілік жазбалар Үкіметке әкімшілік жазбалар олардың күнделікті іс-бөлігі ретінде үкіметтері құрылады деректер болып табылады. дүниеге оқитын Демографтар, неке және өлім жазбалар бірақ үкіметтер барған жинау және analyzable нысандарын егжей-тегжейлі жазбаларды босату ретінде жазбалардың Бұл түрлерін өткен-мұндай зерттеушілер қолданылған. Мысалы, Нью-Йорк мемлекеттік қаласында әрбір такси ішіндегі сандық метр орнатылған. жүргізуші, басталу уақыты мен жері, тоқтату уақыты мен жері, сондай-ақ жол жүру, оның ішінде әрбір такси туралы деректердің барлық түрлері Бұл метр рекордтық. Мен осы тарауда кейінірек баяндаймын зерттеу, Генри Фарбер (2015) сағаттық жалақы мен жұмыс істеген сағат саны арасындағы өзара қарым-қатынас туралы еңбек экономика іргелі пікірталас шешу үшін осы деректерді repurposed.

Әлеуметтік зерттеу үшін үлкен деректер екінші негізгі түрі бизнес әкімшілік жазбалар болып табылады. Бұл бизнес-ақ олардың күнделікті іс-бөлігі ретінде жасау және жинауға деректер болып табылады. Бұл бизнес-әкімшілік жазбалар жиі сандық іздері деп аталатын, және іздеу жүйесі сұрауы журналдарын сияқты нәрселерді қамтиды, әлеуметтік медиа хабарламалар, және ұялы телефондардан қоңырау жазбаларды жатыр. Сыни, бұл бизнес әкімшілік жазбалар ғана онлайн мінез-құлық туралы емес. Мысалы, кету сканерлерді пайдалану дүкендері қызметкері өнімділігін нақты уақыт шараларды құрып жатырмыз. Мен кейінірек осы тарауда туралы баяндаймын деген зерттеу, Александр Mas және Энрико Моретти (2009) бір жұмысшылардың өнімділігі құрдастары өнімділігін әсер қалай оқуға Осы супермаркет кету деректерді repurposed.

Осы мысалдардың екеуін көрсетілгендей, repurposing идеясы үлкен деректерден оқыту негізі болып табылады. Менің тәжірибесіне, әлеуметтік ғалымдар мен деректер ғалымдар өте басқаша repurposing осы жақындайды. оның күшті игнорируя зерттеулер үшін арналған деректермен жұмыс үйреніп әлеуметтік ғалымдар, repurposed деректермен проблемаларды атап тез. Екінші жағынан, деректер ғалымдар оның әлсіз жақтарын игнорируя repurposed деректер артықшылықтарын атап тез. Әрине, ең үздік тәсіл гибридтік болар еді. Бұл зерттеушілер деректер-екеуін жақсы және осы жаңа көздерін сипаттамаларын түсінуге жаман-, содан кейін олардан үйрену қалай анықтау керек, болып табылады. Ал, бұл осы тараудың қалған жоспар болып табылады. Келесі, Мен бизнес және мемлекеттік әкімшілік деректерді он ортақ сипаттамалары сипаттайды. Осыдан кейін, мен осы деректермен пайдалануға болады үш ғылыми-зерттеу тәсілдерін, осы деректердің сипаттамалары жақсы қолайлы тәсілдерін сипаттайды.