2.3.2.1 аяқталмаған

Қарамастан, ол, бәлкім, өзіңіз қалаған ақпараты болмаса, қалай «үлкен» Сіздің «үлкен деректер».

Ең үлкен деректер көздері, олар сіз өз зерттеу үшін келеді ақпарат жоқ екенін мағынада, толық емес болып табылады. Бұл зерттеулер басқа мақсаттар үшін құрылды деректердің ортақ ерекшелігі болып табылады. Көптеген әлеуметтік ғалымдар қазірдің өзінде мұндай сіз келді сұрақ емес, бұрыннан бар сауалнама ретінде толық айналысатын тәжірибесі болды. Өкінішке орай, толық мәселелері үлкен деректер көп экстремалды болуы бейім. теориялық құрылымдар әрекеттер үшін демографиялық, басқа платформаларда мінез-құлық, және деректер: Менің тәжірибесі, үлкен деректер әлеуметтік зерттеу үшін пайдалы ақпарат үш түрін жоқ болуы ұмтылады.

Толық осы нысандарын Барлық үш Gueorgi Kossinets және Дункан Ватт арқылы зерттеуге көрсетілген (2006) университеттегі әлеуметтік желі эволюциясы туралы. Kossinets және Ватт (зерттеушілер хаттар мазмұнына қол жеткізе қойған жоқ) қандай уақытта кімге электрондық хат жолдады кім нақты ақпаратты болды университет, электрондық пошта журналдарын басталды. Бұл электрондық пошта жазбалар олар қарамастан, олардың мөлшері мен егжей-түбегейлі толық, таңғажайып деректер жиынының көрінуі, бірақ. Мысалы, электрондық пошта журналдар осындай жынысы мен жасына ретінде студенттердің демографиялық сипаттамалары туралы деректерді қамтымайды. Әрі қарай, электрондық пошта журналдар осындай телефон қоңыраулары, мәтіндік хабарға немесе бетпе-бет әңгімелесе сияқты басқа бұқаралық ақпарат құралдары арқылы қарым-қатынас туралы ақпаратты қамтымайды. Соңында, электрондық пошта журналдары тікелей қарым-қатынас, көптеген қолданыстағы теориялар теориялық құрылымдар туралы ақпаратты қамтымайды. Мен зерттеу стратегиялары туралы әңгіме болған кезде Кейінірек тарауда, сіз Kossinets және Ватт осы проблемаларды қалай шешкенін көресіз.

толық үш түрлерін, теориялық құрылымдар әрекеттер үшін толық емес деректер мәселесін шешу қиын, және менің тәжірибесі, ол жиі кездейсоқ деректер ғалымдар жете бағаланбайды. Шамамен, теориялық құратын әлеуметтік ғалымдар зерттеп реферат идеялар бар, бірақ, өкінішке орай, осы құратын әрқашан мағыналы анықталады және өлшеу мүмкін емес. Мысалы, эмпирикалық көп ақылды адамдар көп ақша табу деп шамасы қарапайым шағымын тексеру тырысып делік. Сіз өлшеу қажет еді, осы шағымын тексеру үшін «барлау». мақсатында Бірақ, барлау қандай? Мысалы, Gardner (2011) интеллект сегіз түрлі нысандары, шын мәнінде бар екенін мәлімдеді. Ал, дәл осы интеллект нысандарын кез келген шараны мекен рәсімдері бар? психологтар жұмыс орасан сомалары қарамастан, бұл мәселелер әлі күнге дейін бір мәнді жауап жоқ. Ол деректер теориялық құрылымдар әрекеттер үшін қиын болуы мүмкін, себебі Осылайша, тіпті одан да көп ақылды болып салыстырмалы қарапайым талап-адам көп табыс табуға ақша-мүмкін эмпирикалық бағалау қиын болуы. «Нормалар», «әлеуметтік капитал» және «демократия қамтуы әрекеттер маңызды, бірақ қиын теориялық конструкциялық Басқа мысалдар.» Әлеуметтік ғалымдар теориялық құрылымдар мен деректер сындарлы пәрменділігін арасындағы матчты қоңырау (Cronbach and Meehl 1955) . Ал, конструкцияларын бұл тізім жарамдылығын салу, ұсынады ақ әлеуметтік ғалымдар олар зерттеу мақсаттары үшiн жиналған деректермен жұмыс істеді, тіпті өте ұзақ уақыт бойы мазалаған мәселе болып табылады. Зерттеу мақсатынан басқа мақсаттарда жиналған деректермен жұмыс істегенде, сындарлы қолданылу мәселелері одан да күрделі болып табылады (Lazer 2015) .

Егер сіз зерттеу қағазды оқып отырған кезде, конструкция қолданылу алаңдаушылық бағалау үшін бір тез және пайдалы тәсілі әдетте конструкциялық тұрғысынан көрінеді қағаз, басты талап-арыз қабылдайды, және пайдаланылған деректерді тұрғысынан оны қайта-білдіру болып табылады. Мысалы, ақылды адамдар көп, көп ақша табу екенін көрсету үшін талап екі гипотетикалық зерттеулер қарастырайық:

  • 1 оқу: талдау барлау Raven прогрессивті Матрицалар Test-жақсы зерттелген тест жақсы гол адам (Carpenter, Just, and Shell 1990) жоғары, олардың салық декларацияларын туралы табыстар хабарлады Елімізге келіп жатқан
  • 2 оқу: ұзын сөздерді пайдаланылады Twitter адамдар люкс брендтер атап неғұрлым ықтимал болып табылады

Екі жағдайда да, зерттеушілер, олар ақылды адамдар көп, көп ақша табу екенін көрсетті деп сендіреді еді. Бірақ, бірінші зерттеуде теориялық құратын ақ деректермен қызметпен, ал екінші, олар емес. Осы мысал ретінде одан әрі, одан деректер автоматты түрде сындарлы пәрменділігін бар мәселелерді шешпейді. Сіз бұл миллион хабарламаларды, миллиард хабарламаларды, немесе триллион хабарламаларды тартылған ма зерттеу 2 нәтижелерін күмән тиіс. сындарлы пәрменділігін идеясы таныс зерттеушілер емес үшін, Кесте 2.2 сандық бақылау деректерін пайдалана отырып, теориялық құрылымдар қызметпен зерттеулерді бірнеше мысалын көрсетеді.

Кесте 2.2: Қосымша реферат теориялық ұғымдарды шаралар ретінде пайдаланылады сандық іздері мысалдары. Әлеуметтік ғалымдар бұл матч конструкция жарамдылығын қоңырау және әлеуметтік зерттеу үшін үлкен дерек көздерін пайдалана отырып, негізгі проблема болып (Lazer 2015) .
сандық ізі теориялық конструкция дәйексөз
(Тек мета-деректер) университеттен электрондық пошта журналдары әлеуметтік қарым-қатынастар Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
Weibo әлеуметтік медиа хабарламалар Азаматтық белсенділік Zhang (2016)
Фирма (мета-деректер мен толық мәтіні) электрондық пошта журналдары ұйымда Мәдени жарамды, Goldberg et al. (2015)

қызметінің жеделдігін теориялық құрылымдар үшін толық емес деректер мәселесін шешу өте қиын болғанымен, толық емес демографиялық ақпарат және басқа да платформаларда мінез толық емес ақпарат мәселесіне үш ортақ шешімдер бар. бірінші шын мәнінде сізге қажет деректерді жинау болып табылады; Мен сауалнамалар туралы айтып кезде мен 3-тарауда мысалында туралы баяндаймын. Өкінішке орай, деректерді жинау осы түрі әрқашан мүмкін емес. Екінші негізгі шешімі деректерді ғалымдар пайдаланушы атрибуты тұжырым және қандай әлеуметтік ғалымдар шартты есептеу қоңырау атаймыз істеу болып табылады. Бұл тұрғыда, зерттеушілер басқа адамдардың атрибуттарын қорытынды кейбір адамдарға олар бар сол ақпаратты пайдаланады. Үшінші ықтимал шешім Kossinets және пайдаланатын бір бірнеше деректер көздерін біріктіру Ватт-болды. Бұл процесс, кейде біріктіру немесе жазба байланыс деп аталады. Осы процесс үшін Менің сүйікті метафора соңды рекордтық байлау туралы жазбаша ең алғашқы қағаз өте бірінші абзацында ұсынылды (Dunn 1946) :

«Әлемдегі Әр адам өмір Кітапқа жасайды. Бұл кітап туған басталады және қайтыс аяқталады. Оның беттер өміріндегі принципі оқиғалардың жазбалар тұрады. Record байланыс көлемде осы кітаптың беттерін құрастыру процесіне берілген атау. «

Бұл өту 1946 жылы жазылған, және сол уақытта, адамдар өмір кітабы туу, неке, ажырасу, және өлім секілді ірі өмірі оқиғалар мыналарды қамтуы мүмкін деп ойлаған. Алайда, қазір адамдар туралы көп ақпарат жазылады, Өмір кітабы керемет тегжейлі портреті болуы мүмкін, сол түрлі беттерде (яғни, біздің сандық іздері), егер бірге байланысты болуы мүмкін. Өмір Бұл кітап зерттеушілер үшін үлкен ресурс болуы мүмкін. Бірақ, өмір кітабы, сондай-ақ күйзеліс дерекқор деп атауға болады (Ohm 2010) Мен төменде үлкен деректер көздеріне жинаған ақпарат сезімтал табиғаты туралы әңгіме болғанда, көп төменде сипатталғандай, этикаға мақсаттары барлық түрлері үшін пайдаланылуы мүмкін, ол және 6-тарау (этика) қаласында.