2.1 Кіріспе

аналогтық жасы, мінез-құлық-қымбат, сондықтан, салыстырмалы сирек-болғанда не істеп, не туралы деректер жинау. Енді, Сандық заманда, миллиардтаған адамдардың мінез-құлықтың, жазылған сақталған, және analyzable жатыр. Мысалы, сіз, веб-сайтқа басыңыз ұялы телефоныңызға қоңырау шалу немесе несие картасымен нәрсе үшін төлеуге әр жолы, сіздің мінез-сандық жазба құрылады және бизнес сақталады. Бұл деректер бойынша өнім адам жылдардың күн сайын іс-әрекеттері болып табылады, өйткені, олар жиі сандық іздері деп аталады. бизнесті өткізетін осы іздері қатар, үкімет, сондай-ақ, көбінесе цифрланған және analyzable деректерді адамдар мен бизнес екеуі туралы керемет бай деректер бар. Сонымен, бұл бизнес және мемлекеттік жазбалар жиі үлкен деректерді деп аталады.

үлкен деректерді бұрын-соңды өсіп, су тасқынына, біз мінез-құлық деректер мінез-құлық деректер мол болып әлемге тапшы болды әлемнің көшіп білдіреді. Осы түрлері деректер салыстырмалы түрде жаңа болып табылады, өйткені Бірақ, оларды пайдалану зерттеулер сәтсіз сомасы ғалымдар соқырлар қолжетімді деректер қуып ұқсайды. Бұл тарауда, оның орнына, деректер және олар қалай пайдалануға болады түрлі көздерін түсіну үшін принципиалды көзқарас ұсынады. Бұл бай түсіну сіз жақсы деректер тиісті көздері сіздің зерттеу сұрақтарына сәйкес келуі көмектесуі тиіс. Немесе, мысалы, қолданыстағы көздері жоқ болса, болашақ тарауларында идеялар пайдаланып жеке деректерді жинау сізді сендіруге.

Бақылау деректер: үлкен деректер үйренуге алғашқы қадам, ол көптеген жылдар бойы әлеуметтік зерттеу үшін қолданылған деректер кеңірек санаты бөлігі екенін түсінеді болып табылады. Шамамен, бақылау деректер қандай да бір жолмен араласу әлеуметтік жүйені бақылау нәтижесі кез келген деректер болып табылады. Бұл туралы ойлауға шикі жолы бақылау деректер халықтың (3-тарауында мысалы, сауалнамалар, тақырып) сөйлесіп немесе халық орталарын (мысалы, эксперименттер, 4-тарауында тақырыбын) өзгерту тарту емес, бәрі болып табылады. Осылайша, бизнес және мемлекеттік жазбалар қоса, бақылау, сондай-ақ деректер газет мақалаларының және спутниктік фотосуреттер мәтін сияқты нәрселерді қамтиды.

Бұл тарауда үш бөліктен тұрады. Біріншіден, 2.2 бөлімде, мен егжей-тегжейлі деректерді үлкен сипаттайды және оған және, әдетте, өткен әлеуметтік зерттеу үшін қолданылған деректер арасындағы іргелі айырмашылықты түсіндіру. Содан кейін, 2.3 бөлімінде, Мен үлкен деректер көздерінің он ортақ сипаттамалары сипаттайды. Осы сипаттамаларын түсіну тез қолданыстағы көздерін күшті және әлсіз жақтарын тануға және бізге болашақта құрылатын болады, жаңа көздерін пайдалануға көмектеседі мүмкіндік береді. санау заттар, болжау заттар, сондай-ақ тәжірибе жақындатты: Соңында, 2.4 бөлімінде, менің ойымша, сіз бақылау деректерінен үйренуге үшін пайдалануға болатын үш негізгі ғылыми-зерттеу стратегиясын сипаттайды.