2.1 Кіріспе

Аналогтық жастағы мінез-құлық туралы деректерді жинайды - ол не істейді, қашан қымбат болғанымен, салыстырмалы түрде сирек кездеседі. Енді сандық дәуірде миллиардтаған адамның мінез-құлқына жазылады, сақталады және талданады. Мысалы, сіз веб-сайтты басқан сайын, ұялы телефоныңызға қоңырау шалсаңыз немесе сіздің несие картаңызбен бірдеңе төлесеңіз, мінез-құлқыңыздың сандық рекорды бизнес арқылы жасалады және сақталады. Деректердің бұл түрі адамдар күнделікті іс-әрекеттерінің өнімі болғандықтан, олар жиі сандық іздер деп аталады. Кәсіпкерліктер жүргізген осы іздерден бөлек, үкіметтер де адамдар мен кәсіпкерлер туралы керемет деректерге ие. Бұл бизнес пен үкіметтің жазбалары үлкен деректер деп аталады.

Үлкен деректердің ұлғаюы бізді мінез-құлық деректерінің мінез-құлқы туралы деректер көп болатын әлемге жетпейтін әлемнен көшіргенімізді білдіреді. Үлкен деректерден үйренудің алғашқы қадамы көптеген жылдар бойы әлеуметтік зерттеулер үшін қолданылған деректердің кең санатының бір бөлігі болып табылатындығын түсінеді: бақылау деректері . Шамамен, бақылау деректері - қандай да бір жолмен араласпай, әлеуметтік жүйені бақылаудан туындайтын кез-келген деректер. Бұл туралы ойланудың жақсы тәсілі - бұл бақылау деректері - адамдармен сөйлесуді қамтитын (мысалы, сауалнама, 3-тараудың тақырыбы) немесе адамдардың ортасын өзгерту (мысалы, эксперименттер, 4-тараудың тақырыбы). Осылайша, іскерлік және үкіметтік жазбалардан басқа байқаушы деректерге газет мақалалары мен спутниктік суреттердің мәтіндері кіреді.

Бұл тараудың үш бөлімі бар. Біріншіден, 2.2 бөлімінде мен ірі деректер көздерін егжей-тегжейлі сипаттаймын және олар арасындағы және олардың арасында әдеттегі әлеуметтік зерттеулер үшін пайдаланылған деректер арасындағы іргелі айырмашылықты айқындаймын. Содан кейін, 2.3 бөлімінде мен үлкен деректер көздерінің он жалпы сипаттамасын суреттеймін. Осы сипаттамаларды түсініп, бар көздердің күшті және әлсіз жақтарын тез тануға және болашақта қол жетімді жаңа көздерді пайдалануға көмектеседі. Соңында, 2.4 бөлімінде мен бақылау мәліметтерінен үйренуге болатын үш негізгі зерттеу стратегиясын сипаттадым: заттарды санау, болжау және экспериментті жақындату.