2.2 Big data

Big data yaradılmış və tədqiqat məqsədləri üçün hökumətlər tərəfindən toplanmışdır. Tədqiqat üçün bu məlumatları istifadə edərək, buna görə də, repurposing tələb edir.

sosial tədqiqat idealizə view bir alim bir fikir olan və sonra fikir test üçün məlumatların toplanması imagines. tədqiqat Bu stil tədqiqat sual və məlumatları arasında sıx uyğun gətirib çıxarır, lakin fərdi tədqiqatçı tez-tez belə böyük zəngin və milli nümayəndə data kimi onlar lazım olan məlumatları toplamaq üçün lazım olan resursları yoxdur, çünki bu, məhduddur. Belə General Sosial Sorğu (GSS), Amerikan Milli Seçki Study (ANES) və Gəlir Dynamics Panel öyrənilməsi (PSID) Ona görə də, keçmişdə sosial araşdırma bir çox istifadə genişmiqyaslı sosial sorğular. Bu irimiqyaslı sorğu ümumiyyətlə tədqiqatçılar qrupu tərəfindən idarə olunur və onlar bir çox tədqiqatçılar tərəfindən istifadə edilə bilər data yaratmaq üçün nəzərdə tutulmuşdur. Bu irimiqyaslı sorğuların qol Çünki, böyük qayğı məlumatların toplanması dizayn və tədqiqatçılar tərəfindən istifadə üçün çıxan məlumatların hazırlaşır daxil edilir. Bu data tədqiqatçılar tərəfindən və tədqiqatçılar üçün.

digital yaş mənbələrdən istifadə Most sosial tədqiqat, lakin əsaslı fərqlidir. Əvəzində tədqiqatçılar və tədqiqatçılar üçün toplanmış veri istifadə edərək, bu yaradılmış və belə bir mənfəət edilməsi bir xidmət və ya qanun idarə öz məqsədləri üçün biznes və hökumətlər tərəfindən toplanmış məlumat mənbələri istifadə edir. Bu biznes və hökumət məlumat mənbələri böyük data adlandırmaq üçün gəlmişəm. böyük data ilə araşdırma Doing ilk tədqiqat üçün yaradılmışdır data ilə araşdırma bunu çox fərqlidir. Məsələn, müqayisə, belə Baş İctimai Sorğu (GSS) kimi ənənəvi ictimai rəy sorğusu ilə belə Twitter kimi sosial media haqqinda,. Twitter əsas məqsədi istifadəçilərə xidmət təmin etmək və mənfəət etmək üçün. Bu məqsədlərə nail olmaq prosesində, Twitter ictimaiyyətin müəyyən aspektləri öyrənmək üçün faydalı ola bilər data yaradır. Lakin Baş İctimai Sorğu (GSS) fərqli olaraq, Twitter sosial tədqiqat, ilk növbədə diqqət deyil.

müddətli böyük data frustratingly qeyri-müəyyən və bu qruplar bir çox fərqli şeylər. Sosial tədqiqat məqsədləri üçün, mən bu iki böyük məlumat mənbələri növləri ayırmaq üçün faydalı hesab edirəm. Hökumət inzibati və biznes inzibati Government inzibati qeydlər onların gündəlik fəaliyyətinin bir hissəsi kimi hökumətlər tərəfindən yaradılmışdır məlumatlar. qeydlər bu cür-bu cür keçmiş, evlilik və ölüm qeydlər, lakin hökumətlər getdikcə doğum toplanması və analyzable formaları ətraflı qeydlər azad olunur öyrənilməsi demoqraflar kimi tədqiqatçılar tərəfindən istifadə edilmişdir. Məsələn, New York City hökumət şəhərdə hər taksi daxili digital metr quraşdırılıb. Bu metr sürücü, start vaxtı və yeri, stop vaxtı və yeri, və siçan o cümlədən hər bir taksi ride haqqında məlumatların bütün növ qeyd edin. Bu fəsildə sonra demək lazımdır ki, bir araşdırmada, Henry Farber (2015) hourly əmək haqqı və çalışılan saat sayı arasındakı əlaqələr haqqında əmək iqtisadiyyat üzrə fundamental müzakirə etmək üçün bu məlumatları repurposed.

Sosial Araşdırmalar böyük data ikinci əsas növü business inzibati qeydlər edir. Bu iş onların gündəlik fəaliyyətinin bir hissəsi kimi yaratmaq və toplamaq məlumatlar. Bu iş inzibati qeydlər tez-tez digital izləri adlanır və search engine sorğu logs, sosial media ismarıc kimi şeylər daxildir, və mobil telefonlar qeydlər zəng edir. Tənqidi, bu iş inzibati qeydlər yalnız online davranış haqqında deyil. Məsələn, check-out skanerlər istifadə Mağazalar işçi məhsuldarlığı real-time tədbirləri yaradırıq. Mən sonra bu fəsildə sizə deyim bir araşdırmada, Alexandre Mas və Enrico Moretti (2009) bir işçi məhsuldarlıq həmyaşıdları məhsuldarlığının təsir necə öyrənmək üçün bu supermarket check-out məlumat repurposed.

Bu nümunələr həm göstərmək kimi, repurposing ideyası böyük data öyrənmək üçün əsas amillərdir. Mənim təcrübəsi, ictimai elm və data elm bu çox fərqli repurposing yanaşmaq. tədqiqat üçün nəzərdə tutulmuş data ilə iş vərdiş Sosial elm, onun güclü məhəl isə repurposed data problemləri qeyd etmək tez var. Digər tərəfdən, data elm onun zəif məhəl isə repurposed data faydaları qeyd etmək tez var. Təbii ki, ən yaxşı yanaşma hibrid olacaq. Bu tədqiqatçılar data-də yaxşı və pis və sonra onlardan öyrənmək üçün necə anlamaq bu yeni mənbələrin xüsusiyyətləri anlamaq lazımdır. Və bu fəslin qalan plan edir. Sonra, mən biznes və hökumət inzibati məlumatların on ümumi xüsusiyyətləri təsvir edəcək. Bundan sonra bu məlumatlar, bu məlumatların xüsusiyyətlərinə uyğun olan yanaşma ilə istifadə edilə bilər ki, üç tədqiqat yanaşmalar təsvir edəcək.