2.2 Big data

Böyük məlumatlar şirkətlər və hökumətlər tərəfindən tədqiqatlardan başqa məqsədlər üçün yaradılır və toplanır. Araşdırmalar üçün bu məlumatları istifadə edərək, bu səbəbdən repurposing tələb olunur.

Rəqəmsal dövrdə bir çox insanın sosial tədqiqatlarla qarşılaşdıqları ilk üsul böyük məlumatlar adlanır. Bu müddətin yaygın istifadəsinə baxmayaraq, nə qədər böyük məlumatlar barədə fikir birliyi yoxdur. Lakin, böyük məlumatların ən ümumi təriflərindən biri "3 Vs": həcmi, müxtəlifliyi və sürətinə yönəlib. Çoxlu sayda müxtəlif formatlarda müxtəlif məlumatlar var və daim yaradılıb. Bəzi tənqidçilər, Vaqi və Vaksin kimi V'lu əlavə edərkən böyük məlumatların bəzi pərəstişkarları da Veracity və Qiymət kimi digər "V" əlavə edir. Sosial tədqiqat məqsədi üçün 3 "Vs" (və ya 5 "Vs" və ya "Vs") deyilsə, mən başlamaq üçün daha yaxşı bir yer 5 "Ws" dir: Kim, nə, harada, zaman və nə üçün. Əslində, hesab edirəm ki, böyük məlumat mənbələri tərəfindən yaradılan bir çox çətinliklər və imkanlar yalnız bir "W" -dan izləyir: Niyə.

Analoq dövründə, sosial tədqiqatlar üçün istifadə olunan məlumatların əksəriyyəti tədqiqat məqsədilə yaradılıb. Rəqəmsal yaşda, şirkətlər və hökumətlər tərəfindən araşdırmalardan başqa məqsədlər üçün, məsələn, xidmətlərin göstərilməsi, mənfəət əldə edilməsi və qanunların idarə edilməsi kimi çoxlu məlumatlar yaranır. Yaradıcı insanlar, lakin, siz tədqiqat üçün bu korporativ və hökumət məlumat repurpose bilərsiniz ki, həyata var. Duchamp, sənət yaratmaq üçün aşkar bir obyektin repurposed olduğu kimi, fəsil 1-də incəsənət müqəddəratını geri nəzərdən keçirərək, elm adamları indi tapıntıları araşdırma yaratmaq üçün tərif edə bilərlər.

Şübhəsiz ki, repurposing üçün böyük imkanlar var, araşdırma məqsədləri üçün yaradılan məlumatlardan istifadə də yeni çağırışlar təqdim edir. Məsələn, Twitter kimi ictimai media xidmətini müqayisə edin, ümumi Sosial Araşdırmalar kimi ənənəvi ictimai rəy sorğusunu. Twitter-in əsas məqsədi istifadəçilərə xidmət göstərmək və mənfəət əldə etməkdir. Digər tərəfdən Ümumi Sosial Araşdırmalar, xüsusilə ictimai araşdırmalar üçün ictimai araşdırma üçün ümumi məqsədli məlumatlar yaratmağı hədəfləyir. Qollardakı bu fərq, ictimai fikri öyrənmək üçün istifadə oluna bilər olsa da Twitter tərəfindən yaradılan və Ümumi Sosial Araşdırmalar tərəfindən yaradılan məlumatların fərqli xüsusiyyətlərə malik olduğunu bildirir. Twitter Ümumi Sosial Araşdırmanın uyğunlaşa bilməyəcəyi bir miqyasda və sürətlə fəaliyyət göstərir, lakin Ümumi Sosial Araşdırmalardan fərqli olaraq, Twitter istifadəçiləri diqqətlə nümunə götürmür və zamanla müqayisə edilə bilməsi üçün çox çalışmır. Bu iki məlumat mənbəyi fərqli olduğundan, Ümumi Sosial Araşdırmanın Twitter və ya əksinə daha yaxşı olduğunu söyləmək məntiqli deyil. Qlobal əhval-ruhiyyənin hourly ölçülməsini istəyirsinizsə (məsələn, Golder and Macy (2011) ), Twitter Golder and Macy (2011) . Digər tərəfdən, əgər ABŞ-da münasibətlərin polarizasiyada uzunmüddətli dəyişiklikləri başa düşmək istəsəniz (məsələn, DiMaggio, Evans, and Bryson (1996) ), o zaman Ümumi Sosial Araşdırmalar ən yaxşı seçimdir. Daha çox ümumiyyətlə, bu böyük məlumat mənbələrinin digər məlumat növlərinə nisbətən daha yaxşı və ya pis olduğunu iddia etməkdən daha çox, bu fəsildə böyük məlumat mənbələrinin cəlbedici xüsusiyyətlərə malik olduğu və hansı suallara cavab verə bilmədikləri üçün bu fəsildə aydınlıq verməyə çalışacağıq idealdır.

Böyük məlumat mənbələri barədə düşünərkən, bir çox tədqiqatçı dərhal axtarış motorları və sosial media mesajları kimi şirkətlər tərəfindən yaradılan və toplanan onlayn məlumatlara diqqət yetirir. Ancaq bu dar diqqət iki böyük əhəmiyyətli məlumatın digər əhəmiyyətli mənbələrini çıxarır. Birincisi, getdikcə korporativ böyük məlumat mənbələri fiziki dünyada rəqəmsal cihazlardan gəlir. Məsələn, bu fəsildə mən işləyənlərin məhsuldarlığının onun həmyaşıdlarının məhsuldarlığından necə təsirləndiyini öyrənmək üçün supermarketdə çıxış məlumatlarını təkrar edən bir iş barədə sizə məlumat verəcəyəm (Mas and Moretti 2009) . Daha sonra, sonrakı fəsillərdə sizə mobil telefonlardan (Blumenstock, Cadamuro, and On 2015) və elektrik kommunal xidmətlərinin (Allcott 2015) yaratdığı faturalandırma məlumatlarından istifadə edən tədqiqatçılar haqqında məlumat (Blumenstock, Cadamuro, and On 2015) . Bu nümunələri göstərir ki, korporativ böyük məlumat mənbələri yalnız onlayn davranışdan çoxdur.

Online davranışa dar bir diqqətlə buraxılmış ikinci böyük əhəmiyyətli məlumat mənbəyi hökumət tərəfindən yaradılan məlumatlardır. Araşdırmacılar hökumətin inzibati qaydalarına zəng edən bu hökumət məlumatları, vergi qeydləri, məktəb qeydləri və həyati statistika məlumatları (məsələn, doğum və ölümlərin qeydiyyatı kimi) daxildir. Hökumətlər bu cür məlumatları bəzi hallarda yüzlərlə ildir yaradılar və sosial elm adamları sosial elm adamları olduğu müddətdə onları istismar edirlər. Bununla belə, dəyişikliklər rəqəmsalləşdirmədir və bu, hökumətlərin məlumatların toplanması, ötürülməsi, saxlanması və analizi üçün dramatik şəkildə asanlaşdırılıb. Məsələn, bu fəsildə mən sizə əmək iqtisadiyyatı mövzusunda əsas müzakirə aparmaq məqsədilə Nyu-York şəhərinin rəqəmsal taksi sayğaclarından verilən məlumatları əks etdirən bir iş barədə məlumat verəcəyəm (Farber 2015) . Sonra sonrakı fəsillərdə, hökumət tərəfindən toplanmış səsvermə qeydlərinin anketdə (Ansolabehere and Hersh 2012) və bir sınaqda (Bond et al. 2012) istifadə edildiyi barədə sizə məlumat (Ansolabehere and Hersh 2012) .

Hesab edirəm ki, repurpoziya ideyası böyük məlumat mənbələrindən öyrənmək üçün əsasdır və böyük data mənbələrinin xüsusiyyətləri (bölmə 2.3) və bunların tədqiqatda necə istifadə edildiyi barədə daha çox danışmaqdan əvvəl (bölmə 2.4), mən istərdim repurposing haqqında iki ümumi məsləhət təklif etmək. Birincisi, "tapılmış" məlumatlar və "hazırlanmış" məlumatlar arasında yaradılan kontrastım haqqında düşünmək cazibədar ola bilər. Bu yaxındır, amma çox doğru deyil. Tədqiqatçılar baxımından böyük məlumat mənbələri "tapıldı" olsa da, sadəcə göydən düşmürlər. Bunun əvəzinə tədqiqatçılar tərəfindən "tapılmış" məlumat mənbələri bəzi məqsədlər üçün kimsə tərəfindən tərtib edilmişdir. "Tapdığınız" məlumatlar kimsə tərəfindən tərtib edildiyindən, mən həmişə sizin məlumatlarınızı yaradan insanlar və proseslər barədə mümkün qədər anladığınızı məsləhət görürəm. İkincisi, məlumatların təkrarlandığında, probleminiz üçün ideal verilənlər bazasını təsəvvür etmək və bu ideal verilənlər bazasını istifadə etdiyiniz ilə müqayisə etmək çox vaxt çox faydalıdır. Məlumatlarınızı özünüzə topladıysanız, istədiyiniz və sizin etdiyiniz şeylər arasında əhəmiyyətli fərqlər ola bilər. Bu fərqlilikləri nəzərə alaraq, əldə etdiyiniz məlumatlardan nə öyrənə biləcəyinizi və öyrənməyinizə aydınlıq gətirəcək və topladığınız yeni məlumatları təklif edə bilərsiniz.

Təcrübəmdə, sosial elm adamları və məlumat alimləri çox fərqli şəkildə repurpozaya yaxınlaşırlar. Tədqiqat üçün nəzərdə tutulmuş məlumatlarla işləmək üçün vərdiş edən ictimai elm adamı tez-tez qüvvətlərinə baxmayaraq repurposed məlumatlarla bağlı problemləri işarə edir. Digər tərəfdən, məlumat alimləri, zəifliklərini nəzərə almadan, təkrarlanan məlumatların faydalarını göstərmək üçün tez-tez tezdirlər. Təbii ki ən yaxşı yanaşma hibriddir. Yəni, tədqiqatçılar böyük məlumat mənbələrinin xüsusiyyətlərini başa düşməlidirlər - həm yaxşı, həm də pis - onlardan necə öyrənmək lazım olduğunu anlayın. Və bu, bu fəslin qalan hissəsinin planıdır. Növbəti hissədə mən böyük məlumat mənbələrinin on ümumi xüsusiyyətlərini təsvir edəcəyəm. Bundan sonra, növbəti bölmədə bu cür məlumatlarla yaxşı işləyə biləcək üç araşdırma üsulunu təsvir edəcəyəm.