2.3.2.1 Tugallanmagan

Qat'i nazar, "katta" sizning "katta ma'lumotlar" u ehtimol siz istagan ma'lumotga ega emas, qanday qilib.

Eng katta ma'lumot manbalari, ular siz tadqiqotlar uchun kerakli ma'lumotga ega emas, deb ma'noda, to'liq bo'ladi. Bu tadqiqot boshqa maqsadlar uchun tashkil etildi ma'lumotlar umumiy xususiyatdir. Ko'pchilik ijtimoiy olimlar allaqachon siz xohlagan savol so'ramadi Mavjud so'rov sifatida, noto'liqligi bilan shug'ullanadigan tajribasi bor edi. Afsuski, noto'liqligi muammolari katta ma'lumotlar ko'proq ekstremal bo'lish istagi. nazariy konstruktsiyalari amaliy demografik, boshqa platformalarda xatti va ma'lumotlar: mening tajriba, katta ma'lumotlar uch ijtimoiy tadqiqotlar uchun foydali ma'lumotlar turlarini kam bo'lishi istagi.

Noto'liqligi bu shakllarini barcha uch Gueorgi Kossinets va Duncan vatt tomonidan bir ishda ko'rsatilgan (2006) bir universitetda ijtimoiy tarmog'ining evolyutsiyasi haqida. Kossinets va Watts (tadqiqotchilar elektron pochta mazmuni foydalanish imkoniyatiga ega emas edi), nima vaqtda elektron xatlar yuborib, kim haqida aniq ma'lumot bor universitetda email jurnallar bilan boshlandi. Bu e-mail yozuvlar ajoyib ma'lumotlar kabi ovoz, lekin, ular-da, kattaligi va teranligi-tubdan to'liqsiz. Misol uchun, elektron pochta qaydlar kabi jinsi va yoshi, talabalarga demografik xususiyatlari haqida ma'lumotlar o'z ichiga olmaydi. Bundan tashqari, elektron pochta qaydlar bunday telefon qo'ng'iroqlari, matnli xabar yoki yuzma-yuz suhbatlar, boshqa ommaviy axborot vositalari orqali muloqot haqida ma'lumot o'z ichiga olmaydi. Nihoyat, email qaydlar bevosita munosabatlar, ko'p mavjud nazariyalar nazariy tuzilmalar haqida ma'lumot o'z ichiga olmaydi. Men tadqiqot strategiyasi haqida gapirganda Keyinchalik bobda, siz Kossinets va Watts bu muammolarni hal qanday ko'rasiz.

noto'liqligi uch xil, nazariy konstruktsiyalari amaliy to'liq ma'lumotlar muammo hal qilish qiyin bo'ladi, va mening tajriba, u tez-tez tasodifan ma'lumotlar olimlar tomonidan salkam qilinadi. Taxminan, nazariy tuzilmalar afsuski, bu tuzilmalar har doim oldimizga belgilangan va o'lchanadi mumkin emas, ijtimoiy olimlar o'rganish mavhum g'oyalar, lekin. Masalan, empirik yanada aqlli odamlar ko'proq pul topish, tashqi ko'rinishiga ko'ra, oddiy da'vo sinash uchun harakat tasavvur qilaylik. Bu da'voni sinash uchun siz razvedka nima, ". aql" o'lchash uchun kerak, lekin edi? Misol uchun, Gardner (2011) aql sakkiz turli shakllari aslida borligini ta'kidlaydi. Va, aniq aql bu shakllarini har qanday o'lchash mumkin, u erda tartib bo'ladi? psixologlar tomonidan ish ulkan miqdorda bo'lsa-da, bu savollar hali aniq javob yo'q. Shunday qilib, yana ham aqlli bo'ladi nisbatan oddiy da'vo-odamlar pul ko'proq pul-mumkin bu ma'lumotlar nazariy tuzilmalarni amaliy qiyin bo'lishi mumkin, chunki empirik baholash qiyin. "Normalarni", "ijtimoiy kapitalni," va "demokratiyani o'z ichiga amaliy ahamiyatga ega, lekin qiyin nazariy tuzilmalar Boshqa misollar." Ijtimoiy olimlar nazariy tuzilmalar va ma'lumotlar qurish amal uchrashuvini qo'ng'iroq (Cronbach and Meehl 1955) . Va, tuzilmalar, bu ro'yxat ko'rinib turibdiki, ular tadqiqot maqsadida to'plangan ma'lumotlar bilan ishlash ham bo'lsa, amal qilish, ijtimoiy olimlar juda uzoq vaqt davomida bilan kurashib, deb, bir muammo qurish. Tadqiqot boshqa maqsadlar uchun yig'ilgan ma'lumotlar bilan ishlashda, tuzilishi, amal qilish muammolari ham ko'proq qiyin bo'lgan (Lazer 2015) .

Agar tadqiqot qog'oz o'qiyotgan bo'lsa, bir tez va foydali yo'l qurish muddati haqida xavotirlar odatda tuzilmalar ifodalanadi qog'oz, asosiy da'vo etadi baholash uchun, va ishlatilgan ma'lumotlar jihatidan uni qayta izhor. Misol uchun, ko'proq aqlli odamlar ko'proq pul topish, deb ko'rsatish uchun da'vo ikki gipotetik tadqiqotlar ko'rib:

  • Study 1: analitik aql-a test yaxshi o'rganib test Raven ongli yaxshi gol kishi (Carpenter, Just, and Shell 1990) , ularning soliq to'lash bo'yicha oliy xabar daromadlari bardosh bergan
  • Study 2: uzoq so'zlar hashamatli brendlari zikr ehtimoli ko'proq bo'ladi ishlatiladigan Twitter odamlar

Har ikki holatda ham, tadqiqotchilar, ular ko'proq aqlli odamlar ko'proq pul topish ekanligini ko'rsatdi, deyish mumkin. Lekin, birinchi o'rganish nazariy tuzilmalar ham ma'lumotlar amaliyotga qilinadi va ikkinchi ular emas. Bu misol ko'rsatib turibdi sifatida yanada ko'proq ma'lumot avtomatik ravishda tuzilishi, amal bilan muammolarni hal qilmaydi. u bir million tvitlar, bir milliard tvitlar, yoki trillion tvitlar ishtirok bo'lsin Siz o'rganish 2 natijalarini shubha kerak. tuzilishi, amal qilish g'oyasi bilan tanish emas tadqiqotchilar uchun, jadval 2.2 raqamli izi ma'lumotlar yordamida nazariy konstruktsiyalari amaliyotga qilgan tadqiqotlar ayrim misollar beradi.

2.2-jadval: ko'proq mavhum nazariy tushunchalar chora sifatida ishlatiladi raqamli izlar misollar. Ijtimoiy olimlar bu o'yin qurish haqiqiyligini qo'ng'iroq va ijtimoiy tadqiqotlar uchun katta ma'lumotlar manbalaridan foydalanish bilan katta vazifadir (Lazer 2015) .
Raqamli asar nazariy qurish tsitata
a universitetda email doir qaydlarni (meta-ma'lumot faqat) ijtimoiy munosabatlar Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
Weibo ijtimoiy media xabarlar fuqarolik ish Zhang (2016)
firma dan email doir qaydlarni (meta-ma'lumot va to'liq matn) bir tashkilot madaniy Fit Goldberg et al. (2015)

operationalizing nazariy tuzilmalar uchun to'liq ma'lumotlar muammo hal qilish juda qiyin bo'lsa-da, chala demografik ma'lumotlar va boshqa platformalarda xatti haqida tugallanmagan axborot muammosiga keng tarqalgan uchta echimlar bor. birinchi aslida sizga kerak ma'lumotlarni to'plash emas; So'rov haqida aytib, men bob 3 bu misol haqida gapirib beraman. Afsuski, ma'lumotlar yig'ish bunday har doim ham imkoni bo'lmaydi. Ikkinchi asosiy hal ma'lumotlar olimlar foydalanuvchi xususiyati chiqaman va nima ijtimoiy olimlar tuhmat qo'ng'iroq deganimiz, albatta, bo'ladi. Bu yondashuv, tadqiqotchilar, boshqa odamlar sifatlarni chiqarsa, ular ba'zi odamlar bor ma'lumotlarni foydalaning. Kossinets va ishlatiladigan uchinchi mumkin hal-bir necha ma'lumotlar manbalari birlashtirish vatt-bo'ldi. Bu jarayon ba'zan birlashtirish yoki rekord havola deyiladi. Bu jarayon uchun mening sevimli misoli xuddi hech rekord ulanishga yozilgan birinchi qog'oz juda birinchi xatboshida taklif etildi (Dunn 1946) :

"Dunyodagi har bir inson hayot kitob yaratadi. Bu kitob tug'ilishi bilan boshlanadi va o'lim bilan tugaydi. Uning sahifalar hayotida tamoyili voqealar yozuvlar tashkil etadi. Record havola hajmi bu kitobning sahifalarini yig'ish jarayonida berilgan ism. "

Bu parcha 1946 yilda yozilgan va o'sha paytda, odamlar hayot kitobiga tug'ilgan, nikoh, ajralish va o'lim kabi yirik hayot voqealari o'z ichiga olishi mumkin deb o'ylab edi. o'sha turli sahifalar (ya'ni, bizning raqamli izlari), birgalikda bog'lab mumkin bo'lsa, endi odamlar haqida juda ko'p ma'lumotlar yoziladi, deb, Hayot kitobi, ajoyib batafsil portret bo'lishi mumkin. Hayot bu Kitob tadqiqotchilari uchun katta manba bo'lishi mumkin. Lekin, hayot kitobiga ham halokat ma'lumotlar bazasini deb atash mumkin (Ohm 2010) Men, quyida katta ma'lumotlar manbalari tomonidan to'plangan ma'lumotlarning nozik tabiati haqida gapirganda, quyida ko'proq aytilganidek, axloqiy maqsadlarda barcha turdagi foydalanish mumkin, va 6-bob (etika) ham.