2.3.2.1 Бүрэн бус

Үл хамааран хэрхэн "том" таны "том мэдээ" Энэ нь магадгүй таны хүссэн мэдээлэл байхгүй.

Хамгийн том мэдээллийн эх сурвалж нь тэд та өөрийн судалгааны хүснэ мэдээлэл өгөөгүй байна гэсэн утгаар, дутуу байна. Энэ судалгааны бусад зориулалтаар бүтээгдсэн өгөгдлийн нийтлэг шинж чанар байдаг. Нийгмийн олон эрдэмтэд аль хэдийн нь та хүссэн асуултаа асууж биш үү одоо байгаа нь судалгааны талаар, дутсан шийдвэрлэх туршлага байсан. Харамсалтай нь, дутсан асуудал том тоо илүү эрс тэс байх хандлагатай байдаг. онолын бүтцэд ажил хэрэг нь хүн ам зүйн бусад тусгай тавцангуудын дээр зан, мөн өгөгдөл: Миний туршлага нь, том мэдээллийн нийгмийн судалгааны ашигтай мэдээллийн өөр гурван төрлийн алга болсон байх хандлагатай байдаг.

Дутсан эдгээр хэлбэрийн гурван Gueorgi Kossinets болон Данкан Уоттс гаргасан судалгаагаар харуулсан байна (2006) их дээд сургуульд нийгмийн сүлжээний хувьслын тухай. Kossinets болон Watts их сургуулийн и-мэйл бүртгэлүүд (судлаачид и-мэйл агуулгад хандах байхгүй байсан) ямар ч үед руу и-мэйл явуулсан хэн болох талаар нарийн мэдээлэл байсан нь эхэлсэн. Энэ и-мэйл бүртгэл гайхалтай датасетийн шиг сонсогдож, харин тэд, байгаа хэдий ч тэдгээрийн хэмжээ, масштабын-үндсээр нь бүрэн бус. Жишээ нь, и-мэйл бүртгэлүүд болох жендэр, нас оюутнуудын хүн ам зүйн шинж чанарын тухай мэдээллийг багтаасан байна. Цаашилбал, и-мэйл лог зэрэг утасны дуудлага, мессеж, эсвэл нүүр тулсан яриа болон бусад хэвлэл мэдээллийн хэрэгслээр дамжуулан харилцаа холбооны тухай мэдээллийг багтаасан байна. Эцэст нь хэлэхэд, и-мэйл бүртгэлүүдийг шууд харилцаа, олон буй онол дахь онолын бүтцэд тухай мэдээллийг багтаасан байна. Дараа нь бүлэгт, би судалгааны стратегийн тухай ярих үед, та Kossinets болон Watts нь эдгээр асуудлыг шийдэж хэрхэн харах болно.

дутсан гурван төрлийн онолын бүтцэд ажил хэрэг нь бүрэн бус мэдээлэл асуудал хамгийн хэцүү асуудлыг шийдэж байна, миний туршлага нь, энэ нь ихэвчлэн санамсаргүйгээр мэдээлэл эрдэмтэд анзаарахгүй байна. Ойролцоогоор онолын барьж харамсалтай нь, эдгээр барьж үргэлж хоёрдмол утгагүйгээр тодорхойлж чадахгүй байгаа бөгөөд хэмжиж, нийгмийн эрдэмтэд судалж, хийсвэр үзэл санаа, гэхдээ. Жишээ нь, улсын туршлагаар илүү ухаалаг байдаг хүмүүс илүү мөнгө олох бололтой энгийн нэхэмжлэл шалгах гэж оролдож бодъё. Энэ нэхэмжлэлийг тест тулд та оюун ухаан гэж юу вэ, хэмжих хэрэгтэй "оюун ухаан". Гэвч? Жишээ нь, Gardner (2011) тагнуулын найман өөр өөр хэлбэрүүд нь үнэндээ байдаг гэж үзжээ. Тэгээд, үнэн зөв оюун эдгээр хэлбэрийн аль ч арга хэмжээ болох юм тэнд журам байна вэ? сэтгэл ажлын асар их хэмжээний үл харгалзан, эдгээр асуулт ч хоёрдмол утгагүй хариулт байхгүй байна. Тиймээс ч илүү ухаалаг байдаг нь харьцангуй энгийн шаардлага, хүн олох илүү их мөнгө болно энэ нь өгөгдлийн онолын бүтцэд ажил хэрэг хэцүү байх болно, учир нь эмпирик үнэлэх хэцүү байх. "Хэм хэмжээ", "нийгмийн капитал" болон "ардчиллыг зэрэг ажил хэрэг нь чухал хэдий ч хэцүү онолын бүтцэд бусад жишээ." Нийгмийн эрдэмтэд онолын бүтцэд, мэдээлэл бүтцийг хүчинтэй байх хооронд тоглолтыг гэж нэрлэдэг (Cronbach and Meehl 1955) . Мөн бүтцэд энэ жагсаалтыг санал болгодог үндэслэл нь нийгмийн эрдэмтэд маш удаан хугацаанд тэмцэж байна гэсэн асуудал, тэдгээр нь судалгааны зорилгоор цуглуулсан мэдээлэл нь ажиллаж байсан ч барьж байгуулах. Судалгааны өөр зорилгоор цуглуулсан мэдээлэлд ажиллахдаа барих хүчинтэй байх асуудал бүр илүү хэцүү байдаг (Lazer 2015) .

Хэрэв та эрдэм шинжилгээний цаас уншиж байгаа бол, нэг нь хурдан, үр ашигтай арга зам бүтцийг хүчинтэй байх тухай асуудал цаас, бүтцэд хувьд ихэвчлэн илэрхийлдэг гол нэхэмжлэлийг авч байна үнэлж, ашиглаж өгөгдлийн хувьд үүнийг дахин илэрхийлье. Жишээ нь, илүү ухаалаг хүмүүс илүү их мөнгө олох гэж харуулахыг шаардаж хоёр таамаглал судалгаа үзэх:

  • Судалгааны 1: аналитик тагнуулын-тест сайн судалсан туршилтын Raven Прогрессив матрицууд дээр сайн оноо авсан хүн (Carpenter, Just, and Shell 1990) дээд мэдээлсэн орлого нь татварын тайлан дээр жагсаалтыг гаргасан
  • Судалгааны 2: урт үг тансаг зэрэглэлийн брэндүүд энд дурьдах нь илүү магадлалтай байдаг ашигласан Twitter дээр хүн

Аль ч тохиолдолд, судлаачид тэд илүү ухаалаг хүмүүс илүү их мөнгө олох гэж харуулж байна гэж баталдаг юм. Гэхдээ эхний судалгааны онолын бүтэц сайн мэдээ ээс хэрэгжиж байгаа бөгөөд хоёр дахь нь биш юм. Цаашилбал, энэ жишээ харуулж байна гэж, илүү мэдээллийг автоматаар бүтцийг хүчинтэй байх нь асуудлыг шийдэж чадахгүй. Энэ нь сая жиргээ, нэг тэрбум жиргээ, эсвэл их наяд жиргээнд оролцсон эсэх Та судалгааны 2 үр дүнг эргэлзэж байх ёстой. бүтцийг хүчинтэй байх санаа нь танил биш судлаачдын хувьд Хүснэгт 2.2 дижитал ул мөр өгөгдлийг ашиглан онолын бүтцэд хэрэгжиж байна судалгааны зарим жишээг үзүүлдэг.

Хүснэгт 2.2: илүү хийсвэр онолын үзэл баримтлалын арга хэмжээ болгон ашиглаж байгаа дижитал ул мөр жишээ. Нийгмийн эрдэмтэд энэ тоглолт бүтцийг хүчин төгөлдөр гэж нэрлэдэг бөгөөд энэ нь нийгмийн судалгааны том мэдээллийн эх үүсвэрийг ашиглан томоохон сорилт юм (Lazer 2015) .
Дижитал ул мөр Онолын бүтцийг ишлэл
нь их сургуулийн и-мэйл бүртгэлүүд (мета-өгөгдөл нь зөвхөн) Нийгмийн харилцаа Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
Weibo нийгмийн хэвлэл мэдээллийн бичлэгүүд алга байна Иргэний оролцоо Zhang (2016)
нэг пүүсийн и-мэйл бүртгэлүүд (мета-өгөгдөл болон бүрэн текст) байгууллагын соёлын таарах Goldberg et al. (2015)

уйл ажиллагааг онолын бүтцийг нь бүрэн бус мэдээлэл асуудлыг шийдэх нь маш хэцүү байдаг ч, бүрэн бус хүн ам зүйн мэдээлэл болон бусад платформ дээр зан дутуу мэдээллийн асуудлыг гурван нийтлэг шийдэл байдаг. Эхний үнэхээр танд хэрэгтэй мэдээллийг цуглуулах болно; Би судалгааны талаар танд хэлэх үед би 3-р бүлэгт энэ тухай жишээ талаар танд хэлэх болно. Харамсалтай нь, мэдээлэл цуглуулах нь энэ төрлийн үгүй ​​биш аль болох үргэлж байдаг. Хоёр дахь гол шийдэл нь өгөгдлийн эрдэмтэд хэрэглэгчийн шинж дүгнэлт, ямар нийгмийн эрдэмтэд ял зэмлэл гэж нэрлэдэг зүйлийг хийх явдал юм. Энэ хандлагын судлаачид бусад хүмүүсийн шинж чанарыг хэлж тэдгээр нь зарим нэг хүмүүст хэрэгтэй мэдээллийг ашигладаг. олон мэдээллийн эх үүсвэрийг нэгтгэх Гурав дахь боломжит шийдэл-Kossinets болон ашигласан нэг Уоттс байсан юм. Энэ үйл явц нь заримдаа нийлэх, нэгдэх, бичлэг уялдаа холбоо гэж нэрлэдэг. Энэ үйл явцын хувьд миний хамгийн дуртай зүйрлэл бичлэг уялдаа холбоог дээр хэзээ бичсэн хамгийн анхны цаасан дээр маш эхний хэсэгт санал болгож байна (Dunn 1946) :

"Дэлхийн хүн бүр амьдралын Номын бий болгож байна. Энэ номын төрсөн нь эхэлж нас барснаар дуусгавар болно. Үүний хуудас амьдралын зарчим нь үйл явдлын бичлэг дээр хийсэн байна. Бичлэг уялдаа холбоо нэр нь эзлэхүүн болгодог энэ номын хуудас угсрах явцад өгсөн юм. "

Энэ бол ишлэл 1946 онд бичигдсэн бөгөөд тэр үед хүмүүс Амьдралын Ном төрөлт, гэрлэлт, салалт, нас барсан гэх мэт томоохон амьдрал үйл явдлыг оруулж болох юм гэж бодож байв. Гэсэн хэдий ч, одоо хүмүүсийн тухай маш их мэдээлэл бүртгэгдсэн байна гэж, амьдрал Ном нь маш нарийвчилсан хөрөг, тэдгээр өөр өөр хуудас (өөрөөр хэлбэл, манай дижитал ул мөр), хамтад нь заавал биелүүлэх боломжтой бол байж болох юм. Амьдралын Энэ номын судлаачдын хувьд асар их нөөц байж болох юм. Гэхдээ, Амьдралын Ном нь сүйрэлд-ийн мэдээллийн санг гэж нэрлэгдэх болно (Ohm 2010) ёс зүйгүй зорилгоор бүх төрлийн ашиглаж болно, би доор том мэдээллийн эх сурвалжаас цуглуулсан мэдээлэл мэдрэмтгий чанарын тухай ярих үед доор дэлгэрэнгүй тайлбарласан болон 6-р бүлэг (Ёс) байна.