3.4 асуух

Тоон нас нь практик дээр магадлалын дээжлэлтийг илүү хүндрүүлж, магадлалын бус дээж авах шинэ боломжийг бий болгодог.

Түүвэрлэх түүхэнд магадлалын дээж авах аргууд болон магадлалын бус түүвэрлэлтийн аргууд хоёр өрсөлдөх аргууд байсан. Хэдийгээр хоѐр аргыг түүвэрлэх эхний үед ашиглаж байсан боловч магадлалын түүвэрлэлт давамгайлж, нийгмийн олон судлаачид магадлалгүй түүвэрлэлтийг ихээхэн үл итгэх үзэлтэйгээр судлахаар заасан. Гэхдээ доор тайлбарласнаар тоон эринээс үүссэн өөрчлөлт нь судлаачид магадлалын бус түүвэрлэлтийг эргэн харах цаг болжээ. Тухайлбал, магадлалт түүвэрлэлт практик дээр хийхэд хэцүү болж, магадлалын бус түүвэрлэлт илүү хурдан, хямд, илүү сайжирч байна. Илүү хурдан, хямдхан судалгаа нь өөрсдөө төгсдөггүй төдийгүй илүү олон тооны судалгаа, түүврийн хэмжээ зэрэг шинэ боломжуудыг бий болгодог. Жишээлбэл, магадлалын бус аргуудыг ашиглан Хоршооны Конгресс Сонгуулийн Судалгаа (ХАБЭА) нь магадлалт түүвэрлэлтийг ашиглан өмнөх судалгаануудаас 10 дахин их байдаг. Энэхүү том жишээ нь улс төрийн судлаачид дэд бүлгийн болон нийгмийн орчинд хандах хандлага, зан төлөвийн ялгааг судлах боломжийг олгодог. Цаашлаад, энэхүү (Ansolabehere and Rivers 2013) бүх цар хүрээг тооцоолох чанарын бууралт ажиглагдахгүй болжээ (Ansolabehere and Rivers 2013) .

Одоогийн байдлаар нийгмийн судалгаанд дээж авах давамгайлах хандлага нь магадлалын дээж авах магадлал юм. Магадлалын дээж авахад зорилтот бүлгийн бүх гишүүд мэдэгдэж байгаа, тодорхой бус байх магадлалтай, судалгаанд хамрагдсан бүх хүмүүс судалгаанд хариу өгдөг. Эдгээр нөхцөлүүд хангагдсан тохиолдолд математикийн дэглэмийн үр дүн нь судлаачийн дээжийг ашиглах чадварыг зорилтот хүн амын талаархи дүгнэлт гаргахад баталгаатай баталгаа өгдөг.

Бодит ертөнцөд эдгээр математикийн үр дүнгүүдийн нөхцөл байдал тааралддаггүй. Жишээлбэл, хамрах хүрээ нь ихэнхдээ алдаатай, хариуцлагагүй байдаг. Эдгээр асуудлуудаас шалтгаалан судлаачид өөрсдийн дээжээс зорилтот хүн амд дүгнэлт гаргахын тулд янз бүрийн статистикийн зохицуулалтыг ашиглах ёстой байдаг. Тиймээс онолын хувьд магадлалын түүвэрлэлт , онолын баталгааны хүчтэй байдал, магадлалын дээж авах магадлалын дээж хооронд ялгаатай байх нь статистикийн янз бүрийн тохируулгаас хамаардаг.

Цаг хугацаа өнгөрөхөд онолын хувьд магадлалын дээж авах магадлал ба магадлалын дээжлэлтийн ялгаа нэмэгдсээр байна. Жишээлбэл, өндөр чанарын, үнэтэй судалгаа (зураг 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) тооны санал асуулгад тогтмол бус нэмэгдэж байна. Хариуцлагын хэмжээ нь арилжааны телефон судалгааны дүнгээс өндөр байдаг - заримдаа 90% (Kohut et al. 2012) . Эдгээр хариултууд нь тооцооллын чанарыг заналхийлж байгаа нь судалгаагаар статистикийн загвараас хамаарч судлаачид ашигладаггүй тул тохируулахын тулд ашигладаг статистик загвараас улам их хамаардаг. Цаашилбал, эдгээр чанарыг бууруулсан нь судалгааны судлаачдын өндөр хариу арга хэмжээ авахад ихээхэн хүчин чармайлт шаарддагаас болсон байна. Зарим хүмүүс чанар, чанарыг бууруулж, үнийн өсөлтийг бууруулахад чиглэсэн хоёр чиг хандлага нь судалгааны судалгааны үндэс суурь болсон (National Research Council 2013) .

Зураг 3.5: Өндөр үнэтэй судалгаа (Үндэсний Судалгааны Зөвлөл 2013, Б. Д. Мейер, Мок, Салливан 2015 он гэхэд) өндөр үнэтэй судалгаа хийдэггүй байна. Арилжааны телефон судалгааны хувьд телбергуй телбер телбер нь телбергуй, заримдаа 90% -иар ендер байдаг (Kohut нар, 2012). Хариуцлагагүй эдгээр урт хугацааны чиг хандлага нь мэдээлэл цуглуулах нь илүү үнэтэй, тооцоолол нь найдвар багатай гэсэн үг юм. Б. Д.Мейер, Мок, Салливан (2015), 1-р зураг.

Зураг 3.5: Өндөр үнэтэй судалгаа (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) ч гэсэн хариу арга хэмжээ авахгүй байна. Арилжааны телефон судалгааны хувьд (Kohut et al. 2012) , заримдаа 90% -иар ендер байдаг (Kohut et al. 2012) . Хариуцлагагүй эдгээр урт хугацааны чиг хандлага нь мэдээлэл цуглуулах нь илүү үнэтэй, тооцоолол нь найдвар багатай гэсэн үг юм. BD Meyer, Mok, and Sullivan (2015) , зураг 1-ээс авав.

Магадлал дээж авах арга өсөн нэмэгдэж буй хүндрэл бэрхшээл гарч байгаа тэр үед бас бус магадлал дээж авах арга нь сэтгэл хөдөлгөм хөгжил байна. Сорилтын бус аргуудын олон янзын загвар байдаг боловч магадгүй тэдний нэг нийтлэг зүйл бол магадлалын дээж авах математик хамрах хүрээг амархан тохируулах боломжгүй (Baker et al. 2013) . Өөрөөр хэлбэл, магадлалт магадлалын бус аргуудын хувьд хүн бүрт мэдэгдэхүйц бус байх магадлалтай. Сорилтын бус аргууд нь нийгмийн судлаачдын дунд нэр хүнд муутай байдаг бөгөөд тэдгээр нь судалгааны судлаачдын хамгийн их уналтанд орсон байдаг. Жишээлбэл Утга зохиол ухалтын буруу ойлголт (өмнө нь хэлэлцсэн), "Dewey Defeats Truman," АНУ-ын талаарх буруу таамаглал 1948 оны Ерөнхийлөгчийн сонгууль (Зураг 3.6).

Зураг 3.6: Ерєнхийлєгч Харри Труман ялагдалаа буруу зарласан буруу сонины гарчигтай хэвээр байна. Энэ нийтлэл нь магадгүй магадлалын дээжээс (1949 онд Mosteller, Bean 1950, Freedman, Pisani, and Purves 2007) тооцоололд үндэслэсэн. Dewey-ийн үймээнийг Труман 1948 онд явуулсан боловч зарим судлаачид магадлалын бус дээжнээс тооцоо хийхэд эргэлзээтэй байгаа шалтгаан нь хэвээр байна. Эх сурвалж: Harry S. Truman номын сан ба музей.

Зураг 3.6: Ерєнхийлєгч Харри Труман ялагдалаа буруу зарласан буруу сонины гарчигтай хэвээр байна. Энэ нийтлэл нь магадгүй магадлалын дээжээс (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) тооцоололд үндэслэсэн. Хэдийгээр "Dewey Defeats Truman" нь 1948 онд болсон боловч зарим судлаачид магадгүй магадлалын дээжнээс тооцоо хийхэд эргэлзэж байгаа шалтгаан нь хэвээр байна. Эх сурвалж: Harry S. Truman номын сан ба музей .

Цахим насны онцлогт тохирсон магадлалын түүврийн нэг хэлбэр нь онлайн самбар ашиглах явдал юм. Онлайн самбарыг ашигладаг судлаачид зарим компани, засгийн газар, их дээд сургуулиудаас судалгаа авахаар санал асуулга авахаар тохиролцсон том, олон бүлэг хүмүүсийг байгуулахыг шаарддаг. Эдгээр оролцогчид нь онлайн сурталчилгаа зар гэх мэт олон төрлийн зар сурталчилгааны аргуудыг ашигладаг. Дараа нь судалгаанд оролцогчийн хүссэн шинж чанарыг (жишээлбэл, насанд хүрэгчдийн үндэсний төлөөлөл гэх мэт) оролцогчдын жишээнд хандах боломжийг судлаачдад олгож болно. Эдгээр онлайн самбарууд нь магадгүй магадлалгүй аргууд байдаг. Хэдийгээр магадлалын бус интерактив самбарыг нийгмийн судлаачид (жишээ нь, ХАБЭА) ашиглаж байгаа боловч тэдгээрийн гарч буй тооцооллын чанарын талаар маргаан гарсаар байна (Callegaro et al. 2014) .

Эдгээр мэтгэлцээнүүдийг үл харгалзан, нийгмийн судлаачдын хувьд магадлалын бус түүвэрлэлтийг дахин авч үзэх нь зөв цаг хугацааны хоёр шалтгаан байдаг гэж би боддог. Нэгдүгээрт, тоон эрин үед магадлалын бус дээж цуглуулах, дүн шинжилгээ хийхэд олон тооны өөрчлөлт гарсан. Эдгээр шинэ аргууд нь өнгөрсөн үеийн бэрхшээлийг үүсгэсэн аргуудыг бодвол өөр өөр байж болох бөгөөд "магадлалын бус түүвэрлэлт 2.0" гэж бодох нь зүйтэй гэж үздэг. Судлаачид магадгүй магадлалгүй түүвэрлэлтийг дахин авч үзэх хоёр дахь шалтгаан нь магадлалын дээж авах магадлалтай учраас практик нь улам бүр хэцүү болдог. Хариуцлагагүй өндөр хувь хэмжээ байгаа үед бодит судалгаагаар одоогийн судалгаанд хамрагдсан хүмүүст бодит магадлал байхгүй бөгөөд магадгүй магадлалын дээж ба магадлалын бус дээжүүд нь судлаачдын итгэж байгаагаас ялгаатай биш юм.

Өмнө нь хэлсэнчлэн, магадлалын бус дээжийг олон тооны судлаачдын үл итгэх үзлээр авч үзсэн бөгөөд энэ нь судалгааны судалгааны эхэн үед хамгийн ичгэвчилсэн бүтэлгүйтэлтэй холбоотой байсан юм. Бид магадгүй магадлалын дээжийн хэр хол байгааг харуулсан жишээ бол Вэй Ван, Дэвид Ротшилд, Шарад Гелел, Эндрю Гелман (2015) нарын хийсэн судалгаагаар 2012 оны АНУ-ын сонгуулийн үр дүнг таамаглах боломжгүй магадлалын дээж АНУ-ын Xbox-ийн хэрэглэгчид америкчуудын тодорхой бус санаанд ордог. Судлаачид XBox тоглоомын системээс санал асуулга авч байсан бөгөөд Xbox-ийн загварыг эрэгтэй, залуу хараатай болгосон бол 18-оос 29 насныхан 19% -ийг эзэлж байсан бол Xbox-ийн дээжийн 65% Сонгогчдын 47% -ийг эзэлдэг боловч Xbox-ийн дээжийн 93% (зураг 3.7). Хүн ам зүйн хүнд хэцүү байдлаас болж түүхий Xbox-ийн өгөгдөл сонгуулийн өгөөж муу үзүүлэлт юм. Энэ нь Барак Обамагийн эсрэг Митт Ромнигийн хувьд хүчтэй ялалтыг урьдчилан таамаглаж байсан. Дахин хэлэхэд, энэ нь түүхий, тохиромжгүй тохиолдлын дээжний аюулын бас нэг жишээ бөгөөд Утга зохиол ухалтын буруу үйлдлийг санагдуулдаг.

Зураг 3.7: W. Wang et al. (2015). Судалгаанд хамрагдсан хүмүүс XBox-аас элссэний улмаас тэд залуу байх магадлалтай ба 2012 оны сонгуульд сонгогчдынхтай харьцуулахад эрэгтэй байх магадлалтай байна. W. Wang et al. (2015), зураг 1.

Зураг 3.7: W. Wang et al. (2015) . Судалгаанд хамрагдсан хүмүүс XBox-аас элссэний улмаас тэд залуу байх магадлалтай ба 2012 оны сонгуульд сонгогчдынхтай харьцуулахад эрэгтэй байх магадлалтай байна. W. Wang et al. (2015) , зураг 1.

Гэсэн хэдий ч, Ван болон хамт олон эдгээр асуудлуудыг мэдэж, тооцоо хийхдээ санамсаргүй бус түүвэрлэлтийн процессыг тохируулахыг оролдсон. Тухайлбал, дараах давхрагаыг ашигласан бөгөөд энэ нь хамрах хүрээний алдаа, хариу үйлдэл үзүүлэхгүй байж болох магадлалын дээжийг тохируулах аргыг өргөнөөр ашигладаг.

Стратегийн дараахь гол санаа нь зорилтот хүн амын талаарх нэмэлт мэдээллийг ашиглан түүвэрээс гарсан тооцооллыг сайжруулахад туслах явдал юм. Тэдний магадлалын бус судалгаагаар тооцооллын дараах үеийг ашиглан, хүн амын тоог ялгаатай бүлгүүдэд хувааж, бүлэг бүрт Обамагийн дэмжлэгийг тооцоолж, дараа нь бүлгийн үнэлгээний жигнэсэн дунджийг тооцоолсон. Жишээ нь, тэд хүн амыг хоёр бүлэгт (эрэгтэй, эмэгтэй хүмүүс) хувааж болох байсан бөгөөд Обама эрэгтэй, эмэгтэй хүмүүсийн дэмжлэгийг тооцоолж, дараа нь Обамад ерөнхийдөө дэмжлэг үзүүлсэнээр эмэгтэйчүүдийг сонгогчдын 53%, эрэгтэйчүүдийн 47% -ийг эзэлж байна. Аравтын бутархай байдал нь тэнцвэргүй түүврийг засахад тусална. Тухайн бүлгүүдийн хэмжээний талаар нэмэлт мэдээлэл авч болно.

Стратегийн дараах үе шат нь зөв бүлгийг бүрдүүлэх явдал юм. Хэрвээ та бүлгийн хүн бүрийн хувьд хариу урвал ижил байгаа бол хүн амын тоог нэгтгэх боломжтой. Өөрөөр хэлбэл жендерээр ангилах нь эрэгтэй хүн бүхэнд хариулт өгөх хандлагатай байдаг бөгөөд бүх эмэгтэйчүүд ижил хариулттай байх хандлагатай байдаг. Энэ таамаглал нь нэг төрлийн ижил төстэй хариулт-ур чадвар-бүлэг хоорондын таамаглал гэж нэрлэгддэг ба энэ бүлгийн төгсгөлд математик тэмдэглэлд арай илүү тайлбарласан.

Мэдээжийн хэрэг, хариу үйлдэл нь эрэгтэй, эмэгтэй бүх хүмүүст адилхан байх шиг байна. Гэсэн хэдий ч, бүлгийн тоо өсөхийн хэрээр нэг төрлийн бүлэгт хамаарах хариу урвал-бүлгийн төсөөлөл нь илүү үр дүнтэй байдаг. Хэрвээ та илүү олон бүлгийг бий болгосноор хүн амыг янз бүрийн бүлэгт хамруулахад хялбар болно. Жишээлбэл, бүх эмэгтэйчүүд ижил хариу үйлдлийн хувьд үр дүнгүй байх магадлалтай боловч калифорни төгссөн 18-29 насны бүх эмэгтэйчүүдэд Калифорни мужид амьдардаг бүх эмэгтэйчүүдийн хувьд адил хариу үйлдэл үзүүлэх хандлагатай байж болох юм. . Тиймээс давхрагад ашигласан бүлгүүдийн тоо ихсэх тусам аргыг илүү зохистой болгоход шаардлагатай таамаглалууд гардаг. Үүний үр дүнд судлаачид дараах үе шатанд олон тооны бүлэг үүсгэхийг хүсдэг. Гэсэн хэдий ч бүлгүүдийн тоо өсөхийн хэрээр судлаачид өөр өөр асуудалд ордог. Хэрэв бүлэг бүрт цөөн тооны хүмүүс байдаг бол тооцоолол нь илүү тодорхойгүй, мөн ямар ч хариултгүй бүлгийн хувьд онцгой тохиолдолд, дараа нь давхарга нь бүрэн задардаг.

Нэг төрлийн бүлэгт хамаарах хариу урвалын байдал-бүлгийн таамаглал ба бүлгийн боломжит түүврийн хэмжээ хоёрын хооронд үүсэх эн хоорондын зөрчилдөөнөөс хоёр янзын арга байдаг. Нэгдүгээрт, судлаачид илүү том, илүү олон төрлийн дээж цуглуулах боломжтой бөгөөд энэ нь бүлэг бүрт боломжит түүврийн хэмжээг хангахад тусалдаг. Хоёрдугаарт, тэдгээрийг бүлгүүдэд тооцоолоход илүү боловсронгуй статистик загвар ашиглаж болно. Үнэндээ заримдаа судлаачид хоёулаа хоёуланг нь хийдэг. Ван болон бусад хамт олон Xbox-ийн хүмүүсээс сонгон судалж үзсэн.

Тэд магадгүй компьютерийн удирдлагатай ярилцлага хийдэг (магадгүй 3.5-р хэсэгт компьютерийн удирдлагаар ярилцлага хийх талаар ярих болно), Ванг болон бусад ажилтнууд нь маш хямд мэдээлэл цуглуулж, 345,858 өвөрмөц оролцогчдоос мэдээлэл цуглуулах боломж олгосон Сонгуулийн санал асуулгын стандартаар асар их тоо. Энэхүү том хэмжээний түүвэрлэлтийн хэмжээ нь тэдгээрийг давхрага ангиллын олон тооны бүлэг байгуулахад хүргэсэн. Хожуу бүлэглэл нь хүн амын тоог олон зуун бүлэг болгон хуваахыг хэлдэг бол Wang, хамт олон нь хүн амыг хүйсээр (2 ангилал), уралдаан (4 ангилал), нас (4 ангилал), боловсрол (4 ангилал) (51 ангилал), намын үнэмлэх (3 ангилал), үзэл суртлын (3 ангилал), 2008 оны санал (3 ангилал). Өөрөөр хэлбэл, өртөг багатай өгөгдөл цуглуулах боломж олгосон тэдний асар том түүврийн хэмжээ нь тэдгээрийг тооцоолох үйл явцад илүү таатай таамаглал гаргах боломжийг олгосон.

Хэдийгээр 345,858 өвөрмөц оролцогчидтой байсан боловч Ван болон бусад хамт олон нь тийм ч олон хүн байсангүй. Тиймээс тэд бүлэг бүрт дэмжлэг үзүүлэхийн тулд олон шаталсан регресс гэж нэрлэгддэг арга техникийг ашигласан. Тухайлбал, тодорхой бүлгийн хүрээнд Обамагийн дэмжлэгийг тооцоолохын тулд олон тооны регресс нь хоорондоо ойр холбоотой олон бүлгийн мэдээллийг цуглуулсан. Жишээлбэл, Обамад 18-29 насны эмэгтэйчїїдийн дунд Обамад дэмжлэг їзїїлэхийг оролдож байгаад тєсєєлж буй коллежийн тєгсєгчид, Ардчилсан намын гишїїн бїртгэгдсэн, дунд зэргийн єєрийгєє таних чадвартай, 2008 онд Обамад саналаа єгсєн Обамагийн дэмжлэгийг їнэлэхийг тєсєєлж байна. , маш тодорхой бүлэг, мөн ийм шинж чанартай дээжний хэн ч байхгүй байх боломжтой. Тиймээс энэ бүлгийг тооцоолохын тулд олон шаталсан регресс нь ижил төстэй бүлгүүдээс тооцсон статистик загварыг ашигладаг.

Тиймээс Ванг болон хамт олон олон төрлийн регресс, давхар үеийг хослуулсан аргыг ашигладаг байсан тул стратеги нь олон давхаргат түвшинд регресс гэж нэрлэсэн буюу илүү " P. "Вон болон түүний хамтрагчид П.П.-ийг Xbox-ийн магадлалын бус дээжнээс тооцоолоход ашигласан нь Обамагийн 2012 оны сонгуульд ерөнхий дэмжлэгийг маш ойрхон тооцоолсон байдаг (Зураг 3.8). Үнэн хэрэгтээ тэдний тооцоолол нь олон нийтийн санал асуулгын олон нийтийн санал асуулгаас илүү үнэн зөв байв. Иймээс статистик залруулга-ялангуяа П.П. -тухай таамаглал нь магадлалын бус өгөгдлүүдийг засаж залруулах ажлыг сайн хийж байгаа мэт харагдаж байна; Тохируулаагүй Xbox-ийн өгөгдлүүдийг тооцоолоход харагдахуйц алдаа гарсан байна.

Зураг 3.8: Ванг ба бусад (2015). Тохируулаагүй XBox дээж буруу тооцоолол хийсэн. Гэхдээ жинлэсэн XBox түүвэр нь магадгүй магадлалд суурилсан телефон судалгааны дунджаас илүү үнэн зөв байсан. W. Wang et al. (2015), 2 ба 3-р зураг.

Зураг 3.8: W. Wang et al. (2015) . Тохируулаагүй XBox дээж буруу тооцоолол хийсэн. Гэхдээ жинлэсэн XBox түүвэр нь магадгүй магадлалд суурилсан телефон судалгааны дунджаас илүү үнэн зөв байсан. W. Wang et al. (2015) , 2 ба 3-р зураг.

Ванг болон хамт ажилладаг судлаачдын хоёр үндсэн сургамж байдаг. Нэгдүгээрт, тохиромжгүй магадлалгүй дээж нь муу тооцоолол үүсгэж болно; Энэ бол олон судлаачид урьд өмнө нь сонсож байсан хичээл юм. Гэхдээ хоѐрдугаар хичээл нь зөв дүн шинжилгээ хийсний дараа магадлалын дээжийг сайн тооцоолох боломжтой; магадлалын бус дээж нь Утга зохиолын зохиомол алдаа гэх мэт ямар нэг зүйл рүү шууд хүргэхгүй байх ёстой.

Цаашид, магадлалын түүвэрлэлтийн аргыг ашиглан магадлалгүйгээр магадлалын түүвэрлэлтийн аргыг сонгохыг оролдож байгаа бол та хүнд сонголттой тулгарах болно. Заримдаа судлаачид хурдан, хатуу дүрмийг (жишээлбэл, магадлалын дээж авах аргыг үргэлж ашигладаг) хүсдэг боловч ийм дүрмийг санал болгох нь улам бүр хэцүү байдаг. Судлаачид практик дээр дээж авах магадлалын аргуудын хоорондох бэрхшээлтэй тулгардаг бөгөөд энэ нь илүү үнэтэй бөгөөд тэдгээрийн хэрэглээ болон магадлалгүй түүвэрлэх аргуудыг илүү хямд, хурдан, гэхдээ илүү танил бус, илүү олон янзын аргын алинд нь ашигладаг болохыг харуулдаг. Гэхдээ нэг зүйл нь хэрэв та магадгүй магадлалын дээж эсвэл том биш өгөгдлийн эх сурвалжтай хамтран ажиллах шаардлагатай бол (2-р бүлэгт эргэж бодоорой) эргэцүүлбэл дараа үе шатыг ашиглан тооцоо хийсэн гэдэгт итгэх хүчтэй шалтгаан байна. холбогдох аргууд нь тохируулаагүй, түүхий тооцооллоос илүү дээр байх болно.