3.4.1 Магадлалын дээж авах: мэдээлэл цуглуулах, мэдээллийн дүн шинжилгээ

Жин санаатайгаар дээж авах явцад үүссэн гажуудал буцаах боломжтой.

Магадлалын дээж бүх хүмүүс мэдэгдэж, төрийн бус тэг оруулах магадлал байгаа тохиолдолд хүмүүс байдаг ба энгийн магадлалын түүвэрлэх загвар нь энгийн санамсаргүй түүврийн хүн бүрийн оролцоо тэгш магадлалтай байдаг байна. оролцогчид төгс гүйцэтгэл (жишээ нь, ямар ч хамрах хүрээ нь алдаа, ямар ч төрийн бус хариу) нь энгийн санамсаргүй түүвэрлэлтийн дамжуулан сонгосон бол, дараа нь тооцоо, учир нь дээж дээр болно дундаж байх хүн амын бяцхан хувилбар нь шулуухан юм.

Энгийн санамсаргүй түүврийн нь ховор байдаг хэдий ч, практик дээр ашиглаж байна. Харин судлаачид санаатайгаар зардлыг бууруулах, үнэн зөв нэмэгдүүлэх зорилгоор оруулах тэгш бус магадлалаар хүмүүсийг сонгоно. Судлаачид санаатайгаар оруулах янз бүрийн магадлалаар хүмүүсийг сонгох үед, дараа нь тохируулга дээж авах явцад үүссэн гажуудлыг арилгана шаардлагатай байна. Өөрөөр хэлбэл, бид дээжээс ерөнхийлөн хэрхэн дээж хэрхэн сонгосон юм хамаарна.

Жишээ нь, Хүн амын судалгаа (CPS) ажилгүйдлийн түвшинг тооцох нь АНУ-ын Засгийн газар ашиглаж байна. сар бүр 100,000 хүн ярилцлага байна, нүүр тулсан буюу утсаар ч, үр дүн нь тооцсон ажилгүйдлийн түвшинг үйлдвэрлэхэд ашиглаж байна. Тэр жижиг хүн ам (жишээ нь, Rhode Island), том хүн амтай улс орнууд нь хэтэрхий олон нь АНУ-д ч бас хэд хэдэн хариултыг өгөх болно, учир нь Засгийн газар муж улс бүрт ажилгүйдлийн түвшинг тооцож хүссэн учраас энэ насанд хүрэгчдийн энгийн санамсаргүй түүвэр хийх боломжгүй юм (жишээ нь, , Калифорни). Харин оронд нь өөр өөр улс орнуудад CPS дээж хүмүүс өөр өөр үнээр, үйл явц сонголт нь тэгш бус магадлал нь давхаргаас дээж гэж нэрлэдэг. Жишээ нь, хэрэв CPS улсын нэг, дараа нь Rhode Island-д насанд хүрэгчид (: Калифорни мужийн сүсэг 800,000 насанд хүрсэн нэг 2,000 оролцогчид: 30,000,000 насанд хүрсэн нэг 2000 хариулсан Rhode Island) Калифорни мужийн насанд хүрэгчдийн бодвол оруулах ойролцоогоор 30 дахин их магадлалтай байх болно 2000 оролцогчдыг хүссэн юм. Бид дараа нь харж болно хувьд тэгш бус магадлал нь дээж энэ төрлийн маш мэдээллийн онлайн эх сурвалжаас нь юу ч CPS ялгаатай нь, дээж авах механизм нь ихэвчлэн алдартай, эсвэл судлаач хянаж байна.

нь дээж дизайн харгалзан, CPS АНУ-ын шууд төлөөлөл биш юм; Энэ Rhode Island-аас маш олон хүн, Калифорни маш цөөн тооны орно. Тиймийн тул, энэ дээжин дэх ажилгүйдлийн түвшин нь улс орны ажилгүйдлийн түвшинг тооцох мунхаг байж болох юм. Харин оронд нь дээж дундаж нь, энэ нь жигнэсэн дундаж, Rhode Island-аас хүн Калифорнийн хүмүүстэй илүү орсон байх магадлал илүү байна гэж жин Үнэндээ эзэлж авах нь илүү дээр юм. Жишээ нь, Калифорнийн хүн бүр тэд тооцоо ба Rhode Island-аас хүн бүр болно илүү тоолж болно upweighted- байх downweighted-тэд тооцооллын бага тоо юм. Мөн чанартаа та талаар сурах магадлал бага байдаг хүмүүст илүү дуу хоолойг өгсөн байна.

Энэ тоглоомын жишээ нь чухал боловч нийтлэг буруу ойлголт цэг харуулж байна: жишээ сайн тооцоо бий болгохын тулд хүн амын бяцхан хувилбарыг байх хэрэгтэй биш юм. хангалттай мэдээлэл хэрхэн цуглуулдаг байсан тухай мэдэгдэж байгаа бол тухайн мэдээллийн дээжээс тооцоог хийхдээ ашиглаж болно. хандлага нь би зүгээр л тайлбарласан ба шүү дээ би техникийн д математик тайлбарлах гэж сонгодог магадлал дээж хүрээнд шуудхан хавсралтанд-унасан байна. Одоо би тэр санаа бус магадлал дээж хэрэглэж болно хэрхэн харуулах болно.