3.4.1 Kemungkinan sampling: koleksi data lan analisis data

Bobot bisa batalaken distorsi sengojo disababaké déning proses sampling.

Conto kemungkinan sing ngendi kabeh wong duwe dikenal, non nul-kemungkinan Gawan, lan gampang desain kemungkinan sampling punika prasaja acak sampling ngendi saben wong kemungkinan witjaksono Gawan. Nalika penjawab dipilih liwat prasaja acak sampling karo eksekusi sampurna (eg, ora kesalahan jangkoan lan ora non-nanggepi), banjur ngira suta amarga sampel bakal-ing saben-dadi versi miniatur saka populasi.

Prasaja acak sampling arang digunakake ing laku, nanging. Luwih, peneliti sengojo pilih wong kamungkinan unequal Gawan supaya ngurangi biaya lan nambah akurasi. Nalika peneliti sengojo pilih wong kamungkinan beda Gawan, banjur pangaturan sing perlu kanggo batalaken distorsi disebabake proses sampling. Ing tembung liyane, carane kita generalize saka sampel gumantung carane sampel kapilih.

Contone, ing Survey Pedunung saiki (CPS) digunakake dening pamaréntah AS kanggo ngira tingkat pengangguran. Saben sasi babagan 100.000 wong sing diwawancarai, salah siji pasuryan-kanggo-pasuryan utawa liwat telpon, lan asil sing digunakake kanggo gawé tingkat pengangguran ing kira-kira. Amarga pemerintah kapengin ngira tingkat pengangguran ing saben negara, iku ora bisa apa sampel acak prasaja saka diwasa amarga sing bakal ngasilaken banget sawetara penjawab ing negara kanthi populasi cilik (eg, Rhode Island) lan uga akeh saka negara karo gedhe populasi (eg , California). Nanging, ing CPS conto wong ing negara liyane ing beda tarif, proses sing disebut sampling stratified karo kemungkinan unequal saka pilihan. Contone, yen CPS wanted 2,000 penjawab saben negara, banjur diwasa ing Rhode Island bakal duwe bab 30 kaping luwih kemungkinan Gawan saka diwasa ing California (Rhode Island: 2,000 penjawab saben 800,000 diwasa vs California: 2,000 penjawab saben 30,000,000 diwasa). Minangka kita bakal weruh mengko, iki jenis sampling karo kemungkinan unequal mengkono karo sumber online saka data banget, nanging kados CPS, mekanisme sampling biasane ora dikenal utawa kontrol dening peneliti ing.

Given desain sampling, ing CPS ora langsung wakil saka US; kalebu akeh banget wong saka Rhode Island lan uga sawetara saka California. Mulane, iku bakal dadi bodho kanggo ngira tingkat pengangguran ing negara karo tingkat pengangguran ing sampel. Tinimbang tegese sampel, iku luwih apik kanggo njupuk tegese bobot, endi bobot akun kasunyatan sing wong saka Rhode Island padha liyane kamungkinan kanggo kalebu saka wong saka California. Contone, saben wong saka California bakal upweighted- padha bakal count liyane ing ngira-lan saben wong saka Rhode Island bakal downweighted-wong bakal count kurang ing ngira ing. Ing pet, sampeyan suka liyane kanggo wong sing kurang kamungkinan kanggo mangerteni.

Contone dolanan iki nggambaraké sawijining titik penting kang umum dimangertèni: sampel ora perlu dadi versi miniatur pedunung supaya gawé prakiraan apik. Yen cukup dikenal bab carane data iki dikumpulake, banjur informasi sing bisa digunakake nalika nggawe prakiraan saka sampel. Pendekatan aku wis mung diterangake-lan aku njlèntrèhaké matématis ing technical sesambungan-tumiba squarely ing framework klasik kemungkinan sampling. Saiki, Aku bakal nuduhake carane sing idea padha bisa Applied kanggo conto non-kemungkinan.