3.4.1 yiwuwa daukan samfur: data tarin da kuma data analysis

Nauyi iya magance hargitsi da gangan ya sa ta daukan samfur tsari.

Yiwuwar samfurori ne waɗanda inda dukan mutane da aka sani, ba-sifili yiwuwar hada, da kuma sauki yiwuwa daukan samfur zane ne mai sauki bazuwar daukan samfur inda kowane mutum yana daidai yiwuwar hada. A lokacin da aka zaba weights via m bazuwar daukan samfur da cikakken kisa (misali, ba ɗaukar hoto kuskure, kuma babu wadanda ba amsa), to, hakkin ne mai saukin ganewa, saboda samfurin zai-on talakawan-zama dada version na yawan.

Simple bazuwar daukan samfur yana da wuya a yi amfani da yi, duk da haka. Maimakon haka, masu bincike da ganganci zaži mutane da unequal yiwuwa na hada domin rage kudin da kuma ƙara daidaito. A lokacin da masu bincike da ganganci zaži mutane daban-daban tare yiwuwa na hada, to sabawa ake bukata don magance hargitsi sa da daukan samfur tsari. A wasu kalmomin, da yadda muka generalize daga sample dogara kan yadda samfurin da aka zaba.

Alal misali, Current Population Survey (CPS) da ake amfani da gwamnatin {asar Amirka don kimanta da rashin aikin yi kudi. Kowane watan game da 100,000 mutane suna hira, ko dai fuskar-to-face ko a kan tarho, da kuma sakamakon da ake amfani da su samar da rashin aikin yi kiyasta kudi. Domin gwamnati yanã son ya kimanta da yawan marasa aikin yi a kowace jiha, shi ba zai iya yi mai sauki bazuwar samfurin manya saboda cewa zai samar ma 'yan weights a jihohin da kananan alƙarya (misali, Rhode Island) da kuma da yawa daga jihohin da manyan alƙarya (eg , California). Maimakon haka, CPS samfurori mutane daban-daban a jihohin a daban-daban rates, wani tsari da ake kira rabe daukan samfur da unequal yiwuwar selection. Alal misali, idan CPS so 2,000 weights da jihar, to, manya a Rhode Island zai yi game da 30 sau mafi girma yiwuwar hada fiye da manya a California (Rhode Island: 2,000 weights da 800,000 manya vs California: 2,000 weights da 30.000.000 manya). Kamar yadda za mu gani a nan gaba, da irin wannan daukan samfur da unequal yiwuwa faru da online samo data ma, amma sabanin CPS, da daukan samfur inji ne yawanci ba a san ko sarrafawa da bincike.

Ganin da daukan samfur zane, da CPS ne ba kai tsaye wakilin Amurka. ya hada da mutane da yawa daga Rhode Island, da kuma 'yan daga California. Saboda haka, zai zama marasa to kimanta da yawan marasa aikin yi a kasar tare da rashin aikin yi kudi a cikin samfurin. Maimakon samfurin rõwa, shi ne mafi alhẽri ya dauki wani mai nauyi rõwa, inda nauyi asusu na cewa mutane daga Rhode Island kasance mafi kusantar da za a hada da fiye da mutane daga California. Alal misali, kowane mutum daga California zai zama upweighted- su ƙidãya more a kimanta-da kowane mutum daga Rhode Island za a downweighted-su ƙidãya kasa a kimanta. A ainihi, ka ba more murya ga mutanen da ke kasa da su ne m su koyi game da.

Wannan abun wasa misali ya nuna wani muhimmanci, amma fiye fahimci ma'ana: a sample ba ya bukatar ya zama wani dada version na yawan domin nuna kyau kimomi. Idan isa da aka sani game da yadda data aka tattara, to, wanda bayani za a iya amfani da lokacin da yin kimomi daga cikin samfurin. The m Na kawai aka bayyana-da cewa na bayyana shifran a fasaha appendix-dama squarely cikin gargajiya yiwuwa daukan samfur tsarin. Yanzu, zan nuna yadda wannan ra'ayin za a iya amfani da su ba yiwuwa samfurori.