3.4.1 Olasılık örnekleme: veri toplama ve veri analizi

Ağırlıklar kasıtlı örnekleme sürecinin neden olduğu bozulmaları geri alabilirsiniz.

Olasılık örnekleri tüm insanlar dahil bilinen, sıfır olmayan olasılık var nerede olanlardır ve en basit olasılık örnekleme tasarımı her kişinin dahil eşit olasılığa sahip rastgele örnekleme basittir. Katılımcıların mükemmel yürütme (örneğin, hiçbir kapsama hatası ve olmayan hiçbir yanıt) ile basit tesadüfi örnekleme yoluyla seçildiğinde numune üzerinde nüfusun bir minyatür versiyonu ortalama olmak, çünkü o zaman tahmin basittir.

Basit tesadüfi örnekleme nadiren ancak uygulamada kullanılmaktadır. Aksine, araştırmacılar kasıtlı maliyetini azaltmak ve doğruluğu artırmak amacıyla içerme eşitsiz olasılıkları olan insanları seçin. Araştırmacılar kasıtlı içerme olasılıkları farklı olan insanlar seçtiğinizde, daha sonra ayarlamalar örnekleme sürecinin neden olduğu bozulmaları geri almak için ihtiyaç vardır. Diğer bir deyişle, bir numuneden genelleme kadar örnek seçildi bağlıdır.

Örneğin, Cari Nüfus Araştırması (CPS) işsizlik oranını tahmin etmek için ABD hükümeti tarafından kullanılmaktadır. Her biri yaklaşık 100.000 kişi mülakata tabi tutulurlar ay, yüz-yüze veya telefonla ya ve sonuçları tahmin işsizlik oranı üretmek için kullanılır. Hükümet her eyalette işsizlik oranını tahmin etmek istediği, çünkü bu büyük nüfusa sahip devletlerden çok sayıda küçük popülasyonlar (örneğin, Rhode Island) ve devletlerde çok az katılımcıların doğuracak, çünkü yetişkinlerin bir basit tesadüfi örnek yapamaz (örneğin , Kaliforniya). Bunun yerine, farklı oranlarda farklı devletler CPS örnekleri insanlar, bir süreç seçimi eşitsiz bir olasılık ile tabakalı örnekleme denir. Örneğin, CPS devlet başına, daha sonra Rhode Island yetişkinler (: Kaliforniya vs 800.000 yetişkin başına 2.000 katılımcı: 30000000 yetişkin başına 2.000 katılımcıların Rhode Island) Kaliforniya'da yetişkinlere göre daha dahil yaklaşık 30 kat daha yüksek bir olasılık olurdu 2.000 katılımcıların istedi. Daha sonra göreceğimiz gibi, eşitsiz olasılıkla örnekleme bu tür çok veri çevrimiçi kaynakları ile olur, ama CPS aksine, örnekleme mekanizması genellikle bilinmemektedir veya araştırmacı tarafından kontrol edilir.

onun örnekleme tasarımı göz önüne alındığında, CPS ABD doğrudan temsilcisi değildir; çok fazla Rhode Island insanları ve California çok az içerir. Nedenle, örnekteki işsizlik oranı ile ülkedeki işsizlik oranını tahmin etmek akıllıca olacaktır. Bunun yerine örnek ortalamanın, o Rhode Island'da insanlar California insanlardan daha dahil edilecek daha olası olduğunu ağırlıklar aslında hesaba ağırlıklı ortalama, almak daha iyidir. Örneğin, California her kişi, olacağını Rhode Island'dan tahmini-ve her kişi daha saymak olacaktır upweighted- olurdu düşük ağırlık-onlar tahmin az saymak olacaktır. Özünde, size hakkında bilgi edinmek için daha az olasıdır insanlara daha fazla sesi verilir.

Bu oyuncak örneği önemli ama genellikle yanlış noktayı gösterir: Bir örnek iyi tahminler üretmek için nüfusun minyatür versiyonu olması gerekmez. Yeterli veri toplanmıştır nasıl biliniyorsa numuneden tahminler yaparken, daha sonra bu bilgiler kullanılabilir. yaklaşım sadece tarif-ve teknik matematiksel açıklayan klasik olasılık örnekleme çerçevesinde dürüstçe ekte düşer ettik. Şimdi, ben aynı fikri olmayan olasılık örnekleri nasıl uygulanabileceğini göstermek gerekir.