3.4.1 ალბათობა შერჩევის: მონაცემების შეგროვება და მონაცემთა ანალიზი

Weights შეგიძლიათ გაუქმება სხვაობა განზრახ გამოწვეული შერჩევის პროცესში.

ალბათობა ნიმუშები არიან ისეთებიც, სადაც ყველა ადამიანს აქვს ცნობილი, არასამთავრობო ნულოვანი ალბათობის ჩართვის, და მარტივი ალბათობა შერჩევის დიზაინი არის მარტივი შემთხვევითი შერჩევის სადაც თითოეულ ადამიანს აქვს თანაბარი ალბათობა ჩართვა. როდესაც გამოკითხულთა შერჩეული მარტივი შემთხვევითი შერჩევის სრულყოფილი შესრულების (მაგალითად, არ დაფარვის შეცდომა და არ არასამთავრობო საპასუხოდ), მაშინ შეფასებით არის პირდაპირი გამო ნიმუში-საშუალოდ იყოს მინიატურული ვერსია მოსახლეობას.

მარტივი შემთხვევითი შერჩევის იშვიათად გამოიყენება, თუმცა პრაქტიკაში. პირიქით, მკვლევარები შეგნებულად აირჩიეთ ადამიანებს არათანაბარ ალბათობა ჩართვის, რათა შეამციროს ღირებულება და გაზრდის სიზუსტით. როდესაც მკვლევარებმა შეგნებულად აირჩიეთ ადამიანები სხვადასხვა ალბათობა ჩართვის, მაშინ კორექტირება არ არის საჭირო, რათა გაუქმება სხვაობა გამოწვეული შერჩევის პროცესში. სხვა სიტყვებით, თუ როგორ ჩვენ განზოგადება ნიმუში დამოკიდებულია იმაზე, რამდენად ნიმუში შეირჩა.

მაგალითად, აქტუალური მოსახლეობა კვლევა (CPS) გამოიყენება ამერიკის მთავრობის მიერ, რათა დადგინდეს უმუშევრობის დონე. ყოველი თვის დაახლოებით 100,000 ადამიანი გამოიკითხა, ან face-to-face ან ტელეფონით და შედეგები გამოიყენება წარმოების სავარაუდო უმუშევრობის დონე. იმის გამო, რომ ხელისუფლებას სურს, რათა დადგინდეს, უმუშევრობის დონე თითოეულ სახელმწიფოში, მას არ შეუძლია მარტივი შემთხვევითი ნიმუში მოზარდები იმიტომ, რომ ზედმეტად რამდენიმე რესპონდენტი ქვეყნების მოსახლეობა მცირეა (მაგალითად, Rhode Island) და ძალიან ბევრი სახელმწიფოების დიდი მოსახლეობის (მაგ , California). ამის ნაცვლად, CPS ნიმუშები ადამიანი სხვადასხვა ქვეყნების სხვადასხვა განაკვეთები, ამ პროცესს ეწოდება სტრატიფიცირებული შერჩევის უთანასწორო ალბათობა შერჩევა. მაგალითად, იმ შემთხვევაში, თუ CPS სურდა 2,000 რესპონდენტი ერთ სახელმწიფოს, მაშინ მოზარდები Rhode Island ექნება დაახლოებით 30-ჯერ უფრო მაღალია ალბათობა ჩართვის, ვიდრე მოზრდილებში კალიფორნიაში (Rhode Island: 2,000 რესპონდენტი პოსტი 800,000 მოზარდები vs California: 2,000 რესპონდენტი ერთ 30,000,000 მოზარდები). როგორც ვნახავთ შემდეგ, ამ სახის შერჩევის უთანასწორო ალბათობა ხდება ონლაინ წყაროების მონაცემები, მაგრამ განსხვავებით CPS, შერჩევის მექანიზმი, როგორც წესი, არ არის ცნობილი ან აკონტროლებს მკვლევარი.

იმის გათვალისწინებით, მისი შერჩევის დიზაინი, CPS არ არის პირდაპირ წარმომადგენელი აშშ; იგი მოიცავს ძალიან ბევრი ადამიანი Rhode Island და ძალიან ცოტა კალიფორნიის. ამიტომ, არ იქნება მართებული, რათა დადგინდეს, უმუშევრობის დონე ქვეყანაში უმუშევრობის ნიმუში. იმის ნაცვლად, რომ ნიმუში ნიშნავს, უმჯობესია მიიღოს საშუალო შეწონილი, სადაც Weights აიხსნება ის ფაქტი, რომ ხალხს Rhode Island უფრო სავარაუდოა, რომ იყოს ჩართული, ვიდრე ადამიანი, კალიფორნიის. მაგალითად, თითოეული პირის California იქნება upweighted- ისინი ითვლიან მეტი ხარჯთაღრიცხვა და თითოეული პირის Rhode Island იქნება downweighted ისინი იმედი ნაკლებად ხარჯთაღრიცხვა. არსებითად, თქვენ გეძლევათ მეტი ხმა ხალხს, რომ თქვენ ნაკლებად სავარაუდოა, რომ გაეცნობიან.

ეს სათამაშო მაგალითი გვიჩვენებს, მნიშვნელოვანია, მაგრამ ხშირად არასწორად წერტილი: ნიმუში არ უნდა იყოს მინიატურული ვერსია მოსახლეობას, რათა აწარმოოს კარგი შეფასებები. თუ საკმარისი არ არის ცნობილი, თუ როგორ მონაცემები შეგროვდება, მაშინ ეს ინფორმაცია შეიძლება გამოყენებულ იქნას მიღებისას შეფასებით ნიმუში. მიდგომა მე უბრალოდ აღწერილი და რომ მე აღწერს მათემატიკური ტექნიკური დანართი-მოდის squarely ფარგლებში კლასიკური ალბათობა შერჩევის ფარგლებში. ახლა, მე, თუ როგორ, რომ იგივე იდეა შეიძლება მიმართა არასამთავრობო ალბათობა ნიმუშები.