3.4.3 Зразки неймовірності: відповідність зразка

Не всі зразки неймовірності однакові. Ми можемо додати більше контролю на передньому кінці.

Підхід Ван і його колеги використовували для оцінки підсумків 2012 року президентських виборів в США повністю залежить від поліпшення аналізу даних. Тобто, вони зібрали стільки відповідей, як вони могли, а потім спробували повторно вага їх. Додатковий стратегією роботи з відбором проб неймовірності, щоб мати більший контроль над процесом збору даних.

Найпростіший приклад процесу відбору проб частково контрольованої неймовірності квота вибірки, метод , який сходить до ранніх днях дослідження обстеження. У квотною вибіркою, дослідники ділять населення на різні групи (наприклад, молодих чоловіків, молодих жінок і т.д.), а потім встановити квоти на кількість людей, які будуть відібрані в кожній групі. Респонденти вибираються випадковим чином, поки дослідник не виконає свою квоту в кожній групі. Через квоти, отриманий зразок більше схожий цільової групи населення, ніж було б правильно, в іншому випадку, а тому, що ймовірності включення невідомі багато дослідників скептично ставляться до квотною вибіркою. Насправді, відбір проб квота була причиною "Дьюї Поразки Трумена" помилка в 1948 році виборах президента США. Тому що вона забезпечує певний контроль над процесом відбору проб, однак, можна побачити, як відбір проб квоти може мати деякі переваги в порівнянні з повністю неконтрольованою збору даних.

Перехід від квотною вибіркою, більш сучасні підходи до управління процесом вибірки неймовірності тепер можливі. Одним з таких підходів називається зіставленням зразок, і він використовується деякими комерційними провайдерами інтернет - панелі. У своїй простій формі, узгодження зразка вимагає два джерела даних: 1) повний реєстр населення і 2) велика панель добровольців. Важливо, що добровольці не повинні бути ймовірнісної вибірки з будь-якої групи населення; щоб підкреслити , що не існує будь - яких вимог для вибору в панель, я буду називати його брудної панелі. Крім того, як регістр населення і брудна панель повинна включати деяку допоміжну інформацію про кожну людину, в цьому прикладі, я буду враховувати вік і стать, але в реальних ситуаціях ця допоміжна інформація може бути набагато більш докладними. Трюк відповідності зразка, щоб відібрати зразки з брудної панелі таким чином , що виробляє зразки , які виглядають як зразки ймовірності.

відповідності зразка починається, коли імітується імовірнісна вибірка береться з регістра населення; цей модельованої зразок стає мішенню зразка. Потім, на підставі допоміжної інформації, випадки в цільовому зразку зіставляються з людьми в брудній панелі , щоб сформувати парну вибірку. Наприклад, якщо є 25-річна жінка в цільовому зразку, то дослідник знаходить 25-річної жінки з брудної панелі, щоб бути в узгодженої вибірки. Нарешті, члени узгодженого зразка опитуються для отримання остаточного набору респондентів.

Навіть незважаючи на те, що зіставлений зразок виглядає як цільова вибірка, важливо пам'ятати, що зіставлений зразок не є ймовірнісної вибірки. Підібрані зразки можуть відповідати тільки цільової вибірки на відомій допоміжної інформації (наприклад, вік і стать), але не на неймовірне характеристик. Наприклад, якщо люди на брудній панелі, як правило, біднішими, врешті-решт, одна з причин, щоб приєднатися до обстеження панель, щоб заробити гроші, то навіть якщо узгоджений зразок виглядає як цільової вибірки за статтю та віком він все одно матиме ухил в сторону бідних людей. Магія істинної ймовірнісної вибірки є, щоб виключити проблеми на обох виміряних і неймовірне характеристик (точка, яка узгоджується з нашої дискусії узгодження для причинного виведення з наглядових досліджень, в розділі 2).

На практиці узгодження зразка залежить від наявності великої і різноманітної панелі спраглого завершити опитування, і, таким чином, це в основному робиться компаніями, які можуть дозволити собі розвивати і підтримувати таку панель. Крім того, на практиці можуть виникнути проблеми з відповідністю (іноді хороший матч для кого-то в цільовому зразку не існує на панелі) і неответа (іноді люди в зіставляється відмовитися від участі в опитуванні). Тому на практиці, дослідники роблять відповідність зразка також виконувати якісь коригування після стратифікації, щоб зробити оцінки.

Важко дати корисні теоретичні гарантії щодо відповідності зразка, але на практиці він може виконувати добре. Наприклад, Стівен Ansolabehere і Брайан Schaffner (2014) порівняли три паралельних обстеження близько 1000 чоловік , проведених у 2010 році з використанням трьох різних методів відбору проб та інтерв'ю методи: пошта, телефон, а також панель Інтернет з допомогою зіставлення зразків і коригування після стратифікації. Оцінки з трьох підходів, були дуже схожі з оцінками з високоякісних тестів, таких як Поточне обстеження населення (CPS) та інтерв'ю National Health Survey (NHIS). Більш конкретно, як Інтернет і поштові опитування були вимкнені в середньому на 3 процентних пункти, а опитування телефон був відключений на 4 процентних пункти. Помилки це великі приблизно те, що можна було б очікувати від зразків близько 1000 чоловік. Хоча жоден з цих режимів виробництва істотно більш точних даних, як Інтернет і телефонне опитування (який пройшов кілька днів або тижнів) були значно швидше поле, ніж поштовий опитування (який взяв вісім місяців), а також опитування Інтернет, який використовується зіставлення вибірки, було дешевше, ніж в двох інших режимах.

На закінчення, соціологи і статисти неймовірно скептично ставляться до висновків з цих зразків неймовірності, почасти тому , що вони пов'язані з деякими баламутять невдач досліджень обстеження , таких як опитування Literary Digest. Зокрема, я згоден з цим скепсисом: нескоректована зразки неймовірності, швидше за все, для отримання поганих оцінок. Проте, якщо дослідники можуть відрегулювати для відхилень в процесі відбору проб (наприклад, пост-стратифікації) або контролювати процес відбору проб кілька (наприклад, відповідний зразок), вони можуть виробляти більш точні оцінки, і навіть оцінки якості, достатньої для більшості цілей. Звичайно, це не було б краще, щоб зробити бездоганно виконаний вірогідну вибірку, але це вже не по-видимому, є реалістичним варіантом.

Обидва зразки без ймовірності і зразки ймовірності розрізняються за якістю, і в даний час, імовірно, так, що більшість оцінок із зразків ймовірності є більш надійними, ніж оцінки з зразків неймовірності. Але навіть зараз, за ​​оцінками від добре проведених проб без ймовірності, ймовірно, краще, ніж оцінки з погано проведених проб ймовірності. Крім того, зразки неймовірності істотно дешевше. Таким чином, представляється, що ймовірність проти вибірки неймовірності пропонує економічно якісний компроміс (Малюнок 3.6). Дивлячись в майбутнє, я очікую, що оцінки від добре зроблених зразках без ймовірності стане дешевше і краще. Крім того, через збої в роботі стаціонарних телефонних опитувань і зростаючих темпів неответа, я очікую, що зразки ймовірності стане дорожчим і більш низької якості. Через ці довгострокових тенденцій, я думаю, що відбір проб не ймовірністю буде набувати все більшого значення в третій епосі оглядового дослідження.

Малюнок 3.6: Імовірність вибірки на практиці і вибірки неймовірності є як великі, неоднорідні категорії. Загалом, є вартість помилок компроміс з відбором проб, які не ймовірність бути нижчою вартості, але вище помилка. Проте, добре прожарений вибірки без ймовірності може привести до більш точні оцінки, ніж погано зробленої ймовірнісної вибірки. В майбутньому, я очікую, що відбір проб без ймовірності буде ставати все краще і дешевше, в той час як імовірнісна вибірка буде ще гірше і дорожче.

Малюнок 3.6: Імовірність вибірки на практиці і вибірки неймовірності є як великі, неоднорідні категорії. Загалом, є вартість помилок компроміс з відбором проб, які не ймовірність бути нижчою вартості, але вище помилка. Проте, добре прожарений вибірки без ймовірності може привести до більш точні оцінки, ніж погано зробленої ймовірнісної вибірки. В майбутньому, я очікую, що відбір проб без ймовірності буде ставати все краще і дешевше, в той час як імовірнісна вибірка буде ще гірше і дорожче.