3.4.2 Образцы невероятности: взвешивание

С помощью образцов невероятности, веса могут отменить искажения , вызванные предполагаемым процессом отбора проб.

Таким же образом, что исследователи весом ответов из образцов вероятности, они также могут весить ответы от образцов невероятности. Например, в качестве альтернативы КПА, представьте, что вы разместили баннеры на тысячах веб-сайтов для набора участников для обследования с целью оценки уровня безработицы. Естественно, вы бы скептически, что простое среднее вашей выборки будет хорошей оценкой уровня безработицы. Ваш скептицизм, вероятно, потому что вы думаете, что некоторые люди, более вероятно, чтобы завершить обследование, чем другие. Например, люди, которые не проводят много времени в Интернете, менее вероятно, чтобы завершить обследование.

Как мы видели в предыдущем разделе, однако, если мы знаем, как был выбран, как образец мы делаем с вероятностью образцов, то мы можем отменить искажения, вызванные процессом взятия проб. К сожалению, при работе с образцами без вероятности, мы не знаем, как был выбран образец. Но, мы можем сделать предположения относительно процесса отбора проб, а затем применить взвешивание таким же образом. Если эти предположения верны, то взвешивание отменит искажения, вызванные процессом взятия проб.

Например, представьте себе, что в ответ на ваши рекламные баннеры, вы набраны 100000 респондентов. Тем не менее, вы не верите, что эти 100000 респондентов простая случайная выборка взрослых американцев. На самом деле, если сравнить ваши респондентов населения США, вы обнаружите, что люди из некоторых стран (например, Нью-Йорк) чрезмерно представлены и что люди из некоторых стран (например, на Аляске) недостаточно представлены. Таким образом, уровень безработицы в вашей выборке, вероятно, будет плохой оценкой уровня безработицы в целевой группе населения.

Один из способов, чтобы отменить искажение, что происходило в процессе отбора проб, чтобы назначить веса каждому человеку; более низкие веса для людей из стран, которые чрезмерно представлены в образце (например, Нью-Йорк) и более высокие веса для людей из стран, которые недостаточно представлены в образце (например, на Аляске). Более конкретно, вес для каждого респондента связано с их распространенности в вашем образце по сравнению с их распространенности в популяции США. Эта процедура взвешивания называется постстратификация, и идея взвешивания должна напомнить вам , например , в разделе 3.4.1 , где респонденты из Род - Айленд получили меньший вес , чем респонденты из Калифорнии. Постстратификация требует, чтобы вы знаете достаточно, чтобы положить респондентов на группы и знать долю целевой группы населения в каждой группе.

Несмотря на то, взвешивание образца вероятности и выборки невероятности одни и те же математически (см техническое приложение), они хорошо работают в различных ситуациях. Если исследователь имеет совершенную вероятностную выборку (т.е. без ошибок покрытия и не без ответа), то взвешивание будет производить объективную оценку всех признаков во всех случаях. Эта сильная теоретическая гарантия, почему защитники образцов вероятности найти их столь привлекательными. С другой стороны, взвешивание образцов без вероятности будет производить только объективные оценки по всем признакам, если наклонности ответа являются одинаковыми для всех в каждой группе. Другими словами, мысленно возвращаясь к нашему примеру, используя постстратификация будет производить объективную оценку, если все в Нью-Йорке, имеет ту же вероятность участия и все на Аляске имеет ту же вероятность участия и так далее. Это предположение называется гомогенные-реакция-наклонности-внутри-групп предположение, и оно играет ключевую роль в познании , если постстратификация будет хорошо работать с образцами без вероятности.

К сожалению, в нашем примере, гомогенный-реакция-наклонности-в-групп предположение кажется маловероятным, чтобы быть правдой. То есть, это кажется маловероятным, что каждый на Аляске имеет ту же вероятность того, что в вашем опросе. Но, есть три важных момента, которые нужно иметь в виду, о последующей стратификации, все из которых делают это, кажется более перспективным.

Во-первых, однородное-реакция-наклонности-в-групп предположение становится более вероятным, поскольку число групп увеличивается. И, исследователи не ограничиваются группами, основываясь только на одном географическом измерении. Например, мы можем создать группы на основе состояния, возраста, пола и уровня образования. Представляется более вероятным, что есть однородные наклонности реакция в пределах группы 18-29, выпускников женского пола, колледжей, проживающих на Аляске, чем в группе всех людей, живущих на Аляске. Таким образом, как число групп, используемых для постстратификация возрастает, предположения, необходимые для его стать более разумным. Учитывая этот факт, кажется, что исследователи хотели бы создать огромное количество групп для последующей стратификации. Но, как число групп увеличивается, исследователи столкнулись с другой проблемой: разреженности данных. Если есть лишь небольшое число людей в каждой группе, то оценки будут более неопределенными, а в крайнем случае, когда есть группа, которая не имеет респондентов, то постстратификация полностью распадается. Есть два пути выхода из этого присущего напряженности между правдоподобности homogeneous- отклика Склонность-в-групп предположения и спрос на разумных размеров выборки в каждой группе. Один из подходов заключается в переходе к более сложной статистической модели для расчета весов, а другой, чтобы собрать больший, более разнообразный образец, который помогает обеспечить разумные размеры выборки в каждой группе. И, иногда исследователи делают так, как я буду описывать более подробно ниже.

Второе соображение при работе с последующей стратификации из образцов, не вероятность, что предположение однородного отклика Склонность-в-групп уже часто делается при анализе образцов вероятности. Причина, по которой это предположение необходимо для образцов вероятности на практике, что образцы имеют вероятность неполучения ответа, и наиболее распространенный метод для корректировки при неполучении ответа является постстратификация, как описано выше. Конечно, только потому, что многие исследователи делают некоторое предположение не означает, что вы должны делать это слишком. Но, это не означает, что при сравнении образцов невероятности образцы вероятности на практике, мы должны иметь в виду, что оба зависят от предположений и вспомогательной информации для получения оценок. В самых реалистичных условиях, нет просто никаких предположений свободной подход к построению статистических выводов.

И, наконец, если вы заботитесь об одной оценке, в частности, в нашем примере БЕЗРАБОТИЦЫ-то вам необходимо условие слабее, чем гомогенные-реакция-склонность-внутри-групп предположения. В частности, вы не должны считать, что каждый человек имеет такую ​​же склонность ответа, вам нужно только предположить, что нет никакой корреляции между склонностью ответа и уровнем безработицы в каждой группе. Конечно, даже это слабое условие не будет держать в некоторых ситуациях. Например, представьте оценки доли американцев, которые делают работу добровольцев. Если люди , которые делают работу добровольцев, более вероятно, согласятся быть в опросе, то исследователи будут систематически переоценивать количество добровольчества, даже если они делают корректировки после стратификации, результат , который был продемонстрирован эмпирически Abraham, Helms, and Presser (2009) .

Как я уже говорил ранее, образцы невероятности рассматриваются с большим скептицизмом обществоведов, отчасти из-за их роли в некоторых из самых затруднительных неудач в первые дни исследований обследования. Ярким примером того, как далеко мы продвинулись с образцами невероятности является исследование Вэй Ван, Дэвид Ротшильд, Шарада Goel и Эндрю Гельман, который надлежащим образом выздоровел итоги 2012 года выборах в США с использованием не-вероятностная выборка пользователей Американский Xbox -a явно неслучайная выборка американцев (Wang et al. 2015) и (Wang et al. 2015) . Исследователи набраны респондентов из игровой системы XBox, и, как можно было бы ожидать, образец Xbox перекос самца и перекос молодой: 18 - 29 лет составляют 19% электората, но 65% выборки Xbox и мужчины составляют 47% избирателей и 93% выборки Xbox (рис 3.4). Из-за этих сильных демографических смещениях, необработанные данные Xbox был плохим показателем результатах выборов. Он предсказал сильную победу Митта Ромни над Бараком Обамой. Опять же , это еще один пример опасности сырья, неурегулированных образцов невероятности и напоминает фиаско Literary Digest.

Рисунок 3.4: Демография респондентов в Wang и соавт. (2015). Поскольку респонденты были набраны из XBox, они были более склонны быть молодым и более вероятно, будет мужского пола, по отношению к избирателям на выборах 2012 года.

Рисунок 3.4: Демография респондентов в Wang et al. (2015) и Wang et al. (2015) . Поскольку респонденты были набраны из XBox, они были более склонны быть молодым и более вероятно, будет мужского пола, по отношению к избирателям на выборах 2012 года.

Тем не менее, Ван и его коллеги были в курсе этих проблем и пытались вес респондентов для корректировки процесса отбора проб. В частности, они использовали более сложную форму после стратификации я рассказал вам о. Это стоит обучение немного больше о своем подходе, поскольку он строит интуицию о последующей стратификации и конкретной версии Ван и его коллеги использовали один из самых интересных подходов к весовыми образцов невероятности.

В нашем простом примере об оценке безработицы в разделе 3.4.1, мы разделили население на группы в зависимости от страны проживания. В противоположность этому, Ван и его коллеги разделили население на на 176,256 групп, определенных: пола (2 категории), расы (4 категории), возраст (4 категории), образование (4 категории), состояние (51 категорий), партия ID (3 категории), идеология (3 категории) и 2008 голос (3 категории). С большим количеством групп, исследователи надеются, что он будет более вероятным, что в каждой группе, ответ был Склонность коррелируют с поддержкой Обамы. Далее, вместо построения весов индивидуального уровня, как мы делали это в нашем примере, Ван и его коллеги использовали сложную модель для оценки доли населения в каждой группе, которые будут голосовать за Обаму. И, наконец, они объединили эти оценки группы поддержки с известным размером каждой группы, чтобы произвести оценочную общий уровень поддержки. Другими словами, они рубят население в различные группы, оценили поддержку Обамы в каждой группе, а затем принял взвешенное среднее оценок группы для выработки общей оценки.

Таким образом, большая проблема в подходе заключается в оценке поддержки Обамы в каждой из этих групп 176,256. Хотя их панель включены 345,858 уникальных участников, огромное количество по меркам избирательной опроса, было много, много групп, для которых Ван и его коллеги почти не имели респондентов. Поэтому, чтобы оценить поддержку в каждой группе они использовали метод, называемый многоуровневый регрессионный с последующей стратификации, которую исследователи ласково называют г-н П. По существу, оценить поддержку Обамы в рамках определенной группы, г-н П. пулы информацию из многих тесно связаны между группами. Например, рассмотрим задачу оценки поддержки Обамы среди женщин, выходцев из Латинской Америки, между 18-29 лет, которые являются выпускниками колледжей, которые зарегистрированы демократы, которые идентифицируют себя в качестве умеренных, и кто голосовал за Обаму в 2008 году это очень, очень специфическую группу, и возможно, что нет никого в образце с этими характеристиками. Поэтому, чтобы сделать оценки относительно этой группы, г-н П. пулы вместе оценкам от людей в очень сходных группах.

Используя эту стратегию анализа, Ван и его коллеги смогли использовать XBox без вероятностной выборки очень внимательно оценить общую поддержку, которую Обама получил на выборах 2012 года (Рисунок 3.5). На самом деле их оценки были более точными, чем совокупность опросов общественного мнения. Таким образом, в данном случае, взвешивание, в частности, г-н П.-, кажется, делает хорошую работу исправляя перекосы в невероятности данных; уклоны, которые видны при взгляде на оценках из неурегулированных данных Xbox.

Рисунок 3.5: Оценки от Wang и соавт. (2015). Нескорректированная образец XBox производства неточные оценки. Но, взвешенный образец XBox получены оценки, которые были более точными, чем в среднем по вероятности на основе телефонных опросов.

Рисунок 3.5: Оценки от Wang et al. (2015) и Wang et al. (2015) . Нескорректированная образец XBox производства неточные оценки. Но, взвешенный образец XBox получены оценки, которые были более точными, чем в среднем по вероятности на основе телефонных опросов.

Есть два основных урока из изучения Ван и его коллеги. Во-первых, нескорректированные образцы без вероятности может привести к плохим оценкам; это урок, который многие исследователи слышали раньше. Тем не менее, второй урок состоит в том, что образцы без вероятности, при взвешивании должным образом, может на самом деле производят неплохие оценки. На самом деле, их оценки были более точными, чем оценки из pollster.com, агрегирование более традиционных избирательных опросов.

Наконец, существуют серьезные ограничения на то, что мы можем извлечь из этого одного конкретного исследования. Просто потому, что постстратификация работала хорошо в данном конкретном случае, нет никакой гарантии, что она будет хорошо работать и в других случаях. На самом деле, выборы являются, пожалуй, одним из самых простых настроек, так как социологи изучали выборы в течение почти 100 лет, есть регулярная обратная связь (мы можем видеть, кто победит на выборах), а партийная идентификация и демографические характеристики относительно прогнозирования голосования. На данный момент, у нас не хватает твердой теории и эмпирического опыта, чтобы знать, когда взвешивание корректировки образцов без вероятности будет производить достаточно точные оценки. Единственное, что ясно, однако, если вы вынуждены работать с образцами без вероятностные, то есть основания полагать, что скорректированные оценки будет лучше, чем не скорректированных оценок.