3.4.2 Узоры неверагоднасці: ўзважванне

Гэты пераклад быў створаны з дапамогай кампутара. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Узоры неверагоднасці: ўзважванне

З дапамогай узораў неверагоднасці, вагі могуць адмяніць скажэнні , выкліканыя меркаваным працэсам адбору пробаў.

Такім жа чынам, што даследчыкі вагой адказаў з узораў верагоднасці, яны таксама могуць важыць адказы ад узораў неверагоднасці. Напрыклад, у якасці альтэрнатывы кпа, уявіце, што вы размясцілі банэры на тысячах вэб-сайтаў для набору ўдзельнікаў для абследавання з мэтай ацэнкі ўзроўню беспрацоўя. Натуральна, вы б скептычна, што простае сярэдняе вашай выбаркі будзе добрай ацэнкай ўзроўню беспрацоўя. Ваш скептыцызм, верагодна, таму што вы думаеце, што некаторыя людзі, больш верагодна, каб завяршыць абследаванне, чым іншыя. Напрыклад, людзі, якія не праводзяць шмат часу ў Інтэрнэце, менш верагодна, каб завяршыць абследаванне.

Як мы бачылі ў папярэднім раздзеле, аднак, калі мы ведаем, як быў абраны, як узор мы робім з верагоднасцю узораў, то мы можам адмяніць скажэнні, выкліканыя працэсам ўзяцця пробаў. На жаль, пры працы з ўзорамі без верагоднасці, мы не ведаем, як быў абраны ўзор. Але, мы можам зрабіць здагадкі адносна працэсу адбору пробаў, а затым прымяніць ўзважванне такім жа чынам. Калі гэтыя здагадкі верныя, то ўзважванне адменіць скажэнні, выкліканыя працэсам ўзяцця пробаў.

Напрыклад, уявіце сабе, што ў адказ на вашыя рэкламныя банеры, вы набраныя 100000 рэспандэнтаў. Тым не менш, вы не верыце, што гэтыя 100000 рэспандэнтаў простая выпадковая выбарка дарослых амерыканцаў. На самай справе, калі параўнаць вашыя рэспандэнтаў насельніцтва ЗША, вы выявіце, што людзі з некаторых краін (напрыклад, Нью-Ёрк) празмерна прадстаўлены і што людзі з некаторых краін (напрыклад, на Алясцы) недастаткова прадстаўлены. Такім чынам, узровень беспрацоўя ў вашай выбарцы, верагодна, будзе дрэнны ацэнкай ўзроўню беспрацоўя ў мэтавай групе насельніцтва.

Адзін са спосабаў, каб адмяніць скажэнне, што адбывалася ў працэсе адбору пробаў, каб прызначыць вагі кожнаму чалавеку; больш нізкія вагі для людзей з краін, якія празмерна прадстаўлены ва ўзоры (напрыклад, Нью-Ёрк) і больш высокія вагі для людзей з краін, якія недастаткова прадстаўлены ва ўзоры (напрыклад, на Алясцы). Больш канкрэтна, вага для кожнага рэспандэнта звязана з іх распаўсюджанасці ў вашым узоры ў параўнанні з іх распаўсюджанасці ў папуляцыі ЗША. Гэтая працэдура ўзважвання называецца постстратификация, і ідэя ўзважвання павінна нагадаць вам , напрыклад , у раздзеле 3.4.1 , дзе рэспандэнты з Род - Айлэнд атрымалі меншы вага , чым рэспандэнты з Каліфорніі. Постстратификация патрабуе, каб вы ведаеце дастаткова, каб пакласці рэспандэнтаў на групы і ведаць долю мэтавай групы насельніцтва ў кожнай групе.

Нягледзячы на тое, узважванне ўзору верагоднасці і выбаркі неверагоднасці адны і тыя ж матэматычна (гл тэхнічнае дадатак), яны добра працуюць у розных сітуацыях. Калі даследчык мае дасканалую імавернасную выбарку (г.зн. без памылак пакрыцця і не без адказу), то ўзважванне будзе вырабляць аб'ектыўную ацэнку ўсіх прыкмет ва ўсіх выпадках. Гэтая моцная тэарэтычная гарантыя, чаму абаронцы узораў верагоднасці знайсці іх гэтак прывабнымі. З іншага боку, узважванне узораў без верагоднасці будзе вырабляць толькі аб'ектыўныя адзнакі па ўсіх прыкметах, калі схільнасці адказу з'яўляюцца аднолькавымі для ўсіх у кожнай групе. Іншымі словамі, у думках вяртаючыся да нашага прыкладу, выкарыстоўваючы постстратификация будзе вырабляць аб'ектыўную ацэнку, калі ўсё ў Нью-Ёрку, мае тую ж верагоднасць ўдзелу і ўсё на Алясцы мае тую ж верагоднасць ўдзелу і гэтак далей. Гэтая здагадка называецца гамагенныя-рэакцыя-схільнасці-унутры-груп здагадка, і яно адыгрывае ключавую ролю ў спазнаньні , калі постстратификация будзе добра працаваць з ўзорамі без верагоднасці.

На жаль, у нашым прыкладзе, гамагенны-рэакцыя-схільнасці-в-груп здагадка здаецца малаверагодным, каб быць праўдай. Гэта значыць, гэта здаецца малаверагодным, што кожны на Алясцы мае тую ж верагоднасць таго, што ў вашым апытанні. Але, ёсць тры важных моманту, якія трэба мець на ўвазе, аб наступнай стратыфікацыі, усе з якіх робяць гэта, здаецца больш перспектыўным.

Па-першае, аднастайнае-рэакцыя-схільнасці-в-груп здагадка становіцца больш верагодным, паколькі колькасць груп павялічваецца. І, даследчыкі не абмяжоўваюцца групамі, грунтуючыся толькі на адным геаграфічным вымярэнні. Напрыклад, мы можам стварыць групы на аснове стану, ўзросту, полу і ўзроўню адукацыі. Уяўляецца больш верагодным, што ёсць аднастайныя схільнасці рэакцыя ў межах групы 18-29, выпускнікоў жаночага полу, каледжаў, якія пражываюць на Алясцы, чым у групе ўсіх людзей, якія жывуць на Алясцы. Такім чынам, як колькасць груп, якія выкарыстоўваюцца для постстратификация ўзрастае, здагадкі, неабходныя для яго стаць больш разумным. Улічваючы гэты факт, здаецца, што даследчыкі хацелі б стварыць велізарную колькасць груп для наступнай стратыфікацыі. Але, як лік груп павялічваецца, даследчыкі сутыкнуліся з іншай праблемай: разрэджанасці дадзеных. Калі ёсць толькі невялікі лік людзей у кожнай групе, то ацэнкі будуць больш нявызначанымі, а ў крайнім выпадку, калі ёсць група, якая не мае рэспандэнтаў, то постстратификация цалкам распадаецца. Ёсць два шляхі выхаду з гэтага якая ўласціва напружанасці паміж праўдападобнасці homogeneous- водгуку Схільнасць-в-груп здагадкі і попыт на разумных памераў выбаркі ў кожнай групе. Адзін з падыходаў заключаецца ў пераходзе да больш складанай статыстычнай мадэлі для разліку вагаў, а другі, каб сабраць большы, больш разнастайны ўзор, які дапамагае забяспечыць разумныя памеры выбаркі ў кожнай групе. І, часам даследчыкі робяць так, як я буду апісваць больш падрабязна ніжэй.

Другое меркаванне пры працы з наступнай стратыфікацыі з узораў, ня верагоднасць, што здагадка аднастайнага водгуку Схільнасць-в-груп ужо часта робіцца пры аналізе узораў верагоднасці. Прычына, па якой гэта здагадка неабходна для узораў верагоднасці на практыцы, што ўзоры маюць верагоднасць неатрымання адказу, і найбольш распаўсюджаны метад для карэкціроўкі пры неатрыманні адказу з'яўляецца постстратификация, як апісана вышэй. Вядома, толькі таму, што многія даследчыкі робяць некаторы здагадка не азначае, што вы павінны рабіць гэта занадта. Але, гэта не азначае, што пры параўнанні узораў неверагоднасці ўзоры верагоднасці на практыцы, мы павінны мець на ўвазе, што абодва залежаць ад здагадак і дапаможнай інфармацыі для атрымання ацэнак. У самых рэалістычных умовах, няма проста ніякіх здагадак свабоднай падыход да пабудовы статыстычных высноў.

І, нарэшце, калі вы клапоціцеся пра адну ацэнцы, у прыватнасці, у нашым прыкладзе БЕСПРАЦОЎЯ-то вам неабходна ўмова слабей, чым гамагенныя-рэакцыя-схільнасць-унутры-груп здагадкі. У прыватнасці, вы не павінны лічыць, што кожны чалавек мае такую ж схільнасць адказу, вам трэба толькі выказаць здагадку, што няма ніякай карэляцыі паміж схільнасцю адказу і ўзроўнем беспрацоўя ў кожнай групе. Вядома, нават гэта слабое ўмова не будзе трымаць у некаторых сітуацыях. Напрыклад, уявіце ацэнкі долі амерыканцаў, якія робяць працу добраахвотнікаў. Калі людзі , якія робяць працу добраахвотнікаў, больш верагодна, пагодзяцца быць у апытанні, то даследчыкі будуць сістэматычна пераацэньваць колькасць добраахвотніцтва, нават калі яны робяць карэкціроўкі пасля стратыфікацыі, вынік , які быў прадэманстраваны эмпірычнаму Abraham, Helms, and Presser (2009) .

Як я ўжо казаў раней, ўзоры неверагоднасці разглядаюцца з вялікім скептыцызмам грамадазнаўцаў, збольшага з-за іх ролі ў некаторых з самых цяжкіх няўдач у першыя дні даследаванняў абследавання. Яскравым прыкладам таго, як далёка мы прасунуліся з ўзорамі неверагоднасці з'яўляецца даследаванне Вэй Ван, Дэвід Ротшыльд, Шарада Goel і Эндру Гельман, які належным чынам ачуняў выніках 2012 года выбарах у ЗША з выкарыстаннем ня-імавернасны выбарка карыстальнікаў Амерыканскі Xbox -a відавочна невыпадковая выбарка амерыканцаў (Wang et al. 2015) і (Wang et al. 2015) . Даследчыкі набраныя рэспандэнтаў з гульнявой сістэмы XBox, і, як можна было б чакаць, ўзор Xbox перакос самца і перакос малады: 18 - 29 гадоў складаюць 19% электарату, але 65% выбаркі Xbox і мужчыны складаюць 47% выбаршчыкаў і 93% выбаркі Xbox (мал 3.4). З-за гэтых моцных дэмаграфічных зрушэннях, неапрацаваныя дадзеныя Xbox быў дрэнным паказчыкам выніках выбараў. Ён прадказаў моцную перамогу Мітта Ромні над Баракам Абамам. Зноў жа , гэта яшчэ адзін прыклад небяспекі сыравіны, неўрэгуляваных узораў неверагоднасці і нагадвае фіяска Literary Digest.

Малюнак 3.4: Дэмаграфія рэспандэнтаў у Wang і соавт. (2015). Паколькі рэспандэнты былі набраныя з XBox, яны былі больш схільныя быць маладым і больш верагодна, будзе мужчынскага полу, у адносінах да выбаршчыкаў на выбарах 2012 года.

Малюнак 3.4: Дэмаграфія рэспандэнтаў у Wang et al. (2015) і Wang et al. (2015) . Паколькі рэспандэнты былі набраныя з XBox, яны былі больш схільныя быць маладым і больш верагодна, будзе мужчынскага полу, у адносінах да выбаршчыкаў на выбарах 2012 года.

Тым не менш, Ван і яго калегі былі ў курсе гэтых праблем і спрабавалі вага рэспандэнтаў для карэкціроўкі працэсу адбору пробаў. У прыватнасці, яны выкарыстоўвалі больш складаную форму пасля стратыфікацыі я распавёў вам аб. Гэта каштуе навучанне крыху больш пра сваім падыходзе, паколькі ён будуе інтуіцыю аб наступнай стратыфікацыі і канкрэтнай версіі Ван і яго калегі выкарысталі адзін з самых цікавых падыходаў да вагавымі узораў неверагоднасці.

У нашым простым прыкладзе аб ацэнцы беспрацоўя ў раздзеле 3.4.1, мы падзялілі насельніцтва на групы ў залежнасці ад краіны пражывання. У супрацьлегласць гэтаму, Ван і яго калегі падзялілі насельніцтва на на 176,256 груп, вызначаных: полу (2 катэгорыі), расы (4 катэгорыі), узрост (4 катэгорыі), адукацыя (4 катэгорыі), стан (51 катэгорый), партыя ID (3 катэгорыі), ідэалогія (3 катэгорыі) і 2008 голас (3 катэгорыі). З вялікай колькасцю груп, даследчыкі спадзяюцца, што ён будзе больш верагодным, што ў кожнай групе, адказ быў Схільнасць карэлююць з падтрымкай Абамы. Далей, замест пабудовы вагаў індывідуальнага ўзроўню, як мы рабілі гэта ў нашым прыкладзе, Ван і яго калегі выкарысталі складаную мадэль для ацэнкі долі насельніцтва ў кожнай групе, якія будуць галасаваць за Абаму. І, нарэшце, яны аб'ядналі гэтыя ацэнкі групы падтрымкі з вядомым памерам кожнай групы, каб вырабіць ацэначную агульны ўзровень падтрымкі. Іншымі словамі, яны сякуць насельніцтва ў розныя групы, ацанілі падтрымку Абамы ў кожнай групе, а затым прыняў узважанае сярэдняе адзнак групы для выпрацоўкі агульнай ацэнкі.

Такім чынам, вялікая праблема ў падыходзе заключаецца ў ацэнцы падтрымкі Абамы ў кожнай з гэтых груп 176,256. Хоць іх панэль ўключаны 345,858 унікальных удзельнікаў, велізарная колькасць па мерках выбарчай апытання, было шмат, шмат гуртоў, для якіх Ван і яго калегі амаль не мелі рэспандэнтаў. Таму, каб ацаніць падтрымку ў кожнай групе яны выкарыстоўвалі метад, званы шматузроўневы Рэгрэсійная з наступнай стратыфікацыі, якую даследчыкі ласкава называюць г-н П. Па сутнасці, ацаніць падтрымку Абамы ў рамках пэўнай групы, г-н П. пулы інфармацыю з многіх цесна звязаныя паміж групамі. Напрыклад, разгледзім задачу ацэнкі падтрымкі Абамы сярод жанчын, выхадцаў з Лацінскай Амерыкі, паміж 18-29 гадоў, якія з'яўляюцца выпускнікамі каледжаў, якія зарэгістраваныя дэмакраты, якія ідэнтыфікуюць сябе ў якасці ўмераных, і хто галасаваў за Абаму ў 2008 годзе гэта вельмі, вельмі спецыфічную групу, і магчыма, што няма нікога ва ўзоры з гэтымі характарыстыкамі. Таму, каб зрабіць ацэнкі адносна гэтай групы, г-н П. пулы разам ацэнках ад людзей у вельмі падобных групах.

Выкарыстоўваючы гэтую стратэгію аналізу, Ван і яго калегі змаглі выкарыстаць XBox без імавернаснай выбаркі вельмі ўважліва ацаніць агульную падтрымку, якую Абама атрымаў на выбарах 2012 года (Малюнак 3.5). На самай справе іх ацэнкі былі больш дакладнымі, чым сукупнасць апытанняў грамадскага меркавання. Такім чынам, у дадзеным выпадку, узважванне, у прыватнасці, г-н п.-, здаецца, робіць добрую працу выпраўляючы перакосы ў неверагоднасці даных; ўхілы, якія бачныя пры поглядзе на ацэнках з неўрэгуляваных дадзеных Xbox.

Малюнак 3.5: Ацэнкі ад Wang і соавт. (2015). Нескорректированная ўзор XBox вытворчасці недакладныя ацэнкі. Але, ўзважаны ўзор XBox атрыманы ацэнкі, якія былі больш дакладнымі, чым у сярэднім па верагоднасці на аснове тэлефонных апытанняў.

Малюнак 3.5: Ацэнкі ад Wang et al. (2015) і Wang et al. (2015) . Нескорректированная ўзор XBox вытворчасці недакладныя ацэнкі. Але, ўзважаны ўзор XBox атрыманы ацэнкі, якія былі больш дакладнымі, чым у сярэднім па верагоднасці на аснове тэлефонных апытанняў.

Ёсць два асноўных урока з вывучэння Ван і яго калегі. Па-першае, нескорректированные ўзоры без верагоднасці можа прывесці да дрэнным ацэнак; гэта ўрок, які многія даследчыкі чулі раней. Тым не менш, другі ўрок складаецца ў тым, што ўзоры без верагоднасці, пры узважванні належным чынам, можа на самай справе вырабляюць нядрэнныя ацэнкі. На самай справе, іх ацэнкі былі больш дакладнымі, чым ацэнкі з pollster.com, агрэгавання больш традыцыйных выбарчых апытанняў.

Нарэшце, існуюць сур'ёзныя абмежаванні на тое, што мы можам атрымаць з гэтага аднаго канкрэтнага даследавання. Проста таму, што постстратификация працавала добра ў дадзеным канкрэтным выпадку, няма ніякай гарантыі, што яна будзе добра працаваць і ў іншых выпадках. На самай справе, выбары з'яўляюцца, бадай, адным з самых простых налад, так як сацыёлагі вывучалі выбары на працягу амаль 100 гадоў, ёсць рэгулярная зваротная сувязь (мы можам бачыць, хто пераможа на выбарах), а партыйная ідэнтыфікацыя і дэмаграфічныя характарыстыкі адносна прагназавання галасавання. На дадзены момант, у нас не хапае цвёрдай тэорыі і эмпірычнага вопыту, каб ведаць, калі ўзважванне карэкціроўкі узораў без верагоднасці будзе вырабляць досыць дакладныя ацэнкі. Адзінае, што ясна, аднак, калі вы вымушаныя працаваць з ўзорамі без імавернасныя, то ёсць падставы меркаваць, што скарэкціраваныя ацэнкі будзе лепш, чым не скарэкціраваных ацэнак.