3.4 Хто спытаць

Узоры верагоднасці і ўзоры неверагоднасці не адрозніваюцца на практыцы; у абодвух выпадках, гэта ўсё аб вагах.

Адбор пробаў мае фундаментальнае значэнне для абследавання даследаванняў. Даследчыкі амаль ніколі не задаваць пытанні усім у сваёй мэтавай групы насельніцтва. У сувязі з гэтым, даследаванні не з'яўляюцца унікальнымі. Большасць даследаванняў, у той ці іншай меры, уключае ў сябе адбор пробаў. Часам гэта робіцца выбарка відавочна даследчыкам; часам гэта адбываецца няяўна. Напрыклад, даследчык, які працуе лабараторны эксперымент на студэнтаў у сваім універсітэце таксама прымаў ўзор. Такім чынам, выбарка з'яўляецца праблемай, якая прыходзіць на працягу ўсёй кнігі. На самай справе, адна з найбольш распаўсюджаных праблем, якія я чую пра лічбавыя крыніцах узроставых дадзеных "яны не з'яўляюцца рэпрэзентатыўнымі." Як мы ўбачым у гэтым раздзеле, гэтая праблема з'яўляецца і менш сур'ёзнымі і больш тонкія, чым многія скептыкі разумеюць. На самай справе, я буду сцвярджаць, што ўся канцэпцыя "рэпрэзентатыўнасці" ня карысна думаць пра верагоднасць і ня імавернасных выбарак. Замест гэтага, ключ павінен думаць пра тое, як былі сабраныя дадзеныя і як любыя перакосы ў гэтай калекцыі дадзеных могуць быць адменены пры правядзенні ацэнак.

У цяперашні час дамінуе тэарэтычны падыход да прадстаўленні з'яўляецца імавернасны выбарка. Калі дадзеныя збіраюцца з дапамогай метаду імавернаснай выбаркі, якая была выдатна выканана, даследчыкі могуць ўзважваць свае дадзеныя на аснове так, каб яны былі сабраныя, каб зрабіць несмещенные ацэнкі аб мэтавай папуляцыі. Аднак ідэальны імавернасны выбарка ў прынцыпе ніколі не адбываецца ў рэальным свеце. Ёсць , як правіла , дзве асноўныя праблемы : 1) адрозненні паміж мэтавай групы насельніцтва і насельніцтва кадраў і 2) неатрымання адказаў (гэта менавіта тыя праблемы , якія разбуралі апытанне Literary Digest). Такім чынам, замест таго, каб думаць пра імавернаснай выбаркі ў якасці рэалістычнай мадэлі таго, што на самой справе адбываецца ў свеце, то лепш думаць пра імавернаснай выбаркі ў якасці карыснага, абстрактнай мадэлі, гэтак жа, як тое, як фізікі думаюць пра невязкой шара коцяцца бясконца доўга рампы.

Альтэрнатывай імавернаснай выбаркі з'яўляецца выбарка без верагоднасці. Асноўнае адрозненне паміж верагоднасцю і выбаркі неверагоднасці з'яўляецца тое, што з верагоднасцю выбаркі ўсіх у папуляцыі мае вядомую верагоднасць ўключэння. Ёсць, на самай справе, шмат разнавіднасцяў выбаркі неверагоднасці, і гэтыя метады збору дадзеных становяцца ўсё больш распаўсюджанымі ў эпоху лічбавых тэхналогій. Але, адбор проб без верагоднасці мае жахлівую рэпутацыю сярод сацыёлагаў і статыстыкаў. На самай справе, адбор проб , ня верагоднасці , звязана з некаторымі з найбольш драматычных няўдач даследчыкаў абследаванняў, такіх як фіяска Literary Digest (абмяркоўвалася раней) і няправільнага прадказанні аб прэзідэнцкіх выбарах у ЗША 1948 года ( "Дзьюі Паразы Трумэна") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Тым не менш, настаў час перагледзець выбаркі без верагоднасці па дзвюх прычынах. Па-першае, у якасці узораў верагоднасці становяцца ўсё больш цяжка зрабіць на практыцы, лінія паміж ўзорамі верагоднасці і узораў неверагоднасці размываецца. Калі ёсць высокія паказчыкі неатрымання адказаў (як ёсць у рэальных абследаванняў у цяперашні час), фактычная верагоднасць уключэнняў для рэспандэнтаў не вядомыя, і, такім чынам, ўзоры верагоднасці і ўзоры неверагоднасці не гэтак розныя, як мяркуюць многія даследчыкі. На самай справе, як мы ўбачым ніжэй, абодва падыходу ў асноўным належаць на тым жа метадзе ацэнкі: пасля стратыфікацыі. Па-другое, было шмат распрацовак у галіне збору і аналізу пробаў неверагоднасці. Гэтыя метады досыць адрозніваюцца ад метадаў, якія выклікалі праблемы ў мінулым, што я думаю, што гэта мае сэнс думаць пра іх як "неверагоднасці выбаркі 2.0." Мы не павінны мець іррацыянальнае агіду да метадаў без верагоднасці з-за памылак, якія адбыліся вельмі даўно.

Далей, для таго, каб зрабіць гэты довад больш канкрэтным, я разгледжу стандартнай верагоднасці выбаркі і вагаў (раздел 3.4.1). Ключавая ідэя заключаецца ў тым, што, як вы сабралі дадзеныя павінны ўплываць, як вы робіце ацэнкі. У прыватнасці, калі ўсё не маюць аднолькавую верагоднасць ўключэння, то ўсё не павінны мець аднолькавы вагу. Іншымі словамі, калі ваша выбарка не зьяўляецца дэмакратычным, то вашы ацэнкі не павінны быць дэмакратычнымі. Пасля разгляду ўзважвання, я апішу два падыходу да адбору пробаў неверагоднасці: адзін, які факусуюць на ўзважванне, каб мець справу з праблемай бессістэмна сабраных дадзеных (раздел 3.4.2), і той, які спрабуе ўсталяваць больш поўны кантроль над тым, як дадзеныя сабраны (раздел 3.4.3). Аргументы ў асноўным тэксце будзе растлумачана ніжэй са словамі і малюнкамі; Чытачы, якія хацелі б больш матэматычную апрацоўку варта таксама ў тэхнічным дадатку.