3.3.1表示

表示是有關從受訪者進行推論到你的目標人群。

為了理解從受訪者向較大人群推斷時可能發生的錯誤,讓我們考慮一下試圖預測1936年美國總統大選結果的文學摘要民意調查。雖然它發生在75多年前,但這個崩潰仍然是今天教授研究人員的一個重要教訓。

“文學摘要”是一本受歡迎的綜合性雜誌,從1920年開始,他們開始進行稻草民意調查以預測總統選舉的結果。為了做出這些預測,他們會向很多人發送選票,然後簡單地計算返回的選票; “文學摘要”自豪地報導,他們收到的選票既沒有“加權,調整也沒有解釋。”這個程序正確地預測了1920年,1924年,1928年和1932年選舉的獲勝者。1936年,在大蕭條時期, 文學摘要向1000萬人發送了選票,其名字主要來自電話簿和汽車登記記錄。以下是他們描述方法的方式:

“DIGEST的平穩運行機器具有三十年經驗的快速精確度,可以減少對實際情況的猜測......本週,500支鋼筆每天都會丟失超過25萬個地址。每天,在位於紐約第四大道的第四大道上方的一個大房間裡,400名工人巧妙地將一百萬件印刷品 - 足以鋪設四十個城市街區 - 滑入所涉及的信封[原文如此]。每小時,在THE DIGEST自己的郵局變電站,三台喋喋不休的郵資計量機密封並蓋上白色長方形;熟練的郵政員工將他們翻轉成凸出的郵件;車隊DIGEST卡車加速他們表達郵件列車。 。 。下週,來自這一千萬人的第一批答案將開始標記選票的進入潮流,進行三重檢查,核實,五次交叉分類和總計。當最後一個數字已經被檢查和檢查時,如果過去的經驗是一個標準,該國將知道實際普遍投票的四千萬[選民]的1%的一小部分。“(1936年8月22日)

文學摘要對大小迷戀很快就會被任何“大數據”研究者所認識。在分發的1000萬張選票中,返回了驚人的240萬張 - 這比現代政治民意調查大約高出1000倍。從這240萬名受訪者中,判決結果很明確:Alf Landon打算擊敗現任富蘭克林羅斯福。但事實上,羅斯福以壓倒性優勢擊敗了蘭登。 文學摘要怎麼會出現這麼多數據?我們對抽樣的現代理解使文學摘要的錯誤變得清晰,並有助於我們避免在未來犯同樣的錯誤。

清楚地考慮抽樣需要我們考慮四個不同的人群(圖3.2)。第一組是目標人群 ;這是研究人員定義為感興趣的群體的群體。在“ 文學摘要”的案例中,目標人群是1936年總統選舉中的選民。

在確定目標人群後,研究人員需要製定一份可用於抽樣的人員名單。此列表稱為抽樣框架 ,其上的人員稱為框架填充 。理想情況下,目標人群和框架人口將完全相同,但在實踐中往往並非如此。例如,在“ 文學摘要”的案例中,框架人口是1000萬人,其名字主要來自電話簿和汽車登記記錄。目標總體與幀總體之間的差異稱為覆蓋誤差 。覆蓋率錯誤本身並不能保證問題。但是,如果框架群體中的人與目標人群中不在框架群體中的人系統地不同,則可能導致覆蓋偏差 。事實上,這正是“ 文學摘要”民意調查所發生的事情。他們的框架人口往往更有可能支持Alf Landon,部分原因是他們更富有(回想起1936年電話和汽車都相對較新且價格昂貴)。因此,在文學摘要調查中,覆蓋誤差導致覆蓋偏差。

圖3.2:表示錯誤。

圖3.2:表示錯誤。

在定義框架群體之後 ,下一步是研究人員選擇樣本群體 ;這些是研究人員試圖採訪的人。如果樣本具有與幀總體不同的特徵,則採樣可能引入採樣誤差 。然而,在文學摘要慘敗的情況下,實際上沒有採樣 - 該雜誌與框架群體中的每個人聯繫 - 因此沒有採樣錯誤。許多研究人員傾向於關注抽樣誤差 - 這通常是調查中報告的誤差幅度所捕獲的唯一一種誤差 - 但文學摘要慘敗提醒我們,我們需要考慮所有誤差來源,包括隨機誤差和系統誤差。

最後,在選擇樣本群體後,研究人員試圖採訪其所有成員。成功訪談的人稱為受訪者 。理想情況下,樣本人群和受訪者將完全相同,但實際上沒有回應。也就是說,在樣本中選擇的人有時不參與。如果回复的人與那些沒有回應的人不同,則可能存在回應偏見 。無回應偏見是文學摘要民意調查的第二個主要問題。接受選票的人中只有24%做出了回應,結果發現支持蘭登的人更有可能做出回應。

除了僅僅是一個介紹代表性思想的榜樣之外,“ 文學摘要”民意調查是一個經常重複的比喻,提醒研究人員關於隨意抽樣的危險性。不幸的是,我認為許多人從這個故事中吸取的教訓是錯誤的。這個故事中最常見的道德是研究人員無法從非概率樣本中學到任何東西(即,沒有嚴格的基於概率的規則來選擇參與者的樣本)。但是,正如我將在本章後面所述,這不太對。相反,我認為這個故事確實存在兩種道德;道德在今天和1936年一樣真實。首先,大量隨意收集的數據無法保證良好的估計。一般而言,擁有大量受訪者會降低估計的方差,但並不一定會減少偏差。有了大量數據,研究人員有時可以對錯誤的東西進行精確估計;它們可能準確無誤 (McFarland and McFarland 2015) 。 “ 文學摘要”慘敗的第二個主要教訓是,研究人員需要考慮在進行估算時如何收集樣本。換句話說,由於文學摘要民意調查中的抽樣過程系統性地偏向某些受訪者,研究人員需要使用更複雜的估算過程,這使得一些受訪者比其他受訪者更為重要。在本章的後面,我將向您展示一個這樣的加權程序 - 後分層 - 這可以使您從隨意的樣本中做出更好的估計。