3.4 질문하기

확률 샘플과 비 확률 표본이 실제로 그 차이가 있습니다; 두 경우 모두, 모든 가중치 관하여.

샘플링은 연구 조사에 필수적입니다. 연구자들은 거의 자신의 목표 인구에있는 모든 사람에게 자신의 질문을하지 않았다. 이와 관련, 설문 조사는 고유하지 않습니다. 대부분의 연구는 어떤 식 으로든에서 샘플링을 포함한다. 때때로이 샘플링은 연구자에 의해 명시 적으로 이루어집니다; 다른 시간은 암시 적으로 발생합니다. 예를 들어, 그녀의 대학에서 학부 학생들에 대한 실험실 실험을 실행 연구원은 샘플을 촬영하고있다. 따라서, 샘플링은이 책에서 등장하는 문제가있다. 사실, 데이터의 디지털 시대 소스에 대해 듣고 가장 일반적인 문제 중 하나는 "그들이 대표하지 않습니다."우리가이 절에서 볼 수있는 바와 같이,이 문제는 덜 심각하고 많은 회의론자가 생각하는 것보다 더 미묘한 모두이다. 사실, '대표성'의 전체 개념은 확률과 비 확률 표본에 대해 생각하는 데 도움이 아님을 주장한다. 대신에, 키는 데이터를 수집하고, 추정시 데이터 컬렉션의 모든 편향이 방법을 취소 할 수있는 방법에 대해 생각한다.

현재, 표현 지배적 인 이론적 접근 방식은 확률 표본 추출이다. 데이터가 완벽하게 실행 된 확률 샘플링 방법으로 수집 될 때, 연구자들은 표적 집단에 대한 바이어스 추정을 위해 수집 된 방식에 기초하여 데이터를 가중 할 수있다. 그러나 완벽한 확률 표본 추출은 기본적으로 결코 현실 세계에서 발생하지 않습니다. 1) 대상 인구와 프레임 인구와 2 사이의 차이) 무응답 (이것들은 문학 다이제스트 설문 조사를 난파 정확하게 문제이다) 두 가지 주요 문제는 일반적으로있다. 따라서, 오히려 실제로 세계에서 발생하는 현실적인 모델로 확률 샘플링 생각보다,이 방법의 물리학 자들이 무한히 긴 아래로 굴러 마찰 볼 생각 많은처럼, 도움, 추상적 인 모델로 확률 샘플링을 생각하는 것이 좋습니다 비탈길.

확률 표본 추출에 대한 대안은 비 확률 표본 추출이다. 확률과 비 확률 표본 추출의 주요 차이점은 확률이 인구에있는 모든 사람을 샘플링에 포함 알려진 확률을 가지고 있다는 것입니다. 가 아닌 확률 샘플링 많은 품종 사실이며, 데이터 수집이 방법은 디지털 시대에서 점점 보편화되고있다. 그러나, 비 확률 표본 추출은 사회 과학자들과 통계 학자들 사이에 끔찍한 명성을 가지고있다. 사실, 비 확률 표본 추출은 같은 문학 다이제스트 실패 (이전 논의) 및 ( "듀이가 트루먼을 패배") 1948 미국 대통령 선거에 대한 잘못된 예측으로 조사 연구의 가장 극적인 실패의 일부와 관련된 (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

그러나, 시간은 두 가지 이유로 비 확률 표본 추출을 재고 할 권리입니다. 확률 샘플을 실제로 수행하기가 점점 어려워지고있다 첫째, 확률 샘플과 비 확률 표본 사이의 경계가 모호합니다. 높은 무응답의 비율 (현재 실제 설문 조사에 있기 때문에), 응답자에 대한 개재물의 실제 확률은 알려져 있지 않다, 따라서, 확률 샘플과 비 확률 표본 많은 연구자들이 생각만큼 다른이되지 않는 경우. 층화 : 사실, 우리는 아래에 볼 수있는 바와 같이, 두 접근 방법은 기본적으로 동일 추정 방법에 의존한다. 둘째, 수집 및 비 확률 샘플 분석에 많은 발전이 있었다. 이러한 방법은 내가 그것을로 생각하는 의미가 생각 과거에 문제가 발생 방법에서 충분히 다른 "비 확률 표본 추출 2.0."우리 때문에 일어난 오류의 비 확률 방법에 대한 불합리한 혐오가 없어야합니다 옛날에.

다음으로,이 인수는보다 구체적인 만들기 위해, 나는 표준 확률 샘플링과 가중치 (제 3.4.1)를 검토합니다. 핵심 아이디어는 당신이 추정을하는 방법에 영향을해야 데이터를 수집하는 방법이다. 모두 포함 동일한 확률을 가지고 있지 않은 경우 특히 다음 모두는 동일한 가중치가 안된다. 당신의 샘플링 민주주의가 아닌 경우 즉, 다음 추정이 민주적이어야한다. 가중치를 검토 한 결과, 비 확률 표본 추출에 두 가지 방법을 설명합니다 : 데이터가 얼마나을 통해 더 많은 컨트롤을 배치하려고 우연히 수집 된 데이터의 문제 (3.4.2 절) 처리하는 가중치에 초점을 맞추고 하나 하나를 수집 (3.4.3). 본문의 인수는 단어와 사진과 함께 설명한다; 더 수학적인 치료를 원하는 독자는 기술 부록을 참조한다.