3.4.3 비 확률 샘플 : 샘플 일치

이 번역은 컴퓨터에 의해 만들어졌습니다. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.3 비 확률 샘플 : 샘플 일치

모든 비 확률 샘플은 동일하다. 우리는 프론트 엔드에 대한 컨트롤을 추가 할 수 있습니다.

접근 방식 왕과 2012 년 미국 대통령 선거의 결과를 추정하는 데 사용 동료들은 데이터 분석의 개선에 전적으로 의존. 즉, 그들은 할 수있을만큼의 응답을 수집 한 다음를 체중을 다시 시도했다. 비 확률 표본 추출 작업을위한 보완 전략은 데이터 수집 과정을보다 효율적으로 관리하는 것입니다.

부분적으로 제어 된 비 확률 샘플링 프로세스의 간단한 예는 쿼터 샘플링 조사 연구의 초기에 되돌아가는 기술이다. 할당량 샘플링에서 연구자들은 각 그룹에서 선택되는 다른 그룹 (예를 들어, 젊은 남자, 젊은 여성 등) 및 사람의 수에 대한 다음 세트 할당량에 인구를 나눕니다. 연구자가 각 그룹에서 자신의 할당량을 충족 할 때까지 응답자는 우연한 방식으로 선택된다. 때문에 할당량의, 생성 된 샘플은 더 그렇지 않으면 사실보다 표적 집단처럼 보이지만 포함의 확률을 알 수 있기 때문에 많은 연구자들은 할당량 샘플링 회의적이다. 사실, 할당량 샘플링의 원인 1948 년 미국 대통령 여론 조사에서 오류 "듀이가 트루먼을 패배"이었다. 이 샘플링 과정을 일부 제어를 제공하기 때문에, 그러나, 하나는 할당량 샘플링이 완전히 조절되지 않는 데이터 수집을 통해 몇 가지 장점을 가지고하는 방법을 볼 수 있습니다.

할당량 샘플링 넘어서 비 확률 샘플링 과정을 제어하는 방법 현대 이제 가능하다. 하나의 이러한 접근은 샘플과 일치라고하며 일부 상업용 온라인 패널 제공자에 의해 사용된다. 인구의 1) 전체 레지스터 및 자원 봉사자 2) 대형 패널 : 가장 간단한 형태의 샘플과 일치하는 두 개의 데이터 소스가 필요합니다. 자원 봉사자는 어떤 인구에서 확률 표본 일 필요가없는 것이 중요하다; 패널에 선택에 대한 요구 사항이 없음을 강조하기 위해, 나는 더러운 패널을 호출 할 수 있습니다. 또한, 인구 레지스터와 더러운 패널 모두이 예에서, 나는 연령과 성별을 고려 하겠지만, 실제 상황에서이 보조 정보는 훨씬 더 상세한 수, 각 사람에 대한 몇 가지 보조 정보를 포함해야합니다. 샘플 매칭의 비결은 확률 샘플과 같이 샘플을 생산하는 방식으로 더러운 패널에서 샘플을 선택하는 것입니다.

시뮬레이션 된 확률 샘플 인구 레지스터에서 촬영할 때 샘플 매칭이 시작; 이 시뮬레이션 샘플은 대상 샘플이됩니다. 그리고, 상기 보조 정보에 근거하여, 대상 시료의 경우는 유사한 샘플을 형성하기 위해 패널에 얼룩 명에 매칭된다. 예를 들어, 대상 샘플의 25 세 여성이 후, 연구원은 일치하는 샘플로 더러운 패널에서 25 세 여성을 찾습니다. 마지막으로, 일치 된 샘플의 회원은 응답자의 최종 세트를 생산하기 위해 인터뷰를하고 있습니다.

검색된 샘플 대상 시료 같다하더라도, 유사한 샘플 확률 샘플 아니라는 것을 기억하는 것이 중요하다. 유사한 샘플 만 공지 보조 정보 (예를 들어, 연령, 성별)의 검출 대상 시료와 일치하지만 측정 대상의 특성에있다. 더러운 패널의 사람들이 가난-결국 경향 예를 들어, 하나의 이유는 설문 조사 패널이 일치하는 샘플이 나이와 여전히 것 섹스의 관점에서 대상 샘플처럼 보이는 경우에도-다음 돈을 벌 것입니다 가입 가난한 사람들을 향해 바이어스. 진정한 확률 표본 추출의 마법은 모두 측정하고, 측정되지 않은 특성에 대한 문제 (제 2 장에서 관찰 연구에서 인과 적 추론에 대한 일치의 논의와 일치하는 점을) 배제하는 것입니다.

실제로, 샘플 매칭은 설문 조사를 완료 열망 크고 다양한 패널을 구비에 따라, 따라서 그것은 주로 패널을 개발하고 유지하기 위해 감당할 수있는 회사에 의해 이루어집니다. 또한, 실제로 매칭 및 비 응답 (때때로 유사한 샘플 명 조사에 참여하기를 거부) (대상 시료 사람 패널에없는 때로는 좋은 매치)에 문제가있을 수있다. 따라서, 실제로 샘플 매칭을하고 연구진은 추정을 할 사후 층화 조정의 어떤 종류를 수행합니다.

이 샘플 매칭에 대한 유용한 이론적 보증을 제공하는 것이 어렵지만, 실제로 그것은 잘 수행 할 수있다. 예를 들어, 스티븐 Ansolabehere와 브라이언 샤프너 (2014) 우편, 전화 및 샘플 매칭 및 사후 층화 조정을 사용하여 인터넷 패널 : 세 가지 샘플링을 사용 방법을 인터뷰 2010 년에 실시한 약 1,000 명 세 병렬 설문 조사를 비교했다. 세 가지 접근 방법에서 추정은 현재 인구 조사 (CPS) 및 국민 건강 면접 조사 (NHIS)와 같은 높은 품질의 벤치 마크에서 예상과 매우 유사했다. 보다 구체적으로는, 모두 인터넷과 우편 설문 조사는 3 % 포인트의 평균으로 해제했다 및 전화 조사는 오프 4 % 포인트였다. 이 큰 오류 중 하나는 약 천명의 샘플에서 기대할 수있는 약 무엇인가. 하지만, 실질적으로 더 나은 데이터 생성이 모드 없음 (팔개월했다) 메일 설문 조사보다 필드에 실질적으로 더 빨리했다 (일 또는 주했다) 인터넷 및 전화 설문 조사 및 샘플 매칭을 사용하는 인터넷 설문 조사, 모두, 다른 두 가지 모드보다 저렴했다.

그들은 같은 문학 다이제스트 설문 조사 등의 조사 연구의 일부 당황 장애와 연관되어 있기 때문에 결론적으로, 사회 과학자들과 통계는 부분적으로 이러한 비 확률 표본에서 추론의 매우 회의적이다. 부분적으로,이 회의에 동의 : 조정되지 않은 비 확률 표본 나쁜 견적을 생성 할 가능성이있다. 연구자들은 (예를 들어, 사후 층화) 샘플링 과정에서 바이어스를 조정하거나 다소 샘플링 프로세스를 제어 할 수있는 경우에는 (예를 들어, 샘플 일치), 이들은 더 추정하고, 대부분의 용도에 충분한 품질에도 추정치를 생성 할 수있다. 물론, 완벽하게 실행 확률 표본 추출을하는 것이 더 없을 것이다, 그러나 그것은 더 이상 현실적인 옵션이 나타납니다.

비 확률 샘플 확률 샘플 모두의 품질에 차이가, 현재 그 가능성 확률 샘플들로부터 대부분의 추정 비 확률 샘플들로부터 추정보다 더 신뢰할 수있는 경우이다. 하지만, 지금도 잘 수행 비 확률 표본에서 추정 가난 실시 확률 샘플에서 예상보다 아마 더 낫다. 또한, 비 확률 샘플은 실질적으로 저렴하다. 따라서, 비 확률 샘플링 VS 그 확률은 비용 품질 트레이드 오프 (도 3.6)을 제공 나타난다. 기대, 나는 잘 수행 비 확률 표본에서 추정 저렴하고 더 나은 될 것으로 기대하고있다. 또한, 때문에 유선 전화 설문 조사 및 비 - 반응의 증가 속도의 고장, 나는 확률 샘플이 더 비싼되고 낮은 품질의 것으로 기대하고있다. 때문에 이러한 장기 추세, 나는 비 확률 샘플링 조사 연구의 세 번째 시대에 점점 더 중요해질 것이라고 생각합니다.

그림 3.6 : 연습과 비 확률 표본 추출의 확률 샘플링은 모두 대규모 이기종 카테고리입니다. 일반적으로, 비 확률 샘플링 저비용이지만 높은 오류로되고 비용 오류 트레이드 오프가있다. 그러나 잘 수행 비 확률 표본 추출은 가난 할 확률 샘플링보다 더 나은 견적을 생성 할 수 있습니다. 앞으로 나는 비 확률 표본 추출 확률 표본 추출은 더 많은 비용이 얻을 것이다 동안 더 싸게 얻을 것으로 기대.