Các hoạt động

Chìa khóa:

  • mức độ khó khăn: dễ dàng dễ dàng , Trung bình Trung bình , cứng cứng , Rất cứng rất cứng
  • đòi hỏi toán ( đòi hỏi toán học )
  • đòi hỏi mã hóa ( đòi hỏi mã hóa )
  • thu thập dữ liệu ( thu thập dữ liệu )
  • mục yêu thích của tôi ( yêu thích của tôi )
  1. [ cứng , đòi hỏi toán học ] Trong chương này, tôi đã rất tích cực về sau phân tầng. Tuy nhiên, nó không phải luôn luôn nâng cao chất lượng dự toán. Xây dựng một tình huống mà có thể đăng bài-phân tầng có thể làm giảm chất lượng của dự toán. (Đối với một gợi ý, xem Thomsen (1973) ).

  2. [ cứng , thu thập dữ liệu , đòi hỏi mã hóa ] Thiết kế và tiến hành một cuộc điều tra không xác suất về Amazon MTurk hỏi về quyền sở hữu súng ( "Bạn có, hoặc không ai trong gia đình của bạn, sở hữu một khẩu súng, súng trường hoặc súng lục? Là bạn hoặc ai đó trong gia đình của bạn?") Và thái độ đối với việc kiểm soát súng ( "Điều gì làm bạn nghĩ là quan trọng để nhiều bảo vệ quyền của người Mỹ sở hữu súng, hoặc để kiểm soát sở hữu súng?").

    1. không khảo sát của bạn kéo dài bao lâu? Làm thế nào nhiêu chi phí? Làm thế nào để các nhân khẩu học của mẫu của bạn so với các nhân khẩu học của dân số Hoa Kỳ?
    2. dự liệu của người sở hữu súng sử dụng mẫu của bạn là gì?
    3. Chính xác cho các phi tính đại diện của mẫu bằng cách sử dụng sau phân tầng hoặc một số kỹ thuật khác. Bây giờ ước tính của người sở hữu súng là gì?
    4. Làm thế nào để ước tính của bạn so với các ước tính mới nhất từ ​​Trung tâm nghiên cứu Pew? Bạn nghĩ gì giải thích sự khác biệt, nếu có bất kỳ?
    5. Lặp lại bài tập 2-5 cho thái độ đối với việc kiểm soát súng. Làm thế nào để phát hiện của bạn khác?
  3. [ rất cứng , thu thập dữ liệu , đòi hỏi mã hóa ] Goel và các cộng sự (2016) quản lý một cuộc khảo sát không xác suất dựa trên bao gồm 49 câu hỏi trắc nghiệm thái độ rút ra từ khảo sát chung xã hội (GSS) và chọn khảo sát do Trung tâm Nghiên cứu Pew về Amazon MTurk. Họ sau đó điều chỉnh cho các phi-đại diện của dữ liệu sử dụng dựa trên mô hình sau phân tầng (Ông P), và so sánh dự toán điều chỉnh với những ước tính sử dụng các cuộc điều tra GSS / Pew xác suất dựa trên. Tiến hành khảo sát tương tự trên MTurk và cố gắng tái tạo hình 2a và hình 2b bằng cách so sánh dự toán điều chỉnh của bạn với các ước tính từ vòng gần đây nhất của GSS / Pew (Xem Phụ lục Bảng A2 để xem danh sách 49 câu hỏi).

    1. So sánh và đối chiếu kết quả của bạn với các kết quả từ Pew và GSS.
    2. So sánh và đối chiếu kết quả của bạn với các kết quả từ các cuộc khảo sát MTurk trong Goel, Obeng, and Rothschild (2016) .
  4. [ Trung bình , thu thập dữ liệu , đòi hỏi mã hóa ] Nhiều nghiên cứu sử dụng các biện pháp tự báo cáo dữ liệu hoạt động điện thoại di động. Đây là cài đặt thú vị mà các nhà nghiên cứu có thể so sánh hành vi tự báo cáo với hành vi đăng nhập (xem ví dụ, Boase and Ling (2013) ). Hai hành vi thường gặp để hỏi về đang kêu gọi và nhắn tin, và hai khung thời gian chung là "ngày hôm qua" và "trong tuần qua."

    1. Trước khi thu thập dữ liệu, mà của tự báo cáo các biện pháp bạn có nghĩ là chính xác hơn? Tại sao?
    2. Tuyển 5 bạn bè của bạn có trong cuộc khảo sát của bạn. Hãy tóm tắt ngắn gọn về cách những 5 bạn bè đã được lấy mẫu. Có thể thủ tục lấy mẫu này gây ra thành kiến ​​cụ thể trong dự toán của bạn?
    3. Hãy yêu cầu họ vi khảo sát sau đây:
    • "Bao nhiêu lần bạn sử dụng điện thoại di động để gọi cho người khác ngày hôm qua?"
    • "Có bao nhiêu tin nhắn văn bản bạn đã gửi ngày hôm qua?"
    • "Bao nhiêu lần bạn sử dụng điện thoại di động của bạn để gọi những người khác trong bảy ngày qua không?"
    • "Bao nhiêu lần bạn đã sử dụng điện thoại di động của bạn để gửi hoặc nhận tin nhắn văn bản / SMS trong bảy ngày qua không?" Một khi các cuộc điều tra hoàn tất, hãy hỏi để kiểm tra dữ liệu sử dụng của họ như là đăng nhập bằng điện thoại hoặc cung cấp dịch vụ của họ.
    1. Làm thế nào để sử dụng tự báo cáo so sánh để đăng nhập dữ liệu? Đó là chính xác nhất, đó là ít nhất là chính xác?
    2. Bây giờ kết hợp các dữ liệu mà bạn đã thu thập được với các dữ liệu từ những người khác trong lớp học của bạn (nếu bạn đang làm hoạt động này cho một lớp). Với bộ dữ liệu lớn hơn này, lặp lại một phần (d).
  5. [ Trung bình , thu thập dữ liệu ] Schuman và tay ép (1996) cho rằng đơn đặt hàng câu hỏi sẽ có vấn đề đối với hai loại quan hệ giữa các câu hỏi: câu hỏi bán phần mà hai câu hỏi là tại cùng một mức độ đặc hiệu (ví dụ như xếp hạng của hai ứng cử viên tổng thống); và bán toàn bộ câu hỏi mà một câu hỏi chung sau một câu hỏi cụ thể hơn (ví dụ như hỏi "Làm thế nào bạn hài lòng với công việc của bạn?" tiếp theo là "Làm thế nào bạn hài lòng với cuộc sống của bạn?").

    Họ cũng đặc trưng cho hai loại hiệu ứng thứ tự câu hỏi: tác thống nhất xảy ra khi phản ứng với một câu hỏi sau đó được đưa gần hơn (so với họ nếu không sẽ) cho những người đưa ra một câu hỏi trước đó; phản ứng xảy ra khi có sự khác biệt lớn hơn giữa các câu trả lời cho hai câu hỏi.

    1. Tạo một cặp câu hỏi phần phần mà bạn nghĩ rằng sẽ có một tác động lớn thứ tự câu hỏi, một đôi câu hỏi bán toàn bộ mà bạn nghĩ rằng sẽ có một hiệu ứng đơn đặt hàng lớn, và một cặp câu hỏi mà để bạn nghĩ rằng sẽ không có vấn đề. Chạy thử nghiệm khảo sát trên MTurk để kiểm tra các câu hỏi của bạn.
    2. Làm thế nào lớn là tác bán một phần này bạn có thể tạo ra? Đó có phải là một sự nhất quán hay phản tác dụng?
    3. Làm thế nào lớn là hiệu ứng bán toàn bộ là bạn có thể tạo ra? Đó có phải là một sự nhất quán hay phản tác dụng?
    4. Đã có một câu hỏi để hiệu lực trong cặp của bạn mà bạn không nghĩ rằng thứ tự sẽ có vấn đề?
  6. [ Trung bình , thu thập dữ liệu ] Xây dựng trên công việc của Schuman và Presser, Moore (2002) mô tả một khía cạnh riêng biệt của hiệu ứng thứ tự câu hỏi: phụ gia và trừ. Trong khi độ tương phản và độ hiệu ứng này được sản xuất như là một hệ quả của việc đánh giá được hỏi về hai mặt hàng liên quan đến nhau, phụ gia và các hiệu ứng trừ được tạo ra khi người được hỏi đã nhạy cảm hơn với khuôn khổ lớn hơn mà trong đó các câu hỏi được đặt ra. Đọc Moore (2002) , sau đó thiết kế và điều hành một thí nghiệm khảo sát trên MTurk để chứng minh phụ gia hay trừ các hiệu ứng.

  7. [ cứng , thu thập dữ liệu ] Christopher Antoun và các cộng sự (2015) đã tiến hành một nghiên cứu so sánh các mẫu thuận tiện thu được từ bốn nguồn tuyển dụng trực tuyến khác nhau: MTurk, Craigslist, Google AdWords và Facebook. Thiết kế một khảo sát đơn giản và tuyển dụng người tham gia thông qua ít nhất hai nguồn tuyển dụng trực tuyến khác nhau (chúng có thể là nguồn khác nhau từ bốn nguồn được sử dụng trong Antoun et al. (2015) ).

    1. So sánh chi phí cho mỗi tuyển dụng, về mặt tiền bạc và thời gian, giữa các nguồn khác nhau.
    2. So sánh các thành phần của các mẫu thu được từ các nguồn khác nhau.
    3. So sánh chất lượng của dữ liệu giữa các mẫu. Đối với những ý tưởng về làm thế nào để đo lường chất lượng dữ liệu từ các đối tượng, xem Schober et al. (2015) .
    4. nguồn ưa thích của bạn là gì? Tại sao?
  8. [ Trung bình ] YouGov, một công ty nghiên cứu thị trường trên internet, tiến hành các cuộc thăm dò trực tuyến của một bảng điều khiển của khoảng 800.000 người được hỏi ở Anh và sử dụng ông P. để dự đoán kết quả của EU Trưng (tức là, Brexit), nơi các cử tri bỏ phiếu Anh hoặc ở lại hoặc rời khỏi Liên minh châu Âu.

    Mô tả chi tiết của mô hình thống kê YouGov là đây (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Khoảng nói, YouGov phân vùng cử tri vào loại dựa trên 2015 cuộc tổng tuyển cử lựa chọn bỏ phiếu, tuổi tác, trình độ, giới tính, ngày phỏng vấn, cũng như các cử tri mà họ đang sống. Đầu tiên, họ đã sử dụng dữ liệu thu thập được từ các hội thẩm viên YouGov để ước tính, trong số những người người bỏ phiếu, tỷ lệ người dân của từng loại cử tri có ý định bỏ phiếu Rời khỏi. Họ ước tính cử tri đi bầu của cử tri từng loại bằng cách sử dụng các nghiên cứu năm 2015 của Anh bầu cử (BES) sau cuộc bầu cử mặt đối mặt cuộc điều tra, trong đó xác nhận cử tri đi bầu từ các cuộn bầu cử. Cuối cùng, họ ước tính có bao nhiêu người có của từng loại cử tri trong cử tri dựa trên điều tra dân số mới nhất và điều tra dân số hàng năm (với một số thông tin bổ sung từ các BES, số liệu điều tra của YouGov từ xung quanh cuộc bầu cử nói chung, và thông tin về bao nhiêu người bình chọn cho mỗi bên trong mỗi cử tri).

    Ba ngày trước cuộc bầu cử, YouGov cho thấy một dẫn hai điểm cho Rời khỏi. Vào đêm trước ngày bầu cử, các cuộc thăm dò cho thấy quá gần để gọi (49-51 Giữ). Các nghiên cứu cuối cùng trên-một-ngày dự đoán 48/52 ủng hộ Giữ (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Trong thực tế, ước tính này bỏ kết quả cuối cùng (52-48 Để lại) bởi bốn điểm phần trăm.

    1. Sử dụng tổng khuôn khổ lỗi khảo sát được thảo luận trong chương này để đánh giá những gì có thể đã đi sai.
    2. phản ứng YouGov sau khi cuộc bầu cử (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) giải thích: "Điều này có vẻ như trong một phần lớn là do cử tri đi bầu - một cái gì đó chúng tôi đã nói tất cả cùng sẽ là rất quan trọng để kết quả của một cuộc đua mịn cân bằng như vậy. mô hình cử tri đi bầu của chúng tôi đã được một phần dựa vào việc liệu được hỏi đã bình chọn tại cuộc tổng tuyển cử vừa qua và một mức độ cử tri đi bầu ở trên rằng các cuộc bầu cử nói chung buồn bã mô hình, đặc biệt là ở miền Bắc. "Điều này có thay đổi câu trả lời của bạn để phần (a)?
  9. [ Trung bình , đòi hỏi mã hóa ] Viết một mô phỏng để minh họa cho mỗi lỗi biểu diễn trong hình 3.1.

    1. Tạo một tình huống mà các lỗi thực sự bị hủy bỏ.
    2. Tạo một tình huống mà các lỗi hợp chất nhau.
  10. [ rất cứng , đòi hỏi mã hóa ] Các nghiên cứu của Blumenstock và các cộng sự (2015) liên quan đến việc xây dựng một mô hình học máy có thể sử dụng dữ liệu dấu vết kỹ thuật số để dự đoán trả lời khảo sát. Bây giờ, bạn sẽ cố gắng điều tương tự với một tập dữ liệu khác nhau. Kosinski, Stillwell, and Graepel (2013) phát hiện ra rằng Facebook thích có thể dự đoán những đặc điểm cá nhân và các thuộc tính. Đáng ngạc nhiên, những dự đoán này có thể còn chính xác hơn so với những bạn bè và đồng nghiệp (Youyou, Kosinski, and Stillwell 2015) .

    1. Đọc Kosinski, Stillwell, and Graepel (2013) , và tái tạo Hình 2. Dữ liệu của họ có sẵn ở đây: http://mypersonality.org/
    2. Bây giờ, sao chép hình 3.
    3. Cuối cùng, hãy thử mô hình của họ trên dữ liệu Facebook của riêng bạn: http://applymagicsauce.com/. Làm thế nào nó làm việc cho bạn?
  11. [ Trung bình ] Toole et al. (2015) chi tiết sử dụng hồ sơ cuộc gọi (CDR) từ điện thoại di động để dự đoán tổng hợp xu hướng thất nghiệp.

    1. So sánh và đối chiếu những thiết kế của Toole et al. (2015) với Blumenstock, Cadamuro, and On (2015) .
    2. Bạn có nghĩ rằng các CDR nên thay thế các cuộc điều tra truyền thống, bổ sung cho họ hay không được sử dụng ở tất cả cho hoạch định chính sách của chính phủ để theo dõi tình trạng thất nghiệp? Tại sao?
    3. bằng chứng gì sẽ thuyết phục bạn rằng CDR hoàn toàn có thể thay thế các biện pháp truyền thống của tỷ lệ thất nghiệp không?