Các hoạt động

  • mức độ khó khăn: dễ dàng dễ dàng , Trung bình Trung bình , cứng cứng , rất chăm chỉ rất khó
  • yêu cầu toán học ( yêu cầu toán học )
  • yêu cầu mã hóa ( yêu cầu mã hóa )
  • thu thập dữ liệu ( thu thập dữ liệu )
  • mục yêu thích của tôi ( yêu thích của tôi )
  1. [ rất khó , yêu cầu mã hóa , thu thập dữ liệu , yêu thích của tôi ] Một trong những tuyên bố thú vị nhất từ ​​nghiên cứu của Benoit và cộng sự (2016) về mã hóa đám đông các biểu hiện chính trị là kết quả có thể tái sản xuất được. Merz, Regel, and Lewandowski (2016) cung cấp quyền truy cập vào Manifesto Corpus. Cố gắng tái tạo hình 2 từ Benoit et al. (2016) sử dụng công nhân từ Amazon Mechanical Turk. Kết quả của bạn tương tự như thế nào?

  2. [ Trung bình ] Trong dự án InfluenzaNet, một nhóm tình nguyện viên của mọi người báo cáo tỷ lệ mắc, tỷ lệ và hành vi tìm kiếm sức khỏe liên quan đến bệnh giống cúm (Tilston et al. 2010; Noort et al. 2015) .

    1. So sánh và đối chiếu thiết kế, chi phí và các lỗi có khả năng xảy ra trong InfluenzaNet, Google Xu hướng Dịch cúm và các hệ thống theo dõi cúm truyền thống.
    2. Hãy xem xét một thời gian không ổn định, chẳng hạn như sự bùng phát của một dạng cúm mới lạ. Mô tả các lỗi có thể xảy ra trong mỗi hệ thống.
  3. [ cứng , yêu cầu mã hóa , thu thập dữ liệu The Economist là tạp chí tin tức hàng tuần. Tạo một dự án tính toán con người để xem liệu tỷ lệ phụ nữ đối với nam giới trên trang bìa có thay đổi theo thời gian hay không.

    1. Tạp chí có thể có các bìa khác nhau ở tám khu vực khác nhau (Châu Phi, Châu Á Thái Bình Dương, Châu Âu, Liên minh châu Âu, Mỹ Latinh, Trung Đông, Bắc Mỹ và Vương quốc Anh) và tất cả có thể được tải xuống từ trang web của tạp chí. Chọn một trong các khu vực này và thực hiện phân tích. Hãy chắc chắn để mô tả các thủ tục của bạn với đủ chi tiết mà họ có thể được nhân rộng bởi người khác.

    Câu hỏi này được lấy cảm hứng từ một dự án tương tự của Justin Tenuto, một nhà khoa học dữ liệu tại CrowdFlower, công ty Crowdsourcing: xem “Tạp chí Time Really Really Dudes” (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ rất khó , yêu cầu mã hóa , thu thập dữ liệu ] Xây dựng trên câu hỏi trước, bây giờ thực hiện phân tích cho tất cả tám khu vực.

    1. Bạn đã tìm thấy sự khác biệt nào giữa các vùng?
    2. Bạn cần thêm bao nhiêu thời gian và tiền bạc để mở rộng phân tích cho tất cả tám khu vực?
    3. Hãy tưởng tượng rằng các nhà kinh tế có 100 bao gồm khác nhau mỗi tuần. Ước tính cần thêm bao nhiêu thời gian và tiền bạc để mở rộng phân tích của bạn lên 100 trang bìa mỗi tuần.
  5. [ cứng , yêu cầu mã hóa ] Có một số trang web lưu trữ các dự án cuộc gọi mở, chẳng hạn như Kaggle. Tham gia vào một trong những dự án đó và mô tả những gì bạn tìm hiểu về dự án cụ thể đó và về các cuộc gọi mở nói chung.

  6. [ Trung bình ] Xem qua một số tạp chí gần đây trong lĩnh vực của bạn. Có bất kỳ giấy tờ nào có thể đã được cải cách thành dự án cuộc gọi mở không? Tại sao hay tại sao không?

  7. [ dễ dàng ] Purdam (2014) mô tả một bộ sưu tập dữ liệu phân tán về việc xin ăn ở London. Tóm tắt những điểm mạnh và điểm yếu của thiết kế nghiên cứu này.

  8. [ Trung bình ] Dự phòng là một cách quan trọng để đánh giá chất lượng của việc thu thập dữ liệu phân tán. Windt and Humphreys (2016) phát triển và thử nghiệm một hệ thống để thu thập các báo cáo về các sự kiện xung đột từ những người ở Đông Congo. Đọc tờ giấy.

    1. Thiết kế của họ đảm bảo dự phòng như thế nào?
    2. Họ cung cấp một số cách tiếp cận để xác nhận dữ liệu thu thập được từ dự án của họ. Tóm tắt chúng. Điều nào thuyết phục nhất đối với bạn?
    3. Đề xuất một cách mới để dữ liệu có thể được xác thực. Đề xuất nên cố gắng tăng sự tự tin mà bạn sẽ có trong dữ liệu theo cách có hiệu quả về mặt chi phí và đạo đức.
  9. [ Trung bình Karim Lakhani và cộng sự (2013) đã tạo ra một cuộc gọi mở để thu hút các thuật toán mới để giải quyết một vấn đề trong sinh học tính toán. Họ đã nhận được hơn 600 bài nộp có chứa 89 phương pháp tính toán mới lạ. Trong số các bài nộp, 30 đã vượt quá hiệu suất của MegaBLAST của Viện Y tế Quốc gia Hoa Kỳ, và bài nộp tốt nhất đạt được cả độ chính xác và tốc độ cao hơn (nhanh gấp 1.000 lần).

    1. Đọc bài báo của họ, và sau đó đề xuất một vấn đề nghiên cứu xã hội có thể sử dụng cùng một loại cuộc thi mở. Đặc biệt, loại cuộc thi mở này tập trung vào việc tăng tốc và cải thiện hiệu suất của một thuật toán hiện có. Nếu bạn không thể nghĩ ra một vấn đề như thế này trong lĩnh vực của bạn, hãy cố gắng giải thích tại sao không.
  10. [ Trung bình , yêu thích của tôi ] Nhiều dự án tính toán con người dựa vào những người tham gia từ Amazon Mechanical Turk. Đăng ký để trở thành một công nhân trên Amazon Mechanical Turk. Dành một giờ làm việc ở đó. Điều này tác động như thế nào đến suy nghĩ của bạn về thiết kế, chất lượng và đạo đức của các dự án tính toán con người?