أنشطة

  • درجة الصعوبة: سهل سهل ، متوسط متوسط ، الصعب الصعب ، صعب جدا صعب جدا
  • يتطلب الرياضيات ( يتطلب الرياضيات )
  • يتطلب الترميز ( يتطلب الترميز )
  • جمع البيانات ( جمع البيانات )
  • مفضلتي ( أُفضله )
  1. [ صعب جدا ، يتطلب الترميز ، جمع البيانات ، أُفضله ] واحدة من أكثر الادعاءات إثارة من بينوا وزملائه (2016) البحث في ترميز الحشد من البيانات السياسية هو أن النتائج قابلة للاستنساخ. Merz, Regel, and Lewandowski (2016) الوصول إلى Manifesto Corpus. حاول إعادة إنتاج الشكل 2 من Benoit et al. (2016) باستخدام العمال من شركة Amazon Mechanical Turk. كيف كانت نتائجك مماثلة؟

  2. [ متوسط ] في مشروع InfluenzaNet ، تقوم مجموعة من المتطوعين بالإبلاغ عن حالات الإصابة والانتشار والسلوك المتعلق بالصحة المرتبطة بمرض يشبه الإنفلونزا (Tilston et al. 2010; Noort et al. 2015) .

    1. قارن بين التصميم والتكاليف والأخطاء المحتملة في نظام InfluenzaNet واتجاهات الإنفلوانزا في Google وأنظمة التتبع التقليدية للأنفلونزا.
    2. فكر في وقت غير مستقر ، مثل ظهور نوع جديد من الأنفلونزا. صف الأخطاء المحتملة في كل نظام.
  3. [ الصعب ، يتطلب الترميز ، جمع البيانات ] The Economist هي مجلة إخبارية أسبوعية. إنشاء مشروع حساب بشري لمعرفة ما إذا كانت نسبة النساء إلى الرجال على الغلاف قد تغيرت مع مرور الوقت.

    1. يمكن أن يكون للمجلة أغلفة مختلفة في ثماني مناطق مختلفة (أفريقيا وآسيا والمحيط الهادئ وأوروبا والاتحاد الأوروبي وأمريكا اللاتينية والشرق الأوسط وأمريكا الشمالية والمملكة المتحدة) ويمكن تنزيلها كلها من موقع المجلة. اختر واحدة من هذه المناطق وقم بإجراء التحليل. تأكد من وصف الإجراءات الخاصة بك بالتفاصيل الكافية التي يمكن تكرارها من قبل شخص آخر.

    استلهم هذا السؤال من مشروع مشابه أجراه جوستين تينوتو ، وهو عالم معطيات في شركة التعهيد الجماعي CrowdFlower: أنظر: "مجلة تايم تُعجب بالرجال" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ صعب جدا ، يتطلب الترميز ، جمع البيانات ] بناءً على السؤال السابق ، أجرى الآن التحليل لجميع المناطق الثمانية.

    1. ما هي الاختلافات التي وجدتها عبر المناطق؟
    2. ما مقدار الوقت والمال الإضافيين اللذان اضطلعت بهما لرفع مستوى تحليلاتك إلى جميع المناطق الثمانية؟
    3. تخيل أن مجلة الإيكونوميست لديها 100 غلاف مختلف كل أسبوع. قم بتقدير مقدار الوقت الإضافي والمال الذي يتطلبه رفع مستوى تحليلاتك إلى 100 غطاء في الأسبوع.
  5. [ الصعب ، يتطلب الترميز ] هناك العديد من مواقع الويب التي تستضيف مشروعات مكالمات مفتوحة ، مثل Kaggle. شارك في أحد هذه المشاريع ، واذكر ما تعرفه عن هذا المشروع بالتحديد وعن المكالمات المفتوحة بشكل عام.

  6. [ متوسط ] ابحث في عدد حديث من مجلة في مجالك. هل هناك أي أوراق يمكن إعادة صياغتها كمشاريع مفتوحة؟ لما و لما لا؟

  7. [ سهل ] Purdam (2014) يصف مجموعة بيانات موزعة حول التسول في لندن. لخص نقاط القوة والضعف في تصميم البحث هذا.

  8. [ متوسط يعد التكرار طريقة مهمة لتقييم جودة جمع البيانات الموزعة. Windt and Humphreys (2016) نظامًا لجمع تقارير عن أحداث النزاع من أشخاص في شرق الكونغو Windt and Humphreys (2016) . اقرأ الورقة.

    1. كيف يضمن تصميمها التكرار؟
    2. عرضوا عدة أساليب للتحقق من صحة البيانات التي تم جمعها من مشروعهم. تلخيص لهم. الذي كان أكثر إقناعا لك؟
    3. اقتراح طريقة جديدة يمكن التحقق من صحة البيانات. يجب أن تحاول الاقتراحات زيادة الثقة التي ستحصل عليها في البيانات بطريقة فعالة من حيث التكلفة وأخلاقية.
  9. [ متوسط أنشأ كريم لاخاني وزملاؤه (2013) دعوة مفتوحة لطلب خوارزميات جديدة لحل مشكلة في علم الأحياء الحسابي. وقد تلقوا أكثر من 600 طلب يحتوي على 89 منهج حسابي جديد. من بين التقديمات ، تجاوزت 30 أداء أداء MegaBLAST للمعاهد الوطنية الأمريكية للصحة ، وأفضل تقديم تم تحقيقه بدقة أكبر وسرعة أكبر (1000 مرة أسرع).

    1. اقرأ ورقتهم ، ثم اقترح مشكلة بحث اجتماعي يمكن أن تستخدم نفس النوع من المسابقة المفتوحة. على وجه الخصوص ، يركز هذا النوع من المسابقة المفتوحة على تسريع وتحسين أداء خوارزمية موجودة. إذا لم تستطع التفكير في مشكلة كهذه في مجالك ، حاول أن تشرح لماذا لا.
  10. [ متوسط ، أُفضله تعتمد العديد من مشاريع الحوسبة البشرية على المشاركين من شركة Amazon Mechanical Turk. قم بالتسجيل لتصبح عاملاً في شركة Amazon Mechanical Turk. قضاء ساعة واحدة تعمل هناك. كيف يؤثر ذلك على أفكارك حول التصميم والجودة والأخلاقيات لمشاريع حساب الإنسان؟