أنشطة

مفتاح:

  • درجة الصعوبة: سهلة سهل ، متوسط متوسط ، الصعب الصعب ، صعب جدا صعب جدا
  • يتطلب الرياضيات ( يتطلب الرياضيات )
  • يتطلب ترميز ( يتطلب ترميز )
  • جمع البيانات ( جمع البيانات )
  1. [ صعب جدا ، يتطلب ترميز ، جمع البيانات ] واحدة من المطالبات الأكثر إثارة من Benoit et al. (2015) على حشد الترميز من بياناته السياسية هو أن تكون النتائج قابلة للتكرار. Merz, Regel, and Lewandowski (2016) يوفر الوصول إلى البيان كوربوس. حاول إعادة الشكل 2 من Benoit et al. (2015) باستخدام عمال من الأمازون الترك الميكانيكية. كيف مماثلة كانت النتائج الخاصة بك؟

  2. [ متوسط ] في مشروع InfluenzaNet لجنة المتطوعين من الناس تفيد حدوث، وانتشار، والسلوك الساعي للصحة المتعلقة تشبه الانفلونزا مرض (المعهد الدولي للغة) (Tilston et al. 2010; Noort et al. 2015) .

    1. مقارنة وتصميم، والتكاليف، والأخطاء المحتملة في InfluenzaNet، انفلونزا اتجاهات جوجل، ونظم تتبع الإنفلونزا التقليدية.
    2. النظر في وقت غير مستقر، مثل تفشي انفلونزا الخنازير. وصف الأخطاء المحتملة في كل نظام.
  3. [ الصعب ، يتطلب ترميز ، جمع البيانات ] الإيكونوميست هي مجلة إخبارية أسبوعية. إنشاء مشروع حساب البشر لمعرفة ما إذا زادت نسبة النساء إلى الرجال على غلاف مع مرور الوقت.

    1. مجلة يمكن أن يكون غطاءات مختلفة في ثماني مناطق مختلفة (أفريقيا، آسيا والمحيط الهادئ، وأوروبا، والاتحاد الأوروبي، وأمريكا اللاتينية والشرق الأوسط وأمريكا الشمالية، والمملكة المتحدة)، وكلها قابلة للتحميل من موقع مجلة الإيكونوميست . اختيار واحد من هذه المناطق وإجراء التحليل. مما لا شك فيه أن يصف الإجراءات الخاصة بك مع ما يكفي من التفاصيل أنه يمكن تكرارها من قبل شخص آخر.

    وقد استلهم هذا السؤال مشروع مماثل قبل جوستين Tenuto، وهو عالم البيانات في شركة التعهيد الجماعي CrowdFlower ، انظر "مجلة تايم حقا يحب الرجال" .

  4. [ صعب جدا ، يتطلب ترميز ، جمع البيانات ] وبناء على السؤال أعلاه، الآن إجراء تحليل لجميع المناطق الثماني.

    1. ما هي الاختلافات لم تجد في مختلف المناطق؟
    2. كم خارج الوقت والمال أنها لم تأخذ لتوسيع نطاق يصل تحليلك لجميع ثمانية من المناطق؟
    3. تخيل أن الاقتصاديين لديها 100 غطاءات مختلفة كل أسبوع. تقدير كم من الوقت الإضافي والمال ان الامر سيستغرق لتوسيع نطاق يصل تحليلك إلى 100 يغطي كل أسبوع.
  5. [ الصعب ، يتطلب ترميز ] [Kaggle] (https://www.kaggle.com/) هو الموقع الذي يستضيف مشاريع دعوة مفتوحة. المشاركة في واحدة من تلك المشاريع.

  6. [ متوسط ] انظر من خلال العدد الأخير من مجلة في مجال عملك. هل هناك أي الأوراق التي كان يمكن صياغتها على النحو مشاريع دعوة مفتوحة؟ لما و لما لا؟

  7. [ سهل ] Purdam (2014) وصفا لجمع البيانات الموزعة حول التسول في لندن. تلخيص نقاط القوة والضعف في هذا التصميم البحوث.

  8. [ متوسط ] التكرار هو وسيلة هامة لتقييم جودة جمع البيانات الموزعة. Windt and Humphreys (2016) تطوير واختبار نظام لجمع تقارير عن أحداث الصراع من الناس في شرق الكونغو. اقرأ الورقة.

    1. كيف تصميمها ضمان التكرار؟
    2. أنها توفر العديد من الطرق للتحقق من صحة البيانات التي تم جمعها من مشروعهم. تلخيص لهم. الذي كان الأكثر إقناعا بالنسبة لك؟
    3. اقتراح طريقة جديدة يمكن التحقق من صحة البيانات. وينبغي للاقتراحات محاولة لزيادة الثقة التي عملتم في البيانات بطريقة فعالة من حيث التكلفة والأخلاقية.
  9. [ متوسط ] كريم لاخاني وزملاؤه (2013) خلقت دعوة مفتوحة للحصول خوارزميات جديدة لحل مشكلة في علم الأحياء الحسابي. أنها تلقت أكثر من 600 الطلبات التي تحتوي على 89 النهج الحسابية الجديدة. من التقديمات، أنها تلقت 30 التي فاقت أداء المعاهد الوطنية الأميركية للMegaBLAST الصحة، وأفضل تقديم حقق كلا أكبر والدقة والسرعة (1000 مرات أسرع).

    1. قراءة ورقتهم، ومن ثم اقتراح مشكلة البحث الاجتماعي التي يمكن أن تستخدم نفس النوع من مسابقة مفتوحة. على وجه الخصوص، ويركز هذا النوع من مسابقة مفتوحة على تسريع وتحسين أداء خوارزمية الحالية. إذا كنت لا يمكن التفكير في مشكلة من هذا القبيل في مجال عملك، في محاولة لتفسير لماذا لا.
  10. [ متوسط ] العديد من المشاريع حساب الإنسان تعتمد على المشاركين من الأمازون الترك الميكانيكية. الاشتراك لتصبح عاملة في الأمازون الترك الميكانيكية. قضاء ساعة واحدة يعملون هناك. كيف يؤثر هذا أفكارك حول تصميم والجودة وأخلاقيات مشاريع compuation الإنسان؟