פעילויות

  • דרגת קושי: קל קַל , בינוני בינוני , קשה קָשֶׁה , קשה מאוד קשה מאוד
  • דורש מתמטיקה ( דורש מתמטיקה )
  • דורש קידוד ( דורש קידוד )
  • איסוף נתונים ( איסוף נתונים )
  • המועדפים שלי ( המועדף עליי )
  1. [ קשה מאוד , דורש קידוד , איסוף נתונים , המועדף עליי ] אחת הטענות המרגשות ביותר של Benoit ועמיתים (2016) מחקר על קידוד קהל של המניפסטים הפוליטיים היא כי התוצאות לשחזור. Merz, Regel, and Lewandowski (2016) מספק גישה המניפסט קורפוס. נסה לשחזר דמות 2 מ Benoit et al. (2016) באמצעות עובדים אמזון מכני טורק. עד כמה היו התוצאות שלך?

  2. [ בינוני בפרויקט InfluenzaNet, צוות מתנדבים של אנשים מדווח על שכיחות, שכיחות והתנהגות המבקשת בריאות הקשורים למחלות דמויי שפעת (Tilston et al. 2010; Noort et al. 2015) .

    1. השווה וניגוד בין העיצוב, העלויות והשגיאות האפשריות ב- InfluenzaNet, ב- Google Flu Trends ובמערכות מעקב מסורתיות לשפעת.
    2. חשבו על זמן לא יציב, כמו התפרצות של סוג חדש של שפעת. תאר את השגיאות האפשריות בכל מערכת.
  3. [ קָשֶׁה , דורש קידוד , איסוף נתונים ] האקונומיסט הוא מגזין חדשותי שבועי. יצירת פרויקט חישוב אנושי כדי לראות אם היחס בין נשים לגברים על העטיפה השתנה עם הזמן.

    1. המגזין יכול להיות שונה בשמונה אזורים שונים (אפריקה, אסיה פסיפיק, אירופה, האיחוד האירופי, אמריקה הלטינית, המזרח התיכון, צפון אמריקה, בריטניה) והם יכולים להיות כל להוריד מאתר המגזין. בחר אחד מהאזורים האלה ובצע את הניתוח. הקפד לתאר את הנהלים שלך עם פירוט מספיק שהם יכולים להיות משוכפל על ידי מישהו אחר.

    שאלה זו קיבלה השראה מפרויקט דומה של ג'סטין טנוטו, מדען נתונים בחברת CrowdFlower של חברת ההמונים: ראה "מגזין Time Time Love Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ קשה מאוד , דורש קידוד , איסוף נתונים ] בניין על השאלה הקודמת, עכשיו לבצע את הניתוח עבור כל שמונה אזורים.

    1. אילו הבדלים מצאת בין אזורים?
    2. כמה זמן וכסף נוסף נדרש כדי להגדיל את הניתוח שלך לכל שמונה האזורים?
    3. תארו לעצמכם שלכלכלן יש 100 כריכות שונות בכל שבוע. להעריך כמה זמן נוסף וכסף יידרש כדי להגביר את הניתוח שלך 100 מכסה בשבוע.
  5. [ קָשֶׁה , דורש קידוד ] ישנם מספר אתרי אינטרנט המארחים פרויקטים של שיחות פתוחות, כגון Kaggle. השתתף באחד מהפרויקטים הללו, ותאר את מה שאתה לומד על פרויקט מסוים זה ועל שיחות פתוחות בכלל.

  6. [ בינוני ] עיין בגיליון האחרון של כתב עת בתחום שלך. האם יש מסמכים שיכולים להיות מחדש כמו פרויקטים להתקשר פתוח? למה או למה לא?

  7. [ קַל ] Purdam (2014) מתאר אוסף נתונים מבוזר על הקבצנות בלונדון. לסכם את נקודות החוזק והחולשות של עיצוב זה המחקר.

  8. [ בינוני ] יתירות היא דרך חשובה להעריך את האיכות של איסוף נתונים מבוזרים. Windt and Humphreys (2016) פיתחו ובדקו מערכת לאיסוף דיווחים על אירועי סכסוך מאנשים במזרח קונגו. קרא את הנייר.

    1. איך העיצוב שלהם להבטיח יתירות?
    2. הם הציעו מספר גישות לאימות הנתונים שנאספו מהפרויקט שלהם. לסכם אותם. מה היה הכי משכנע לך?
    3. להציע דרך חדשה כי הנתונים יכול להיות מאומת. הצעות צריך לנסות להגדיל את הביטחון שאתה תהיה בנתונים בצורה חסכונית ואתית.
  9. [ בינוני ] כארים Lakhani ועמיתיו (2013) יצרו שיחה פתוחה כדי לבקש אלגוריתמים חדשים כדי לפתור בעיה בביולוגיה חישובית. הם קיבלו יותר מ 600 הגשות המכילות 89 גישות חישוביות חדשניות. מתוך הגשות, 30 חרגו מהביצועים של המכונים הלאומיים של מכון הבריאות הלאומי של ארה"ב, וההגשה הטובה ביותר השיגה הן דיוק והן מהירות גבוהות יותר (פי 1,000 מהר יותר).

    1. קרא את העיתון שלהם, ולאחר מכן להציע בעיה במחקר חברתי שיכול להשתמש באותו סוג של תחרות פתוחה. במיוחד, סוג זה של תחרות פתוחה מתמקד בהאיץ ושיפור הביצועים של אלגוריתם קיים. אם אתה לא יכול לחשוב על בעיה כזאת בתחום שלך, נסה להסביר למה לא.
  10. [ בינוני , המועדף עליי ] פרויקטים רבים של חישובים אנושיים מסתמכים על משתתפי אמזון מכני טורק. הירשם כדי להיות עובד על אמזון מכני טורק. לבלות שעה אחת עובד שם. איך זה משפיע על המחשבות שלך על עיצוב, איכות, ואתיקה של פרויקטים חישוב האדם?