Δραστηριότητες

Κλειδί:

  • βαθμός δυσκολίας: εύκολη εύκολος , μέσο μέσον , σκληρά σκληρά , πολύ δύσκολο πολύ δύσκολο
  • απαιτεί μαθηματικά ( απαιτεί μαθηματικά )
  • απαιτεί κωδικοποίησης ( απαιτεί την κωδικοποίηση )
  • συλλογή δεδομένων ( συλλογή δεδομένων )
  1. [ πολύ δύσκολο , απαιτεί την κωδικοποίηση , συλλογή δεδομένων ] Ένα από τα πιο συναρπαστικά αξιώσεις από Benoit et al. (2015) σε πλήθος-κωδικοποίηση των πολιτικών μανιφέστων είναι ότι τα αποτελέσματα είναι επαναλήψιμα. Merz, Regel, and Lewandowski (2016) παρέχει πρόσβαση στο Μανιφέστο Corpus. Προσπαθήστε να αναπαράγουν εικόνα 2 από Benoit et al. (2015) χρησιμοποιώντας εργαζομένων από Amazon Mechanical Turk. Πώς παρόμοια ήταν τα αποτελέσματά σας;

  2. [ μέσον ] Στο έργο InfluenzaNet μια ομάδα εθελοντών των ανθρώπων που αναφέρουν την επίπτωση, τον επιπολασμό και την υγεία συμπεριφορά αναζήτησης που σχετίζονται με τη γρίπη-όπως-νόσους (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. Συγκρίνουν και να αντιπαραβάλλουν το σχεδιασμό, το κόστος, και είναι πιθανό λάθη στο InfluenzaNet, το Google Flu Trends, και τα παραδοσιακά συστήματα παρακολούθησης της γρίπης.
    2. Σκεφτείτε ένα άστατο καιρό, όπως το ξέσπασμα της γρίπης των χοίρων. Περιγράψτε τα πιθανά σφάλματα σε κάθε σύστημα.
  3. [ σκληρά , απαιτεί την κωδικοποίηση , συλλογή δεδομένων ] Το Economist είναι ένα εβδομαδιαίο περιοδικό ειδήσεων. Δημιουργήστε ένα έργο ανθρώπινο υπολογισμού για να δούμε αν η αναλογία των γυναικών προς τους άνδρες στο εξώφυλλο έχει αυξηθεί την πάροδο του χρόνου.

    1. Το περιοδικό μπορεί να έχει διαφορετικά εξώφυλλα σε οκτώ διαφορετικές περιοχές (Αφρική, Ασία-Ειρηνικός, Ευρώπη, Ευρωπαϊκή Ένωση, τη Λατινική Αμερική, Μέση Ανατολή, τη Βόρεια Αμερική, και Ηνωμένο Βασίλειο) και μπορούν όλοι να το κατεβάσετε από την ιστοσελίδα του The Economist . Διαλέξτε μία από αυτές τις περιοχές και να εκτελέσει την ανάλυση. Να είστε βέβαιος να περιγράψει τις διαδικασίες σας με αρκετή λεπτομέρεια ώστε να μπορούν να αναπαραχθούν από κάποιον άλλο.

    Αυτή η ερώτηση είναι εμπνευσμένο από ένα παρόμοιο έργο από τον Justin Tenuto, ένας επιστήμονας δεδομένων στην εταιρεία crowdsourcing CrowdFlower , δείτε το "Time Magazine θέλει πραγματικά Dudes" .

  4. [ πολύ δύσκολο , απαιτεί την κωδικοποίηση , συλλογή δεδομένων ] Με βάση την παραπάνω ερώτηση, τώρα να διενεργήσει την ανάλυση για όλες τις οκτώ περιφέρειες.

    1. Ποιες διαφορές βρήκατε μεταξύ των περιφερειών;
    2. Πόσο επιπλέον χρόνο και χρήματα πήρε για να αναβαθμίσουν-up ανάλυσή σας σε όλα τα οκτώ από τις περιφέρειες;
    3. Φανταστείτε ότι ο Economist έχει 100 διαφορετικά εξώφυλλα κάθε εβδομάδα. Εκτιμηθεί πόσο πρόσθετο χρόνο και χρήματα θα πάρει για να αναβαθμίσουν-up ανάλυσή σας και 100 εξώφυλλα εβδομάδα.
  5. [ σκληρά , απαιτεί την κωδικοποίηση ] [Kaggle] (https://www.kaggle.com/) είναι μια ιστοσελίδα που φιλοξενεί έργα ανοικτής πρόσκλησης. Συμμετάσχουν σε ένα από αυτά τα έργα.

  6. [ μέσον ] Κοιτάξτε μέσα από ένα πρόσφατο τεύχος του περιοδικού στον τομέα σας. Υπάρχουν έγγραφα που θα μπορούσαν να έχουν αναδιατυπωθεί ως έργα ανοικτή πρόσκληση εκεί; Γιατί ή γιατί όχι?

  7. [ εύκολος ] Purdam (2014) περιγράφεται μια κατανεμημένη συλλογή δεδομένων για επαιτεία στο Λονδίνο. Συνοψίζουν τα δυνατά και αδύνατα σημεία αυτής της έρευνας σχεδιασμού.

  8. [ μέσον ] Πλεονασμού είναι ένας σημαντικός τρόπος για την αξιολόγηση της ποιότητας της κατανεμημένης συλλογής δεδομένων. Windt and Humphreys (2016) την ανάπτυξη και δοκιμή ενός συστήματος για τη συλλογή αναφορών των γεγονότων των συγκρούσεων από τους ανθρώπους στο Ανατολικό Κονγκό. Διαβάστε το χαρτί.

    1. Πώς το σχεδιασμό τους διασφαλίζουν απολύσεων;
    2. Προσφέρουν διάφορες προσεγγίσεις για την επικύρωση των δεδομένων που συλλέγονται από το έργο τους. Συνοψίσει τους. Ποια ήταν η πιο πειστική για εσάς;
    3. Προτείνει ένα νέο τρόπο που θα μπορούσε να επικυρωθούν τα στοιχεία. Προτάσεις πρέπει να προσπαθήσουν να αυξήσουν την εμπιστοσύνη που θα έχουν στα δεδομένα κατά τρόπο που να είναι οικονομικά αποδοτική και ηθικά.
  9. [ μέσον ] Karim Lakhani και οι συνεργάτες του (2013) δημιούργησε μια ανοικτή πρόσκληση για την επιδίωξη νέων αλγορίθμων για την επίλυση ενός προβλήματος στην υπολογιστική βιολογία. Έλαβαν περισσότερα από 600 αιτήματα που περιέχει 89 νέες υπολογιστικές προσεγγίσεις. Από τις παρατηρήσεις, που έλαβαν 30 που ξεπέρασαν τις επιδόσεις των ΗΠΑ Εθνικών Ινστιτούτων MegaBLAST Υγείας, καθώς και η καλύτερη υποβολή επιτευχθεί τόσο μεγαλύτερη ακρίβεια και ταχύτητα (1.000 φορές πιο γρήγορα).

    1. Διαβάστε το χαρτί τους, και στη συνέχεια να προτείνει ένα κοινωνικό πρόβλημα έρευνα που θα μπορούσε να χρησιμοποιήσει το ίδιο είδος ανοιχτού διαγωνισμού. Ειδικότερα, αυτό το είδος του ανοικτού διαγωνισμού εστιάζεται για την επιτάχυνση και τη βελτίωση της απόδοσης ενός υπάρχοντος αλγορίθμου. Εάν δεν μπορείτε να σκεφτείτε πρόβλημα όπως αυτό στον τομέα σας, προσπαθήστε να εξηγήσετε γιατί όχι.
  10. [ μέσον ] Πολλά από τα έργα του ανθρώπου υπολογισμού βασίζονται σε συμμετέχοντες από Amazon Mechanical Turk. Εγγραφείτε για να γίνει ένας εργαζόμενος στο Amazon Mechanical Turk. Περάστε ένα ώρες που εργάζονται εκεί. Πώς επηρεάζει αυτή τις σκέψεις σας σχετικά με το σχεδιασμό, την ποιότητα και την ηθική των έργων του ανθρώπου compuation;