Δραστηριότητες

  • βαθμός δυσκολίας: εύκολη εύκολος , Μεσαίο Μεσαίο , σκληρά σκληρά , πολύ δύσκολο πολύ δύσκολο
  • απαιτεί μαθηματικά ( απαιτεί μαθηματικά ),
  • απαιτεί κωδικοποίηση ( απαιτεί κωδικοποίηση ),
  • συλλογή δεδομένων ( συλλογή δεδομένων ),
  • τα αγαπημένα μου ( το αγαπημένο μου ),
  1. [ πολύ δύσκολο , απαιτεί κωδικοποίηση , συλλογή δεδομένων , το αγαπημένο μου ] Ένας από τους πιο συναρπαστικούς ισχυρισμούς της έρευνας του Benoit και των συναδέλφων (2016) σχετικά με την κωδικοποίηση των πολιτικών μανιφέστων είναι ότι τα αποτελέσματα είναι αναπαραγώγιμα. Merz, Regel, and Lewandowski (2016) παρέχουν πρόσβαση στο Manifesto Corpus. Προσπαθήστε να αναπαράγετε το σχήμα 2 από τους Benoit et al. (2016) χρησιμοποιώντας εργαζόμενους από την Amazon Mechanical Turk. Πόσο παρόμοια ήταν τα αποτελέσματά σας;

  2. [ Μεσαίο ] Στο σχέδιο InfluenzaNet, μια ομάδα εθελοντών ατόμων αναφέρει τη συχνότητα, τη συχνότητα και τη συμπεριφορά που αναζητούν την υγεία σχετικά με την ασθένεια που μοιάζει με γρίπη (Tilston et al. 2010; Noort et al. 2015) .

    1. Συγκρίνετε και αντιπαραβάλλετε το σχεδιασμό, το κόστος και τα πιθανά σφάλματα στο InfluenzaNet, το Google Flu Trends και τα παραδοσιακά συστήματα παρακολούθησης της γρίπης.
    2. Εξετάστε ένα αναστατωμένο χρόνο, όπως ένα ξέσπασμα μιας νέας μορφής γρίπης. Περιγράψτε τα πιθανά σφάλματα σε κάθε σύστημα.
  3. [ σκληρά , απαιτεί κωδικοποίηση , συλλογή δεδομένων ] Το Economist είναι ένα εβδομαδιαίο περιοδικό ειδήσεων. Δημιουργήστε ένα ανθρώπινο έργο υπολογισμού για να δείτε αν η αναλογία των γυναικών με τους άνδρες στο κάλυμμα έχει αλλάξει με την πάροδο του χρόνου.

    1. Το περιοδικό μπορεί να έχει διαφορετικές καλύψεις σε οκτώ διαφορετικές περιοχές (Αφρική, Ασία, Ειρηνικός, Ευρώπη, Ευρωπαϊκή Ένωση, Λατινική Αμερική, Μέση Ανατολή, Βόρεια Αμερική και Ηνωμένο Βασίλειο) και όλες μπορούν να μεταφορτωθούν από την ιστοσελίδα του περιοδικού. Επιλέξτε μία από αυτές τις περιοχές και εκτελέστε την ανάλυση. Βεβαιωθείτε ότι περιγράφετε τις διαδικασίες σας με αρκετές λεπτομέρειες ώστε να μπορούν να αναπαραχθούν από κάποιον άλλο.

    Αυτή η ερώτηση ήταν εμπνευσμένη από ένα παρόμοιο έργο του Justin Tenuto, επιστήμονα δεδομένων στην εταιρεία crowdourcing CrowdFlower: δείτε το "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data) .

  4. [ πολύ δύσκολο , απαιτεί κωδικοποίηση , συλλογή δεδομένων ] Με βάση την προηγούμενη ερώτηση, πραγματοποιήστε τώρα την ανάλυση και για τις οκτώ περιοχές.

    1. Ποιες διαφορές διαπιστώσατε στις περιοχές;
    2. Πόσο πρόσθετος χρόνος και χρήματα χρειάστηκε για να αυξήσετε την ανάλυσή σας και στις οκτώ περιφέρειες;
    3. Φανταστείτε ότι ο Economist έχει 100 διαφορετικά καλύμματα κάθε εβδομάδα. Εκτιμήστε πόσο επιπλέον χρόνο και χρήματα θα χρειαστείτε για να αυξήσετε την ανάλυσή σας σε 100 καλύψεις την εβδομάδα.
  5. [ σκληρά , απαιτεί κωδικοποίηση ] Υπάρχουν αρκετοί ιστότοποι που φιλοξενούν ανοικτά προγράμματα κλήσεων, όπως το Kaggle. Συμμετέχετε σε ένα από αυτά τα έργα και περιγράψτε τι μαθαίνετε σχετικά με αυτό το συγκεκριμένο έργο και για ανοιχτές συνομιλίες εν γένει.

  6. [ Μεσαίο ] Ανατρέξτε σε ένα πρόσφατο τεύχος ενός περιοδικού στον τομέα σας. Υπάρχουν έγγραφα που θα μπορούσαν να αναδιατυπωθούν ως ανοιχτά προγράμματα κλήσεων; Γιατί ή γιατί όχι?

  7. [ εύκολος ] Ο Purdam (2014) περιγράφει μια κατανεμημένη συλλογή δεδομένων σχετικά με την επαιτεία στο Λονδίνο. Συγκεντρώστε τα πλεονεκτήματα και τις αδυναμίες αυτού του σχεδιασμού της έρευνας.

  8. [ Μεσαίο ] Η απόλυση είναι ένας σημαντικός τρόπος αξιολόγησης της ποιότητας της συλλογής κατανεμημένων δεδομένων. Windt and Humphreys (2016) ανέπτυξαν και δοκιμάστηκαν ένα σύστημα συλλογής αναφορών συμβάντων συγκρούσεων από ανθρώπους στο ανατολικό Κονγκό. Διάβασε το χαρτί.

    1. Πώς ο σχεδιασμός τους εξασφαλίζει πλεονασμό;
    2. Έδωσαν διάφορες προσεγγίσεις για την επικύρωση των δεδομένων που συλλέχθηκαν από το έργο τους. Συνοψίστε τα. Ποιο ήταν το πιο πειστικό για εσάς;
    3. Προτείνετε έναν νέο τρόπο με τον οποίο θα μπορούσαν να επικυρωθούν τα δεδομένα. Οι προτάσεις πρέπει να προσπαθήσουν να αυξήσουν την εμπιστοσύνη που θα έχετε στα δεδομένα με τρόπο που να είναι οικονομικά αποδοτικός και ηθικός.
  9. [ Μεσαίο ] Ο Karim Lakhani και οι συνεργάτες του (2013) δημιούργησαν μια ανοιχτή πρόσκληση για να ζητήσουν νέους αλγορίθμους για την επίλυση ενός προβλήματος στην υπολογιστική βιολογία. Έλαβαν περισσότερες από 600 υποβολές που περιείχαν 89 νέες υπολογιστικές προσεγγίσεις. Από τις υποβολές, 30 υπερέβησαν την απόδοση των MegaBLAST των ΗΠΑ των Εθνικών Ινστιτούτων Υγείας και η καλύτερη υποβολή πέτυχε τόσο μεγαλύτερη ακρίβεια όσο και ταχύτητα (1.000 φορές ταχύτερη).

    1. Διαβάστε το έγγραφό τους και στη συνέχεια προτείνετε ένα κοινωνικό ερευνητικό πρόβλημα που θα μπορούσε να χρησιμοποιήσει το ίδιο είδος ανοικτού διαγωνισμού. Συγκεκριμένα, αυτό το είδος ανοικτού διαγωνισμού επικεντρώνεται στην επιτάχυνση και τη βελτίωση της απόδοσης ενός υπάρχοντος αλγορίθμου. Εάν δεν μπορείτε να σκεφτείτε ένα πρόβλημα όπως αυτό στον τομέα σας, προσπαθήστε να εξηγήσετε γιατί όχι.
  10. [ Μεσαίο , το αγαπημένο μου ] Πολλά ανθρώπινα έργα υπολογισμού βασίζονται σε συμμετέχοντες από την Amazon Mechanical Turk. Εγγραφείτε για να γίνετε εργάτης στο Amazon Mechanical Turk. Περάστε μια ώρα εργασίας εκεί. Πώς αυτό επηρεάζει τις σκέψεις σας για το σχεδιασμό, την ποιότητα και την ηθική των ανθρώπινων έργων υπολογισμού;