Activités

Clé:

  • degré de difficulté: facile facile , moyen moyen , difficile difficile , très dur très dur
  • exige des mathématiques ( exige des mathématiques )
  • exige le codage ( exige le codage )
  • collecte de données ( collecte de données )
  • mes favoris ( mon préféré )
  1. [ difficile , exige des mathématiques ] Dans le chapitre, je suis très positif au sujet de post-stratification. Cependant, il n'améliore pas toujours la qualité des estimations. Construire une situation où peut post-stratification peut diminuer la qualité des estimations. (Pour un indice, voir Thomsen (1973) ).

  2. [ difficile , collecte de données , exige le codage ] Concevoir et mener une enquête non probabiliste sur Amazon MTurk poser des questions sur la possession d'armes ( «Avez-vous, ou est-ce que quelqu'un dans votre ménage, posséder une arme à feu, fusil ou pistolet? Est-ce que vous ou quelqu'un d'autre dans votre ménage?») Et les attitudes envers le contrôle des armes à feu ( «Que pensez-vous est plus important pour protéger le droit des Américains à posséder des armes, ou pour contrôler la possession d'armes?»).

    1. Quelle est la durée de votre enquête prend-il? Combien ça coûte? Comment les données démographiques de votre échantillon comparent les données démographiques de la population des États-Unis?
    2. Quelle est l'estimation brute de la propriété des armes à feu en utilisant votre échantillon?
    3. Correct pour la non-représentativité de votre échantillon à l'aide post-stratification ou une autre technique. Maintenant, quelle est l'estimation de la possession d'armes?
    4. Comment vos estimations comparent à la dernière estimation du Pew Research Center? Que pensez-vous expliquer les différences, s'il y a un?
    5. Répétez l'exercice 2-5 pour les attitudes envers le contrôle des armes à feu. Comment vos conclusions diffèrent-ils?
  3. [ très dur , collecte de données , exige le codage ] Goel et ses collègues (2016) ont administré un sondage sur le non probabiliste composé de 49 questions à choix multiples attitudes tirées de l'Enquête sociale générale (ESG) et sélectionnez enquêtes par le Pew Research Center sur Amazon MTurk. Ils ajustent ensuite pour la non-représentativité des données à l'aide basée sur un modèle post-stratification (M. P), et de comparer les estimations ajustées avec celles estimées à l'aide des enquêtes ESG / Pew probabilistes. Effectuer la même enquête sur MTurk et essayer de reproduire la figure 2a et la figure 2b en comparant vos estimations ajustées avec les estimations des séries les plus récentes de l'ESG / Pew (Voir tableau annexe A2 pour la liste des 49 questions).

    1. Comparer et contraster vos résultats aux résultats de Pew et GSS.
    2. Comparer et contraster vos résultats aux résultats de l'enquête MTurk dans Goel, Obeng, and Rothschild (2016) .
  4. [ moyen , collecte de données , exige le codage ] De nombreuses études utilisent des mesures de données sur les activités de téléphonie mobile d'auto-évaluation. Ceci est un paramètre intéressant où les chercheurs peuvent comparer les comportements auto-rapportés avec le comportement consignées (voir par exemple, Boase and Ling (2013) ). Deux comportements communs à poser au sujet sont appels et SMS, et deux cadres de temps commun sont "hier" et "la semaine dernière."

    1. Avant de recueillir des données, qui de l'auto-évaluation des mesures pensez-vous est plus précis? Pourquoi?
    2. Recruter 5 de vos amis pour être dans votre enquête. S'il vous plaît résumer brièvement comment ces 5 amis ont été échantillonnés. cette procédure d'échantillonnage peut induire des biais spécifiques dans vos estimations?
    3. S'il vous plaît les micro-sondage suivant demander:
    • "Combien de fois avez-vous utilisé téléphone portable pour appeler d'autres hier?"
    • "Combien de messages texte avez-vous envoyé hier?"
    • "Combien de fois avez-vous utilisé votre téléphone portable pour appeler d'autres au cours des sept derniers jours?"
    • "Combien de fois avez-vous utilisé votre téléphone mobile pour envoyer ou recevoir des messages texte / SMS au cours des sept derniers jours?" Une fois l'enquête terminée, demander de vérifier leurs données d'utilisation comme connecté par leur téléphone ou du prestataire de services.
    1. Comment autodéclaration utilisation comparer pour enregistrer les données? Ce qui est le plus précis, ce qui est moins précis?
    2. Maintenant combiner les données que vous avez recueillies avec les données provenant d'autres personnes dans votre classe (si vous faites cette activité pour une classe). Avec ce plus grand ensemble de données, répétez la partie (d).
  5. [ moyen , collecte de données ] Schuman et Presser (1996) font valoir que les ordonnances de question seraient d' importance pour les deux types de relations entre les questions: questions partiel partie où deux questions sont au même niveau de spécificité (par exemple notation de deux candidats à la présidence); et les questions partiel entières où une question générale suit une question plus précise (par exemple, demandent «Comment êtes-vous satisfait de votre travail?» suivi de «Comment êtes-vous satisfait de votre vie?»).

    Ils caractérisent en outre deux types d'effets question d'ordre: les effets de cohérence se produisent lorsque les réponses à une question plus tard sont rapprochés (qu'ils ne le seraient autrement) à ceux donnés à une question précédente; contraster les effets se produisent quand il y a de plus grandes différences entre les réponses à deux questions.

    1. Créer une paire de questions partiel partie que vous pensez avoir un effet question d'ordre, une paire de questions de partie à tout ce que vous pensez avoir un effet important de l'ordre, et une autre paire de questions dont l'ordre que vous pensez pas d'importance. Exécuter une expérience d'enquête sur MTurk pour tester vos questions.
    2. Quelle a été l'effet partiel partie que vous étiez en mesure de créer? Était-ce un effet de cohérence ou de contraste?
    3. Quelle a été l'effet de partie-tout vous étiez en mesure de créer? Était-ce un effet de cohérence ou de contraste?
    4. Y avait-il un effet de l'ordre de la question dans votre paire où vous ne pensiez pas que l'ordre serait question?
  6. [ moyen , collecte de données ] Construire sur les travaux de Schuman et Presser, Moore (2002) décrit une dimension distincte de l' effet question d'ordre: additif et soustractif. Bien que le contraste et la cohérence des effets sont produits à la suite des évaluations des deux éléments des répondants par rapport à l'autre, les effets additifs et soustractifs sont produits lorsque les répondants sont rendus plus sensibles au cadre plus large dans lequel les questions sont posées. Lire Moore (2002) , puis de concevoir et exécuter une expérience d'enquête sur MTurk pour démontrer additives ou soustractives effets.

  7. [ difficile , collecte de données ] Christopher Antoun et ses collègues (2015) ont mené une étude comparant les échantillons de commodité obtenus à partir de quatre sources de recrutement en ligne différents: MTurk, Craigslist, Google AdWords et Facebook. Concevoir une enquête simple et recruter des participants à travers au moins deux sources de recrutement en ligne différents (ils peuvent être des sources différentes des quatre sources utilisées dans Antoun et al. (2015) ).

    1. Comparez le coût par recrue, en termes d'argent et de temps, entre les différentes sources.
    2. Comparer la composition des échantillons obtenus à partir de sources différentes.
    3. Comparer la qualité des données entre les échantillons. Pour des idées sur la façon de mesurer la qualité des données des répondants, voir Schober et al. (2015) .
    4. Quelle est votre source préférée? Pourquoi?
  8. [ moyen ] YouGov, une firme de recherche de marché basée sur Internet, a mené des sondages en ligne d'un groupe d'environ 800.000 personnes interrogées au Royaume-Uni et utilisé MP pour prédire le résultat du référendum de l'UE (par exemple, Brexit) où les électeurs britanniques votent soit pour rester ou quitter l'Union européenne.

    Une description détaillée du modèle statistique de YouGov est ici (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Grosso modo, YouGov partitionne électeurs en types basés sur 2015 élections générales choix de vote, l'âge, les qualifications, le sexe, la date de l'interview, ainsi que la circonscription où ils vivent. D'abord, ils ont utilisé les données recueillies auprès des panélistes YouGov pour estimer, parmi ceux qui votent, la proportion de personnes de chaque type des électeurs qui ont l'intention de voter congé. Ils estiment le taux de participation de chaque type d'électeur en utilisant l'étude de 2015 British Election (BES) post-électorale face-à-face enquête, qui a validé la participation des listes électorales. Enfin, ils estiment combien de personnes il y a de chaque type d'électeurs dans l'électorat basée sur le dernier recensement et l'Enquête démographique annuelle (avec des informations d'addition des BES, des données d'enquête YouGov de partout dans l'élection générale, et de l'information sur la façon dont beaucoup de gens ont voté pour chaque parti dans chaque circonscription).

    Trois jours avant le vote, YouGov a montré une avance de deux points pour le congé. A la veille du vote, le sondage a montré trop proche de l'appel (49-51 Remain). La dernière étude sur le jour prédit 48/52 en faveur de rester (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). En fait, cette estimation a raté le résultat final (52-48 Congé) par quatre points de pourcentage.

    1. Utilisez le cadre d'erreur totale d'enquête abordés dans ce chapitre pour évaluer ce qui aurait pu mal.
    2. La réponse de YouGov après l'élection (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) a expliqué: «Cela semble en grande partie en raison de la participation - quelque chose qui nous l'avons dit tout au long serait cruciale pour le résultat d'une telle course finement équilibrée. Notre modèle de participation a été fondée, en partie, si les répondants avaient voté à la dernière élection générale et un niveau de participation supérieur à celui des élections générales bouleverser le modèle, en particulier dans le Nord. "Est-ce que cela change votre réponse à la partie (a)?
  9. [ moyen , exige le codage ] Ecrire une simulation pour illustrer chacune des erreurs de représentation dans la figure 3.1.

    1. Créer une situation où ces erreurs annulent effectivement out.
    2. Créer une situation où les erreurs aggravent les uns des autres.
  10. [ très dur , exige le codage ] La recherche de Blumenstock et ses collègues (2015) consiste à construire un modèle d'apprentissage de la machine qui pourrait utiliser les données de trace numérique pour prédire les réponses au sondage. Maintenant, vous allez essayer la même chose avec un ensemble de données différent. Kosinski, Stillwell, and Graepel (2013) a révélé que Facebook aime peut prédire les traits et les attributs individuels. Étonnamment, ces prévisions peuvent être encore plus précis que ceux des amis et des collègues (Youyou, Kosinski, and Stillwell 2015) .

    1. Lire Kosinski, Stillwell, and Graepel (2013) , et de reproduire la figure 2. Leurs données sont disponibles ici: http://mypersonality.org/
    2. Maintenant, se répliquent la figure 3.
    3. Enfin, essayez de leur modèle sur vos propres données Facebook: http://applymagicsauce.com/. Comment ça marche bien pour vous?
  11. [ moyen ] Toole et al. (2015) détail l' utilisation d'appel des enregistrements (CDR) à partir de téléphones mobiles pour prédire les tendances globales sur le chômage.

    1. Comparer et la conception de Toole et al. (2015) avec Blumenstock, Cadamuro, and On (2015) .
    2. Pensez-vous que les CDR devraient remplacer les enquêtes traditionnelles, les compléter ou non être utilisé à tous pour les décideurs du gouvernement pour suivre le chômage? Pourquoi?
    3. Quelle preuve vous convaincrait que CDRs peuvent remplacer complètement les mesures traditionnelles du taux de chômage?