3.1 Présentation

Les chercheurs qui étudient les dauphins ne peuvent pas leur poser de questions et sont donc obligés d'essayer d'en apprendre davantage sur les dauphins en observant leur comportement. D'autre part, les chercheurs qui étudient les humains ont plus de facilité: leurs répondants peuvent parler. Parler aux gens était une partie importante de la recherche sociale dans le passé, et je m'attends à ce que ce soit aussi le cas à l'avenir.

Dans la recherche sociale, parler aux gens prend généralement deux formes: des enquêtes et des entretiens approfondis. Grosso modo, la recherche utilisant des enquêtes implique le recrutement systématique d'un grand nombre de participants, des questionnaires très structurés et l'utilisation de méthodes statistiques pour généraliser les participants à une plus grande population. D'un autre côté, la recherche utilisant des entretiens approfondis implique généralement un petit nombre de participants, des conversations semi-structurées et débouche sur une description riche et qualitative des participants. Les sondages et les entrevues approfondies sont deux approches puissantes, mais les enquêtes sont beaucoup plus touchées par le passage de l'ère analogique à l'ère numérique. Par conséquent, dans ce chapitre, je vais me concentrer sur la recherche par sondage.

Comme je le montrerai dans ce chapitre, l'ère numérique crée de nombreuses opportunités pour les chercheurs de recueillir des données plus rapidement et à moindre coût, de poser différents types de questions et d'augmenter la valeur des données d'enquête avec des sources de données volumineuses. Cependant, l'idée que la recherche par sondage peut être transformée par un changement technologique n'est pas nouvelle. Vers 1970, un changement similaire se produisait grâce à une technologie de communication différente: le téléphone. Heureusement, comprendre comment le téléphone a changé la recherche par sondage peut nous aider à imaginer comment l'ère numérique va changer la recherche par sondage.

La recherche par sondage, telle que nous la connaissons aujourd'hui, a commencé dans les années 1930. Au cours de la première phase de la recherche par sondage, les chercheurs échantillonnaient au hasard des régions géographiques (comme les pâtés de maisons) et se rendaient ensuite dans ces régions afin d'avoir des conversations face à face avec des ménages échantillonnés au hasard. Ensuite, un développement technologique - la diffusion généralisée des téléphones fixes dans les pays riches - a finalement mené à la deuxième ère de la recherche par sondage. Cette deuxième ère différait à la fois dans la manière dont les gens étaient échantillonnés et dans la façon dont les conversations avaient lieu. À la deuxième époque, plutôt que d'échantillonner les ménages dans des zones géographiques, les chercheurs ont échantillonné au hasard des numéros de téléphone dans une procédure appelée numérotation aléatoire . Et plutôt que de voyager pour parler aux gens face à face, les chercheurs les ont plutôt appelés au téléphone. Ceux-ci peuvent sembler être de petits changements logistiques, mais ils ont rendu la recherche par sondage plus rapide, moins coûteuse et plus flexible. En plus d'être habilitants, ces changements ont également été controversés parce que de nombreux chercheurs craignaient que ces nouvelles procédures d'échantillonnage et d'entrevue puissent introduire une variété de biais. Mais finalement, après beaucoup de travail, les chercheurs ont trouvé comment collecter des données de manière fiable en utilisant la numérotation aléatoire et les interviews téléphoniques. Ainsi, en cherchant comment exploiter avec succès l'infrastructure technologique de la société, les chercheurs ont pu moderniser la façon dont ils ont mené leurs enquêtes.

Maintenant, un autre développement technologique - l'ère numérique - nous conduira éventuellement à une troisième ère de recherche par sondage. Cette transition est en partie motivée par la décroissance graduelle des approches de la deuxième ère (BD Meyer, Mok, and Sullivan 2015) . Par exemple, pour diverses raisons technologiques et sociales, les taux de non-réponse - c'est-à-dire la proportion de personnes échantillonnées qui ne participent pas aux enquêtes - augmentent depuis de nombreuses années (National Research Council 2013) . Ces tendances à long terme signifient que le taux de non-réponse peut maintenant dépasser 90% dans les enquêtes téléphoniques standard (Kohut et al. 2012) .

D'un autre côté, la transition vers une troisième ère est également motivée en partie par de nouvelles opportunités passionnantes, dont certaines seront décrites dans ce chapitre. Bien que les choses ne soient pas encore réglées, je m'attends à ce que la troisième ère de la recherche par sondage soit caractérisée par l'échantillonnage non probabiliste, les entrevues informatisées et le couplage des enquêtes aux grandes sources de données (tableau 3.1).

Tableau 3.1: Trois ères de la recherche par sondage fondée sur les Groves (2011)
Échantillonnage Interviewer Environnement de données
Première époque Échantillonnage probabiliste de zone Face à face Enquêtes autonomes
Deuxième époque Échantillonnage aléatoire de numérotation aléatoire (RDD) Téléphone Enquêtes autonomes
Troisième ère Échantillonnage non probabiliste Administré par ordinateur Enquêtes liées aux grandes sources de données

La transition entre la deuxième et la troisième ère de la recherche par sondage n'a pas été complètement lisse, et il y a eu des débats féroces sur la façon dont les chercheurs devraient procéder. En revenant sur la transition entre la première et la deuxième époque, je pense qu'il y a une idée clé pour nous maintenant: le début n'est pas la fin . C'est-à-dire qu'au départ beaucoup de méthodes téléphoniques de la deuxième ère étaient ad hoc et ne fonctionnaient pas très bien. Mais, grâce à un travail acharné, les chercheurs ont résolu ces problèmes. Par exemple, les chercheurs effectuaient des numérotations aléatoires depuis de nombreuses années avant que Warren Mitofsky et Joseph Waksberg ne développent une méthode d'échantillonnage par numérotation aléatoire ayant de bonnes propriétés pratiques et théoriques (Waksberg 1978; ??? ) . Ainsi, nous ne devons pas confondre l'état actuel des approches de la troisième ère avec leurs résultats finaux.

L'histoire de la recherche par sondage montre que le domaine évolue, entraîné par les changements technologiques et sociétaux. Il n'y a aucun moyen d'arrêter cette évolution. Au contraire, nous devrions l'embrasser, tout en continuant à tirer la sagesse des époques antérieures, et c'est l'approche que je vais prendre dans ce chapitre. Premièrement, je soutiendrai que les grandes sources de données ne remplaceront pas les enquêtes et que l'abondance des sources de données volumineuses augmente (et non diminue) la valeur des enquêtes (section 3.2). Compte tenu de cette motivation, je résumerai le cadre d'erreur total de l'enquête (section 3.3) qui a été développé durant les deux premières époques de la recherche par sondage. Ce cadre nous permet de comprendre de nouvelles approches de la représentation - en particulier des échantillons non probabilistes (section 3.4) - et de nouvelles approches de mesure - en particulier de nouvelles façons de poser des questions aux répondants (section 3.5). Enfin, je vais décrire deux modèles de recherche pour lier les données d'enquête aux grandes sources de données (section 3.6).