Les sondages

De Comment mesure-t-on ?
Aller à la navigation Aller à la recherche


En bref: Q'est un sondage : il s'agit d'une méthode statistique permettant, à partir d'un échantillon, de déterminer l'opinion d'une population. Il existe différentes manières d’effectuer des sondages (méthode aléatoire, quotas, questionnaire), certaines sont plus efficaces que d’autres. Néanmoins, chacune a ses avantages et ses inconvénients, et c’est ce que nous allons essayer de décortiquer par la suite dans cet article.

Qu'est-ce qu'un sondage

Les sondages jouent un rôle important dans la collecte de données et la compréhension des opinions publiques sur une grande variété de sujets, allant des préférences politiques aux habitudes de consommation en passant par les loisirs. Afin d’obtenir des résultats fiables et représentatifs, il est essentiel d’utiliser des méthodes de sondages rigoureuses.

Mais avant tout, un sondage c’est quoi. Il s’agit tout simplement d’une série de questions que les intéressés posent à la populations afin d’avoir un ordre d’idée de la pensée générale sur un sujet précis ou une question : que pensez-vous ? Quelle est votre position sur ... ?

Afin d'obtenir les meilleurs résultats possible, le traitement des données est facilité par le fait que chacune des réponses (oui, non, souvent, quelques fois, …) est attribué à un code. Mais il ne s’agit là que de la méthode numérique (souvent envoyé par mail), il est aussi possible de sonder l’échantillon en présentiel par le biais d’enquêteurs et d’enquêtrices.

Méthodes de sondage

Il existe trois moyens bien distincts d’effectuer un sondage : sonder un échantillon pris aléatoirement dans une population mère, choisir l'échantillon en fonction de certaines données, poser un questionnaire à un échantillon qui est déjà triées fonction des informations que l'on désir obtenir. La méthode la moins soumise aux erreurs est la seconde, car elle supprime la source d’incertitude due au choix de l’échantillon. Néanmoins, il ne faut pas négliger la dernière méthode qui supprime directement l'étape du choix de l'échantillon.

Méthode aléatoire

Cette méthode est très peu utilisée par les instituts de sondage en France en raison de son taux de fiabilité moins élevé que les autres méthodes à grande échelle. Le principe est simple : chaque individu, quelque soit son sexe, son âge ou encore sa religion, a une chance égale de figurer dans l’échantillon. On peut effectuer ce tirage avec ou sans remise (une même personne peut être interrogée plusieurs fois). En cas de refus, une personne est remplacée par une autre de la même manière. Si l’échantillon est suffisamment grand, on peut espérer que ce dernier soit "représentatif" de la population. Cependant, il peut y avoir des biais dans la représentation de l'échantillon;lon. Par exemple, un échantillon tiré au hasard dans l’annuaire ne prend pas en compte le fait que très peu de jeunes ont un téléphone fixe ou encore que les personnes âgées ont peu de chances de décrocher si le numéro leur est inconnu. Ainsi, cette technique fiable à grande échelle. Cependant, à une échelle plus locale (typiquement dans les entreprises), la méthode est souvent utilisée car plus précise.

Méthode des quotas

Contrairement à la méthode aléatoire où l’échantillon était tiré complètement au hasard, la méthode des quotas essaye de reproduire, avec les individus qui répondent, un échantillon qui reproduit à peu près fidèlement la population mère. Elle se fonde sur plusieurs critères : sexe, âge, profession, région… . En pratique, la méthode va essayer de garder, dans l’échantillon, les mêmes proportions que dans la population mère. Par exemple, si il y a 45% de femmes et 55% d’hommes dans la population mère, l’échantillon devra garder ces proportions. Ainsi, on pourra supposer qu'il y a une certaine corrélation dans les résultats entre l’échantillon et la population mère.

Questionnaire

Le principe de la méthode du questionnaire est simple : les intéressés vont poser un questionnaire à un échantillon qui est déjà trié selon le type d'information qu'ils désirent obtenir. La différence avec les deux autres méthodes est qu'il s'agit là d'un échantillon qui est sélectionné automatiquement. En effet, le questionnaire va être mis à disposition d'un certain groupe de personnes qui choisissent ou non d'y répondre. C'est par exemple le type de sondage présent sur des sites internet. Cependant, les erreurs (aléatoires et systématiques) dues à ce type de sondage ne sont pas négligeable. En effet, elle représente en moyenne 50% de la variance observée dans les réponses. Il est donc nécessaire de prendre en compte ces erreurs lors du traitement des données recueillies.

La fiabilité des sondages

Erreur sociologique

Pour augmenter la fiabilité des sondages, il est important de réduire la marge d’erreur. Pour cela, la taille de la population à interroger doit respecter un certain volume. De plus, lorsqu’un sondage est mis en ligne, il doit aussi faire apparaitre diverses informations : institut de sondage, identité du client, taille de l’échantillon, date du questionnaire et marge d’erreur. Néanmoins, même si l’institut de sondage est reconnu, il peut se tromper. Par exemple, lors des élections législatives de 2017, un taux de participation de 49% avait été enregistré contre 60% prédit par les sondages, soit une marge d’erreur de 11 points. Ainsi, les données du sondages ont faussé la représentation de la population en communiquant des résultats non représentatifs. De plus, même si la méthode utilisée est très adaptée, il se peut que l’échantillon ne soit quand même pas représentatif de la population mère. Dans ce cas un coefficient de redressement est utilisé afin de limiter la marge d’erreur et pour se rapprocher au plus de la population mère. Mais encore, le fait qu’une partie non négligeable des sondés ne souhaitent tout simplement pas répondre au sondage fausse encore plus les résultats car la population mère est encore moins représentée. Certes on pourra toujours utiliser la méthode du coefficient de redressement mais ce ne sera jamais aussi fiable que de vrais personnes qui expriment leurs pensées. Pour finir, d’après le sociologue français Pierre Bourdieu, l’opinion publique n’existe pas. Pour justifier ses propos, il développe plusieurs arguments tels que l’omission de certaines questions, le biais dû au choix de l’échantillon ou encore l’exclusion des non-réponses afin de revaloriser le taux d’autres réponses. Tout cela peut évidemment être discutable si on regarde aujourd’hui la place qu’occupe les sondages : il en existe dans de nombreux domaines allant des opinions politiques aux habitudes de consommation de la population.

Erreur mathématique

Avant d'être un moyen de connaitre l'opinion de la population, un sondage est avant tout une étude statistique. Ce qui signifie que des mathématique se cachent derrière. En effet, un des objectifs, avant de sonder un échantillon, est de construire cette échantillon afin qu'il représente fidèlement la population mère, quel qu'elle soit. Ainsi, deux cas se distingue : si l'échantillon est d'une taille suffisamment conséquente ou au contraire si elle est trop faible.

Commençons par le premier cas. Si l'échantillon est suffisamment grand, on pourra supposer par la suite qu'il y a une corrélation entre les résultats recueilli et l'opinion de la population mère. En effet, avec un grand nombre de personne, il sera possible de reproduire tous les cas possible et surtout les particuliers.

Ce qui n'est pas le cas si l'échantillon est d'une taille trop faible. Dans ce cas, les résultats sont redressés à l'aide de coefficient dont la valeur dépend de la taille de l'échantillon. Ainsi, même avec très peu de résultats, il est tout de même possible de remonter à l'opinion de la population mère. Cependant, contrairement au premier cas, il n'est pas certain que les cas particuliers soit reproduits lors du rehaussement des résultats.

Lorsque les résultats des sondages sont communiqués à la population, ils doivent obligatoirement être accompagné de l'intervalle de confiance à 95%. Il s'agit de l'intervalle dans lequel le résultat a 95% de chance de se trouver. Par exemple, si les résultats de l'institut de sondage X indique que, aux prochaines élections, le candidat Y fera 53%, et bien ce résultats n'a pas trop de sens seul. En effet, sans autres informations, cela signifierai que, peu importe la taille de l'échantillon (53 pour 100 ou 530 000 pour 1 000 000), le résultats sera toujours le même alors que c'est complètement faux. C'est là qu'intervient les intervalles de confiance. L'intervalle est donnée par la formule suivante, n étant la taille de l'échantillon et p le résultat du sondage :

[math]\displaystyle{ \left[p-1.96\sqrt{\frac{p\left(1-p\right)}{n}},p+1.96\sqrt{\frac{p\left(1-p\right)}{n}}\right] }[/math]

En appliquant la formule dans notre exemple, on trouve, en fonction de la taille de l'échantillon :

Intervalles de confiances
n = 100 [math]\displaystyle{ \left[43.2,62.8\right] }[/math]
n = 1000 [math]\displaystyle{ \left[49.9,56.1\right] }[/math]
n = 1000 [math]\displaystyle{ \left[52,54\right] }[/math]

Ainsi, le résultats le plus parlant est l'intervalle de confiance car il nous indique la marge d'erreur là où la valeur donnée par le sondage ne l'indique pas. Alors, on peut voir que si l'échantillon a une taille de 1000 personnes, il y a 95% de chances pour que le candidats Y est entre 49.9% et 56.1% des voix.

Bibliographie

https://fr.wikipedia.org/wiki/Sondage_(statistique)#:~:text=Un%20sondage%20est%20une%20méthode,de%20cette%20population%2C%20appelée%20échantillon
https://fr.wikipedia.org/wiki/Sondage_(sciences_sociales)
https://tpesondages.e-monsite.com/pages/de-la-realisation-des-sondages/les-differentes-techniques/la-methode-aleatoire.html
https://tpesondages.e-monsite.com/pages/de-la-realisation-des-sondages/les-differentes-techniques/la-methode-aleatoire.html
https://fr.surveymonkey.com/learn/survey-best-practices/survey-vs-questionnaire/#:~:text=Qu'est%2Dce%20qu'un%20questionnaire%2C%20quand%20et,posées%20dans%20un%20ordre%20précis
https://www.acrimed.org/IMG/article_PDF/article_a3938.pdf