La confusion entre corrélation et causalité est appelée l'effet cigogne. Son nom vient de la corrélation entre le nombre de nids de cigogne et le nombre de naissances humaines. Ces faits partagent en fait une même cause, les cigognes nichent en milieu rural, où les naissances sont plus importantes.
On parle de causalité quand un événement en implique un autre alors qu'on parle de corrélation quand deux événements varient simultanément. Ainsi, une conséquence est corrélée à sa cause mais deux conséquences seront aussi corrélées. En observant une corrélation entre deux événements il peut donc être difficile de savoir si l'un est la cause de l'autre ou si les deux sont les conséquences d'un même autre événement.
Exemple : La consommation de chocolat par pays est corrélée au nombre de prix Nobel. Le chocolat rendrait-il plus intelligent ? Non, ils partagent une cause commune: les pays les plus développés économiquement investissent d'avantage dans la recherche et les habitants ont plus facilement accès au chocolat.
Commentaires préférés (3)
C’est pas faux
La corrélation confondu avec la causalité est d'ailleurs courante dans les débats, politiques ou non pour argumenter son propos
Certaines corrélations sont également uniquement du au hasard. Le site tylervigen.com/spurious-correlations est d'ailleur parfait pour s'en rendre compte, il regroupe un certains nombre de donnés au fil des ans, pour créer des corrélations entre deux données n'ayant rien a voir (plus les US dépensent pour l'espace, la science et la technologie, plus il y a de suicide par pendaison, étranglement et suffocation). Dans le même style, la religion pastafariste encourage le retour des pirates, leur déclin étant la cause du réchauffement climatique.
Un autre erreur est d'inverser la cause et la conséquence: il y a une forte corrélation entre le vent et la vitesse des pales d'un moulin a vent. Mais c'est bien sur, les moulins a vent tournent pour créer le vent (d'ou leur nom) !
Alors certes, tout ses exemples sont débiles, mais parfois c'est plus subtil que ça, et on tombe dans le panneau. Méfiez vous la prochaine fois que quelqu'un essaye de vous faire croire a quelque chose, simplement parce que les chiffres sembles corréler.
Tous les commentaires (60)
C’est pas faux
La corrélation confondu avec la causalité est d'ailleurs courante dans les débats, politiques ou non pour argumenter son propos
Je suis pas sûr qu'on se couche tous moins bête donc quelques autres exemples issus de Wikipedia :
- Il y a une corrélation entre la pointure et le niveau en mathématiques chez les collégiens. Caché : Le niveau en maths et la pointure augmente avec l'âge (cause).
- Il existe une corrélation entre la vente de crème glacée et le nombre de morts par noyade. Caché : Qui dit glace dit souvent plage et baignade (cause), donc noyade.
On peut en inventer d'autres :
- Il existe une corrélation entre éducation et mort par voiture. Caché : Plus les personnes sont riches (cause), plus elles sont éduqués et peuvent utilser des transports.
La corrélation ne veut pas dire cause -> conséquence donc causalité.
Comment ça le chocolat ne rend pas plus intelligent ? Révisez vos sources !
Certaines corrélations sont également uniquement du au hasard. Le site tylervigen.com/spurious-correlations est d'ailleur parfait pour s'en rendre compte, il regroupe un certains nombre de donnés au fil des ans, pour créer des corrélations entre deux données n'ayant rien a voir (plus les US dépensent pour l'espace, la science et la technologie, plus il y a de suicide par pendaison, étranglement et suffocation). Dans le même style, la religion pastafariste encourage le retour des pirates, leur déclin étant la cause du réchauffement climatique.
Un autre erreur est d'inverser la cause et la conséquence: il y a une forte corrélation entre le vent et la vitesse des pales d'un moulin a vent. Mais c'est bien sur, les moulins a vent tournent pour créer le vent (d'ou leur nom) !
Alors certes, tout ses exemples sont débiles, mais parfois c'est plus subtil que ça, et on tombe dans le panneau. Méfiez vous la prochaine fois que quelqu'un essaye de vous faire croire a quelque chose, simplement parce que les chiffres sembles corréler.
Ajouter à cela quelques sophismes et inversions des causes - conséquences et on se retrouve souvent à débattre avec ou contre des arguments ridicules, comme c'est souvent le cas d'ailleurs.
Maman disait : la vie, c'est comme une boîte de chocolat...
Je savais quelle était la différence entre corrélation et causalité... en lisant l'anecdote je me perd tant l'explication est "fumeuse" ! ;) Restons dans la fumée...
"Causalité". Si je fume, j'augmente mes possibiltés d'avoir un cancer : il y a une relation directe et unique de "cause à effet" entre les deux notions tabagie-cancer... Si j'ai un cancer de la gorge c'est sûrement parce que j'ai fumé.
"Corrélation". On meurt souvent dans un lit d'hôpital ; et si on fume on a de forte chance d'avoir un jour un cancer et d'être soigné dans un hôpital ; mais la relation entre les notions (tabagie-hôpital) n'est ni directe ni unique... Je ne suis pas forcément dans un lit d'hôpital parce que j'ai fumé.
Et le fameux xkcd sur le sujer:
www.explainxkcd.com/wiki/index.php/552:_Correlation
"sujet" (le 'r' est à côté du 't'...)
Cela me fait penser à une anecdote récente sur le même sujet. secouchermoinsbete.fr/75489-le-paradoxe-de-simpson-met-les-statistiques-sens-dessus-dessous
On a 20% de risque de mourir ivre au volant. Ce qui veut dire que l'on a 80% de risque de mourir sobre en voiture. Conclusion hâtive : il vaut mieux conduire ivre au volant pour avoir une probabilité plus faible de ne pas mourir . Pour ce cas là on sait de suite que le temps de conduite sobre et bien plus élevé que celle ivre et donc que la probabilité de mourir sobre et plus élevé et cela n'a rien à voir avec l'alcool. Ce dernier agrave même le risque de mourir au volant ( pour ceux qui hésitaient encore ;) )
secouchermoinsbete.fr/75489-le-paradoxe-de-simpson-met-les-statistiques-sens-dessus-dessous
La voilà
Il y a un exemple très connu qui n'a pas encore été cité qui permet de mettre en évidence les erreurs qui peuvent être causés par des mauvais liens de causalité :
Il est statistiquement prouvé que ceux qui s'endorment avec leurs chaussures ont plus de chance de se réveiller en ayant mal au crâne.
On pourrait donc en déduire que le fait de porter des chaussures pourrait, pour une raison x ou y (mauvaise circulation du sang...), provoquer la migraine.
Or ceci est faux, ces deux événements corrélés ont une origine commune : le fait de rentrer chez sois après une soirée bien arrosés.
Évidemment c'est simpliste ici, mais si vous êtes attentif vous vous retrouverez souvent à crier devant les débats télévisés : "Et le lien de causalité, c'est pour les chiens ?!"
Déjà, le sujet de base de l'anecdote est pas franchement intéressant, mais en plus la rédaction elle-même est d'un ennui...
C'est la première fois que je ne trouve absolument aucun intérêt à une anecdote, même en cherchant bien...
Un exemple très célèbre dans le domaine : il y a corrélation entre la taille importante des pieds et le faible nombre de fautes d'orthographe commises (en gros on remarque que les individus ayant des grands pieds font moins de fautes d'ortographe et inversement). Mais cela ne signifie pas qu'il y a causalité (qu'avoir des grands pieds cause moins de fautes). Ici la cause réside dans l'âge des individus : les adultes font naturellement moins de fautes d'ortographe que les enfants, or les premiers ont des grands pieds et les seconds ont des petits pieds.
L'explication pour les cigognes est pourtant toute simple mais apparemment ces chercheurs ne savent pas que ce sont les cigognes qui apportent les enfants... Bientôt ils vont nous dire aussi que les enfants qui ne finissent pas leur soupe ne sont pas davantage mangés par les ogres que les autres enfants.