Le paradoxe de Simpson met les statistiques sens dessus-dessous

Proposé par
le
dans

Le paradoxe de Simpson est un paradoxe statistique contre-intuitif. L'exemple type est celui des chances de succès d'un traitement médical pour des petits et grands calculs rénaux : le premier traitement peut avoir de meilleures chances de succès que le second traitement sur les petits et grands calculs pris individuellement, tout en ayant des chances de succès moindres que le second traitement sur les calculs pris de manière globale et non scindés par taille.

Imaginez que vous avez un calcul rénal, et afin de vous soigner, vous étudiez deux traitements, le traitement A et le traitement B. Vous tombez sur une étude, et le résultat est clair : sur 350 patients, le traitement A en a sauvé 273, alors que le traitement B en a sauvé 289. Le traitement B semble donc meilleur.Cependant, en regardant les chiffres détaillés : pour des petits calculs, le traitement A a sauvé 81 patients sur 87, soit 93%, tandis que le traitement B en a sauvé 234 sur 270, soit 87%. Pour des gros calculs, le traitement A a sauvé 192 patients sur 263, soit 73%, tandis que le traitement B en a sauvé 55 sur 80, soit 69%. Dans les deux cas, le traitement A semble alors meilleur. En réalité, il s'agit de la même étude, avec les mêmes chiffres, mais souffrant du paradoxe de Simpson : le facteur de confusion vient du fait que les petits calculs sont plus faciles à soigner, et que le traitement B est bien plus utilisé pour les petits calculs tandis que le traitement A est utilisé sur les gros calculs. Ainsi, malgré une plus grande réussite individuelle, le traitement A a un taux de réussite globale plus faible.


Tous les commentaires (70)

Ce n'est plus une anecdote ca c'est un cours de math...

a écrit : Ta "démonstration" est tout à fait fausse.
L'erreur est dans le terme : "moins de chance de faire péter l'avion".

Tu veux donc dire que 1 bombe est moins dangereuse que 2 bombes. Par interpolation on peut dire que 0 bombe est moins dangereux que 1 bombe.

O
r tu as volontairement emporté une bombe (1 > 0) avec toi donc tu as augmenté le risque de faire exploser l'avion.
Ce qui est paradoxal avec ta phrase : "si j'emporte une bombe, je diminue les risques de faire péter l'avion".

Si mon raisonnement est correct, libre à toi de me prouver le contraire, cela signifie que ton raisonnement est fallacieux et que par conséquent, que tu n'as pas réussi à montrer que tu pouvais faire dire n'importe quoi aux statistiques.
Tu auras juste démontré à quel points l'usage des statistiques (probabilités dans ce cas ci) n'est pas simple et qu'il faut rester critiques face aux récits qui paraissent extraordinaires mais vrais.
Afficher tout
Je crois que tu n’as pas compris ce qu’il voulait dire. Je reformule ses dires :
Il y a une probabilité très faible qu’une bombe soit présente à bord de l’avion. Et la probabilité est quasi nulle d’avoir 2 bombes. Donc si je prends 1 bombe avec moi (et que je ne l’a fait pas péter, évidemment !), la probabilité devient nulle qu’il y ait une seconde bombe (portée par quelqu’un de mal attentionné cette fois-ci).
Tu comprends mieux ?

a écrit : 20% des accidents mortels sont dus à l’alcool.
Conclusion, 80% des accidents de la route font suite à la consommation de boissons non alcoolisées.

Donc on a plus de chance de mourir d’un accident de la route après la consommation de boissons non alcoolisées.

On fait dire ce que l’on veut aux statistiques.
Pas mal comme exemple, voilà comme on peut contrecarrer ce genre d'argument :

Ici le problème est qu'on répond à une autre question ("Y a-t-il plus de chance de faire un accident sous influence ?") qu'à la question posée ("SI je faisais un accident, y a-t-il plus de chance que ce soit à cause de l'alcool ?").

Pour résoudre ça, il faut considérer le nombre de conduites alcoolisés : si par exemple les gens roulent 5% du temps sous influence, il y a (20/5)/(80/95)~5 fois plus de chance de faire un accident après avoir bu de l'alcool.

Ça reste un calcul grossier mais vous avez compris l'idée :D.

a écrit : Si j'ai bien compris, si on prend l'exemple d'un QCM où notre réussite ne dépend pas de nos connaissances mais uniquement de la chance. Plus on a de questions, moins on a de chance de réussir. 2 questions : 50% de réussite. 3 questions : 33%. 4 questions : 25%..
Sur un questionnaire de 100 questio
ns on peut en réussir 80 ce qui est très bon mais pour un deuxième questionnaire de 10 questions si on en réussit 9 on obtient un meilleur résultat que le premier.
Y a moyen que mon raisonnement n'ait aucun lien avec l'anecdote car j'essaye de comprendre donc soyez indulgents :D
Afficher tout
Je n'en suis pas certaine, mais tu dois y être... En répondant à moins de questions (9)tu as de meilleures stats, pourtant tu as donné moins de bonnes réponses. Je l'ai compris comme ça aussi...

a écrit : je vais pas trop spoiler mais oui, elle sera plus simple, c'est juste l'origine d'une expression. Sinon je pense que je vais aussi poster des anecdotes en relation avec l'histoire, ou la technologie (informatique et espace surement) Quel appétissant programme ! J'ai hâte !

Est-ce que ça marche sur les noeuds au cerveau ?!

a écrit : Pas mal comme exemple, voilà comme on peut contrecarrer ce genre d'argument :

Ici le problème est qu'on répond à une autre question ("Y a-t-il plus de chance de faire un accident sous influence ?") qu'à la question posée ("SI je faisais un accident, y a-t-il plus de chance que
ce soit à cause de l'alcool ?").

Pour résoudre ça, il faut considérer le nombre de conduites alcoolisés : si par exemple les gens roulent 5% du temps sous influence, il y a (20/5)/(80/95)~5 fois plus de chance de faire un accident après avoir bu de l'alcool.

Ça reste un calcul grossier mais vous avez compris l'idée :D.
Afficher tout
Non !?!!?

a écrit : Je crois que tu n’as pas compris ce qu’il voulait dire. Je reformule ses dires :
Il y a une probabilité très faible qu’une bombe soit présente à bord de l’avion. Et la probabilité est quasi nulle d’avoir 2 bombes. Donc si je prends 1 bombe avec moi (et que je ne l’a fait pas péter, évidemment !), la probabilité d
evient nulle qu’il y ait une seconde bombe (portée par quelqu’un de mal attentionné cette fois-ci).
Tu comprends mieux ?
Afficher tout
Sauf que l'événement "bombe à bord" est indépendant. Donc, si X est la proba d'une bombe à bord, la probabilité qu'il y ai 2 bombes à bord d'un avion vaut X^2. Vu que X est déjà faible, X^2 est effectivement ridicule.
MAIS ce n'est pas le bon calcul. Nous on veut savoi la probabilité d'une seconde bombe s'il y en a déjà une. Les événements étant indépendant elle est de X => Avoir une bombe avec soit ne change pas d'un iota la probabilité.

a écrit : Est ce un exemple ? secouchermoinsbete.fr/73913-le-concorde-est-passe-en-un-instant-d-avion-le-plus-sur-a-avion-le-moins-fiable Non c'est simplement dû au faible "échantillon" d'heures de vol du Concorde en comparaison des autres types d'avion. Si je me souviens bien, il y a sur scmb une anecdote qui parle du 1er et seul meurtre commis en Islande. Il s'agit donc d'un événement rare. Si l'année suivante il y avait eu 2 meurtre, le taux de criminalité aurait augmenté de 100% (soit doublé). Et pourtant c'est un événement qui reste rare.