Le paradoxe de Simpson est un paradoxe statistique contre-intuitif. L'exemple type est celui des chances de succès d'un traitement médical pour des petits et grands calculs rénaux : le premier traitement peut avoir de meilleures chances de succès que le second traitement sur les petits et grands calculs pris individuellement, tout en ayant des chances de succès moindres que le second traitement sur les calculs pris de manière globale et non scindés par taille.
Imaginez que vous avez un calcul rénal, et afin de vous soigner, vous étudiez deux traitements, le traitement A et le traitement B. Vous tombez sur une étude, et le résultat est clair : sur 350 patients, le traitement A en a sauvé 273, alors que le traitement B en a sauvé 289. Le traitement B semble donc meilleur.Cependant, en regardant les chiffres détaillés : pour des petits calculs, le traitement A a sauvé 81 patients sur 87, soit 93%, tandis que le traitement B en a sauvé 234 sur 270, soit 87%. Pour des gros calculs, le traitement A a sauvé 192 patients sur 263, soit 73%, tandis que le traitement B en a sauvé 55 sur 80, soit 69%. Dans les deux cas, le traitement A semble alors meilleur. En réalité, il s'agit de la même étude, avec les mêmes chiffres, mais souffrant du paradoxe de Simpson : le facteur de confusion vient du fait que les petits calculs sont plus faciles à soigner, et que le traitement B est bien plus utilisé pour les petits calculs tandis que le traitement A est utilisé sur les gros calculs. Ainsi, malgré une plus grande réussite individuelle, le traitement A a un taux de réussite globale plus faible.
Tous les commentaires (70)
C'est pas faux
L homme qui arrive à mettre des commentaires 1 jour avant la sortie d une anecdote ! Trop balaise le gars :)
MDR je n'ai rien compris du tout... Rien du tout, suis-je le seul?? Y a vraiment pas des anecdotes facile ou soit c'est très mal explique!
Au pire on euthanasie tout le monde
C'est génial pour illuster de manière absurde cette différence corrélation/causalité que tu évoques.
i1.wp.com/sciencepop.fr/wp-content/uploads/2016/08/biautisme2.jpg?w=661&ssl=1
Ce parodoxe est bien connu des étudiants en médecine français à qui on enseigne à analyser les articles scientifiques. Car évidemment, dans la réalité, les auteurs publieront le résultats global, sans donner les sous-analyses discordantes.
On peut éviter ce biais par les études expérimentales avec randomisation (répartition aléatoire du traitement). Puisqu'elles éliminent le biais du choix de la méthode influencée par la pathologie. Raison pour laquelle, on priviélégie ce genre d'étude pour montrer la supériorité d'un traitement sur un autre.
On peut le suspecter par l'analyse de certaines données. Par exemple, dans la description des échantilons, les moyennes ou médianes de la taille du calcul, associées à leurs indices de dispertion (respectivement écart-type et valeurs extremes +/- écarts interquartiles), dans chaque groupe et sur le total feront apparaitre une nette différence. l'auteur peut bien sûr être tenté de ne pas donner ces valeurs qui lui sont préjudiciables.
De fait, la compétence du lecteur reste fondamentale. Ainsi un uro ou néphrologue remarquera immédiatement qu'on analyse de manière globale les différents stades ou formes d'une même pathologie alors que la prise en charge diffère. Un peu comme si on analysait le traitement d'un cancer en mélangeant tous les stades, des précoces bien localisé aux avancés avec métastases. De même, le spécialiste connaitra l'importance de la taille du calcul dans le choix et donc s'attendra à avoir une description de l'échatillon et des analyses statistiques de cette donnée. Si l'auteur les a volontairement omise pour dissimuler son biais, cette absence en elle-même mettra en doute la valeur de l'étude.
1- savoir combien d'enfants fréquentaient cette école à cette époque? On aura ainsi la possibilité de calculer un taux de prévalence du cancer intra-cérébral dans cette population.
2- Idéalement, aurait-on une école se trouvant dans la même zone mais éloignée de toute antenne (l'école du village d'à côté par exemple)? On aura ainsi une population contrôle relativement comparable en terme d'exposition environnementale (air, eau,nourriture). Il faudra alors rechercher le nombre de cancer intra-cérabral chez les enfants ayant fréquentés cette école à la même période et calculer le taux de prévalence de cette population.
A défaut, on prendra le taux de prévalence régional/national (çà se trouve assez facilement avec les regsitres).
3- comparaison statistiques des 2 taux pour déterminer s'il y a une différence significative ou pas.
On pourrait alors calculer un Risque Relatif, ce qui nous donne la force de l'association (1er critère de Bradford Hill)
C'est un biais connu des statisticiens mais qui peut, dans certains cas, passer inaperçu et amener à des conclusions erronées.
Or, ton argumentation volontairement fausse et exagérée laisse penser que le paradoxe de Simpson est un type d'argument fallacieux, ce qui n'est pas vrai.
L'erreur est dans le terme : "moins de chance de faire péter l'avion".
Tu veux donc dire que 1 bombe est moins dangereuse que 2 bombes. Par interpolation on peut dire que 0 bombe est moins dangereux que 1 bombe.
Or tu as volontairement emporté une bombe (1 > 0) avec toi donc tu as augmenté le risque de faire exploser l'avion.
Ce qui est paradoxal avec ta phrase : "si j'emporte une bombe, je diminue les risques de faire péter l'avion".
Si mon raisonnement est correct, libre à toi de me prouver le contraire, cela signifie que ton raisonnement est fallacieux et que par conséquent, que tu n'as pas réussi à montrer que tu pouvais faire dire n'importe quoi aux statistiques.
Tu auras juste démontré à quel points l'usage des statistiques (probabilités dans ce cas ci) n'est pas simple et qu'il faut rester critiques face aux récits qui paraissent extraordinaires mais vrais.
Je viens de faire un AVC à la fin de la dernière phrase....
Et un 2em en lisant tout les messages...
Excusez moi par avance pour ce petit hors-sujet.
C'est pas faux... (pour les fans de Kaamelot)