Le paradoxe de Simpson met les statistiques sens dessus-dessous

Proposé par
le
dans

Le paradoxe de Simpson est un paradoxe statistique contre-intuitif. L'exemple type est celui des chances de succès d'un traitement médical pour des petits et grands calculs rénaux : le premier traitement peut avoir de meilleures chances de succès que le second traitement sur les petits et grands calculs pris individuellement, tout en ayant des chances de succès moindres que le second traitement sur les calculs pris de manière globale et non scindés par taille.

Imaginez que vous avez un calcul rénal, et afin de vous soigner, vous étudiez deux traitements, le traitement A et le traitement B. Vous tombez sur une étude, et le résultat est clair : sur 350 patients, le traitement A en a sauvé 273, alors que le traitement B en a sauvé 289. Le traitement B semble donc meilleur.Cependant, en regardant les chiffres détaillés : pour des petits calculs, le traitement A a sauvé 81 patients sur 87, soit 93%, tandis que le traitement B en a sauvé 234 sur 270, soit 87%. Pour des gros calculs, le traitement A a sauvé 192 patients sur 263, soit 73%, tandis que le traitement B en a sauvé 55 sur 80, soit 69%. Dans les deux cas, le traitement A semble alors meilleur. En réalité, il s'agit de la même étude, avec les mêmes chiffres, mais souffrant du paradoxe de Simpson : le facteur de confusion vient du fait que les petits calculs sont plus faciles à soigner, et que le traitement B est bien plus utilisé pour les petits calculs tandis que le traitement A est utilisé sur les gros calculs. Ainsi, malgré une plus grande réussite individuelle, le traitement A a un taux de réussite globale plus faible.


Tous les commentaires (70)

a écrit : un petit calcul et un grand calcul étant des choses complètement différentes, ce paradoxe n'en est en réalité pas un. C'est comme si vous disiez : le traitement A contre les rhumes guérit plus que le traitement B contre les cancers. Vous n'allez pas prendre le traitement A pour soigner votre cancer, bien que rhume et cancer soient des sous-ensembles de "maladie" ! Afficher tout le problème c'est que si on commence comme ça, chaque calcul est différent, donc on peux pas faire de statistiques. Certains diront que même la catégorie "gros calculs" est trop large. Ce qui est intéressent ici, c'est que selon la granularité des catégories, les chiffres se contredisent, en ayant les mêmes chiffres

J'ai lu paradoxe deS Simpson... du coup arrivé au bout je cherchais encore la référence à la série.

Ça va plaire aux adeptes des complots ça !
Merci pour l'anecdote, elle est un peu compliquée c'est vrai, mais je pense avoir compris l'idée. Et en plus j'ai l'impression que le côté "complexe" fait taire les trolls, mais je m'avance peut-être

a écrit : En effet sans le complément avec un exemple précis, j'aurais sans doute tapé ma tête sur les murs... et encore, ceux qui l'ont modéré n'avaient ni les sources ni l'exemple, et Philippe a reformulé la première partie mais ma formulation était encore plus matheuse. je pleins les pauvres modérateurs ayant du subir ça.

a écrit : J'ai lu paradoxe deS Simpson... du coup arrivé au bout je cherchais encore la référence à la série. Sauf que le patronyme Simpson est très répandu dans les pays anglo-saxons et il y'en a même quelques uns en France. Donc avant la série avec les bonhommes jaunes il y a eu un tas de Simpson.

Il y a une chance sur 1 million d’avoir une bombe à bort d’un avion
Il y a 1 chance sur 100 millions d’avoir 2 bombes dans l’avion
Il suffit juste alors d’emporter une bombe avec moi pour diminuer les risques de chance de faire peter l’avion !

Heureusement qu'il y a le complément. J'ai trouvé l'anecdote incompréhensible telle quelle (et pourtant j'étais bon en maths à l'école) mais j'ai trouvé que le complément était parfaitement expliqué.

L’explication aurait été plus simple en utilisant un autre exemple que des calculs rénaux. Expliquer une histoire de calculs mathématiques avec des calculs rénaux... mauvaise idée

a écrit : On attend quoi pour punir les sobres ? oh, et surtout, si vous avez un accident de la route, n'allez pas a l’hôpital ! c'est statistiquement l'un des endroits les plus dangereux sur terre, on a bien plus de chance de mourir dans un lit d’hôpital que chez soi !
Un autre problème est la confusion ent
re corrélation et causalité. Une corrélation, c'est une liaison entre deux variables, mais ça n'implique pas toujours une causalité.
Il existe une corrélation entre la pluie et le sol mouillé. on peut en déduire une causalité : l'eau, ça mouille.
Par contre, certaines corrélations ne sont du qu'au hasard, ce site en répertorie des pas mal :
www.tylervigen.com/spurious-correlations
Il y a une corrélation entre le budget scientifique, spatial et technologique, et le nombre de suicide par pendaison ou étranglement. Doit on en conclure une causalité ? Les personnes pensant que la Terre est plates finissent ils par se suicider quand ils découvrent la vérité ?
Parfois, il peut exister un biais qui implique une corrélation, mais pas une causalité directe, ou du moins pas celle qui semble évidente.
Une étude montre que les familles ayant des animaux de compagnie ont des enfants moins allergique. Miracle, les chiens guérissent les allergies !
ou alors, les enfants avec des allergies ont des problèmes avec les animaux de compagnie...
Dans le même style, une association anti-ondes dénonçait le fait que les personnes vivant sous des pylônes hautes tensions étaient sujets a plus de maladies. Miracle, on a prouvé la nocivité des ondes !
ou alors, les personnes vivant sous ces pylônes sont plus pauvre que la moyenne, et donc avec un accès au soin restreint...
Des assurances ont constatés que la plupart des accidents se font dans des trajets de moins de 30 km. c'est évident, on est moins prudent quand on fait le trajet maison-boulot et boulot-maison !
ou alors, les trajets courts sont les plus commun...
Une étude montre que ceux faisant du jogging à 60 ans ont moins de problèmes de santé à 70 ans. le jogging est donc très bon pour la santé !
ou alors, ceux qui ne font pas de jogging a 60 ans sont déjà en mauvaise santé, donc pas mieux a 70 ans...
Une étude montre que les vegans ont moins de problème d’obésité : la viande, c'est mal !
ou alors, les vegans ont en général une hygiène de vie meilleure que la moyenne, sans fast-food, sodas ou autres.
Des biais comme ça, on peut en trouver plein. méfiez vous
Afficher tout
Merci pour ce pavé, je viens de me rendre compte que je me fais souvent piéger par ce genre de stats ^^'

Posté le

windowsphone

(3)

Répondre

a écrit : On attend quoi pour punir les sobres ? oh, et surtout, si vous avez un accident de la route, n'allez pas a l’hôpital ! c'est statistiquement l'un des endroits les plus dangereux sur terre, on a bien plus de chance de mourir dans un lit d’hôpital que chez soi !
Un autre problème est la confusion ent
re corrélation et causalité. Une corrélation, c'est une liaison entre deux variables, mais ça n'implique pas toujours une causalité.
Il existe une corrélation entre la pluie et le sol mouillé. on peut en déduire une causalité : l'eau, ça mouille.
Par contre, certaines corrélations ne sont du qu'au hasard, ce site en répertorie des pas mal :
www.tylervigen.com/spurious-correlations
Il y a une corrélation entre le budget scientifique, spatial et technologique, et le nombre de suicide par pendaison ou étranglement. Doit on en conclure une causalité ? Les personnes pensant que la Terre est plates finissent ils par se suicider quand ils découvrent la vérité ?
Parfois, il peut exister un biais qui implique une corrélation, mais pas une causalité directe, ou du moins pas celle qui semble évidente.
Une étude montre que les familles ayant des animaux de compagnie ont des enfants moins allergique. Miracle, les chiens guérissent les allergies !
ou alors, les enfants avec des allergies ont des problèmes avec les animaux de compagnie...
Dans le même style, une association anti-ondes dénonçait le fait que les personnes vivant sous des pylônes hautes tensions étaient sujets a plus de maladies. Miracle, on a prouvé la nocivité des ondes !
ou alors, les personnes vivant sous ces pylônes sont plus pauvre que la moyenne, et donc avec un accès au soin restreint...
Des assurances ont constatés que la plupart des accidents se font dans des trajets de moins de 30 km. c'est évident, on est moins prudent quand on fait le trajet maison-boulot et boulot-maison !
ou alors, les trajets courts sont les plus commun...
Une étude montre que ceux faisant du jogging à 60 ans ont moins de problèmes de santé à 70 ans. le jogging est donc très bon pour la santé !
ou alors, ceux qui ne font pas de jogging a 60 ans sont déjà en mauvaise santé, donc pas mieux a 70 ans...
Une étude montre que les vegans ont moins de problème d’obésité : la viande, c'est mal !
ou alors, les vegans ont en général une hygiène de vie meilleure que la moyenne, sans fast-food, sodas ou autres.
Des biais comme ça, on peut en trouver plein. méfiez vous
Afficher tout
Se référer au pastafarisme pour cause/causalité

a écrit : 20% des accidents mortels sont dus à l’alcool.
Conclusion, 80% des accidents de la route font suite à la consommation de boissons non alcoolisées.

Donc on a plus de chance de mourir d’un accident de la route après la consommation de boissons non alcoolisées.

On fait dire ce que l’on veut aux statistiques.
Absolument pas. Les statistiques ne sont pas responsables des raisonnements fallacieux.

a écrit : Se référer au pastafarisme pour cause/causalité En effet, j'aurais pu citer leur preuve mathématique que le réchauffement climatique est du à la baisse du nombre de pirate, corrélation oblige

a écrit : Hum je vois ( rien compris ) Je me sentais ultra seule ! Merci d'être là ! :')

a écrit : 20% des accidents mortels sont dus à l’alcool.
Conclusion, 80% des accidents de la route font suite à la consommation de boissons non alcoolisées.

Donc on a plus de chance de mourir d’un accident de la route après la consommation de boissons non alcoolisées.

On fait dire ce que l’on veut aux statistiques.
Déjà première erreur dans votre message 80% des ACCIDENTS MORTELS font suite à la consommation....
Et deuxiement, non les 80% ne sont pas du à la non consommation d'alcool mais à d'autres causes (vitesse, sommeil, drogues, animaux, pannes mécaniques etc)....

Cette anecdote est complètement fausse ! Il n’y a aucune référence à Bart ou Homer la dedans.

a écrit : Bon, l'anecdote n'est pas simple à expliquer, je vous invite à vous reporter au tableau Wikipedia qui résume bien la chose. Vu la difficulté du sujet, je la trouve au contraire assez claire ...

a écrit : On attend quoi pour punir les sobres ? oh, et surtout, si vous avez un accident de la route, n'allez pas a l’hôpital ! c'est statistiquement l'un des endroits les plus dangereux sur terre, on a bien plus de chance de mourir dans un lit d’hôpital que chez soi !
Un autre problème est la confusion ent
re corrélation et causalité. Une corrélation, c'est une liaison entre deux variables, mais ça n'implique pas toujours une causalité.
Il existe une corrélation entre la pluie et le sol mouillé. on peut en déduire une causalité : l'eau, ça mouille.
Par contre, certaines corrélations ne sont du qu'au hasard, ce site en répertorie des pas mal :
www.tylervigen.com/spurious-correlations
Il y a une corrélation entre le budget scientifique, spatial et technologique, et le nombre de suicide par pendaison ou étranglement. Doit on en conclure une causalité ? Les personnes pensant que la Terre est plates finissent ils par se suicider quand ils découvrent la vérité ?
Parfois, il peut exister un biais qui implique une corrélation, mais pas une causalité directe, ou du moins pas celle qui semble évidente.
Une étude montre que les familles ayant des animaux de compagnie ont des enfants moins allergique. Miracle, les chiens guérissent les allergies !
ou alors, les enfants avec des allergies ont des problèmes avec les animaux de compagnie...
Dans le même style, une association anti-ondes dénonçait le fait que les personnes vivant sous des pylônes hautes tensions étaient sujets a plus de maladies. Miracle, on a prouvé la nocivité des ondes !
ou alors, les personnes vivant sous ces pylônes sont plus pauvre que la moyenne, et donc avec un accès au soin restreint...
Des assurances ont constatés que la plupart des accidents se font dans des trajets de moins de 30 km. c'est évident, on est moins prudent quand on fait le trajet maison-boulot et boulot-maison !
ou alors, les trajets courts sont les plus commun...
Une étude montre que ceux faisant du jogging à 60 ans ont moins de problèmes de santé à 70 ans. le jogging est donc très bon pour la santé !
ou alors, ceux qui ne font pas de jogging a 60 ans sont déjà en mauvaise santé, donc pas mieux a 70 ans...
Une étude montre que les vegans ont moins de problème d’obésité : la viande, c'est mal !
ou alors, les vegans ont en général une hygiène de vie meilleure que la moyenne, sans fast-food, sodas ou autres.
Des biais comme ça, on peut en trouver plein. méfiez vous
Afficher tout
Dans le même esprit, il y a ce livre « freakonomics » (que je vous conseille à tous) qui analyse les données statistiques différemment.
Dans un des chapitre, l’auteur (les auteurs?) explique que sous le mandat de Rudolf Giuliani (ancien maire de NYC), la criminalité a fortement baissé. Les médias expliquent ce chiffre par une augmentation des effectifs de police et autre propagande pro-Guiliani.
Les auteurs ont préféré creuser une autre piste et ils se sont aperçu qu’une vingtaine d’année avant que Giuliani ne soit élu, une loi autorisant l’avortement était passé et que celles qui en avaient le plus bénéficié étaient des mères célibataires issues de milieux défavorisés... justement le profil-type de la mère de délinquant. Ces criminels en puissance n'étant pas nés, 20ans plus tard, le taux de criminalité chute.
Pour le coup, la morale n'est pas qu'on peut faire dire ce qu'on veut aux statistiques mais que la raison la plus évidente n'est pas toujours la plus juste

a écrit : Dans le même esprit, il y a ce livre « freakonomics » (que je vous conseille à tous) qui analyse les données statistiques différemment.
Dans un des chapitre, l’auteur (les auteurs?) explique que sous le mandat de Rudolf Giuliani (ancien maire de NYC), la criminalité a fortement baissé. Les médias expliquent ce
chiffre par une augmentation des effectifs de police et autre propagande pro-Guiliani.
Les auteurs ont préféré creuser une autre piste et ils se sont aperçu qu’une vingtaine d’année avant que Giuliani ne soit élu, une loi autorisant l’avortement était passé et que celles qui en avaient le plus bénéficié étaient des mères célibataires issues de milieux défavorisés... justement le profil-type de la mère de délinquant. Ces criminels en puissance n'étant pas nés, 20ans plus tard, le taux de criminalité chute.
Pour le coup, la morale n'est pas qu'on peut faire dire ce qu'on veut aux statistiques mais que la raison la plus évidente n'est pas toujours la plus juste
Afficher tout
Intéressant ça ! Ça mériterait une anecdote.

Plus y a de gruyere, plus y a de trous dedans et donc moins y a de gruyere....