Stats-checking & Paradoxe de simpson

« Les faits sont têtus » disait Napoléon Bonaparte. Pas si sûr… Avec les mêmes faits, nous pouvons conclure à une chose et à son inverse.

Pour illustrer cela, prenons un exemple réel, basé sur un article scientifique (ici).

1314 femmes ont été suivies pendant 20 ans. On divise ces femmes en deux groupes :

  • les fumeuses, il y en a 582,
  • les non-fumeuses, il y en a 732.

En suivant ces deux échantillons de femmes, nous cherchons à savoir si fumer augmente la probabilité de décès.

Regardons alors les résultats, après 20 ans de suivi :

  • chez les fumeuses, 139/582 sont décédées, soit 23,9 %
  • chez non-fumeuses, 230/732 sont décédées, soit 31,4 %.

Avec grande surprise, les fumeuses ont un pourcentage de décès plus faible que celui des non-fumeuses. Fumer n’aurait-il aucune conséquence sur la santé/l’espérance de vie ? Voire, fumer serait-il bon pour la santé ?

Avant d’aller prendre une cigarette, examinons plus attentivement les données (le + désigne les fumeuses, le – les non-fumeuses) :

Graphiques réalisés par David Louapre du blog ScienceEtonnante
Graphiques réalisés par David Louapre du blog ScienceEtonnante
Tableau issu de l'étude citée
Tableau issu de l’étude citée

En étudiant le groupe de femmes par tranches d’âge, cela semble plus cohérent : le pourcentage de décès est plus important chez les fumeuses. Par exemple, chez les 45-54 ans, le pourcentage de femmes fumeuses décédées est de 20,8 %, et celui des femmes non-fumeuses est de 15,4%.

PARADOXE DE SIMPSON

Nous voici donc en flagrant délit de paradoxe : si l’on prend l’échantillon de femmes dans sa globalité, ce sont les non-fumeuses qui représentent le plus de décès. Mais, en prenant en compte l’âge, le résultat obtenu est inversé.

Ce paradoxe est également lié à un autre facteur : l’effectif. En effet, si l’on prend par exemple le groupe des 65-74 ans, on a beaucoup plus de femmes non-fumeuses (129) que fumeuses (36) dans ce groupe. Cette différence est cohérente dans la mesure où beaucoup moins de femmes âgées fument comparé aux jeunes femmes.
En effet, les deux groupes ne sont pas homogènes, et c’est donc bien normal que globalement il y a moins de morts chez les fumeuses. Ainsi, s’il y avait autant de femmes âgées fumeuses que non-fumeuses, il n’y’aurait pas eu de paradoxe, puisque les deux groupes seraient alors homogènes.

Nous allons maintenant parler du

FACTEUR DE CONFUSION

 

Une troisième variable « cachée » vient s’immiscer, c’est l’âge. Cette troisième variable est un facteur de confusion, dans la mesure où elle cause aussi le phénomène que nous étudions, à savoir le décès.

En effet, les personnes âgées ont plus de chance de décéder à cause de leur âge avancé, indépendamment du fait qu’ils qu’elles fument ou non.
Etudier les décès par tranche d’âge, aussi appelé la « stratification », nous a permis de neutraliser ce facteur de confusion.
À l’inverse, en regardant les statistiques de façon globale, ce facteur de confusion désavantage le groupe des non-fumeuses, du fait de la disproportion dans le nombre de femmes âgées fumeuses et non-fumeuses. Ce n’est donc pas les femmes fumeuses qui représentent le moins de décès, mais les femmes fumeuses et jeunes. On observe une corrélation entre le facteur âge et le facteur fumer.

L’ajustement sur la variable âge correspond à une analyse multivariée (au lieu de univariée).

Mais alors, qui nous garantit qu’il n’y a pas une quatrième variable cachée qui pourrait nous jouer des tours ? Par exemple, il se pourrait qu’il existe un gène qui nous inciterait à fumer et par ailleurs nous ferait mourir plus vite. On constaterait alors une corrélation entre fumer et mourir, mais ce ne serait pas l’acte de fumer qui favoriserait le décès, mais bien ce gène.

Eh bien, il y a une façon de vérifier si ce quatrième facteur existe vraiment ou pas. Il suffit de prendre des gens au hasard, disons 1000 personnes, et de dire à 500 de fumer, et à 500 de ne pas fumer, sans leur donner de choix. On casse ainsi le facteur de confusion qui serait le gène qui inciterait à fumer. Si les deux groupes sont bien homogènes, il y a autant de personnes avec le méchant gène dans les deux groupes.

Cette méthode correspond à l’essai contrôlé randomisé (Randomized Controlled Test RCT en anglais). C’est la méthodologie utilisée de base lors des essais cliniques. Il s’agit ici d’une étude interventionnelle : on intervient en forçant telle personne à fumer et telle autre à ne pas fumer. Évidemment, une telle expérience serait aujourd’hui illégale, puisqu’il est clairement établi que fumer ne permet pas de vivre plus longtemps.
A contrario, on trouve les études observationnelles, où on ne fait qu’observer. C’est le cas de l’étude sur l’impact de la cigarette. Les études observationnelles peuvent être mal interprétées et nous mener à l’erreur, car nous ne contrôlons pas toutes les variables (des facteurs de confusion peuvent alors s’immiscer). Il est alors prudent de rester vigilant et alerte. Une manière de dévoiler un paradoxe de Simpson, c’est de stratifier. Or, cela demande une réflexion préalable sur les possibles facteurs de confusion.

En résumé, lorsqu’une étude médicale avance des statistiques, il faut d’abord se demander si nous sommes dans un essai clinique (ou essai contrôlé randomisé) ou dans une étude observationnelle (sans intervention, juste observations). Dans ce dernier cas, le paradoxe de Simpson peut pointer son nez, notamment quand les groupes ne sont pas homogènes. Cela ne signifie pas que les études observationnelles n’ont aucune valeur. Mais il faut avoir pris les bonnes précautions méthodologiques pour ne pas faire dire aux faits ce qu’ils ne sont pas.

« Il y a 3 sortes de mensonges : les petits mensonges, les gros mensonges, et les statistiques. » – Mark Twain

Z. Hedaraly, Ingénieur en Big Data, avec la relecture de Dr Ordoscopie, Pharmacien

Soyez le premier à commenter

Laisser un commentaire