Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
28 décembre 2007 5 28 /12 /décembre /2007 08:50
Lorsque j’ai créé cette catégorie « Statistique », j’avais en tête un article paru dans la revue « La recherche Hors série ». Il s’agit du numéro 13 d’octobre-décembre 2003.
 
Je vais citer un exemple de la page 60 « du bon usage des statistiques » (Ulrich Hoffrage, Ralph Hertwig, Gerd Gigrenzer et Samuel Lindsey).
 
« Etant donné une maladie dont la prévalence (nombre de cas dans une population sans distinction des cas nouveaux et anciens) et de 1/1000 et pour laquelle il existe un test de dépistage donnant 5% de faux positifs, quel est le risque qu’une personne dont le test est positif soit effectivement malade (on ne sait rien d’autre de cette personne). »
 
Comme vous êtes prévenus, vous allez sans doute cogiter et ne pas répondre « 95% » comme la plupart des gens (donné par 27 étudiants en faculté de médecine sur 60).
 
 
 
 
 
Alors la bonne valeur ?
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Sur 1000 personnes, il n’y a un malade (vrai positif) et 50 faux positifs. Il y aura donc 1 malade sur 51 positifs soit 2% (la décimale est illusoire à ce niveau de précision). La réponse a été donnée par 11 étudiants sur 60.
 
Je trouve l’exemple frappant en ce qui concerne la signification des statistiques. En effet, il est simple : il n’y a que 2 « taux ». « Tout le monde » sait ce qu’est un taux.
Les valeurs de ces taux ne sont pas aberrantes (bien que 5% de faux positif puisse sembler un peu élevé). La prévalence est « raisonnable ».
Pourtant, le fait de n’avoir qu’une probabilité de 2% d’être malade lorsqu’on est positif est ridiculement faible. Tellement faible que cela en est choquant.
J’aimerai savoir ce que signifie « être positif » pour les contrôles anti-dopage. Quel est le taux de « faux positif » ? Est-il aussi faible ?
 
On pourrait croire que le fait d’être positif entraîne « presque à coup sûr » le fait d’être malade. Ce n’est pas le cas dans cet exemple.
Pire, le résultat va à l’encontre ce que « l’on croit savoir ». Qui en effet est capable de prendre le recul nécessaire (de mener le raisonnement et de faire le calcul) dans la « vie courante » lorsqu’on présente des chiffres ? Encore une fois, je rappelle que ce ne sont que 2 taux : il n’y a rien de compliqué, même pas une moyenne !
 
Si l’on ne prend pas conscience que la fourniture de données chiffrées imposent des explications (origine, obtention, signification, algorithme de calcul, validation, …), on est fatalement dans l’erreur. Cette prise de conscience devrait notamment toucher les journalistes afin qu’ils ne publient pas des chiffres en dehors de tout contexte.

Partager cet article

Repost 0
Published by thidgr - dans Statistique
commenter cet article

commentaires

Présentation

  • : je blogue, donc je suis
  • : Si vous cherchez la vérité, allez croire ailleurs !
  • Contact

Recherche

Archives