Suite au cours de statistique de ce matin (et après avoir fait un billet sur l'inutilité des statistiques, ici), un mot sur les dangers des statistiques. Tous ceux qui ont eu un enfant né dans les dix dernières années se sont entendu dire qu'il fallait coucher son enfant sur le dos, sinon on risquait de le tuer (la fameuse mort subite du nourrisson).

  • la mort subite du nourrisson
Quand mon fils est né, il hurlait le soir, et le seul moyen de l'endormir était de le faire dormir sur le ventre. Maintenant que la troisième est sur le point d'atteindre son premier anniversaire, je peux l'avouer: on a fait dormir les trois bébés sur le ventre...

Bon, je dois avouer que pour le premier, on ne faisait pas les fiers, et on a passé des nuits blanches à se réveiller au moindre bruit. Et je pense que mes premières insomnies remontent à cette époque. Où le moindre bruit suspect me faisait me réveiller... Le soucis avec son premier enfant est que tous les bruits sont suspects. Il commence à respirer un peu fort: on se réveille. Il rempli sa couche: on se réveille. Il ne fait pas un bruit suspect pendant 2 minutes d'affilé: on se réveille. Car je peux aussi avouer qu'en plus de dormir sur le ventre, les trois ont - plus ou moins - dormi dans le lit de leurs parents. Facteur aggravant disent les médecins ! Et depuis toutes ces années je me demande qui a décidé de ces critères, et surtout quels étaient les chiffres. Le nombre de décès est-il vraiment significativement différent quand les bébés dorment sur le ventre et sur le dos ? Car j'aimerais bien voir les statistiques, avec bien entendu des variables de contrôle... Ça peut paraître anecdotique (voir ressembler à une vengeance personnelle pour un paquet de nuits blanches) mais dans ces histoires de mort subite du nourrisson les statisticiens n'ont jamais été neutres.

  • Sally Clark et les probabilités
L'exemple le plus connu est probablement celui de Sally Clark. En novembre 1999, en Angleterre, Sally Clark a est accusée d’avoir tué ses deux enfants, Christopher  en décembre 1996 (âgé de 11 semaines) et Harry en janvier 1998 (âgé de 8 semaines). Faute de preuves, l’expert auprès du tribunal, le Professeur Meadow, a convaincu la cour à l'aide de statistique. Il a invoqué un rapport (le CESDI SUDI en ligne ici) qui indiquait que la mort subite du nourrisson touchait un bébé sur 8543, et donc, pour connaitre la probabilité qu'une mère ait deux enfants qui décède ainsi, il a expliqué que la méthodologie était la suivante : you have to multiply 1 in 8,543 times 1 in 8,543 and I think it gives that in the penultimate paragraph, its points out that it’s approximately a chance of 1 in 73 million”. Afin de convaincre la cour, il a utilisé la comparaison chevaline suivante… it’s the chance of backing that long odds outsider at the Grand National, you know; let’s say it’s a 80 to 1 chance, you back the winner last year, then the next year there’s another horse at 80 to 1 and it is still 80 to 1 and you back it again and it wins. Now here we’re in a situation that, you know, to get to these odds of 73 million you’ve got to back that 1 in 80 chance four years running, so yes, you might be very, very lucky because each time it’s just been a 1 in 80 chance and you know, you’ve happened to have won it, but the chance of it happening four years running we all know is extraordinarily unlikely. So it’s the same with these deaths. You have to say two unlikely events have happened and together it’s very, very, very unlikely.

Avec 650 000 naissances par an, avec mes yeux d'actuaire, je parlerais plutôt de période de retour centennale (73 millions sur 650 000 doit être proche de la centaine) pour évoquer ce double décès.

L'argument était relativement simple: si un tel accident (deux décès) est exceptionnellement rare, c'est que ce n'est peut-être pas un accident, et ce sont alors des infanticides. Sauf que pour évaluer - correctement - la probabilité qu'il s'agisse d'un accident, il faut chercher le nombre de fois qu’un événement rarissime se produit dans une population identique (celle de ceux qui ont subi deux décès) et non le nombre de fois qu’il se produit au sein de la population totale (on pourra lire l'article ici sur la récurrence des décès).

Malheureusement, ces deux accidents sont rarissimes, Il est donc difficile de calculer précisément cette probabilité. Et les auteurs du rapport mentionné initialement évoquaient ce point, “when a second SIDS death occurs in the same family, in addition to careful search fo inherited disorder, there must always be a very thorough investigation of the circumstances- though it would be inappropriate to assume maltreatment was always the cause”.

En fait, selon une étude publiée par Stephen Watkins dans le British Medical Journal, “Conviction by mathematical error”, en 2000, la période de retour d'un double décès dans une même famille serait plus proche de 18 mois que de 100 ans (ici). En octobre 2001, la Royal Statistical Society a publié également un communiqué en ce sens (ici).

Pour les amateurs d'open data, il serait agréable que de telles statistiques soient accessibles, non ? Qu'on puisse enfin se faire une idée...