La Probabilité Noie le Poisson
Lamartine s’était émerveillé de la beauté d’un lac en automne.
Moi, quand je vois un lac, je pense au nombre de poissons que je peux en tirer.
Un lac contient un certain nombre de poissons que je ne connais pas.
Je souhaite trouver un procédé qui me permette de diagnostiquer du nombre de poissons qu’il y a vraisemblablement dans ce lac pour les prendre tous. C’est là une ambition digne d’un stratège et on verra que cela conditionne aussi notre santé à tous. Comment?, lis un peu la suite et je te montrerai comment, grâce au subterfuge des probabilités, on peut jouer à l’apprenti sorcier en toute impunité.
Le mathématicien que je voudrais représenter va s’y prendre comme suit:
a) je considère que les poissons aiment manger et qu’ils se laisseront appâter par les asticots que je mettrai au bout de ma canne à pêche.
b) je fais l’hypothèse que les poissons viennent mordre à l’hameçon de façon aléatoire et que le temps qui s’écoule entre deux prises successives varie de façon aléatoire de telle sorte que je puis assumer que c’est une variable aléatoire suivant une loi de Poisson dont le paramètre p m’est inconnu.
Ma stratégie de décision sera donc la suivante:
a) je vais évaluer le temps d’attente jusqu’à la première prise. Soit T1 ce temps.
b) A partir de là, je vais appliquer la règle de décision d’arrêt suivante: si le temps d’attente jusqu’à la prise suivante excède k2*T1 alors je considère qu’il n’y plus de poisson dans le lac ; le lac d’après moi n’en contenait donc qu’un seul. Le seuil k2 est calculé de façon que la probabilité pour que le temps d’attente T2 jusqu’à la seconde prise soit inférieur à une valeur prédéfinie que j’appelle le risque de me tromper, soit 5% par exemple. Si par contre j’attrape un poisson avant que le temps supplémentaire k2*T1 ne se soit écoulé, alors je continue ma pêche et je me définis un nouveau seuil d’attente que j’évalue à k3*T2, T2 étant le temps qui s’est écoulé entre la première prise et la seconde.
De façon générale, après avoir pêché N poissons à des intervalles de temps successifs T1, T2,…TN, je déciderai que le lac ne contient que N poissons, pas un de plus, si après la dernière prise, j’attends plus de kn+1*TN où le seuil kn+1 est défini de façon que la probabilité pour que la variable aléatoire Tn+1 soit supérieure à kn+1*TN soit inférieure à 5% sachant que j’ai observé la réalisation des évènements T1,…TN.
Je suis donc à tout moment tiraillé entre la décision d’arrêter la pêche et de la continuer selon que le seuil que je me fixe dynamiquement est atteint ou pas. Mais ça coûte d’attendre, et pourtant il y a l’espoir d’attraper plus de poissons si je suis patient…mais le temps c’est de l’argent et avec le temps, le poisson pourrit. Dilemme cornélien…Il faut donc que je sache gérer les risques de prendre des décisions à tort.
Une telle approche est appelée test d’hypothèses séquentiel. On applique le même type d’approche dans l’industrie pharmaceutique pour la mise sur le marché d’un médicament. Il faut décider d’arrêter ou non les tests de validation d’un médicament selon un protocole donné. On va par exemple aller à la pêche aux bactéries dans une éprouvette close. On veut vérifier qu’un médicament a éradiqué tous les microbes qu’il est censé détruire dans ce récipient.
Le problème, c’est que la probabilité noie la complexité du problème intrinsèque car elle procède par lissage des paramètres inconnus (encore et toujours grâce à la super star méthode de l’intégration: voir “Bonne année Intégrale” déjà publié dans les délires mathématiques). Elle ne dit rien, mais le peut-elle seulement, sur ce que ça coûte en vies humaines et effet secondaires que d’accepter un risque de se tromper de 5%.
La probabilité de décider à tort que le nouveau produit est efficace est appelé erreur de première espèce. La probabilité de décider de continuer les tests, donc que le produit n’est pas suffisamment efficace, est appelée erreur de second espèce. Cette seconde espèce est souvent mise à rude épreuve car décider de continuer les tests coûte de l’argent,…la tentation de ne pas trop insister là-dessus est grande: business is business. Ainsi, avec ce type d’erreur, on peut noyer le poisson.
Edmond