A bas le hasard !


 

 

 

 

 

 

 

 

 

 

 

 

Le hasard et ses conséquences, voilà le vrai problème.

En effet, toute étude scientifique a pour objet de tirer des conclusions issues de données chiffrées.


Mais quelle valeur accorder à ces données, sont-elles réellement le reflet de la réalité ?

Toute l’énergie du chercheur doit donc tendre vers une réduction maximaliste de l’influence du hasard sur les résultats présentés.

 

L’intervalle de confiance.

Faire une estimation (les intentions de vote par exemple), c’est tenter de définir les paramètres d’une population à partir des paramètres observés sur un échantillon. Nous pressentons et nous parions que l’estimation est proche de la valeur exacte.

Mais qu’entendons-nous par «proche» ?

Le but de l’estimation en statistique est de calculer des bornes qui permettent de situer avec une confiance suffisamment grande où se trouve la valeur inconnue du paramètre dans la population étudiée. Il faut donc calculer un intervalle de confiance dans lequel est située la vraie valeur de la quantité étudiée.

Le statisticien se sait donc incapable de connaître la vraie valeur, mais il en fournit modestement une estimation. L’essentiel de son travail sera de réduire au minimum le risque d’erreur.

 

Le risque d’erreur consentie.

Les bornes de l’intervalle de confiance sont calculées en fonction d’un risque fixé par l’investigateur. On parle d’intervalle de confiance à 90%, à 95%... Le consensus général adopté par l’ensemble de la communauté scientifique est de présenter des intervalles de confiance d’au moins 95%. Ceci signifie qu’il y a quand même 5 chances sur 100 pour que la valeur produite dans une étude soit fausse.

 

Le point fondamental avant de gober tout et n’importe quoi :

La taille de l’intervalle de confiance est avant tout fonction de l’effectif de l ‘échantillon. Autrement dit, plus l’effectif est faible, plus la taille de l’intervalle de confiance est élevé, plus la valeur produite par l’étude à des chances d’être simplement due au hasard, moins l’étude est précise et donc plus ses conclusions sont hasardeuses voire fausses.

 

 

 

Bibliographie

T. Ancelle. Statistique, épidémiologie. Editions Maloine, 2002.