Piège 1. Les échantillons.


 

 

 

 

 

 

La statistique, mais pour quoi faire ?

 

1. Se faire une idée, la meilleure possible, d’une population au travers d’un échantillon de cette population.

2. Comparer des populations à partir des mesures effectuées sur ces échantillons.

3. Quelques définitions:

  • Population: ensembles d'unités dont on extrait des échantillons.
  • Echantillon: sous ensemble d'une population. Notion fondamentale en statistique exprimant que l'on travaille sur une partie seulement de la population. Les statistiques permettent d'étendre à une population des conclusions tirées de ce qui a été appris sur l'échantillon. De la représentativité de l'échantillon dépend la portée des conclusions.

Préambule.

Il est facile de comprendre que pour pouvoir tirer des conclusions pertinentes, l’échantillon doit être «représentatif» de la population. C’est ici que les statistiques peuvent devenir la forme la plus raffinée du mensonge !

Le calcul statistique n’est qu’une transformation des données collectées par le statisticien. Si ces données sont mauvaises, le résultat sera n’importe quoi.

 

C’est donc une boîte noire.

Il est très facile d’avoir des échantillons peu ou pas représentatifs en particulier chez l’animal.

Dans une cage, mettons cent rats de laboratoire provenant du même élevage aussi semblables que possible (sexe, taille, poids…). Supposons qu’ils représentent tous les rats voire tous les mammifères. Notre étude tente d’évaluer l’effet d’un nouveau régime alimentaire sur la prise pondérale des animaux comparé au régime ordinaire. Nous décidons dans un premier temps de prendre 50 rats dans la cage commune (cage A), pour les mettre dans une cage B (nouveau régime), les autres sont placés dans une cage C (régime ordinaire).

Mais comment avons nous fait pour constituer notre échantillon sans nous faire mordre ? Eh bien en attrapant les rats les plus faibles et les moins agiles pour remplir la cage B. C’est donc une faute méthodologique grave puisque sans le vouloir nous avons sélectionné cet échantillon. Si nous affectons le nouveau régime aux rats les plus forts ce dernier paraîtra illégitimement meilleur.

C’est le problème de la comparaison d’une valeur expérimentale avec une valeur théorique.

 

Eclairons la boîte noire.

Les conditions de recrutement des échantillons représentatifs de la totalité de la population sont stratégiques. Pour faire très simple et pour éviter le moindre biais de sélection, le hasard doit être convié : Un échantillon représentatif sera donc un sous ensemble d’une population obtenue par tirage au sort. Les statisticiens utilisent par exemple une table de nombres au hasard.

ls peuvent alors commencer à travailler sérieusement.