Chronique raisonnable n° 17 ou leçon d’autodéfense intellectuelle du jeudi 22 mars 2012

17ème Leçon d’autodéfense intellectuelle Jeudi 22 mars 2012
=====================================================================

17ème chronique raisonnable, pour :

o     apprendre à soumettre à la critique les informations reçues

·        prévenir les manipulations et

·        démonter les croyances,

« Être libre, c’est ne plus avoir peur et être responsable de sa vie ».

Continuons ensemble l’étude des pièges d’un usage malicieux des mathématiques : apprendre à compter pour ne pas s’en laisser conter. Rappelez-vous l’émission précédente !

De l’étude des probabilités, nous avons déduit que des phénomènes qui nous semblaient exceptionnels, voire surnaturels, vu sous l’angle de l’évènement personnel devenait tout à fait probable rapporté à l’ensemble de la population d’un pays et au nombre de jours d’une période. Ainsi la probabilité de penser à une personne précise juste avant l’annonce de son décès. De même, nous avons vu qu’il est tout à fait normal de retrouver en grand nombre des aînés dans un groupe particulier, parce que les aînés sont plus nombreux parmi toutes les populations ayant majoritairement des familles de moins de 4 enfants. Enfin, nous avons conclu en répondant à la question du Chevalier de Méré à Blaise Pascal, en lui expliquant pourquoi il gagnait plus fréquemment en jouant aux dés la sortie d’un 6 avec 4 lancés d’un dé et perdait plus fréquemment en jouant la sortie d’un double 6 avec 24 lancés d’une paire de dés. Dans le premier cas, le calcul de probabilité nous donne un peu plus d’un cas sur deux, alors que dans la deuxième situation, nous obtenons un peu d’un cas sur deux.

Aujourd’hui, nous vous proposons de voir les notions de base de statistique.

Le mot statistique va prendre deux sens différents suivant qu’il est utilisé au singulier ou au pluriel. Au pluriel, il désigne, la suite des nombres concernant un événement, comme les statistiques des hauteurs de précipitations quotidienne durant une année. Au singulier, il désigne la branche des mathématiques qui étudie les méthodes pour traiter, analyser et présenter ces données. Dans cette présentation, nous nous limiterons à une branche appelée « statistique descriptive », qui permet de décrire des « populations », personnes, objets ou évènements.

Notre premier outil descriptif sera une courbe, la fameuse courbe de Laplace-Gauss.

Si l’on reprend le lancer de deux dés différents, nous pouvons représenter les résultats théoriques de nos lancers de dés par un graphique. Celui-ci aura pour axe des Y (ou axe vertical) la probabilité (en pourcentage) d’obtenir les différentes sommes de 2 à 12, ces sommes ou résultats étant elles indiquées sur l’axe des X (ou axe horizontal). Cette courbe est en fait un histogramme qui représente à peu prés la courbe de Gauss (rappelez-vous le jeune Jonathan Carl Friedrich Gauss qui découvrit le moyen rapide de réaliser la somme de 100 nombres en lui substituant seule multiplication !). Cette courbe est aussi appelée courbe de distribution normale. Elle représente la la distribution de nombreux phénomènes humains ou naturels aléatoires. Il importe donc de savoir la reconnaître. On la surnomme aussi la courbe en cloche car c’est sa forme. Dans notre exemple de lancers de deux dés, nous avons le sommet de la cloche pour la somme 7 avec une probabilité autour de 17%, aux extrémités nous trouvons d’un côté la somme 2 avec une probabilité autour de 2,5% et de l’autre la somme 12 avec la même probabilité, au-delà la probabilité est nulle. La différence entre l’histogramme et la courbe, c’est que l’histogramme est discontinu, alors que la courbe est continue, elle « lisse » l’histogramme.

Hhhbbdbc

Mais le problème de la statistique est de jongler avec un nombre important de valeurs difficile à appréhender, la solution a été de tenter de réduire ces ensembles de données à une valeur qui permette de conserver les caractéristiques de ces données. Les mesures qui permettent cela sont des mesures de tendance centrale. Elles indiquent la tendance centrale ou typique de l’ensemble de données. Ces mesures sont au nombre de trois, elles ne donnent pas nécessairement la même valeur et comme elles sont fréquemment utilisées, elles doivent être connues. Pour ces mesures de tendance centrale, il s’agit de la moyenne, de la médiane et du mode. Attention, elles peuvent être utilisés pour tromper.

La moyenne est la valeur moyenne de toutes les données présentes dans l’ensemble. On la calcule en additionnant toutes les valeurs des données et en divisant par le nombre de données. On la note ainsi [grand X chapeauté par un trait au-dessus égale sigma de x indice i que divise n] avec :

grand X chapeauté par un trait au-dessus comme symbole mathématique de la valeur moyenne des xi   ;

x est une des valeurs observés ;

åxi est la somme de toutes les valeurs des x observées ;

n est le nombre d’observations de l’ensemble des données.

Par exemple, pour le prix de la baguette de pain, on peut trouver dans 6 commerces différents les prix suivants :

0,70€   0,80€   0,90€   0,90€   0,95€   1,10€   1,20€   1,45€

La moyenne est de : 0,70 + 0,80 + 0,90 + 0,90 + 0,95 + 1,10 + 1,20 + 1,45 soit 8,00 que divise 8 = 1,00€

On trouve facilement la médiane en ordonnant toutes les valeurs observées de la plus petite à la plus grande, c’est la valeur telle que la moitié des données sont au-dessus et l’autre moitié au-dessous. Si le nombre d’observations est impair, la médiane se trouve sur la valeur qui est au milieu. Si le nombre d’observations est pair, la médiane est la moyenne des deux observations centrales

Dans notre exemple la médiane est 0,90 + 0,95 soit 1,85 divisé par 2 = 0,925€

Le mode est la valeur la plus fréquente à l’intérieur de l’ensemble

On voit que c’est 0,90€ qui revient le plus souvent.

En règle générale, les trois valeurs diffèrent peu pour une distribution normale. Mais ce n’est pas toujours le cas, il arrivera que le recours à une des mesures de la tendance centrale soit trompeuse, car la mesure choisie ne donne pas une idée juste de ce qui est typique de l’ensemble des données observées, or c’était notre objectif initial.

Cela est évident lorsque l’on parle des salaires d’une population ou même d’une entreprise. Si une université de lettre vous annonce que le revenu annuel de ses diplômés est de 242 000 €, ne vous laissez pas impressionner par cette annonce. Demandez à voir les données réelles. En effet, si un des diplômés joue dans une équipe de basket et a été embauché dans une équipe professionnelle des Etats-Unis, avec un revenu de 4 millions de dollars, les résultats sont faussés. La moyenne est une mesure de tendance très sensible aux effets des données extrêmes. La question se pose alors de choisir la bonne mesure pour indiquer la tendance recherchée.

Pour aider à répondre à cette question voici une nouvelle présentation des 3 mesures de tendances centrales :

         La moyenne : c’est la mesure de tendance centrale la plus utilisée. Elle existe toujours (il y a toujours une moyenne) et elle prend en compte la valeur de toutes les données. Elle est cependant sensible aux valeurs extrêmes.

         La médiane : elle aussi est communément utilisée, mais moins que la moyenne. Elle existe toujours, mais ne prend pas en compte toutes les valeurs (sinon pour compter combien il y en a). elle n’est pas sensible aux valeurs extrêmes. Lorsque de telles valeurs extrêmes existent, elle peut donc être plus représentative que la moyenne de ce qui peut être typique des données.

         Le mode : il est plus rarement utilisé et il s’emploie surtout pour décrire des variables nominales (décrites par un nom) ou discrètes (qui prennent uniquement un nombre limité de valeurs réelles). Il peut y avoir un mode ou plusieurs, ou même pas de mode du tout. Il ne prend pas en compte toutes les données.

Lors de la prochaine émission, nous reviendrons sur l’importance de bien connaître ces mesures de tendance centrale et verrons comment les utiliser judicieusement. Enfin, n’oubliez pas les conseils des émissions précédentes, ces conseils vous sont donnés pour laisser le moins de prise possible à l’émotion manipulatrice voulue.

Et retrouvez sur le site du cercle libertaire jean-barrué (http://cerclelibertairejb33.free.fr ) nos chroniques en référence au « Petit cours d’autodéfense intellectuelle » de Normand Baillargeon.

Alors, à dans quinze jours.

SharePARTAGER
Ce contenu a été publié dans Non classé. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

 

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.