Que sont la statistique et les statistiques ?

Retour aux pages persos

Tension statistique appliquée et statistique mathématique

Une définition de la statistique

Pourquoi une formation à la statistique ?

Comment une formation à la statistique ?

Objectifs d'une formation en statistique.

Les emplois des termes Statistique, statistique, statistiques

Contribution à la statistique ( poème )

Des situations-problèmes pour apprendre

 

Comment pouvons-nous résister au plaisir de commencer cette réflexion par un texte poétique dont l�auteur, poétesse polonaise, fut honorée en cette fin d�année 1996 ?.

Ce poème nous donne à sa façon l�occasion de réfléchir à partir de statistiques, c�est à dire les données, les résultats, sur la statistique et quelques-uns de ses objets de préoccupation.

Nous aurions d�ailleurs pu tout aussi bien partir des propos suivants : " La statistique est une science toute moderne : le génie des anciens ne se portait pas volontiers vers des travaux de précision ; les moyens de recherche et de communication leur manquaient ; enfin (...) ils ne paraissent pas avoir soupçonné l�existence d�un principe de compensation qui finit toujours par manifester l�influence des causes régulières et permanentes, en atténuant de plus en plus celle des causes irrégulières et fortuites. De nos jours, au contraire, la statistique a pris un développement en quelque sorte exubérant; et l�on n�a plus qu�à se mettre en garde contre les applications prématurées et abusives qui pourraient la décréditer pour un temps, et retarder l�époque si désirable où les données de l�expérience serviront de bases certaines à toutes les théories qui ont pour objet les diverses parties de l�organisation sociales. (...) Nous entendrons par statistique , la science qui a pour objet de recueillir et de coordonner des faits nombreux sensiblement indépendants des anomalies du hasard, et qui dénotent l�existence des causes régulières dont l�action s�est combinée avec celle des causes fortuites " Ces propos relatifs à cette science statistique sont de Augustin A. Cournot...en 1836 ! Il dit encore " La statistique est une science d�observation. Les chiffres sont les instruments à l�usage des statisticiens, et la précision de ces instruments est rendue comparable au moyen des formules tirées de la théorie des chances. Mais le but essentiel du statisticien, comme de tout autre observateur, est de pénétrer autant que possible dans la connaissance de la chose en soi, et pour cela de dégager autant que cela se peut faire, par une discussion rationnelle, les données immédiates de l�observation, des modifications qui les affectent, en raison seulement du point de vue où se trouve placé l�observateur, et des moyens d�observation mis à sa disposition " . En 1922, un des plus grands statisticiens de la première moitié du XXème siècle, Ronald A. Fisher, écrivit "L�objet de la méthode statistique est la réduction des données. Une masse de données doit être remplacée par un petit nombre de quantités représentant correctement cette masse, et contenant autant que possible la totalité de l�information pertinente contenue dans les donnée d�origine. Cet objectif est accompli par la construction d�une population infinie hypothétique. La statistique comporte des problèmes de spécification apparaissant à travers le choix de la formalisation mathématique de la population, des problèmes d�estimation, impliquant le choix de méthodes de calcul de quantités dérivées de l�échantillon, que nous appelerons statistiques, construites pour estimer les valeurs des paramètres de la population hypothétique, et en des problèmes de distribution ".

Donner une définition de la statistique constitue une prouesse. En 1870 on pouvait en repérer déjà plus de 60 et en 1935 W.F.Willcox en dénombrait plus d�une centaine. Parmi ces définitions, il convient de pointer celles qui se fondent sur une point de vue critique ou humoristique. Elles émanent d�auteurs qui usent plus de leur notoriété que de leurs compétences relatives tant aux méthodes et buts de la statistique qu�à leur succès et à leurs limites. Parmi les définitions les plus connues dans ce genre, les suivantes seraient attribuées respectivement à Benjamin Disraeli "il existe trois sortes de mensonges: les mensonges, les affreux mensonges et les statistiques", à Adolphe Thiers"l�art de préciser les choses que l�on ignore", à Laveleye " l�art de mentir mathématiquement " et à Macauley " Les chiffres disent toujours ce que souhaite l�homme habile qui sait en jouer ". Que ces citations soient fidèles ou non ne constitue pas le fait majeur, ce qui importe c�est qu�elles soient évoquées à divers propos et souvent utilisées comme argument d�autorité par les détracteurs de la statistique. Ces propos analysés montrent combien la confusion entre l�outil, les résultats que cet outil produit et l�usage que tout un chacun peut faire de ces résultats pour son argumentation, est manifestement entretenue. Il est d�ailleurs très intéressant de constater que de telles affirmations pourraient être énoncées à propos de nombreux objets comme par exemple la photographie ! Combien d�outils nobles pourraient être dénigrés au nom des détournements que la bêtise humaine en fait ? Comment peut-on condamner sans appel un outil en se fondant sur des usages inadéquats et erronés ?

A côté de ces expressions qui jugent plus qu�elles ne définissent, figurent celles qui confondent l�outil et un domaine d�application, lui-même parfois plus ou moins pertinent. Ainsi en 1749, Achenwald écrit que la statistique est la connaissance approfondie de la situation respective et comparative des Etats. En 1785 le but de la statistique est selon Sinclair de constater la somme de bonheur dont jouit une population et les moyens de l�augmenter. D�autres exemples pourraient être trouvés de nos jours encore, tels que la réduction de l�économie politique à la statistique, la réduction de la statistique aux mathématiques, la confusion entre les statistiques (les données) et la statistique, etc ...

Enfin une autre catégorie de définitions se caractérise par une limitation excessive du domaine, ainsi trouve-t-on la science des mesures, la science des moyennes , ce qui ne rend compte que de quelques tâches du statisticien renvoyant à une représentation de la statistique comme accumulation de données plus ou moins dégrossies, organisées et ordonnées. Ce point de vue demeure présent chez W.F. Willcox qui propose la statistique est l�étude numérique des groupes ou des masses, par l�étude des unités qui les composent, que ces unités soient des hommes ou non, des êtres animés ou inanimés

Si nous tentons d�évoluer vers des conceptions plus actuelles de la statistique, nous pourrions en premier lieu nous référer à celle de M.G. Kendall pour qui la statistique est la branche de la méthode scientifique qui traite des données obtenues en comptant ou en mesurant les propriétés de populations de phénomènes naturels pour en second lieu la compléter par celle de A. Vessereau pour qui les méthodes statistiques englobent toutes les recherches dans lesquelles le grand nombre et l�enchevêtrement des facteurs exigent une technique d�interprétation basée sur la connaissance des lois du hasard.

Pour notre part nous avons cherché à expliciter notre conception de la statistique au moyen des schémas ci-après qui prennent appui sur la définition suivante : La statistique est la science qui procède à l'étude méthodique à partir de modélisations mathématiques, des modes d'utilisation et de traitement de données, c'est à dire de l'information, dans le but de conduire et d'étayer une réflexion ou de prendre une décision en situation concrète soumise aux aléas de l'incertain.

La statistique descriptive étudie ces modes d'utilisation et de traitement de données, à un premier niveau, dans la perspective de produire essentiellement des descriptions des informations.

La statistique inférentielle les étudie à un second niveau dans la perspective d'étendre ces informations décrites à un domaine de validité non exploré directement, avec, si possible, un contrôle des risques encourus dans ce raisonnement inductif.

Dans ce premier schéma, nous traduisons cette tension dialectique qui lie deux dimensions de la statistique comme les deux pôles inséparables d�un aimant. Ces deux pôles nous les nommons respectivement statistique mathématique et statistique appliquée à... Il nous paraît impossible d�envisager la statistique mathématique, c�est à dire la théorie statistique dans le cadre théorique au sein duquel se développent l�explicitation, la formalisation des notions, concepts, méthodes et des raisonnements de la statistique de même que nous ne pouvons imaginer que cette théorie soit coupée de sa mise en �uvre dans d�autres cadres théoriques tels que la psychologie, l�économie, la mécanique, la médecine, etc...

C�est un peu de ce point de vue que nous regardons la physique dans sa tension entre la physique mathématique et la physique appliquée.

Le second schéma vise à présenter les buts et les opérations que nous assignons à la statistique et qui par là même la caractérise en partie. Nous lui attribuons comme but central de constituer un outil d�aide à la décision, que cette décision soit prise à partir d�une exploration, d�une description de données spécifiées recueillies dans des circonstances connues ou encore à partir d�hypothèses testées conduisant à une certaine maîtrise du risque d�erreur encouru.

Ce schéma s�inscrit dans un ensemble de caractéristiques qui servent à définir aujourd�hui la statistique :

- une sorte de langage commun , méthode générale reliant divers domaines scientifiques

- portant sur des ensembles d�individus, de variables et de relations

- conduisant plutôt à des conclusions vraisemblables et probables que vraies et certaines énonçant des propriétés de groupe valides sur des ensembles parfois imparfaitement définis

Si l�on caractérise les mathématiques comme une science du certain, la statistique pourrait alors s�en distinguer alors comme une science de l�incertain qui cherche à établir les frontières de l�incertitude. Dans cette perspective le raisonnement statistique prend appui sur les théories des probabilités.

A cette étape, il convient de rappeler que le terme statistique apparaît alors:

- comme substantif au singulier pour désigner le domaine scientifique, la discipline universitaire : la Statistique,

- comme substantif au pluriel pour désigner les données qui constituent un part de ces objets d�étude : les statistiques,

- comme substantif (au singulier ou au pluriel) pour désigner une fonction des résultats d�une variable (statistique) recueillis sur un échantillon : une statistique (exemple, la moyenne empirique est une variable qui à chaque échantillon associe la moyenne des valeurs d�une variable recueillies )

- comme adjectif pour préciser d�une part ce qui est relatif à la statistique, ( exemple : tableau statistique, échantillon statistique, variable statistique ), d�autre part ce qui concerne les grands nombres, les phénomènes complexes ( mécanique statistique, rationalité statistique )

Force est de constater qu�à côté de ces mots nous pouvons observer des comportements humains qui expriment des rapports à ce domaine de connaissances et aux pratiques sociales afférentes. En France nombre de personnes à la seule évocation du terme en soulignent aussitôt les aspects négatifs sans pour autant être en mesure de fournir un exemple précis d�un usage inadéquat et trompeur de la statistique. Ajoutons qu�une formation insuffisante en ce domaine conduit à rendre difficile le discernement d�une étude statistique correcte par rapport à une étude incorrecte. Des résultats sérieux et correctement traités peuvent être mal interprétés par défaut de compétences élémentaires en statistique tandis que certaines personnes ayant acquis la mauvaise habitude de croire tout ce que les media colportent constituent des proies faciles pour des manipulateurs de résultats qualifiés de statistiques en la circonstance. Trois conduites liées à une compétence insuffisante peuvent être identifiées : le rejet systématique, l�acceptation naïve ou l�usage détourné à des fins personnelles avantageuses.

Dans notre vie quotidienne actuelle, les statistiques et donc la statistique tiennent une place dominante dont les media se font tout particulièrement l'écho pour ne considérer que la partie émergée de l�iceberg statistique. Tout se passe comme si aujourd�hui la statistique était devenue un outil pour penser et agir aussi indispensable au citoyen que l�écriture, la lecture et le calcul. En 1963, W. Weaver écrit " La théorie des probabilités et la statistique sont deux domaines importants, intégrés à nos activités quotidiennes. Le monde de l�industrie, les compagnies d�assurance sont largement tributaires des lois probabilistes. La physique elle-même est de nature essentiellement probabiliste. Il en est de même des fondements de la biologie. Cependant, en dépit de cette importance, les responsables de l�enseignement n�ont pas encore admis le caractère universel de la théorie des probabilités et de la statistique. Il faut espérer que des éléments de la théorie des probabilités soient introduits dès que possible au niveau de l�enseignement secondaire..."

Pourquoi et dans quels buts faut-il envisager une formation à la statistique ?

C�est alors tout naturellement que nous sommes conduit à porter notre réflexion sur la place et le rôle de l�enseignement dans la formation de l�esprit statistique de l�enfant et de l�adolescent. Quand en 1973, Maurice Glaymann et Tamas Varga choisissaient cet extrait pour l'introduction de leur ouvrage, ils exprimaient leur satisfaction partielle en précisant qu�au cours des dix années écoulées, l�enseignement des mathématiques avait connu, tant en France que dans de nombreux pays, des réformes qui laissaient entrer l�enseignement des probabilités. Ils ajoutaient alors " et ce n�est peut-être plus qu�une question de temps pour qu�elles constituent une partie intégrante des programmes scolaires de tous les pays " . Qu�en est-il de nos jours près de 25 ans plus tard ? Certes, dans cette prophétie, il est plus question de probabilité que de statistique mais nous gageons que les deux domaines étaient envisagés dans l�esprit de cette attente. L�ouvrage qu�ils rédigèrent propose des pistes de travail pour un enseignement des probabilités à l�école primaire dont les effets ne pourraient qu�être avantageux dans la formation de l�esprit statistique. Un lien qui se trouve confirmer dans un autre ouvrage fort intéressant intitulé L�enseignement des probabilités et de la statistique de Arthur Engel.

Dans les années 80, Lennart Rade expose dans un article consacré à la statistique et publié par l�UNESCO des constats émis depuis les années 50 relatifs à la formation de l'esprit statistique. Ainsi en 1959 un rapport d'une commission sur l'enseignement des mathématiques aux U.S.A. conclut ses travaux par ces propos " Si les mathématiques ont trait à des situations où les faits peuvent être déterminés, elles donnent aussi les moyens d'étudier, de comprendre et de maîtriser l'incertain. Parmi les plus récentes applications des mathématiques, beaucoup font appel à la théorie des probabilités et au raisonnement statistique.(...) La pensée statistique joue un rôle croissant dans la vie quotidienne des adultes instruits. L'initiation à la pensée statistique est un complément important à l'initiation à la pensée déductive." . En France la même année lors d'un séminaire sur l'enseignement des mathématiques organisé par l'Organisation Européenne de Coopération Economique, le point de vue suivant est soutenu " Le calcul des probabilités élémentaire doit être considéré comme une branche des mathématiques susceptibles d'être enseignée dans les écoles secondaires. L'induction statistique doit être considérée comme une branche des mathématiques appliquées qui entre pour une part capitale dans les processus de décision conformes à l'esprit de la "méthode scientifique" et dont de très nombreux secteurs des sciences physiques et des sciences du comportement humain font un usage accru. Il faut admettre en outre que le raisonnement statistique acquiert une importance croissante dans le domaine des affaires publiques. Un enseignement élémentaire approprié du calcul des probabilités et de la statistique doit faire partie du nouveau programme des études secondaires des cours préparatoires sur ces matières devront figurer aux programmes (...) des institutions formant les professeurs.". Ces propos confirment que ni notre préoccupation ni nos souhaits ne sont des idées nouvelles et originales !

Ainsi nous pouvons tenter d'exposer quelques arguments en faveur d'un enseignement de la statistique à l'école primaire ou secondaire : il est un fait que la statistique est partie intégrante de notre culture actuelle et que de nombreuses notions de statistique interviennent dans notre vie quotidienne, auquel nous ajoutons que la pensée statistique est une composante de la capacité à manipuler des nombres, ainsi nous parions qu'un contact précoce avec ce domaine de connaissance développerait une compréhension élémentaire de notre environnement actuel inondé de statistiques.

Comment peut-on envisager cette formation ?

Dans la formation universitaire, l'enseignement de la statistique concerne de nombreux étudiants dont les goûts personnels les avaient poussés à fuir durant leur scolarité secondaire toute référence à ce qui pouvait ressembler de près ou de loin aux mathématiques. Il en est ainsi en sciences humaines ou en sciences sociales au sein desquelles les approches statistiques ont une place importante. Or la compréhension de ces approches et les interprétations qu'elles induisent ou qu'elles servent à étayer nécessitent une formation en statistique qui ne se réduise pas à des conduites de presse-boutons. Par expérience personnelle, je constate les grandes difficultés auxquelles sont confrontés ces étudiants de ces disciplines universitaires. Ainsi, à titre d'exemple, la formation en sciences de l'éducation dont une partie des étudiants sont des enseignants actuels ou futurs, contient une formation à la statistique. Les finalités de mon enseignement sont exprimées au travers des objectifs généraux suivants :

Objectifs généraux de l�enseignement de la Statistique

en licence et en maîtrise de Sciences de l�Education:

Cet enseignement vise à apporter à chaque étudiant quelques outils techniques et conceptuels efficaces et bien identifiés qui devraient l'aider à :

- expliciter les questions d�une problématique dont l'émergence et/ou la validation des réponses relèvent d�une approche statistique en liaison avec le modèle dans lequel cette problématique est posée,

- décrire, traiter, analyser des données de manière pertinente dans le cadre d�une étude en particulier dans le domaine éducatif,

- faire le lien entre la réflexion analytique sur des questions relevant du champ de l�éducation, leur formalisation et leur traitement quantitatif,

- lire avec un regard critique et distancié, les conclusions de diverses études statistiques en particulier celles apparaissant dans des rapports de recherche en Sciences de l�Education,

- poursuivre de façon autonome et personnalisée un apprentissage en statistique afin d�enrichir les acquis personnels actuels,

- poser un regard plus positif à l�égard d�un domaine largement exploité dans les media , dans le sens de ne pas considérer les résultats dans l�ordre du tout ou rien mais en les replaçant judicieusement dans leur domaine de validité et en relativisant la portée,

- exploiter des notions et des démarches mathématiques à des fins d�outils, et de ce fait à modifier dans un sens positif le rapport souvent négatif que nombre entretient avec cette science,

- s�exercer à un raisonnement intégrant l�idée de "risque d�erreur" dans l�énoncé des conclusions.

- s�exercer à l�interprétation de phénomènes éducatifs sur la base de données statistiques recueillies sur des "faits" et des relations entre ces "faits" en particulier sur des "faits éducatifs" et sur des relations entre ces "faits éducatifs"

- s�exercer à la communication des résultats des analyses des données en faisant une distinction bien nette entre le modèle utilisé et la réalité qu�il est supposé représenter, entre les traitements conduits au sein du modèle et les interprétations reformulées dans le contexte au sein duquel est posé le problème.

Des situations problèmes pour apprendre la statistique

A vous qui êtes étudiante ou étudiant en licence de sciences de l�éducation, Le document situations-problèmes qui suit vous offre à une occasion d�exercer vos compétences dans le domaine de la statistique. Il y a lieu de considérer qu�il vise à poser des obstacles pour les franchir et que rien ne peut justifier objectivement qu�ils vous soient insurmontables.

L�acquisition de nouvelles connaissances implique des remises en cause diverses qui sont souvent dérangeantes. Je pense que la persévérance est un des facteurs de réussite particulièrement en accord avec le postulat de la modifiabilité cognitive permanente en lequel j�investis un grand espoir.

Toutefois cette acquisition implique la mise en situation didactique avec la médiation d�outils d�aide dont ce document devrait constituer une concrétisation. Elle implique aussi une mise à distance de l�anxiété que génère l�inconnu : or il ne peut y avoir apprentissage que du "nouveau", certes en relation avec l�"ancien", et il ne peut y avoir apprentissage sans production d�erreurs dont la rectification engendre la connaissance nouvelle.

Ainsi ce document est à considérer comme un outil de médiation entre vous et les connaissances statistiques, il requiert une activité effective de votre part et non l�attente contemplative de la réponse que l�enseignant essayera de fournir en tenant compte des contraintes de temps. En attendant de pouvoir rédiger un document autocorrectif, il importe d�être conscient que la totalité des exercices et problèmes ne pourra être corrigée. Le lecteur qui aurait un sentiment de frustration trop grand peut toujours rencontrer l�enseignant, discuter avec des amis compétents ou détruire certains énoncés pour ne pas leur laisser jouer leur rôle de stimulus intellectuel.

Par ailleurs un travail autonome peut être suggéré à savoir réaliser un croisement entre la grille d�objectifs de références et chaque énoncé en tentant d�y repérer les objectifs sous-jacents.

Retour au début ou Situations-problèmes