loadingPage en cours de chargement


    ACCUEIL | TÉLÉCHARGER | PETITES ANNONCES | FORUM | F.A.Q | LIVRE D'OR | PARTENAIRES | CONTACT | A PROPOS
 
  Rechercher
  separation
  introduction
  Arithmétique
  Algèbre
  Analyse
  Géométrie
  Mécanique
  Électrodynamique
  Atomistique
  Cosmologie
  Chimie
  Méthodes Numériques
  Maths. Sociales
  Ingénierie
  separation
  Biographies
  Bibliographie
  Liens
  separation
  Humour
  Serveur d'exercices
  separation
  Parrains
5 connectés
News News :: Erreur Erreur :: Statistiques Statistiques :: ClearType ClearType :: Imprimer Imprimer :: Bookmark and Share

Arithmétique

THÉORIE DE LA DÉMONSTRATION | NOMBRES | OPÉRATEURS ARITHMÉTIQUES |
THÉORIE DES NOMBRES | THÉORIE DES ENSEMBLES | PROBABILITÉS | STATISTIQUES

7. STATISTIQUES (1/2)

Dernière mise-à-jour de ce chapitre: 29.07.2010 23:44
Version: 2.1 Revision 13 | Avancement: ~90%

Table des matières LISTE DES SUJETS TRAITÉS SUR CETTE PAGE

La statistique est une science qui a pour objet le groupement méthodique de faits ou événements répétitifs qui se prêtent à une évaluation numérique dans le temps suivant une loi donnée.

Il faut savoir que parmi tous les domaines de la mathématique, celle qui est utilisée à la plus large échelle dans un cadre professionnel dans les entreprises est bien la statistique! Raison pour laquelle ce chapitre est un des plus gros alors que seuls les concepts élémentaires y sont présentés!

Il est peut être inutile de préciser que la statistique est beaucoup utilisée en ingénierie, physique théorique, en économétrie, en gestion de projets, dans l'industrie des processus, dans les domaines des assurances vies et non vies, dans l'actuariat ou dans la simple analyse de banque de données (avec MS Excel très souvent... malheureusement....) et la liste est encore longue. Par ailleurs, nous rencontrerons les outils présentés ici assez souvent dans les chapitres de Mécanique des Fluides, de Thermodynamique, des Techniques de Gestion, du Génie Industriel et d'Économétrie (en particulier dans ces deux dernières). Le lecteur pourra donc s'y reporter pour avoir des applications pratiques concrètes des quelques-uns des éléments théoriques les plus importants qui seront vus ici.

Signalons également que outre les quelques exemples simples données sur ces pages, de nombreux autres exemples applicatifs sont donnés sur le serveur d'exercices du site dans les catégories Probabilités et Statistiques, Génie Industriel, Économétrie et Techniques de Gestion.

Définition: Le but principal de la statistique est de déterminer les caractéristiques d'une population donnée à partir de l'étude d'une partie de cette population, appelée "échantillon" ou "échantillon représentatif".

Remarque: Le traitement des données concerne la "statistique descriptive". L'interprétation des données à partir des estimateurs s'appelle "l'inférence statistique" (ou "statistique inférentielle"), et l'analyse de données en masse la "statistique fréquentielle" (en opposition à l'inférence bayesienne).

Lorsque nous observons un événement prenant en compte certains facteurs, il peut arriver qu'une deuxième observation ait lieu dans des conditions qui semblent identiques. En répétant ces mesures plusieurs fois sur différents objets supposés similaires, nous pouvons constater que les résultats observables sont distribués statistiquement autour d'une valeur moyenne qui est, finalement le résultat possible le plus probable. Dans la pratique, nous n'effectuons cependant parfois qu'une seule mesure et il s'agit alors de déterminer la valeur de l'erreur que nous commettons en adoptant celle-ci comme moyenne mesurée. Cette détermination nécessite de connaître le type de distribution statistique auquel nous avons à faire et c'est ce que nous allons nous attarder (entre autres) à étudier ici (les bases du moins!). Il existe cependant plusieurs approches méthodologiques courantes (les moins courantes n'étant pas citées pour l'instant) face au hasard :

1. Une toute première consiste à ignorer purement et simplement les éléments aléatoires, pour la bonne raison que l'on ne sait pas comment les intégrer. Nous utilisons alors la "méthode des scénarios" appelé aussi "simulation déterministe". C'est typiquement un outil utilisé par les financiers ou gestionnaires non diplômés travaillant avec des outils comme MS Excel (qui inclut un outil de gestion de scénarios) ou MS Project (qui inclut un outil de type scénarios optimiste, pessimiste, attendu déterministes).

2. Une seconde approche envisageable, quand nous ne savons pas associer des probabilités précises aux futurs événements aléatoires, est la théorie des jeux (cf. chapitre de la Théorie Des Jeux Et De La Décision) où l'on utilise des critères de sélection semi-empiriques comme le critère du maximax, du minimax, de Laplace, de Savage, etc.

3. Enfin, quand nous pouvons lier des probabilités aux événements aléatoires, soit que ces probabilités découlent de calculs ou de mesures, soit qu'elles reposent sur une expérience acquise auprès de situations antérieurs de même nature que la situation actuelle, nous pouvons faire appel aux statistiques descriptives et inférentielles (contenu du présent chapitre) pour tirer des informations exploitables et pertinentes de cette masse de données acquises.

4. Une dernière approche quand nous avons connaissance de probabilités relatives aux issues intervenantes faisant suite à des choix stratégiques est l'utilisation de la théorie de la décision (cf. chapitre de la Théorie Des Jeux Et De La Décision).

Remarque: Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est qu'un "indicateur". C'est la statistique mathématique qui lui donne le statut d'estimateur dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. Nous cherchons en général à ce que l'estimateur soit sans biais, convergeant et efficace.

Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite sur le concept d'échantillons et de moyennes :

ÉCHANTILLONS

Lors de l'étude statistique d'ensembles d'informations, la façon de sélectionner l'échantillon est aussi importante que la manière de l'analyser. Il faut que l'échantillon soit représentatif de la population (nous ne faisons pas nécessairement référence à des populations humaines!). Pour cela, l'échantillonnage aléatoire est le meilleur moyen d'y parvenir.

Le statisticien part toujours de l'observation d'un ensemble fini d'éléments, que nous qualifions de "population". Les éléments observés, en nombre n, sont tous de même nature, mais cette nature peut être fort différente d'une population à l'autre.

Définitions:

D1. Nous sommes en présence d'un "caractère quantitatif" lorsque chaque élément observé fait explicitement l'objet d'une même mesure. A un caractère quantitatif donné, nous associons une "variable quantitative" coutinue ou discrète qui synthétise toutes les valeurs possibles que la mesure considérée est susceptible de prendre (ce type d'information étant représenté par des courbes de Gauss, de Bêta, de Poisson, etc.)

Remarque: Nous reviendrons sur le concept de "variable" en statistiques plus loin...

D2. Nous sommes en présence d'un "caractère qualitatif" lorsque chaque élément observé fait explicitement l'objet d'un rattachement unique à une "modalité" choisie dans un ensemble de modalités exclusives (de type: homme | femme) permettant de classer tous les éléments de l'ensemble étudié selon un certain point de vue (ce type d'information étant représenté par des diagrammes à barre, fromages, diagrammes à bulles, etc.). L'ensemble des modalités d'un caractère peut être établi à priori avant l'enquête (une liste, une nomenclature, un code) ou après enquête. Une population étudiée peut être représentée par un caractère mixte, ou ensemble de modalités tel que genre, tranche salariale, tranche d'âge, nombre d'enfants, situation matrinomaile par exemple pour un individu.

D3. Un "échantillon aléatoire" est un échantillon tiré au hasard dans lequel tous les individus d'une population ont la même chance, ou "équiprobabilité" (et nous insistons sur le fait que cette probabilité doit être égale), de se retrouver dans l'échantillon.

D4. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous disons alors que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-biaisé")

Remarque: Un petit échantillon représentatif est, de loin, préférable à un grand échantillon biaisé. Mais lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat moins bon que celui qui est biaisé...

MOYENNES

La notion de "moyenne" ou "tendance centrale" (les financiers appellent cela aussi une "mesure de localisation"...) est avec la notion de "variable" à la base des statistiques.

Cette notion nous semble très familière et nous en parlons beaucoup sans nous poser trop de questions. Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce ne sont que des qualificatifs!) pour distinguer la forme de la résolution d'un problème consistant à calculer la moyenne.

Il faut donc être très très prudent quant aux calculs des moyennes car il y a une fâcheuse tendance dans les entreprises à se précipiter et à utiliser systématiquement la moyenne arithmétique sans réfléchir, ce qui peut amener à de graves erreurs! 

Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au dénombrement, à la physique, à l'économétrie, à la géométrie et à la sociologie. Le lecteur trouvera d'autres exemples pratiques en parcourant l'ensemble du site.

Définitions: Soit des nombres equation réels, nous avons alors :

D1. La "moyenne arithmétique" ou "moyenne empirique" (la plus communément connue) définie par le quotient de la somme des n valeurs observées equation par l'effectif total n:

equation   (7.1)

et très souvent notée equationou encore equation et est pour toute loi statistique discrète ou continue un estimateur sans biais de l'espérance (mais pas forcément).

Si plusieurs valeurs occurrent plus d'une fois dans les mesures, la moyenne arithmétique sera alors souvent notée formellement:

equation   (7.2)

et appelée "moyenne pondérée par les effectifs". Enfin, indiquons que dans le cadre de cette démarche, la moyenne pondérée par les effectifs prendra le nom "d'espérance mathématique" dans le domaine d'étude des probabilités.

Nous pouvons tout aussi bien utiliser les fréquences d'apparition des valeurs observées (dites "fréquence des classes"):

equation   (7.3)

Nous avons alors la "moyenne pondérée par les fréquences de classe":

equation   (7.4)

Avant de continuer, indiquons que dans le domaine de la statistique il est souvent utile et nécessaire de regrouper les mesures/données dans des intervalles de classe de largeur donnée (voir les exemples plus loin). Il faut souvent faire plusieurs essais pour cela même s'il existe des formules semi-empiriques pour choisir le nombre de classes lorsque nous avons n valeurs à disposition. Une des ses règles semi-empiriques utilisée par de nombreux praticiens consiste à retenir le plus petit nombre entier de classes k tel que:

equation   (7.5)

la largeur de l'intervalle de classe étant alors obtenue en divisant l'étendue (différence entre la valeur maximale mesurée et la minimale) par k. Par convention et en toute rigueur... (donc rarement respecté dans les notations), un intervalle de classe est fermé à gauche et ouvert à droite: [...,...[.

Ensuite, pour chaque intervalle i le praticien prendra par tradition pour la moyenne entre les deux bornes pour le calcul et la multipliera par la fréquence fi de classe correspondante. Dès lors, le regroupement en fréquence de classe fait que :

1. La moyenne pondérée par les effectifs diffère de la moyenne arithmétique.

2. Vue l'approximation effectuée elle sera un moins bon indicateur que la moyenne arithmétique

3. Elle est très sensible aux choix du nombre de classes donc médiocre à ce niveau là

Plus loin, nous verrons deux propriétés extrêmement importantes de la moyenne arithmétique et de l'espérance mathématique qu'il vous faudra absolument comprendre (moyenne pondérée des écarts à la moyenne et la moyenne des écarts à la moyenne).

Remarque: Le "mode", noté Mod ou simplement M, est par définition la valeur qui apparaît le plus grand nombre de fois dans une série de valeurs. Dans MS Excel, soulignons que la fonction MODE( ) renvoie la première valeur dans l'ordre des valeurs ayant le plus grand nombre d'occurrences en supposant donc une distribution unimodale.

D2. La "médiane" ou "moyenne milieu", notée equation (ou plus simplement M), est la valeur qui coupe une population en deux parties égales. Dans le cas d'une distribution statistique continue f(x) d'une variable aléatoire X, il s'agit de la valeur qui représente 50% de probabilités cumulées d'avoir lieu tel que (nous détaillerons le concept de distribution statistique plus loin très en détails):

equation   (7.6)

Dans le cas d'une série de valeurs ordonnées equation, la médiane est donc de par sa définition la valeur de la variable telle que l'on ait autant d'éléments qui ont une valeur qui lui est supérieure ou égale, que d'éléments qui ont une valeur qui lui est inférieure ou égale. Elle est principalement utilisée pour les distributions asymétriques, car elle les représente mieux que la moyenne arithmétique

Plus rigoureusement:

- Si le nombre de termes est impair, de la forme 2n+1, la médiane de la série est le terme de rang n+1 (que les termes soient tous distincts ou non!).

- Si le nombre de termes est pair, de la forme 2n, la médiane de la série est la demi-somme (moyenne arithmétique) des valeurs des termes de rang n et n + 1 (que les termes soient tous distincts ou non!).

Dans tous les cas, de par cette définition, il découle qu'il y a au moins 50 % des termes de la série inférieurs ou égaux à la médiane, et au moins 50% des termes de la série supérieurs ou égaux à la médiane.

Considérons par exemple la table de salaires ci-dessous:

N° Employé Salaire Cumul employés %Cumul employés
1 1200 1 6%
2 1220 2 12%
3 1250 3 18%
4 1300 4 24%
5 1350 5 29%
6 1450 6 35%
7 1450 7 41%
8 1560 8 47%
9 1600 9 53%
10 1800 10 59%
11 1900 11 65%
12 2150 12 71%
13 2310 13 76%
14 2600 14 82%
15 3000 15 88%
16 3400 16 94%
17 4800 17 100%
Tableau: 7.1  - Identification de la médiane

Il y a un nombre impair 2n+1 de valeurs. Donc la médiane de la série est le terme de rang n+1. Soit 1'600.- (résultat que vous donnera n'importe quel tableur informatique). La moyenne arithmétique quant à elle vaut 2'020.

En relation directe avec la médiane il est important de définir le concept suivant afin de comprendre le mécancisme sous-jacent:

Définition: Soit donné une série statistique equation, nous appelons "dispersion des écarts absolus" autour de x le nombre equation défini par :
 

equation   (7.7)

equation est minimum pour une valeur de x la plus proche d'une valeur donnée equation au sens de l'écart absolu. La médiane est la valeur qui réalise ce minimum (extrémum)! L'idée va alors consister à étudier les variations de la fonction pour trouver le rang de cet extrémum.

En effet, nous pouvons écrire :

equation   (7.8)

Donc par définition de la valeur x :

equation   (7.9)

Ce qui nous permet donc de faire sauter les valeurs absolues est simplement le choix de l'indice r qui est pris de telle manière que la série de valeurs peut en pratique toujours être coupé en deux parties: tout ce qui est inférieur à un élément de la série indexé par r et tout ce qui lui est supérieur (la médiane donc par anticipation).

equation est donc une fonction affine (assimilable à l'équation d'une droite pour r et n fixés) par morceaux (discrète) où l'on peut assimiler le facteur:

2r-n   (7.10)

à la pente et:

equation   (7.11)

à l'ordonnée à l'origine.

La fonction est donc décroissante (pente négative) tant que r est inférieur à n/2 et croissante quand r est supérieur à n/2. Plus précisément, nous distinguons deux cas qui nous intéressent particulièrement puisque n est un entier (elle pas donc par un extremum!) :

- Si n est pair, nous pouvons poser equation, alors la pente peut s'écrire equation et elle est nulle si equation et dès lors puisque ce résultat n'est valable par construction que pour equation alors equation est constante sur equation  et nous avons un extrémum obligatoirement au milieu de cet intervalle (moyenne arthmétique des deux termes).

- Si n est impair, nous pouvons poser equation (nous coupons la série en deux parties égales), alors le pente peut s'écrire equation et elle est donc nulle si equation et dès lors puisque ce résultat n'est valable que pour equation alors il est immédiat que la valeur du milieu sera la médiane equation.

Nous retrouvons donc bien la médiane dans les deux cas. Nous verrons aussi plus loin comment la médiane est définie pour une variable aléatoire continue.

Il existe un autre cas pratique où le statisticien n'a à sa disposition que des valeurs regroupées sous forme d'intervalles de classes statistiques. La procédure pour déterminer la médiane est alors différente:

Lorsque nous avons à notre disposition uniquement une variable classée, l'abscisse du point de la médiane se situe en général à l'intérieur d'une classe. Pour obtenir alors une valeur plus précise de la médiane, nous procédons à une interpolation linéaire. C'est ce que nous appelons la "méthode d'interpolation linéaire de la médiane".

La valeur de la médiane peut être lue sur le graphique ou calculée analytiquement. Effectivement, considérons le graphique représentant la probabilité cumulée F(x) en intervalles de classe comme ci-dessous où les bornes des intervalles ont été reliées par des droites:                      

equation
  (7.12)

La valeur de la médiane M se trouve évidemment au croisement entre la probabilité de 50% (0.5) et l'abscisse. Si nous prenons dans le cadre particulier de l'exemple ci-dessus la borne supérieure de l'intervalle de classe précédant celle contenant la médiane nous avons 2 et 4 pour la borne inférieure de l'intervalle suivant. Nous avons alors en calculant la pente la relation suivante:

equation   (7.13)

Ce que nous écrivons fréquemment:

equation   (7.14)

d'où la valeur de la médiane:

equation   (7.15)

Prenons le tableau suivant que nous retrouverons bien plus tard dans le présent chapitre:

Montant des
tickets

Nombre de tickets

Nombre cumulés de tickets

Fréquences
relatives cumulées

[0;50[

668

668

0.068

[50,100[

919

1'587

0.1587

[100,150[

1'498

3'085

0.3085

[150,200[

1'915

5000

0.5000

[200,250[

1'915

6'915

0.6915

[250,300[

1'498

8'413

0.8413

[300,350[

919

9'332

0.9332

[350,400[

440

9'772

0.9772

[400 et +

228

10'000

1

Tableau: 7.2  - Identification de la classe médiane et du mode

Nous voyons que la "classe médiane" est dans l'intervalle [150,200] car la valeur cumulée de 0.5 s'y trouve (colonne toute à droite) mais la médiane a elle, en utilisant la relation établie précédemment, précisément une valeur de (c'est trivial dans l'exemple particulier du tableau ci-dessus mais faisons quand même le calcul...):

equation   (7.16)

et nous pouvons faire de même avec n'importe quel autre centile bien évidemment!

Nous pouvons également donner une définition pour déterminer la valeur modale si nous sommes seulement en possession des fréquences des classes d'intervalles. Pour cela partons du diagramme en barre des fréquences simplifié ci-dessous:

equation
  (7.17)

En utilisant les relations de Thalès (cf. chapitre de Géométrie Euclidienne), nous avons immédiatement, en notant M la valeur modale:

equation   (7.18)

Comme dans une proportion, on ne change pas la valeur du rapport en additionnant les numérateurs et en additionnant les dénominateurs, il vient:

equation   (7.19)

Nous avons alors:

equation   (7.20)

Avec l'exemple précédent cela donne alors:

equation   (7.21)

La question qui se pose ensuite est celle de la pertinence du choix de la moyenne, du mode ou de la médiane et termes de communication...

Un bon exemple reste celui du marché du travail où de façon générale, alors que le salaire moyen et le salaire médian sont relativement différents, les institutions de statistiques étatiques calculent la médiane que beaucoup de médias traditionnels assimilent alors explicitement au concept de "moyenne arithmétique" dans leurs communiqués.

Remarque: Pour éviter d'obtenir une moyenne arithmétique ayant peu de sens, nous calculons souvent une "moyenne élaguée", c'est à dire une moyenne arithmétique calculée après avoir enlevé des valeurs aberrantes à la série.

Les "quantiles" généralisent la notion de médiane en coupant la distribution en des ensembles données de parties égales (de même cardinal pourrions nous dire...) ou autrement dit en intervalles réguliers. Nous définissons ainsi les "quartiles", les "déciles" et les "centiles" (ou "percentiles") sur la population, ordonnée dans l'ordre croissant, que nous divisons en 4, 10 ou 100 parties de même effectif.

Nous parlerons ainsi du centile 90 pour indiquer la valeur séparant les premiers 90% de la population des 10% restant.

Précisons que dans la version francophone de MS Excel les fonctions QUARTILE( ), CENTILE( ), MEDIANE( ), RANG.POURCENTAGE ( ) sont disponibles et spécifions qu'il existe plusieurs variantes de calcul des ces centiles d'où une variation possible entre les résultats sur différents logiciels.

Ce concept est très important dans le cadre des intervalles de confiance que nous verrons beaucoup plus loin dans ce chapitre et très utile dans le domaine de la qualité avec l'utilisation des boîtes à moustaches (traduction de Box & Whiskers Plot ou BoxPlot) permettant de comparer rapidement deux populations de données et surtout d'éliminer les valeurs aberrantes (prendre comme référence la médiane sera justement plus judicieux!):

equation
  (7.22)

Une autre représentation mentale très importante des boîtes à moustache est la suivante (elle permet de se donner donc une idée de l'asymétrie de la distribution):

equation
equation
  (7.23)

D4. Par analogie avec la médiane, nous définissons la "médiale" comme étant la valeur (dans l'ordre croissant des valeurs) qui partage la somme (cumuls) des valeurs en deux masses égales (donc la somme totale divisée par deux).

Dans le cas de salaires, alors que le médiane donne le 50% des salaires se trouvant en-dessous et en-dessus, la médiale donne combien de salariés se partagent (et donc le salaire partageant) la première moitié et combien de salariés se partagent la seconde moitié de l'ensemble des coûts salariaux.

Par exemple pour revenir à notre tableau sur les salaires:

N° Employé Salaire Cumul salaire %Cumulé salaire
1 1200 1200 3.5%
2 1220 2420 7%
3 1250 3670 10.7%
4 1300 4970 14.5%
5 1350 6320 18.4%
6 1450 7770 22.6%
7 1450 9220 26.8%
8 1560 10780 31.4%
9 1600 12380 36.1%
10 1800 14180 41.3%
11 1900 16080 46.8%
12 2150 18230 53.1%
13 2310 20540 59.8%
14 2600 23140 67.4%
15 3000 26140 76.1%
16 3400 29540 86%
17 4800 34340 100%
Tableau: 7.3  - Identification de la médiale

La somme de tous les salaires fait donc 34'340 et la médiale est alors 17'170 (entre l'employé n°11 et 12) alors que la médiane était de 1'600. Nous voyons alors que la médiale correspond au 50% du cumul. Ce qui est un indicateur très utile dans le cadre des analyse de Pareto ou de Lorenz par exemple (cf. chapitre de Technique de Gestion).

D5. La "moyenne quadratique" parfois simplement notée Q qui est définie par :

equation   (7.24)

avec m=2.

Remarque: C'est une des moyennes les plus connues en statistiques car l'écart-type est une moyenne quadratique (voir plus loin).

exempleExemple:

Soit un carré de côté a , et un autre carré de côté b. La moyenne des aires des deux carrés est égale à carrée de côté:

equation   (7.25)

D6. La "moyenne harmonique" parfois simplement notée H est définie par :

equation   (7.26)

peu connue mais découle souvent de raisonnements simples et pertinents (typiquement la résistance équivalente d'un circuit électrique ayant plusieurs résistances en parallèles). Il existe une fonction MOYENNE.HARMONIQUE( ) dans MS Excel pour la calculer.

exempleExemple:

Soit une distance d parcourue dans un sens à la vitesse equation et dans l'autre (ou pas) à la vitesse equation. La vitesse moyenne s'obtiendra en divisant la distance totale 2d par le temps mis à la parcourir:

  equation   (7.27)

Si nous calculons le temps mis lorsqu'on parcourt d avec une vitesse equation c'est tout simplement le quotient:

  equation   (7.28)

Le temps total vaut donc: 

equation   (7.29)

La vitesse moyenne (son inverse pour être exacte) sera donc bien du type harmonique :

equation   (7.30)

D7. La "moyenne géométrique" parfois notée simplement G est définie par :

equation   (7.31)

Cette moyenne est souvent oubliée mais néanmoins très connue dans le domaine de l'économétrie (surtout quand nous étudierons le rendement géométrique moyen) et de la finance d'entreprise (cf. chapitre Techniques De Gestion) raison pour laquelle il existe une fonction MOYENNE.GEOMETRIQUE( ) dans MS Excel pour la calculer.

exempleExemple:

Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année un intérêt (c'est absurde mais c'est un exemple) de equation , mais pour la deuxième année un intérêt de equation Au même moment une autre banque offre un intérêt constant pour deux ans: X%. C'est pareil, dirons-nous un peu rapidement. En fait les deux placements n'ont pas la même rentabilité.

Dans la première banque, un capital equation deviendra au bout de la première année: 

equation    (7.32)

et la seconde année: 

equation   (7.33)

Dans l'autre banque nous aurons au bout d'un an: 

equation   (7.34)

et après la seconde année:

equation   (7.35)

etc...

Comme vous pouvez le voir le placement ne sera pas identique si equation ! Donc X% n'est donc pas la moyenne de equation et equation.

Posons maintenant:

  equation et equation   (7.36)

Quelle est en fait la valeur moyenne r ?

Au bout de deux ans le capital est multiplié par equation. Si la moyenne vaut r il sera alors multiplié par equation. Nous avons donc la relation:

equation   (7.37)

C'est un exemple d'application où nous retrouvons donc la moyenne géométrique. L'oubli de la moyenne harmonique une erreur fréquente dans les entreprises lorsque certains employés calculent le taux moyen d'augmentation d'une valeur de référence.

D8. La "moyenne mobile", appelée aussi "moyenne glissante" est définie par:

equation   (7.38)

La moyenne mobile est particulièrement utilisée en économie, où elle permet de représenter une courbe de tendance d'une série de valeurs, dont le nombre de points est égal au nombre total de points de la série de valeurs moins le nombre que vous spécifiez pour la période.

Une Moyenne Mobile (MM) en finance est calculée à partir des moyennes des cours d'une valeur, sur une période donnée: chaque point d'une moyenne mobile sur 100 séances est la moyenne des 100 derniers cours de la valeur considérée. Cette courbe, affichée simultanément avec la courbe d'évolution des cours de la valeur, permet de lisser les variations journalières de la valeur, et de dégager des tendances.

Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de dégager des tendances à court terme MMC (20 séances selon les habitudes de la branche), moyen terme (50-100 séances) ou long terme MML (plus de 100 séances).

equation
  (7.39)

Les croisements des moyennes mobiles par la courbe des cours (découpée avec une certaine granularité) de la valeur génèrent des signaux d'achat ou de vente (selon les professionnels) suivant le cas:

- Signal d'achat: lorsque la courbe des cours franchit la MM.

- Signal de vente: lorsque la courbe des cours franchit la MM vers le bas.

Outre la moyenne mobile, précisons qu'il existe une quantité d'autres indicateurs artificiels souvent utilisés en finance comme par exemple le "upside/downside ratio".

L'idée est la suivante: Si vous avec un produit financier (cf. chapitre d'Économétrie) actuellement de prix equation (prix courant) pour lequel vous avez un objectif de gain haut à un prix haut correspondant que noterons equation (high price) et inversement le potentiel de perte que vous estimez à un prix equation (low price).

Alors, le rapport:

equation   (7.40)

donne le Upside/Downside Ratio.

Par exemple, un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 5.- a donc un ratio equation et donc un facteur spéculatif identique pour permette le grain ou une perte de 5.-.

Un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 20.- a donc un equation donc deux fois le potentiel spéculatif de gain par rapport à celui de perte.

Certaines associations boursières recommandent de refuser les equation inférieurs à 3. Les investisseurs ont tendance à rejeter les equation trop élevés pouvant être un signe de gonflage artificiel.

D9. La "moyenne pondérée" (dont nous avons déjà fait mention plus haut d'un cas particulier) est définie par:

equation   (7.41)

et est utilisée par exemple en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistiques pour calculer une espérance (le dénominateur étant toujours égal à l'unité en probabilités) et en gestion de projets pour estimer les durées des tâches.

Dans le cas général le poids equation représente l'influence pondéré ou arbitraire/empirique de l'élément equation par rapport aux autres.

D10. La "moyenne fonctionnelle" ou "moyenne intégrale" est définie par :

equation   (7.42)

equation dépend d'une fonction f d'une variable réelle intégrable (cf. chapitre de Calcul Différentiel Et Intégral) sur un intervalle [a,b]. Elle est très souvent utilisée en théorie du signal (électronique, électrotechnique).

PROPRIÉTÉS DES MOYENNES

Voyons maintenant quelques propriétés pertinentes qui relient quelques-unes de ces moyennes ou qui sont propres à une moyenne donnée.

Les premières propriétés sont importantes donc prenez garde à bien les comprendre :

P1. Le calcul des moyennes arithmétique, quadratique et harmonique peut être généralisé à l'aide de la relation suivante :

equation   (7.43)

où nous retrouvons :

1. Pour equation, la moyenne arithmétique

2. Pour equation, la moyenne quadratique

3. Pour equation, la moyenne harmonique

P2. La moyenne arithmétique a une propriété de linéarité, c'est-à-dire que (sans démonstration car quand simple à vérifier) :

equation   (7.44)

C'est la version statistique de la propriété de l'espérance en probabilité que nous verrons plus loin.

P3. La somme pondérée des écarts à la moyenne arithmétique est nulle.

Démonstration:

D'abord, par définition, nous savons que :

equation et equation   (7.45)

il s'ensuit que :

equation   (7.46)

Ainsi, cet outil ne peut être utilisé comme mesure de dispersion!

Par extension la moyenne des écarts à la moyenne pondérée par les effectifs est nulle aussi :

equation   (7.47)

equationC.Q.F.D.

Ce résultat est relativement important car il permettra plus loin de mieux saisir le concept d'écart-type et de variance.

P4. Soit à démontrer :

equation   (7.48)

Démonstration:

Tout d'abord, nous prenons deux nombres réels non nuls equation et equation tels que equation et nous écrivons :

1. La moyenne arithmétique :

equation   (7.49)

2. La moyenne géométrique :

equation   (7.50)

3. La moyenne harmonique :

equation   (7.51)

4. La moyenne quadratique :

equation   (7.52)

Remarque: Les comparaisons entre les moyennes précitées et la médiane ou encore les moyennes glissantes et pondérées n'ont pas de sens c'est pour cela que nous nous abstenons à les faire.

Prouvons déjà que equation  par l'absurde en posant equation :

equation   (7.53)

Par commodité posons equation nous savons que equation. Or :

equation   (7.54)

et nous cherchons à montrer que equation n'est pas possible. Mais ceci découle des équivalences suivantes :

equation   (7.55)

Il y donc contradiction et ce qui vérifie notre hypothèse initiale :

equation   (7.56)

Regardons maintenant si equation :

Sous l'hypothèse equation. Nous cherchons donc maintenant à montrer que :

equation   (7.57)

Or nous avons les équivalences suivantes :

equation   (7.58)

et la dernière expression est évidement correcte.

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

equation   (7.59)

Nous prouvons maintenant equation et démontrons-le par l'absurde en posant equation :

equation   (7.60)

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

equation   (7.61)

Nous avons donc bien :

equation   (7.62)

Démontrons par l'absurde que equation en posant equation et que equation .

Démonstration:

Nous avons alors :

equation
  (7.63)

Il y a donc contradiction avec l'hypothèse initiale et nous avons donc bien :

equation   (7.64)

equationC.Q.F.D.

Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à Archimède pour placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il existe des relations remarquables parfois entre la statistique et la géométrie (fruit du hasard ???).

equation
  (7.65)

Nous allons d'abord poser equation et O est le milieu de equation . Ainsi, le cercle dessiné equation est de centre O et de rayon equation. D est l'intersection de la perpendiculaire à equation passant par B et du cercle equation (nous choisissons l'intersection que nous voulons). H est quant à lui le projeté orthogonal de B sur equation.

Archimède affirme que equation est la moyenne arithmétique de a et b et que equation est la moyenne géométrique de a et b, et equation la moyenne harmonique de a et b.

Nous démontrons donc que (trivial) :

equation   (7.66)

Donc equation est bien la moyenne arithmétique equation de a et b.

Ensuite nous avons dans le triangle rectangle ADB:

equation   (7.67)

Puis dans le triangle rectangle equationnous avons :

equation   (7.68)

Nous additionnons alors ces deux égalités, et nous trouvons :

equation   (7.69)

Nous savons que D est sur un cercle de diamètre equation, donc ADC est rectangle en D, donc :

equation   (7.70)

Puis nous remplaçons equation et equation par a et b:

equation   (7.71)

Et donc, equationest bien la moyenne géométrique equationde a et b.

Nous reste à prouver alors que equationest la moyenne harmonique de a et b :

Nous avons dans un premier temps (projection orthogonale) :

equation   (7.72)

Puis nous avons aussi (projection orthogonale aussi):

equation   (7.73)

Nous avons donc :

equation   (7.74)

et comme equation , nous avons donc :

equation   (7.75)

equationest donc bien la moyenne harmonique de a et b, Archimède ne s'était pas trompé.

TYPES DE VARIABLES

Lorsque nous avons parlé des échantillons au début de ce chapitre, nous avons fait mention de deux types d'informations : les variables quantitatives et qualitatives. Nous n'avons cependant pas précisé qu'il existait trois types de variables quantitatives très importantes qu'il convient absolument de différencier :

1. Les variables discrètes (par comptage): Sont analysées avec des loi stastistiques basées un domaine de définition dénombrable toujours strictement positif (loi de Poisson typiquement dans l'industrie). Sont quasiment toujours représentées sous forme graphique par des histogrammes.

2. Les variables continues (par mesure): Sont analysées avec des loi stastistiques basées un domaine de définition non dénombrable strictement positif ou pouvant prendre toute valeur positive ou négative (loi Normale typiquement dans l'industrie). Sont également quasiment toujours représentées sous forme graphique par des histogrammes.

3. Les variables par attribut (de classification): Il ne s'agit pas de données numériques mais de données qualitatives de type {Oui, Non}, {Réussi, Échec}, {A temp, En retard}, etc. Les données de type attribut suivent une loi Binômiale.

Comprendre les différents types de données est une disciples important de l'ingénieur parce que cela a des conséquences importantes sur le type d'analyse, les outils et et technique qui seront employées.

Il y a une question fréquente concernant la collecte de données est de savoir la quantité qui devrait être collecter. Au fait cela dépend du niveau de précision souhaité. Nous verrons beaucoup plus loin dans ce chapitre (avec démonstration) comment déterminer mathématiquement la quantité de données à collecter en faisant de la précision souhaitée pour un process Normal.

Voyons de près de quoi il s'agit car maintenant que le concept de moyenne nous est relativement bien connu, nous allons pouvoir aborder des calculs plus formels et qui prendront tout leur sens.

VARIABLES DISCRÈTES

Soit X un variable indépendante (un élément d'un échantillon dont la propriété est indépendante des autres éléments) qui peut prendre les valeurs aléatoires discrètes equation dans equation avec les probabilités respectives equation où, de par l'axiomatique des probabilités: 

equation   (7.76)

Alors nous définissons "l'espérance mathématique" de la variable X par la relation:

equation   (7.77)

appelée aussi "règle des parties".

En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est associé une probabilité à laquelle nous associons également une valeur (donnée par la variable aléatoire). La question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir. La valeur espérée, (l'espérance mathématique donc...) est alors la moyenne pondérée, par la probabilité, de toutes les valeurs des événements de l'espace des échantillons.

Si la probabilité est donnée par une fonction de distribution (voir les définitions des fonctions de distribution plus bas) de la variable aléatoire, nous avons:

equation   (7.78)

Remarques:

R1. equation peut être notée equation s'il n'y pas de confusion possible.

R2. Si nous considérons chaque valeur equation comme les composantes d'un vecteur equation et chaque probabilité (ou pondération) equation comme les composantes d'un vecteur equation alors nous pouvons écrire l'espérance de manière technique sous la forme d'un produit scalaire souvent noté:

equation   (7.79)

Voici les propriétés mathématiques les plus importantes de l'espérance pour toute variable aléatoire (quelque soit sa loi!) ou pour toute série de variables aléatoires et que nous utiliserons souvent tout au long de ce chapitre:

P1. Multiplication par une constante:

equation   (7.80)

P2. Somme de deux variables aléatoires:

equation   (7.81)

où nous avons utilisé dans la 4ème ligne, la propriété vue dans le chapitre de Probabilités:

equation

Nous en déduisons que pour n variables aléatoires equation, définies sur une même loi de distribution:

equation   (7.82)

P3. Espérance d'une constante:

equation   (7.83)

Après avoir traduit la tendance par l'espérance, il est intéressant de traduire la dispersion ou "déviation standard" autour de l'espérance par une valeur appelée "variance de X", notée V(X) ou equation (lire "sigma-deux") et donnée sous sa forme discrète par:

equation   (7.84)

La variance n'est cependant pas comparable directement à la moyenne, car l'unité de la variance est le carré de l'unité de la variable, ce qui découle directement de sa définition. Pour que l'indicateur de dispersion puisse être comparé aux paramètres de tendance centrale (moyenne, médiane et... mode), il suffit d'en prendre la racine carrée.

Par commodité, nous définissons ainsi "l'écart-type" de X, noté equation, par:

equation   (7.85)

L'écart-type est donc la moyenne quadratique des écarts entre les observations et leur moyenne.

Remarques:

R1. L'écart-type equation de la variable aléatoire X peut être noté equation s'il n'y pas de confusion possible.

R2. L'écart-type et la variance sont, dans la littérature, souvent appelés "paramètres de dispersion" à l'opposé de la moyenne, mode et médiane qui sont appelés des "paramètres de position".

Définition: Le rapport equation (exprimé en %) parfois utilisé dans les entreprises comme comparaison de la moyenne et de l'écart-type est appelée le "coefficient de variation" (C.V.).

Pourquoi trouvons-nous un carré (réciproquement une racine) dans cette définition de la variance? La raison intuitive est simple (la rigoureuse l'est nettement moins...). Nous avons démontré plus haut que la somme des écarts à la moyenne pondéré par les effectifs, est toujours nulle :

equation   (7.86)

Or, si nous assimilons les effectifs par la probabilité en normalisant ceux-ci par rapport à n, nous tombons sur une relation qui est la même que la variance à la différence que le terme entre parenthèse n'est pas au carré. Et nous voyons alors immédiatement le problème... la mesure de dispersion serait toujours nulle d'où la nécessité de porter cela au carré.

Nous pourrions imaginer cependant d'utiliser la valeur absolue des écarts à la moyenne, mais pour un certain nombre de raisons que nous verrons plus loin lors de notre étude des estimateurs le choix de porter au carré intervient s'impose assez naturellement.

Signalons cependant quand même l'utilisation courante dans l'industrie de l'écart-moyen:

equation

qui est un indicateur élémentaire très utilisé lorsque nous ne souhaitons pas faire de l'inférence statistique sur une série de mesures. Cet écart peut être facilement calculé dans MS Excel à l'aide de la fonction ECART.MOYEN( ).

Dans le cas où nous avons à disposition une série de mesures, nous pouvons estimer la valeur moyenne (l'espérance) et la variance des mesures par les estimateurs suivants (il s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les événements sont tous équiprobables) dont la notation est particulière :

equation et equation   (7.87)

Démonstration:

equation   (7.88)

equationC.Q.F.D.

Le terme de la somme se trouvant dans l'expression de la variance (écart-type) est appelée "somme des carrés des écarts à la moyenne". Nous l'appelons aussi la "somme des carrés totale", ou encore la "variation totale" dans le cadre de l'étude de l'ANOVA (voir la fin de ce chapitre).

Remarque: Il est important que le lecteur comprenne que dans ce cas l'espérance se calcule simplement en utilisant la moyenne arithmétique!

La variance peut également s'écrire sous la forme de la "formule de Huyghens" que nous réutiliserons plusieurs fois par la suite. Voyons de quoi il s'agit:

equation   (7.89)

Faisons maintenant un petitr crochet relativement à un scénario fréquent générateur d'erreurs dans les entreprises lorsque plusieurs séries statistiques sont manipulées (cas très fréquent dans l'industrie ainsi que dans les assurances ou la finance).

Considérons deux séries statistiques portant sur le même caractère:

- equation, effectif total n, moyenne equation, écart-type equation

- equation, effectif total m, moyenne equation, écart-type equation

Nous noterons equation la série statistique obtenue en regroupant les deux séries. Nous avons alors:

equation   (7.90)

Donc la moyenne des moyennes n'est pas égale à la moyenne globale (première erreur fréquente dans les entreprises) exceptée si les deux séries statistiques ont le même nombre d'effectifs!!!

Concernant l'écart-type, rappelons d'abord que nous avons:

equation   (7.91)

Pour la suite, rappelons que nous avons démontré précédemment la relation de Huyghens:

equation   (7.92)

Il vient alors:

equation
  (7.93)

Donc nous voyons que l'écart-type global n'est pas égal à la somme des écarts-types (deuxième erreur courante dans les entreprises) excepté si les effectifs et les moyennes sont les mêmes dans les deux séries!!!

Considérons maintenant X une variable aléatoire d'espérance equation (valeur constante et déterminée) et de variance equation (valeur constante et déterminée), nous définissons la "variable centrée réduite" par la relation:

equation   (7.94)

et l'on démontre de façon très simple (contactez-nous si vous souhaitez que nous ajoutions la démonstration) en utilisant la propriété de linéarité de l'espérance et la propriété de multiplication par un scalaire de la variance (voir de suite après) que:

equation   (7.95)

Démonstration:

equation   (7.96)

et en utilisant la formule de Huyghens:

equation   (7.97)

equationC.Q.F.D.

Ainsi, toute répartition statistique définie par une moyenne et un écart-type peut être transformée en une autre distribution statistique souvent plus simple à analyser.

Voici quelques propriétés mathématiques importantes de la variance :

P1. Multiplication par une constante :

equation   (7.98)

P2. Somme de deux variables aléatoires:

equation   (7.99)

où nous introduisons le concept de "covariance" dont nous verrons une expression plus commode un peu plus bas.

Introduisons une forme plus générale et extrêmement importante dans de nombreux domaines:

equation   (7.100)

Donc dans le cas général:

equation   (7.101)

En utilisant la linéarité de l'espérance et le fait que:

equation   (7.102)

nous avons pour la covariance :

equation   (7.103)

et donc nous obtenons la relation très utilisée en statistiques et finance appelée "formule de la covariance"... :

equation   (7.104)

Indiquons également que si equation, nous retrouvons la formule de Huyghens:

equation   (7.105)

Ainsi, le terme de covariance equation est défini par l'expression:

equation   (7.106)

appelée "forme bilinéaire de la variance" ou "forme multivariée".

Remarque: Les statistiques peuvent être découpées selon le nombre de variables aléatoires que nous étudions. Ainsi, lorsqu'une seule variable aléatoire est étudiée, nous parlons de "statistique univariée", pour deux variables aléatoires de "statistique bivariée" et en général, de "statistique multivariée".

Si la covariance est univariée, nous avons dès lors: 

equation   (7.107)

Si et seulement si les variables sont équiprobables, nous la retrouvons la covariance dans la littérature sous la forme suivante qui découle de calculs que nous avons déjà fait ultérieurement avec l'espérance :

equation   (7.108)

La covariance est un indicateur de la variation simultanée de X et Y. En effet si, en général X et Y croissent simultanément, les produits equation seront positifs (corrélés positivement), tandis que si Y décroît lorsque X croît, ces même produits seront négatifs (corrélés négativement).

Soit equationun vecteur de composantes equation et equation un autre vecteur de composantes equation, tous deux étant des variables aléatoires, le calcul de la covariance des composantes deux à deux donnent ce que l'on appelle la "matrice des covariances" (outil très utilisé en finance et dans la gestion en général!).

Effectivement, si nous notons: 

equation   (7.109)

Nous pouvons dès lors écrire une matrice symétrique (le plus souvent dans la pratique elle est carrée) sous la forme:

equation   (7.110)

Cette matrice a comme propriété remarquable que si nous prenons deux vecteurs identiques (dont les composantes sont les mêmes variables aléatoires) et que nous calculons la matrice, alors la diagonale de cette dernière donnera les variances des composantes de vecteurs (voir les exemples dans le chapitre d'économétrie)! Raisons pour laquelle cette matrice est souvent appelée "matrices des variances-covariances".

Remarque: Cette matrice est très importante et nous la retrouverons fréquemment dans le chapitre d'Économétrie lors de notre étude da la théorie du portefeuille et dans les techniques de fouille de données (data mining, clustering) dans le chapitre de Méthodes numériques (l'analyse par composantes principales).

Rappelons maintenant que nous avions un axiome en probabilités (cf. chapitre de Probabilités) qui énonçait que deux événements A,B sont indépendants si :

equation   (7.111)

De la même façon, par extension, nous définissons l'indépendance des variables aléatoires discrètes.

Définition: Soit X,Y deux variables aléatoires discrètes. Nous disons que X, Y sont indépendantes si :

equation   (7.112)

Plus généralement, les variables discrètes equation sont indépendantes (en bloc) si :

equation.  (7.113)

L'indépendance de deux variables aléatoires implique que leur covariance est nulle (la réciproque est fausse!). Prouvons ceci dans le cas où les variables aléatoires ne prennent qu'un nombre fini de valeurs equation et equation respectivement, avec I, J des ensembles finis :

equation   (7.114)

et donc :

equation   (7.115)

Remarque: Donc plus la covariance est faible, plus les séries sont indépendantes. A l'inverse, plus la covariance est élevée, plus les séries sont liées.

Etant donné que :

equation   (7.116)

si X, Y sont indépendantes alors equation:

equation   (7.117)

De manière plus générale si equation sont indépendantes (en bloc) alors pour toute loi statistique (!) nous avons:

equation   (7.118)

Souvent en statistique, il est utile de déterminer l'écart-type de la moyenne empirique (ou en d'autres termes... : l'erreur quadratique moyenne). Voyons de quoi il s'agit :

Soit la moyenne d'une série de termes déterminés chacun par la mesure de plusieurs valeurs (il s'agit au fait de son estimateur dans un cas particulier comme nous le verrons beaucoup plus loin): 

equation    (7.119)

alors en utilisant les propriétés de l'espérance:

equation   (7.120)

et si toutes les variables aléatoires sont identiquement distribuées et indépendantes nous avons alors:

equation   (7.121)

Pour la variance, le même raisonnement s'applique:

equation   (7.122)

et si les variables aléatoires sont toutes identiquement distribuées:

equation   (7.123)

d'où l'écart-type de la moyenne appelé aussi "erreur-type", "erreur-standard" ou encore "variation non systématique":

equation   (7.124)

et il s'agit rigoureusement de l'écart-type de l'estimateur de la moyenne (c'est peut-être plus clair ainsi)!

Cette relation se trouve dans de nombreux logiciels dont dans les graphiques MS Excel (mais il n'y a pas de fonction intégrée), écrite avec l'écart-type (comme ci-dessus), soit avec la notation de la variance (suffit de mettre au carré...).

Signalons que la dernière relation peut-être utilisée même si la moyenne des n variables aléatoires n'est pas identique! La condition suffisante étant juste que les écarts-types soient tous égaux et c'est le cas de l'industrie (production).

Nous avons donc:

equation   (7.125)

equation désigne la somme des n variables aléatoires et equation leur moyenne.

La variable centrée réduite que nous avions introduite plus haut:

equation   (7.126)

peut alors s'écrire de plusieurs manières:

equation   (7.127)

Par ailleurs, en supposant que le lecteur sait déjà ce qu'est une loi normale equation, nous démontrerons plus loin en détails car c'est extrêmement important (!) que la loi de probabilité de la variable aléatoire equation, moyenne de n variables aléatoires identiquement distribuées et linéairement indépendantes, est alors la loi:

equation   (7.128)

Maintenant, considérons X et Y deux variables aléatoires ayant pour covariance:

equation   (7.129)

Nous avons:

equation   (7.130)

nous allons démontrer cette relation immédiatement car l'utilisation de la covariance seule pour l'analyse des données n'est pas géniale car elle n'est pas à proprement parler bornée et simple d'usage (au niveau de l'interprétation). Nous allons donc construire un indicateur plus facile d'usage en entreprise.

Démonstration:

Choisissons une constante a quelconque et calculons la variance de :

equation   (7.131)

Nous pouvons alors immédiatement écrire à l'aide des propriétés de la variance et de l'espérance:

equation   (7.132)

La quantité de droite est positive et nulle en tout a par construction de la variance (de gauche). Donc le discriminant de l'expression, vue comme un trinôme en a du type:

equation   (7.133)

Donc pour que P(a) soit positif pour tout a nous avons comme seule possibilité que:

equation   (7.134)

Soit après simplification:

equation   (7.135)

equationC.Q.F.D.

Ce qui nous donne:

equation   (7.136)

Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-Schwarz" :

equation   (7.137)

Si les variances de X et Y sont non nulles, la corrélation entre X et Y est définie par le "coefficient de corrélation linéaire" :

equation   (7.138)

ce qui peut aussi s'écrire sous forme développée (en utilisant la formule de Huyghens) :

equation   (7.139)

ou encore plus condensée :

equation   (7.140)

Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre sans unité, compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire de X et Y et ou, géométriquement, le plus ou moins grand aplatissement. Un coefficient de corrélation nul ou proche de 0 signifie qu'il n'y a pas de relation linéaire entre les caractères. Mais il n'entraîne aucune notion d'indépendance plus générale.

Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement corrélés. Il faut prendre garde à la confusion fréquente entre corrélation et causalité. Cependant, que deux phénomènes soient corrélés n'implique en aucune façon que l'un soit cause de l'autre.

Ainsi:

- Si equation nous avons affaire à une corrélation négative dite "corrélation négative parfaite" (tous les points de mesures sont situés sur une droite de régression de pente négative).

- Si equation nous avons affaire à une corrélation négative ou positive dite "corrélation imparfaite" ou la relation linéaire sera respectivement décroissante ou croissante.

- Si equation la corrélation est nulle... (pas de relation linéaire).

- Si equation nous avons affaire à une corrélation positive dite "corrélation positive parfaite" (tous les points de mesures sont situés sur une droite de régression de pente positive).

L'analyse de régression et de corrélation poursuit donc deux objectifs:

1. Déterminer le degré d'association entre les différentes variables: celui-ci est exprimé par le coefficient de détermination, qui est le carré du coefficient de corrélation. Le coefficient de détermination mesure la contribution d'une des variables à l'explication de la seconde.

2. Déterminer les caractéristiques de cette association, c'est-à-dire des paramètres equation et equation de la droite de régression (voir la section d'analyse numérique du site au chapitre des algorithmes traitant de la régression linéaire). Si l'on peut faire valablement l'hypothèse de la stabilité du processus générateur des couples de valeurs des deux variables, la connaissance de ces paramètres permettrait de prédire le comportement du phénomène étudié

En utilisant les expressions de la moyenne et de l'écart-type de variables équiprobables tel que démontré plus haut, nous passons de :

equation   (7.141)

à :

equation   (7.142)

où nous voyons que la covariance devient alors la moyenne des produits moins le produit des moyennes.

Soit après simplification :

equation   (7.143)

et peut être calculé dans MS Excel avec entre autres la fonction COEFFICIENT.CORRELATION( ).

Remarques:

R1. Dans la littérature le coefficient de corrélation est souvent appelée "coefficient d'échantillonnage de Pearson" (dans le cas équiprobable) ou "test de Bravais-Pearson" (dans le cas non équiprobable) et lorsque nous le portons au carré, nous parlons alors de "coefficient de détermination".

R2. Souvent le carré de ce coefficient est un peu abusivement interprété comme le % de variation expliqué de la variable étudiée Y par la variable explicative X.

Enfin, à noter que nous avons donc la relation suivante qui est énormément utilisée dans la pratique (voir le chapitre d'Économétrie pour des exemples fameux!):

equation   (7.144)

ou sa version avec l'écart-type:

equation   (7.145)

exempleExemple:

Une compagnie aérienne a à sa disposition 120 sièges qu'elle réserve pour des passagers en correspondance venant de deux autres vols arrivés un peu plus tôt dans la journée et en partance pour Francfort. Le premier vol arrive de Manille et le nombre de passagers à son bord suit une loi Normale de moyenne 50 et de variance 169. Le second vol arrive de Taïpei et le nombre de passagers à son bord suit une loi Normale de moyenne 45 et de variance 196.

Le coefficient de corrélation linéaire entre le nombre de passagers des deux vols est de:

equation   (7.146)

La loi que suit le nombre de passagers pour Francfort si nous supposons que la loi du couple suit elle aussi une loi Normale est (nous utilisons la propriété de stabilité de la loi Normale qui sera démontrée plus loin):

equation   (7.147)

avec:

equation   (7.148)

et:

equation   (7.149)

ce qui donne:

equation   (7.150)

VARIABLES CONTINUES

Définitions:

D1. Nous disons que X est une variable continue si sa "fonction de répartition" est continue. La fonction de répartition de X étant définie par:

equation   (7.151)

soit la probabilité cumulée que la variable aléatoire X soit plus petite ou égale à la valeur x fixée. Nous avons aussi bien évidemment equation.

D2. Si de plus la fonction de répartition F de X est continûment dérivable de dérivée equation appelée "fonction de densité" ou "fonction de masse" ou encore "fonction de distribution" alors nous disons que X est absolument continue et dans ce cas nous avons:

equation   (7.152)

avec la condition de normalisation:

equation   (7.153)

Toute fonction de distribution de probabilité doit satisfaire l'intégrale de normalisation dans son domaine de définition!

Remarque: Il est intéressant de remarquer que la définition amène à ce que la probabilité qu'une variable aléatoire totalement continue prenne une valeur donnée est nulle! Donc ce n'est pas parce qu'un événement à une probabilité nulle qu'il ne peut arriver!!!

La moyenne ayant été définie par la somme pour une variable discrète, elle devient une intégrale pour une variable continue:

equation   (7.154)

et la variance s'écrit donc :

equation   (7.155)

Nous avons alors aussi la médiane qui est logiquement redéfinie dans le cas d'une variable aléatoire continue par:

equation   (7.156)

et elle coïncide rarement avec la moyenne!

Souvent les statisticiens utilisent les mêmes notations pour l'espérance mathématique d'une variable continue:

  equation   (7.157)

et pour la variance:

equation   (7.158)

que pour une variable discrète.

Par la suite, nous calculerons ces différents termes avec développements uniquement dans les cas les plus usités.

FONCTIONS DE DISTRIBUTIONS

Lorsque nous observons des phénomènes probabilistes, et que nous prenons note des valeurs prises par ces derniers et que nous les reportons graphiquement, nous observons toujours que les différentes mesures obtenues suivent une caractéristique courbe ou droite typique fréquemment reproductible.

Dans le domaine des probabilités et statistiques, nous appelons ces caractéristiques des "fonctions de distribution" car elles indiquent la fréquence avec laquelle la variable aléatoire apparaît avec certaines valeurs.

Remarque: Nous utilisons aussi simplement le terme "fonction" ou encore "loi" pour désigner ces caractéristiques.

Ces fonctions sont en pratique bornées par ce que nous appelons "l'étendue de la distribution", ou "dispersion de la distribution", qui correspond à la différence entre la donnée maximale (à droite) et la donnée minimale (à gauche) des valeurs observées :

equation   (7.159)

Si les valeurs observées se distribuent d'une certaine manière c'est qu'elles ont alors une probabilité d'avoir une certaine valeur de la fonction de distribution.

Dans la pratique industrielle (cf. chapitre de Génie Industriel), la dispersions de valeurs statistiques est important parce qu'elle donne une indication sur la vairation d'un processus (variablité).

Définitions:

D1. La relation mathématique qui donne la probabilité qu'a une variable aléatoire d'avoir une valeur donnée de la fonction de distribution est appelée "fonction de densité", "fonction de masse" ou encore "fonction marginale".

D2. La relation mathématique qui donne la probabilité cumulée qu'a une variable aléatoire d'être inférieure ou égale à une certaine valeur est nommée la "fonction de répartition" ou "fonction cumulée".

D3. Des variables aléatoires sont dites "indépendantes et identiquement distribuées" (i.i.d.) si elles suivent toutes la même fonction de distribution et qu'elles sont indépendantes...

Remarque: Le lecteur pourra trouver la fonction de distribution de Weibull (ou "loi de Weibull") dans le chapitre traitant du Génie Industriel (section sur l'Ingénierie).

De telles fonctions étant très nombreuses dans la nature, nous proposons au lecteur une étude détaillée des plus connues seulement.

FONCTION DISCRÈTE UNIFORME

Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons concevoir des situations où nous pouvons supposer a priori que tous les événements élémentaires sont équiprobables (c'est-à-dire qu'ils ont même probabilité). Nous utilisons alors le rapport entre le nombre de cas favorables et le nombre de cas possibles pour calculer la probabilité de tous les événements de l'Univers des événements U. Plus généralement si U est un ensemble fini d'événements équiprobables et A une partie de U nous avons sous forme ensembliste :

equation   (7.160)

Plus communément, soit e un événement pouvant avoir N issues équiprobables possibles. Alors la probabilité d'observer l'issue donnée de l'événement suit une "fonction discrète uniforme" (ou "loi discrète uniforme") donnée par la relation :

equation   (7.161)

Ayant pour espérance (ou moyenne) :

equation   (7.162)

Si nous nous mettons dans le cas particulier où equation avec equation. Nous avons alors (cf. chapitre de Suites et Séries):

equation   (7.163)

Et pour variance:

 equation   (7.164)

exempleExemple:

Tracé de la fonction de distribution et respectivement de répartition pour la loi discrète uniforme de paramètres {1,5,8,11,12} (nous voyons que chaque valeur a bien une probabilité équiprobable) :

equationequation
  (7.165)

FONCTION DE BERNOULLI

Si nous avons affaire à une observation binaire alors la probabilité d'un événement reste constant d'une observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de variables de Bernoulli, deux à deux indépendantes).

Nous appelons ce genre d'observations où la variable aléatoire à valeurs 0 ou 1, avec probabilité (1-p), p respectivement, des "essais de Bernoulli" avec "événements contraires à probabilités contraires". 

Ainsi, une variable aléatoire X suit une "fonction de Bernoulli" (ou "loi de Bernoulli") si elle ne peut prendre que les valeurs 0 ou 1, associées aux probabilités q et p de sorte que equation et:

equation   (7.166)

L'exemple classique d'un tel processus est le jeu de pile de face ou de tirage avec remise. Il est inutile de vérifier formellement que la probabilité cumulée est unitaire...

Remarquons que par extension, si nous considérons N événements où nous obtenons dans un ordre particulier k fois une des issues possible (réussite) et N-k l'autre (échec), alors la probabilité d'obtenir une telle série (de k réussites et N-k échecs ordonnées dans un ordre particulier) sera donnée par:

 equation   (7.167)

conformément à ce que nous avions vu obtenu en combinatoire dans le chapitre de Probabilités!

exempleExemple:

Tracé de la fonction pour equation :

equation
  (7.168)

La fonction de Bernoulli a donc pour espérance (moyenne):

equation   (7.169)

et pour variance (nous utilisons la formule de Huyghens démontrée plus haut):

equation   (7.170)

Remarque: L'exemple ci-dessus n'est certes par pertinent mais nous verrons dans le chapitre de Techniques De Gestion que la fonction de Bernoulli apparaît naturellement au début de notre étude des files d'attentes.

FONCTION GÉOMÉTRIQUE

La loi géométrique ou "loi de Pascal" consiste dans une épreuve de type Bernoulli, dont la probabilité de succès est p et celle d'échec equation sont constantes, que nous renouvelons de manière indépendante jusqu'au premier succès.

Si nous appelons X la variable aléatoire donnant le rang du premier succès la probabilité que equation est alors (cas particulier de la fonction de Bernoulli):

equation   (7.171)

avec equation.

Cette loi a pour espérance:

equation   (7.172)

Or, cette dernière relation s'écrit aussi (car c'est une simple série géométrique):

equation   (7.173)

Effectivement, nous avons démontré dans le chapitre sur les Suites et Séries que :

equation   (7.174)

En prenant la limite lorsque equation nous obtenons :

equation   (7.175)

car equation.

Ensuite, il suffit de dériver les deux membres de l'égalité par rapport à q et nous obtenons :

equation   (7.176)

Nous avons donc le nombre moyen d'essais X qu'il faut faire pour arriver au premier succès:

equation   (7.177)

Calculons maintenant la variance en rappelant comme à chaque fois que (formule de Huyghens):

equation   (7.178)

Commençons donc par calculer equation :

equation
  (7.179)

Le dernier terme de cette expression est l'équivalent de l'espérance calculée précédemment. Soit :

equation   (7.180)

Il reste à calculer :

equation   (7.181)

Nous avons :

equation   (7.182)

Or en dérivant l'égalité :

equation   (7.183)

Nous obtenons :

equation   (7.184)

Par conséquent :

equation   (7.185)

Donc :

equation   (7.186)

Pour finir :

equation   (7.187)

exemple Exemple:

E1. Vous essayez, tard dans la nuit et dans l'obscurité, d'ouvrir une serrure au moyen d'un trousseau de 5 clés, sans porter attention, car vous êtes un peu fatigué (ou un peu éméché...) vous essayez chaque clé. Sachant qu'une seule convient, quelle est la probabilité d'utiliser la bonne clé au k-ème essai?

equation   (7.188)

E2. Tracé de la fonction de distribution et répartition pour la fonction Géométrique de paramètre equation:

equation equation
  (7.189)

Déterminons maintenant la fonction de répartition de la loi géométrique. Nous partons donc de:

equation   (7.190)

nous avons alors par définition la probabilité que l'expérience réussisse dans les n premiers essais:

equation   (7.191)

avec n entier valant 0...1...2, etc.

Posons:

equation   (7.192)

Nous avons alors:

equation   (7.193)

FONCTION BINOMIALE

Si nous revenons maintenant à notre épreuve de Bernoulli. Plus généralement, tout N-uplet particulier formé de k succès et de N-k échecs aura pour probabilité (dans le cadre d'un tirage avec remise ou sans remise si la population est grande en première approximation...):

equation   (7.194)

d'être tiré (ou d'apparaître) quel que soit l'ordre d'apparition des échecs et réussites.

Mais, nous savons que la combinatoire permet de déterminer le nombre de N-uplets de ce type (le nombre de manières d'ordonner les apparitions d'échecs et de réussites). Le nombre d'arrangements possibles étant, nous l'avons démontré (cf. chapitre Probabilités), donné par la binomiale :

equation   (7.195)

Donc comme la probabilité d'obtenir une série de k succès et N-k échecs particuliers est toujours identique (quelque soit l'ordre) alors il suffit de multiplier la probabilité d'une série particulière par la combinatoire (cela étant équivalent à faire à une somme):

equation   (7.196)

pour avoir la probabilité totale d'obtenir une quelconque de ces séries possibles (puisque chacune est possible).

Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) simple avec contrainte sur l'ordre ou à l'étude d'une série de succès ou d'échecs. Nous utiliserons cette relation dans le cadre de la théorie des files d'attentes ou en fiabilité. Il faut noter que dans le cas de grandes populations, même si le tirage n'est pas avec remise il est considéré comme tel...

Ecrite autrement ceci donne la "fonction Binomiale" (ou "loi Binomiale") connue aussi sous la forme de la fonction de distribution suivante:

equation   (7.197)

et parfois notée:

equation   (7.198)

et peut être calculée dans MS Excel à l'aide de la fonction LOI.BINOMIALE( ).

Nous disons parfois que la loi Binomiale est non exhaustive car la taille de la population initiale n'est pas apparente dans l'expression de la loi.

exempleExemple:

Nous souhaitons tester l'alternateur d'un groupe électrogène. La probabilité de défaillance à la sollicitation de ce matériel est estimée à 1 défaillance pour 1'000 démarrages.

Nous décidons d'effecteur un test de 100 démarrages. La probabilité d'observer 1 panne au cours de ce test est de:

equation   (7.199)

Nous avons bien évidemment pour la fonction de répartition (très utile dans la pratique comme le contrôle de lots de fournisseurs ou la fiabilité!): 

equation   (7.200)

Effectivement, nous avons démontré dans le chapitre de Calcul Algébrique que:

equation   (7.201)

Donc:

equation   (7.202)

Il vaut mieux utiliser MS Excel pour ne pas s'embêter à calculer ce genre de relations (ou tout autre logiciel largement répandu) en utilisant la fonction CRITERE.LOI.BINOMIALE( ).

L'espérance mathématique (moyenne) de P(N,k) est:

 equation   (7.203)

Or:

equation   (7.204)

d'où:

equation   (7.205)

donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée de probabilité p après N essais.

Avant de calculer la variance, introduisons la relation suivante:

equation   (7.206)

En effet, en utilisant les développements précédents:

equation   (7.207)

Commençons maintenant le (long) calcul de la variance dans lequel nous allons utiliser les résultats précédents:

equation
  (7.208)

L'écart-type étant equation, nous avons : 

equation   (7.209)

exempleExemple:

Tracé de la fonction de distribution et respectivement de répartition de la loi binomiale equation:

equationequation
  (7.210)

FONCTION HYPERGÉOMÉTRIQUE

Nous considérons pour approche à cette fonction un exemple simple concernant une urne contenant n boules dont m sont noires et les autres m' blanches (pour un exemple concret utilisé dans l'industrie se reporter au chapitre de Génie Industriel). Nous tirons successivement, et sans les remettre dans l'urne, p boules. Quelle est la probabilité que parmi ces p boules, il y en ait k qui soient noires (dans cet énoncé l'ordre du tirage ne nous intéresse donc pas!).

Nous parlons souvent de "tirage exhaustif" avec la loi hypergéométrique car contrairement à la loi binomiale, la taille du lot qui sert de base au tirage va apparaître dans la loi. Raison pour laquelle la loi hypergéométrique tend vers les valeurs de la loi normale lorsque la taille du lot est petite.

Remarque: Cela équivaut à l'étude non ordonnée d'un tirage sans remise (cf. chapitre de Probabilités) avec contrainte sur les occurrences appelé parfois "tirage simultané". Nous utiliserons cette relation souvent dans le domaine de la qualité ou de la fiabilité ou les boules noires sont associées à des éléments avec défauts et les blanches à des éléments sans défauts.

Les p boules peuvent être choisies parmi les n boules de equation façons (représentant donc le nombre de tirages différents possibles) avec pour rappel (cf. chapitre de Probabilités) :

equation   (7.211)

Les k boules noires peuvent être choisies parmi les m noires de equation façons. Les p-k boules blanches peuvent être elles choisies de equation façons. Il y a donc equation tirages qui donnent k boules noires et p-k boules blanches.

La probabilité recherchée vaut donc:

equation   (7.212)

et est dite suivre une "fonction Hypergéométrique" (ou "loi Hypergéométrique") et peut être obtenue heureusement de manière directe dans MS Excel avec la fonction LOI.HYPERGEOMETRIQUE( ).

exempleExemples:

E1. Nous souhaitons mettre en production un petit développement informatique de 10'000 lignes de code. Le retour d'expérience) montre que la probabilité de défaillance est de 1 bug pour 1'000 lignes de code.

Nous testons environ 50% des fonctions du logiciel au hasard avant l'envoi au client (soit l'équivalent de 5'000 lignes de code). La probabilité d'observer 5 bugs est avec MS Excel:

=LOI.HYPERGEOMETRIQUE(5;5000;10000;10000)=24.62%

E2. Dans une petite production unique d'un lot de 1'000 pièces dont nous savons que 30% en moyenne sont mauvaises à cause de la complexité des pièces par retour d'expérience d'un fabrication précédente similaire. Nous savons qu'un client va en tirer 20 au hasard pour décider d'accepter ou de rejeter le lot. Il ne rejettera pas le lot s'il trouve zéro pièce défectueuse parmi ces 20. Quelle est la probabilité d'en avoir exactement 0 de défectueuse?

=LOI.HYPERGEOMETRIQUE (0;20;300;1000)=0.073%

et comme on exige un tirage nul, le calcul de la loi hypergéométrique se simplifie en:

equation   (7.213)

Il n'est pas interdit de faire le calcul direct de l'espérance et de la variance la fonction hypergéométrique mais le lecteur pourra sans trop de peine imaginer que ce calcul va être... relativement indigeste. Alors nous pouvons utiliser une méthode indirecte qui de plus est intéressante.

D'abord le lecteur aura peut-être, même certainement, remarqué qu'au fait l'expérience de la loi hypergéométrique est une série d'essais de Bernoulli (sans remise bien entendu!).

Alors, nous allons tricher en utilisant dans un premier temps la propriété de linéarité de l'espérance. Définissons pour cela une nouvelle variable correspondant implicitement au fait à l'expérience da la fonction hypergéométrique (k essais de Bernoulli de suite!) :

equation   (7.214)

equation représente la réussite d'obtenir au i-ème tirage une boule noire (soit 0 ou 1). Or, nous savons que pour tout i la variable aléatoire equation suit une fonction de Bernoulli pour laquelle nous avons démontré lors de notre étude de la loi de Bernoulli que equation. Dès lors, de par la propriété de linéarité de l'espérance nous avons :

equation   (7.215)

Or, dans l'essai de Bernoulli, p est la probabilité d'obtenir l'élément recherché (pour rappel...). Dans la loi hypergéométrique ce qui nous intéresse est la probabilité d'avoir une boule noire (qui sont en quantité m, avec donc m' boules blanches) par rapport à la quantité totale de boules n. Et le rapport nous donne évidemment cette probabilité. Ainsi, nous avons :

equation   (7.216)

k est le nombre de tirages (attention à ne pas confondre avec l'énoncé initial!). Cette moyenne donne donc le nombre moyen de boules noires lors d'un tirage de k boules parmi n.

Pour déterminer la variance, nous allons utiliser la variance de la fonction de Bernoulli et la relation suivante démontrée lors de l'introduction de l'espérance et de la covariance au début de ce chapitre :

equation   (7.217)

Dons en rappelant que nous avons equation il vient:

equation   (7.218)

Or, pour la loi de Bernoulli, nous avons:

equation   (7.219)

Alors nous avons déjà:

equation   (7.220)

Ensuite, nous avons facilement:

equation   (7.221)

Le calcul de equation nécessite une bonne compréhension des probabilités (c'est un bon rappel!).

L'espérance equation est donnée (implicitement) par la somme pondérée des probabilités que deux événements aient lieu en même temps comme nous le savons. Or, nos événements sont binaires: soit c'est une boule noire (1) soit c'est une boule blanche (0). Donc tous les termes de la somme n'ayant pas deux boules noirs consécutivement seront nuls!

Le problème est alors de calculer la probabilité d'avoir deux boules noires consécutives et celle-ci s'écrit donc:

equation   (7.222)

Donc nous avons finalement:

equation   (7.223)

Soit:

equation   (7.224)

Finalement:

equation   (7.225)

où nous avons utilisé le fait que:

equation   (7.226)

est composé de:

equation   (7.227)

terme puisqu'il correspond au nombre de façons qu'il y a de choisir le couple (i, j) avec equation.

Donc finalement:

equation   (7.228)

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction Hypergéométrique de paramètre equation:

equation equation
  (7.229)

FONCTION MULTINOMIALE

La loi binomiale concerne le nombre de succès dans N épreuves de Bernoulli indépendantes donnant chacune un résultat binaire, comme dans le jeu de pile ou face. La loi multinomiale est une généralisation de celle-ci, applicable par exemple à N jets d'un dé à six faces. Contrairement à ces exemples simples, les différentes possibilités ne sont en plus généralement pas équiprobables.

Considérons une approche à nouveau par l'exemple :

Soit l'espace des événements equation muni d'une probabilité equation. Nous tirons n fois de suite avec remise un élément de equation avec la probabilité equation. Quelle est la probabilité d'obtenir le nombre 1, equation fois le nombre 2, equation fois, sur une suite d'un tirage de n éléments.

Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) avec contraintes sur les occurrences. Donc sans contraintes nous verrons par l'exemple que nous retombons sur un tirage avec remise simple.

Nous avons vu dans le chapitre de Probabilités, que si nous prenons un ensemble d'événements ayant plusieurs issues, alors les différentes combinaisons de suites que nous pouvons obtenir en prenant p éléments choisis parmi n est:

equation   (7.230)

Il y a donc :

equation  (7.231)

façons différentes d'obtenir equation fois un certain événement. Ensuite, en associant ce que nous avons vu pour la loi binômiale il vient:

Il y a ensuite : 

equation  (7.232)

façons différentes d'obtenir equation un second événement  puisque dans l'ensemble de la suite, de n éléments déjà equation on été tirés ce qui fait qu'il n'en reste plus equation sur lesquels nous pouvons obtenir les equation voulus.

Nous avons alors selon la loi binômiale:

equation   (7.233)

et:

equation   (7.234)

Alors nous avons dans le cas particulier de deux séries d'uplets:

equation   (7.235)

et comme:

equation   (7.236)

il vient:

equation   (7.237)

Ainsi, par récurrence nous avons la probabilité probabilité P recherchée appelée "fonction Multinomiale" (ou "loi Multinomiale") et donnée par :

equation   (7.238)

dans des logiciels comme MS Excel, le terme:

equation   (7.239)

appelé "coefficient multinomial" est disponible sous le nom de la fonction MULTINOMIALE( ).

exempleExemples:

E1. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité que les six faces apparaissent le même nombre de fois (mais pas nécessairement conséctivement!):

equation   (7.240)

où nous voyons bien que m correspond au nombre de groupes de réussites.

E2. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité qu'une seule et unique face apparaisse 12 fois (donc que le "1" apparaisse 12 fois de suite, ou le "2", ou le "3", etc.):

equation   (7.241)

Nous retrouvons donc avec ce dernier exemple un résultat connu de la binomiale.

FONCTION DE POISSON

Pour certains événements forts rares, la probabilité p est très faible et tend vers zéro. Toutefois la valeur moyenne equation tend vers une valeur fixe lorsque n tend vers l'infini.

Nous partirons donc d'une distribution binomiale de moyenne equation que nous supposerons finie lorsque n tend vers l'infini.

La probabilité de k réussites lors de n épreuves vaut (loi Binomiale) : 

equation   (7.242)

En posant equation (où m est temporairement la nouvelle notation pour la moyenne selon equation), cette expression peut s'écrire:

equation   (7.243)

En regroupant les termes, nous pouvons mettre la valeur de equation sous la forme:

equation   (7.244)

Nous reconnaissons que, lorsque n tend vers l'infini, le deuxième facteur du produit a pour limite equation.

Quant au troisième facteur, puisque nous nous intéressons aux petites valeurs de k (la probabilité de réussite est très faible), sa limite pour n tendant vers l'infini vaut 1.

Cette technique de passage à la limite est parfois appelée dans ce contexte: "théorème limite de Poisson".

Nous obtenons ainsi la "fonction de Poisson" (ou "loi de Poisson"), appelée également parfois "loi des événements rares", donnée donc par:

equation   (7.245)

qui peut être obtenu dans MS Excel avec la fonction LOI.POISSON( ).

Il s'agit bien d'une loi de probabilité puisque en utilisant les séries de Taylor, nous montrons que la somme des probabilités cumulées est bien:

equation   (7.246)

Remarque: Nous retrouverons fréquemment cette loi dans différents chapitres du site comme par exemple lors de l'étude du Génie Industriel en maintenance préventive ou encore dans le même chapitre lors de l'étude des théories des files d'attentes (le lecteur peut s'y reporter pour un exemple intéressant et pragmatique) et enfin dans le domaine de l'assurance.

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction de Poisson de paramètre equation:

equationequation
  (7.247)

Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est petite et constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test d'acceptabilité et fiabilité, et contrôles statistiques de qualité. Entre autres, elle s'applique aux processus tels que l'émission des quanta de lumière par des atomes excités, le nombre de globules rouges observés au microscope, le nombre d'appels arrivant à une centrale téléphonique. La distribution de Poisson est valable pour de nombreuses observations faites en physique nucléaire ou corpusculaire.

L'espérance (moyenne) de la fonction de Poisson est (nous utilisons la série de Taylor de l'exponentielle):

equation   (7.248)

et donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée.

Ce résultat peut paraître déroutant.... la moyenne s'exprime par la moyenne??? Oui il ne faut simplement pas oublier que celle-ci est donnée au début par:

equation   (7.249)

Remarque: Pour plus de détails le lecteur peut aussi se reporter à la partie concernant les "estimateurs" dans le présent chapitre.

La variance de la fonction de distribution de Poisson est elle donnée par (en utilisant à nouveau les séries de Taylor):

equation
  (7.250)

toujours avec:

equation   (7.251)

Les lois théoriques de distribution statistiques sont établies en supposant la réalisation d'un nombre infini de mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini N. D'où la nécessité d'établir des correspondances entre les valeurs utiles théoriques et expérimentales. Pour ces dernières nous n'obtenons évidemment qu'une approximation dont  la validité est toutefois souvent admise comme suffisante.

FONCTION DE GAUSS-LAPLACE/LOI NORMALE

Cette caractéristique est la plus importante fonction de distribution en statistiques suite au résultat d'un théorème connu appelé "théorème central limite" qui comme nous le verrons, permet de démontrer (entre autres) que toute suite de variables aléatoires indépendantes de même loi ayant une espérance et un écart-type fini et non nécessairement égaux converge vers une fonction de Gauss-Laplace (loi Normale).

Il est donc très important de focaliser particulièrement sont attention sur les développements qui vont être faits ici!

Partons d'une fonction Binomiale et faisons tendre le nombre n d'épreuves vers l'infini. Si p est fixé au départ, la moyenne equation tend également vers l'infini, de plus l'écart-type equation tend également vers l'infini.

Remarque: Le cas où p varie et tend vers 0 tout en laissant fixe la moyenne equation ayant été étudié lors de la présentation de la fonction de Poisson.

Si nous voulons calculer la limite de la fonction Binomiale, il s'agira donc de faire un changement d'origine qui stabilise la moyenne, en 0 par exemple, et un changement d'unité qui stabilise l'écart-type, à 1 par exemple.

Voyons tout d'abord comment varie equation en fonction de k (nombre de réussites) et calculons la différence:

equation   (7.252)

Nous en concluons que equation est une fonction croissante de k, tant que equation est positif (pour n, p et q fixés). Pour le voir il suffit de prendre quelques valeurs (du membre de droite de l'égalité) ou d'observer la distribution graphique de la fonction Binomiale en se souvenant bien que:

equation   (7.253)

Comme equation il est par conséquent évident que la valeur de k voisine de la moyenne equation constitue le maxima de equation.

D'autre part la différence equation est le taux d'accroissement de la fonction equation. Nous pouvons alors écrire :

equation   (7.254)

comme étant la pente de la fonction.

Définissons maintenant une nouvelle variable aléatoire telle que sa moyenne soit nulle (variations négligeables) et son écart-type unitaire (une variable centrée-réduite en d'autres termes). Nous avons alors :

equation

Nous avons alors aussi avec cette nouvelle variable:

 equation   (7.255)

Appelons F(x) l'expression de equation calculée en fonction de la nouvelle variable de moyenne nulle et d'écart-type unitaire dont nous recherches l'expression quand n tend vers l'infini.

Reprenons:

equation   (7.256)

Afin de simplifier l'étude de cette relation quand n tend vers l'infini et k vers l'espérance, multiplions des deux côtés par equation:

equation   (7.257)

Récrivons le terme de droite de l'égalité. Il vient alors:

equation   (7.258)

Et maintenant récrivons le terme de gauche de la relation antéprécédente. Il vient:

equation

Après un passage à la limite pour n tendant vers l'infini nous avons dans un premier temps pour le terme antéprécédent:

equation   (7.259)

Donc:

equation   (7.260)

et dans un second temps, tenant compte du fait que les valeurs de k considérées se trouvent alors au voisinage de l'espérance np, nous obtenons:

equation   (7.261)

et:

equation   (7.262)

Donc:

equation   (7.263)

et comme:

equation   (7.264)

Nous avons finalement:

equation   (7.265)

Cette relation peut encore s'écrire en réarrangeant les termes: 

equation   (7.266)

et en intégrant les deux membres de cette égalité nous obtenons (cf. chapitre de Calcul Différentiel Et Intégral) :

equation   (7.267)

La fonction suivante est une des solutions de la relation précédente: 

equation   (7.268)

Effectivement:

equation   (7.269)

La constante est déterminée par la condition que:

equation   (7.270)

qui représente la somme de toutes les probabilités, vaille 1. Nous pouvons montrer pour cela que :

equation   (7.271)

Démonstration:

Nous avons:

equation   (7.272)

Donc concentrons-nous sur le dernier terme de l'égalité. Ainsi:

equation   (7.273)

puisque equation est une fonction paire (cf. chapitre d'Analyse Fonctionnelle). Ecrivons maintenant le carré de l'intégrale de la manière suivante:

equation   (7.274)

et faisons un changement de variable en passant en coordonnées polaires, dès lors nous faisons aussi usage du Jacobien dans ses mêmes coordonnées (cf. chapitre de Calcul Différentiel Et Intégral) :

equation   (7.275)

Par extension pour equation nous avons:

equation   (7.276)

equationC.Q.F.D.

Nous obtenons donc la "loi normale centrée réduite" notée:

equation   (7.277)

qui peut être calculée dans MS Excel avec la fonction LOI.NORMALE.STANDARD( ) ou pour la réciproque par LOI.NORMALE.STANDARD.INVERSE( ).

Pour information, une variable suivant une loi Normale centrée réduite est très souvent par tradition notée Z (pour "Zentriert" en allemand).

En revenant aux variables non normées:

equation   (7.278)

nous obtenons donc la "fonction Gauss-Laplace" (ou "loi de Gauss-Laplace") ou également appelée "loi Normale" :

equation   (7.279)

souvent notée N(equation,equation) qui peut être calculée dans MS Excel avec la fonction LOI.NORMALE( ) ou pour la réciproque par LOI.NORMALE.INVERSE( ).

La probabilité cumulée de valoir une certaine valeur k étant bien évidemment donnée par :

equation   (7.280)

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction Normale de paramètresequation:

equationequation
  (7.281)

Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de phénomènes aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne equation (c'est important de s'en souvenir).

Montrons maintenant que equation représente bien l'espérance mathématique (ou la moyenne) de x (c'est un peu bête mais on peut quand même vérifier...):

equation   (7.282)

Posons :

equation   (7.283)

Nous avons dès lors :

equation   (7.284)

Calculons la première intégrale:

equation   (7.285)

Donc il vient au final:

equation   (7.286)

Remarques:

R1. Le lecteur pourrait trouver cela déroutant dans un premier temps que le paramètre d'une fonction soit un des résultats que nous cherchons de la fonction. Ce qui dérange est la mise en pratique d'une telle chose. Au fait, tout s'éclairera lorsque nous étudierons plus loin dans ce chapitre les concepts "d'estimateurs de vraisemblance".

R2. Indiquons que dans la pratique (finance, qualité, assurance, etc.) il est fréquent de devoir calculer l'espérance uniquement pour des valeurs positives de la variable aléatoire qui est définie alors naturellement comme étant "l'espérance positive" et donnée par:

equation   (7.287)

Nous en verrons un exemple pratique dans le chapitre d'Économétrie lors de notre étude du modèle théorique de la spéculation de Louis Bachelier.

Montrons aussi (...) que equation représente bien l'écart type de X (il convient, en d'autres termes de montrer que equation) et pour cela rappelons que nous avions démontré que (formule de Huyghens):

equation   (7.288)

Nous avons déjà calculé tout à l'heure equation commençons alors par calculer equation :

equation   (7.289)

Posons equation qui conduit dès lors à :

equation   (7.290)

Or, nous savons :

equation   (7.291)

Il reste donc à calculer la première intégrale. Pour cela, procédons par une intégration par parties (cf. chapitre de Calcul Différentiel et Intégral) :

equation   (7.292)

D'où :

equation   (7.293)

Il vient finalement :

equation   (7.294)

Une signification supplémentaire de l'écart-type dans la loi de Gauss-Laplace est une mesure de la largeur de la distribution telle que (cela ne peut se vérifier qu'à l'aide d'intégration à l'aide de méthodes numériques) que toute moyenne et pour tout écart-type non nul nous avons:

equation
  (7.295)

La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes d'une mesure. La présentation d'un résultat comme equation signifie que la valeur moyenne a environ 68.3% de chance (probabilité) de se trouver entre les limites de equation et equation, ou qu'elle a 95.5% de se trouver entre equation et equation etc.

Remarque: Ce concept est beaucoup utilisé en gestion de la qualité en entreprise particulièrement avec le concept industriel anglo-saxon Six Sigma (cf. chapitre de Génie Industriel) qui impose une maîtrise de 6equation autour de chaque côté (!) de la moyenne des côtés des pièces fabriquées (ou tout autre sujet dont on mesure la déviation).

Niveau de qualité Sigma

Taux de non-défection assuré en %

Taux de défection en parties par million

1equation

68.26894

317'311

2equation

95.4499

45'500

3equation

99.73002

2'700

4equation

99.99366

63.4

5equation

99.999943

0.57

6equation

99.9999998

0.002

Tableau: 7.4  - Niveau de qualité Sigma avec taux de défection/non-défection

La deuxième colonne du tableau peut facilement être obtenue avec Maple. Par exemple pour la première ligne:

>S:=evalf(int(1/sqrt(2*Pi)*exp(-x^2/2),x=-1..1));

et la première ligne de la troisième colonne par:

>(1-S)*1E6;

Si la loi Normale est décentrée, il suffirait alors d'écrire pour la deuxième colonne:

>S:=evalf(int(1/sqrt(2*Pi)*exp(-(x-mu)^2/2),x=-1..1));

et ainsi de suite pour tout écart-type et toute moyenne on retombre sur les mêmes intervalles!!!

La loi de Gauss-Laplace n'est par ailleurs pas qu'un outil d'analyse de données mais également de génération de données. Effectivement, cette loi est une des plus importantes dans le monde des multinationales qui recourent aux outils statistiques pour la gestion du risque, la gestion de projets et la simulation lorsqu'un grand nombre de variables aléatoires sont en jeu. Le meilleur exemple d'application en étant le logiciel CrystalBall ou @Risk de Palisade (mon préféré...).

Dans ce cadre d'application (gestion de projets), il est par ailleurs très souvent fait usage de la somme (durée des tâches) ou le produit de variables aléatoires (facteur d'incertitude du client) suivant des lois de Gauss-Laplace. Voyons comment cela se calcule :

SOMME DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes. Supposons que X suit la loi equation et que Y suit la loi equation. Alors, la variable aléatoire equation aura une densité égale au produit de convolution deequation. C'est-à-dire:

equation   (7.296)

ce qui équivaut à faire le produit conjoint (cf. chapitre de Probabilités) des probabilités d'apparition des deux variables continues (se rappeler le même genre de calcul sous forme discrète!)

Pour simplifier l'expression, faisons le changement de variable equation et posons equation, equation.

Comme:

equation   (7.297)

Nous obtenons:

equation   (7.298)

Nous posons :

equation   (7.299)

Alors :

equation   (7.300)

Sachant que :

equation   (7.301)

et:

equation   (7.302)

 notre expression devient :

equation   (7.303)

Nous reconnaissons l'expression de la loi de Gauss-Laplace de moyenne equation et d'écart type equation.

Par conséquent, equation suit la loi :

equation   (7.304)

Ce résultat est ce que nous nommons en statistiques la "stabilité par la somme" de la loi de Gauss-Laplace. Nous retrouverons ce type de propriétés pour d'autres lois que nous étudierons plus loin.

PRODUIT DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes réelles. Nous désignerons par equation et equation les densités correspondantes et nous cherchons à déterminer la densité de la variable equation.

Notons f la fonction de densité du couple (X,Y). Vu que X, Y  sont indépendantes (cf. chapitre de Probabilités) :

equation   (7.305)

La fonction de répartition de Z est:

equation   (7.306)

equation.

D peut se réécrire comme union disjointe (nous faisons cette opération pour anticiper lors du futur changement de variables une division par zéro) :

equation   (7.307)

avec :

equation   (7.308)

Nous avons :

equation  (7.309)

La dernière intégrale vaut zéro car equation est de mesure (épaisseur) nulle pour l'intégrale selon x.

Nous effectuons ensuite le changement de variable suivant :

equation   (7.310)

Le jacobien de la transformation est:

equation   (7.311)

Donc:

equation   (7.312)

Notons equation la densité de la variable Z. Par définition :

equation   (7.313)

D'un autre côté :

equation   (7.314)

comme nous venons de le voir. Par conséquent :

equation   (7.315)

Ce qui est un peu triste c'est que dans le cas d'une loi de Gauss-Laplace (loi Normale), cette intégrale ne peut être calculée simplement que numériquement... il faut alors faire appel à des méthodes d'intégration du type Monte-Carlo (cf. chapitre de Méthodes Numériques).

D'après quelques recherche faites sur Internet cependant, mais sans certitude, cette intégrale pourrait être calculée et donnerait une nouvelle loi appelée "loi de Bessel".

LOI NORMALE CENTRÉE RÉDUITE

La fonction de Gauss-Laplace n'est pas tabulée puisqu'il faudrait autant de tables numériques que de valeurs possibles pour la moyenne equation et l'écart-type equation (qui sont donc des paramètres de la fonction comme nous l'avons vu).

C'est pourquoi, en opérant un changement de variable, la loi Normale devient la "loi Normale centrée réduite" où :

1. "Centrée" signifie soustraire la moyenne equation (la fonction à alors pour axe de symétrie l'axe des ordonnées)

2. "Réduite" signifie, diviser par l'écart-type equation

Par ce changement de variable, la variable k est remplacée par la variable aléatoire centrée réduite :

equation   (7.316)

Si la variable k a pour moyenne equation et pour écart- type equation alors la variable equation a pour moyenne 0 et pour écart-type 1.

Donc la relation :

equation   (7.317)

s'écrit alors (trivialement) plus simplement :

equation   (7.318)

qui n'est d'autre que l'expression de la loi Normale centrée réduite souvent notée N(0,1) que nous retrouverons très fréquemment dans les chapitres relatifs à la physique, la finance, la gestion et l'ingénierie!

Remarque: Calculer l'intégrale de la relation précédente entre n'importe quelle bornes n'est pas possible formellement parlant de manière exacte. Une idée possible et simple consiste alors à exprimer l'exponentielle en série de Taylor et de faire ensuitre l'intégration terme par terme de la série (en s'assurant de prendre suffisamment de termes pour la convergence!).

DROITE DE HENRY

Souvent, dans les entreprises c'est la loi de Gauss-Laplace (Normale) qui est analysée mais des logiciels courants et facilement accessibles comme MS Excel sont incapables de vérifier que les données mesurées suivent une loi Normale lorsque nous faisons de l'analyse fréquentielle (aucun outil intégré par défaut ne permet de le faire) et que nous n'avons pas les données d'origines non groupées.

L'astuce consiste alors à utiliser la variable centré réduite qui se construit comme nous l'avons démontré plus haut avec la relation suivante:

equation   (7.319)

L'idée de la droite d'Henry est alors d'utiliser la relation linéaire entre k et k* donnée par l'équation de la droite:

equation   (7.320)

et qui peut être tracée pour déterminer la moyenne et l'écart-type de la loi Normale.

exempleExemple:

Supposons que nous ayons l'analyse fréquentielle suivante de 10'000 tickets de caisse dans un supermarché :

Montant des
tickets

Nombre de tickets

Nombre cumulés de tickets

Fréquences
relatives cumulées

[0;50[

668

668

0.068

[50,100[

919

1'587

0.1587

[100,150[

1'498

3'085

0.3085

[150,200[

1'915

5000

0.5000

[200,250[

1'915

6'915

0.6915

[250,300[

1'498

8'413

0.8413

[300,350[

919

9'332

0.9332

[350,400[

440

9'772

0.9772

[400 et +

228

10'000

1

Tableau: 7.5  - Intervalles de classe pour la détermination de la droite de Henry

Si nous traçons maintenant cela sous MS Excel nous obtenons:

equation
  (7.321)

Ce qui ressemble terriblement à une loi Normale d'où l'autorisation, sans trop de risques, d'utiliser dans cet exemple la technique de la droite d'Henry.

Mais que faire maintenant? Eh bien connaissant les fréquences cumulées, il ne nous reste plus qu'à calculer pour chacune d'entre elles k*  à l'aide de tables numériques ou avec la fonction NORMSINV( ) de MS Excel (car rappelons que l'intégration formelle de la fonction gaussienne n'est pas des plus faciles...).

Ceci nous donnera les valeurs de la loi Normale centrée réduite N(0,1) de ces mêmes fréquences respectives cumulées (fonction de répartition). Ainsi nous obtenons (nous laissons le soin au lecteur de chercher sa table numérique ou d'ouvrir son logiciel préféré...):

Borne de l'intervalle

Fréquences relatives cumulées

Correspondance pour k* de N(0,1)

50

0.068

-1.5

100

0.1587

-1

150

0.3085

-0.5

200

0.5000

0

250

0.6915

0.5

300

0.8413

1

350

0.9332

1.5

400

0.9772

2

-

1

-

Tableau: 7.6  - Fréquences relatives cumulées pour la droite de Henry

Signalons que dans le tableau ci-dessus, dans MS Excel, les valeurs de fréquences cumulées nulles et unitaires (extrêmes) posent problèmes. Il faut alors jouer un petit peu...

Comme nous l'avons spécifié plus haut, nous avons sous forme discrète:

equation   (7.322)

Donc graphiquement sous MS Excel nous obtenons grâce à notre tableau le graphique suivant:

equation
  (7.323)

Donc à l'aide de la régression donnée par MS Excel (ou calculée par vos soins selon les techniques de régressions linéaires vues dans le chapitre de Méthodes Numériques). Il vient :

equation   (7.324)

Donc nous avons immédiatement :

equation   (7.325)

Il s'agit donc d'une technique particulière pour une distribution particulière! Des techniques similaires plus ou moins simples (ou compliquées suivant les cas) existent pour nombre de distributions.

FONCTION LOG-NORMALE

Nous disons qu'une variable aléatoire positive X suit une "fonction log-normale" (ou "loi log-normale") de paramètresequation (moment de la loi log-Normale), si et seulement si en posant:

equation   (7.326)

nous voyons que y suit une fonction de probabilité cumulée de type loi Normale de moyenne equation et de variance equation (moments de la loi Normale).

La fonction de densité de X pour equation est alors (cf. chapitre de Calcul Intégral) :

equation   (7.327)

qui peut être calculée dans MS Excel avec la fonction LOI.LOGNORMALE( ) ou pour la réciproque par LOI.LOGNORNALE.INVERSE( ).

Ce type de scénario se retrouve fréquemment en physique, dans les techniques de maintenance ou encore en finance des marchés dans le modèle de pricing des options (voir ces chapitres respectifs du site pour des exemples concrets). Il y a par ailleurs une remarque importante relativement à la loi log-normale dans le traitement plus loin du théorème central limite!

Montrons que la fonction de probabilité cumulée correspond bien à une loi Normale si nous faisons le changement de variable mentionné précédemment:

equation   (7.328)

en posant:

equation   (7.329)

et :

equation    (7.330)

nous avons bien:

equation   (7.331)

L'espérance (moyenne) de X est donnée alors par (le logarithme népérien n'étant pas défini pour equation nous bornons l'intégrale à partir de zéro) :

equation   (7.332)

où nous avons effectué le changement de variable :

equation   (7.333)

L'expression :

equation   (7.334)

étant par ailleurs égale à :

equation   (7.335)

la dernière intégrale devient donc :

equation   (7.336)

Rappelons que la variance de X est définie par :

equation   (7.337)

Calculons equation en procédant de manière similaire aux développements précédents:

equation   (7.338)

où nous avons encore une fois le changement de variable:

equation   (7.339)

et où nous avons transformé l'expression :

equation   (7.340)

sous la forme:

equation   (7.341)

Donc :

equation   (7.342)

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction Log-Normale de paramètres equation:

equation equation
  (7.343)

FONCTION UNIFORME CONTINUE

Soient equation. Nous définissons la fonction de distribution de la "fonction uniforme" (ou "loi uniforme") par la relation :

equation   (7.344)

Nous avons donc pour fonction de répartition:

equation

Il s'agit bien d'une fonction de distribution car elle vérifie (intégrale simple) :

equation   (7.345)

La fonction uniforme a par ailleurs pour espérance (moyenne) :

equation   (7.346)

et pour variance en utilisant la formule de Huyghens : 

equation   (7.347)

equation signifie qu'en dehors du domaine de définition [a,b] la fonction de distribution est nulle. Nous retrouverons ce type de notation dans certaines autres fonctions de distribution.

exempleExemple:

Tracé de la fonction de distribution et respectivement de répartition pour la loi Uniforme de paramètres equation:

equation equation
  (7.348)

Remarque: Cette fonction est souvent utilisée en simulation dans les entreprises pour signaler que la variable aléatoire a des probabilités égales d'avoir une valeur comprise dans un certain intervalle (typiquement dans les rendements de portefeuilles ou encore dans l'estimation des durées des projets). Le meilleur exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui s'intègre dans MS Project.

Voyons un résultat intéressant de la loi Uniforme continue (et qui s'applique à la discrète aussi en fait...).

Souvent j'entends des gestionnaires (qui se jugent de haut niveau) dire que comme une mesure à une probabilité égale d'avoir lieu dans un intervalle fermé donné, alors la somme de deux variables aléatoires indépendantes du même type aussi!

Or nous allons démontrer ici que ce n'est pas (si quelqu'un a une démonstration plus élégante je suis preneur)!

Démonstration:

Considérons deux variables aléatoires indépendantes X et Y suivante une loi uniforme dans un intervalle fermé [0,a]. Nous cherchons donc la densité de leur somme qui sera notée:

equation   (7.349)

Nous avons alors:

equation   (7.350)

avec la variable:

equation   (7.351)

Pour calculer la loi de la somme, rappelons que nous savons qu'en termes discrets cela équivaut faire le produit conjoint des probabilités (cf. chapitre de Probabilités) d'apparition des deux variables continues (se rappeler le même genre de calcul sous forme discrète!)

C'est-à-dire:

equation   (7.352)

Comme equation si equation et sinon 0 alors le produit de convolution précédent se réduit à:

equation   (7.353)

L'intégrant vaut par définition 0 sauf lorsque par construction equation où il vaut alors 1.

Intéressons nous alors aux bornes de l'intégrale dans ce dernier cas qui est bien évidemment le seul qui est intéressant....

Faisons d'abord un changement de variables en posant:

equation   (7.354)

d'où:

equation   (7.355)

L'intégrale s'écrit alors dans alors dans cet intervalle après ce changement de variable:

equation   (7.356)

En se rappelant comme vu au début que equation, alors nous avons immédiatement si equation et equation que l'intégrale est nulle.

Nous allons considérer deux cas pour cet intervalle car la convolution de ces deux fonctions rectangulaires peuvent se distingueront à la situation où dans un premier temps elles se croisent (s'emboîtent), c'est-à-dire où equation, et ensuite s'éloignent l'une de l'autre, c'est-à-dire equation.

- Dans le premier cas (emboîtement) où equation:

equation   (7.357)

où nous avons changé la borne inférieure à 0 car de toute façon equation est nulle pour toute valeur négative (et lorsque equation, equation est justement négatif ou nul!).

- Dans le deuxième cas (déboîtement) où equation:

equation   (7.358)

où nous avons changé la borne supérieur à a car de toute façon equation est nulle pour toute valeur supérieure (et lorsque equation, z est justement plus grand que a).

Donc au final, nous avons:

equation   (7.359)

equationC.Q.F.D.

Il s'agit d'un cas particulier, volontairement simplifié, de la loi triangulaire que nous allons voir de suite.

Ce résultat (qui peut sembler contre intuitif) se vérifie en quelques secondes avec un tableur comme MS Excel en utilisant la fonction ALEA.ENTRE.BORNES( ) et la fonction FREQUENCE( ).

FONCTION TRIANGULAIRE

Soit equation. Nous définissons la "fonction triangulaire" (ou "loi triangulaire") par construction selon les deux fonctions de distribution suivantes:

equation   (7.360)

a est souvent assimilé à la valeur optimiste, c la valeur attendue (le mode) et b la valeur pessimiste.

C'est effectivement la seule manière de l'écrire si le lecteur garde à l'esprit que le triangle de base c-a doit avoir une hauteur h valant 2/(c-a) telle que sa surface totale soit égale à l'unité (nous allons de suite le montrer).

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction triangulaire de paramètres (a,c,b)=(0,3,5):

equation equation
  (7.361)

La pente de la première droite (croissante de gauche) est donc bien évidemment:

 equation   (7.362)

et la pente de la deuxième droite (décroissante à droite):

equation   (7.363)

Cette fonction est une fonction de distribution si elle vérifie:

equation   (7.364)

Il s'agit dans ce cas de l'aire du triangle qui rappelons-le est simplement la base multipliée par la hauteur le tout divisé par 2 (cf. chapitre sur les Formes Géométriques):

equation = 1   (7.365)

Remarque: Cette fonction est beaucoup utilisée en gestion de projet dans le cadre de l'estimation des durées des tâches ou encore en simulations industrielles. La valeur a correspondant à la valeur optimiste, la valeur c à la valeur attendue (mode) et la valeur b à la valeur pessimiste. Le meilleur exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui s'intègre dans MS Project.

La fonction triangulaire a par ailleurs une espérance (moyenne) :

equation   (7.366)

et pour variance :

equation   (7.367)

on remplace equation par l'expression obtenue précédemment et on simplifie (c'est de l'algèbre élémentaire pénible...) :

equation   (7.368)

Nous pouvons montrer que la somme de deux variables aléatoires indépendantes chacune de loi uniforme sur [a,b] suit une loi uniforme sur [2a,2b] mais si elles n'ont pas les mêmes bornes, alors leur somme donne une loi triangulaire.

FONCTION DE PARETO

La "fonction de Pareto" (ou "loi de Pareto") est la formalisation du principe des 80-20. Cet outil d'aide à la décision détermine les facteurs (environ 20%) cruciaux qui influencent la plus grande partie (80%) de l'objectif.

Remarque: Cette loi est un outil fondamental et basique en gestion de la qualité (cf. chapitre de Génie Industriel et Techniques de Gestion). Elle est aussi utilisée en réassurance. La théorie des files d'attente s'est intéressée à cette distribution, lorsque des recherches des années 90 ont montré que cette loi régissait aussi au nombre de grandeurs observées dans le trafic internet (et plus généralement sur tous les réseaux de données à grande vitesse).

Une variable aléatoire est dite par définition suivre une loi de Pareto si sa fonction de répartition est donnée par :

equation   (7.369)

avec x qui doit être supérieur ou égal à xm.

La fonction de densité (fonction de distribution) de Pareto est alors :

equation   (7.370)

avec equation et equation (donc equation).

La distribution de Pareto est donc définie par deux paramètres, xm et k (nommé "index de Pareto").

C'est par ailleurs bien une fonction de distribution puisque étant connue sa fonction de répartition:

equation   (7.371)

L'espérance (moyenne) est donnée par:

 equation   (7.372)

si equation. Si equation, l'espérance n'existe pas.

Pour calculer la variance, en utilisant la relation :

equation   (7.373)

Nous avons :

equation   (7.374)

si equation. Si equation, equation n'existe pas.

Donc si equation :

equation   (7.375)

Si equation, la variance n'existe pas.

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction de Pareto de paramètre equation:

equationequation
  (7.376)

Remarque: Il faut noter que lorsque equation la distribution s'approche de equation où equation est la fonction Delta de Dirac.

FONCTION EXPONENTIELLE

Nous définissons la "fonction exponentielle" (ou "loi exponentielle") par la relation de fonction de distribution suivante :

equation   (7.377)

avec equation qui comme nous allons de suite le montrer n'est au fait que l'inverse de la moyenne.

Remarques:

R1. Cette fonction se retrouve fréquemment en physique nucléaire (désintégrations) ou encore en physique quantique ainsi qu'en fiabilité (maintenance préventive).

R2. Nous pouvons obtenir cette loi dans MS Excel avec la fonction LOI.EXPONENTIELLE( ).

Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie :

 equation   (7.378)

La fonction exponentielle a pour espérance (moyenne) en utilisant l'intégration par parties: 

equation    (7.379)

et pour variance nous utilisons à nouveau equation et il ne nous reste plus qu'à calculer :

equation   (7.380)

Un changement de variable equation conduit à :

equation   (7.381)

Une double intégration par parties donne :

equation   (7.382)

D'où equation il vient dès lors :

equation   (7.383)

Donc l'écart-type (racine carrée de la variance pour rappel) et la moyenne ont exactement la même expression!

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction exponentielle de paramètre equation:

equationequation
  (7.384)

Déterminons maintenant la fonction de répartition de la loi exponentielle:

equation   (7.385)

Remarque: Nous verrons plus loin que la fonction de distribution exponentielle n'est qu'un cas particulier d'une fonction plus générale qui est la fonction du Khi-Deux, cette dernière aussi n'étant qu'un cas particulier d'une fonction encore plus générale qui est la fonction Gamma.

FONCTION DE CAUCHY

Soient X,Y deux variables aléatoires indépendantes suivant des lois Normales centrées réduites (variance unité et espérance nulle). La fonction de densité est donc donnée par :

equation   (7.386)

La variable aléatoire :

equation   (7.387)

(la valeur absolue intervient dans l'intégrale lors du changement variable) suit une caractéristique appelée "fonction de Cauchy" (ou "loi de Cauchy") ou encore "loi de Lorentz".

Déterminons sa fonction de densité f. Pour cela, rappelons que f est déterminée par la relation (générale):

equation   (7.388)

Donc (application du calcul intégral élémentaire) :

equation   (7.389)

dans le cas où f est continue.

Etant donné que X et Y sont indépendantes, la fonction de densité du vecteur aléatoire est donnée par un des axiomes des probabilités (cf. chapitre de Probabilités) :

equation   (7.390)

Donc :

equation   (7.391)

où donc equation.

Cette dernière intégrale devient :

equation   (7.392)

Faisons le changement de variable equation dans l'intégrale intérieure. Nous obtenons :

equation   (7.393)

Donc :

equation   (7.394)

C'est maintenant que la valeur absolue va nous être utile pour écrire :

equation   (7.395)

Pour la première intégrale nous avons :

equation   (7.396)

Il ne reste donc plus que la seconde intégrale et en faisant le changement de variable equation, nous obtenons :

equation   (7.397)

Ce que nous noterons par la suite (afin de respecter les notations optées jusqu'à présent) :

equation   (7.398)

et qui n'est d'autre que la fonction de Cauchy.

Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie (cf. chapitre de Calcul Différentiel et Intégral):

equation   (7.399)

exempleExemple:

Tracé de la fonction de distribution:

equation
  (7.400)

La fonction de Cauchy a pour espérance (moyenne) :

equation  (7.401)

Attention !!! Les calculs précédents ne donnent pas zéro au fait car la soustraction d'infinis est non pas nul mais indéterminé ! La loi de Cauchy n'admet donc pas d'espérance rigoureusement parlant!

Ainsi, même si nous pouvons bricoler une variance :

equation   (7.402)

celle-ci est absurde et n'existe rigoureusement parlant pas puisque la l'espérance n'existe pas...!

LOI BÊTA

Rappelons d'abord que la fonction Gamma d'Euler est définie par la relation (cf. chapitre de Calcul Différentiel Et Intégral):

equation   (7.403)

Nous avons démontré (cf. chapitre de Calcul Différentiel Et Intégral) qu'une propriété non triviale de cette fonction est que:

equation    (7.404)

Posons maintenant:

equation   (7.405)

où :

equation   (7.406)

En faisant le changement de variables :

equation   (7.407)

nous obtenons :

equation   (7.408)

Pour l'intégrale interne nous utilisons maintenant la substitution equation et nous trouvons alors:

equation   (7.409)

La fonction B qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous avons donc :

equation   (7.410)

Maintenant que nous avons défini ce qu'était la fonction bêta, considérons deux paramètres equation et considérons la relation particulière ci-dessous comme étant la "fonction de distribution Bêta" ou "loi bêta" (il existe plusieurs formulations de la loi bêta donc une très importante qui est étudiée en détails dans le chapitre de Techniques de Gestion):

equation   (7.411)

où:

equation   (7.412)

Nous vérifions d'abord que que equation est bien une fonction de distribution (sans trop aller dans les détails...):

equation   (7.413)

Maintenant, nous calculons qu'elle est son espérance (moyenne) :

equation   (7.414)

en utilisant la relation:

equation   (7.415)

et sa variance :

equation   (7.416)

En sachant que equation et que equation nous trouvons :

equation   (7.417)

et donc :

equation   (7.418)

exempleExemple:

Tracé de la fonction pour equation en rouge, equation en vert, equation en noir, equation en bleu, equation en magenta, equation en cyan, equation en gris, equation en turquoise, equation en jaune, equation en couleur or :

equation
  (7.419)

et tracé de la fonction de distribution et répartition de la loi bêta de paramètres equation:

equationequation
  (7.420)

FONCTION GAMMA

La fonction Gamma d'Euler étant connue, considérons deux paramètres equation et définissons la "fonction Gamma" (ou "loi Gamma") comme étant donnée par la relation :

equation   (7.421)

En faisant le changement de variables equation nous obtenons :

equation   (7.422)

et pouvons alors écrire la relation sous une forme plus classique que nous trouvons fréquemment dans les ouvrages :

equation   (7.423)

et c'est sous cette forme que nous retrouvons cette fonction dans MS Excel sous le nom LOI.GAMMA( ) et pour sa réciproque par LOI.GAMMA.INVERSE( ).

Remarques:

R1. Si equation alors equation et equation nous retombons sur la loi exponentielle.

R2. Si equation la distribution s'appelle alors la "fonction d'Erlang".

Ensuite, nous vérifions avec un raisonnement similaire en tout point celui de fonction bêta que equation est une fonction de distribution :

equation   (7.424)

exempleExemple:

Tracé de la fonction pour equation en rouge, equation en vert, equation en noir, equation en bleu, equation en magenta :

equation
  (7.425)

et tracé de la fonction de distribution et répartition pour la fonction Gamma de paramètre equation:

equationequation
  (7.426)

La fonction Gamma a par ailleurs pour espérance (moyenne):

equation   (7.427)

et pour variance :

equation   (7.428)

Démontrons une propriété de la fonction Gamma qui nous servira à démontrer plus tard dans ce chapitre lors de notre étude de l'analyse de la variance et des intervalles de confiance sur des petits échantillons une autre propriété extrêmement importante de la loi du khi-deux.

Comme nous le savons, la fonction de densité d'une variable aléatoire suivant une fonction Gamma de paramètres equation est :

equation   (7.429)

avec (cf. chapitre de Calcul Différentiel Et Intégral) la fonction Gamma d'Euler :

equation   (7.430)

Par ailleurs, quand une variable aléatoire suite une fonction Gamma nous la notons:

equation   (7.431)

Soit X, Y deux variables indépendantes. Montrons que si equation et equation alors :

equation   (7.432)

Notons f la fonction de densité du couple (X,Y), equation la fonction de densité de X et equation la fonction de densité de Y. Vu que X, Y  sont indépendantes, nous avons :

equation   (7.433)

pour tout equation.

Soit equation. La fonction de répartition de Z est alors :

equation   (7.434)

equation.

Remarque: Nous appelons un tel calcul une "convolution" et les statisticiens ont souvent à manipuler de telles entités ayant à travailler sur des nombreuses variables aléatoires qu'il faut sommer ou même multiplier.

En simplifiant :

equation   (7.435)

Nous effectuons le changement de variable suivant :

equation   (7.436)

Le jacobien est alors (cf. chapitre de Calcul Différentiel Et Intégral) :

equation   (7.437)

Donc avec la nouvelle borne d'intégration equation nous avons:

equation   (7.438)

Si nous notons g la fonction de densité de Z nous avons :

equation   (7.439)

Par suite :

equation   (7.440)

equation et equation étant nulles lorsque leur argument est négatif, nous pouvons changer les bornes d'intégration :

equation pour equation   (7.441)

Calculons g :

equation   (7.442)

Après le changement de variable equation nous obtenons :

equation   (7.443)

B est la fonction bêta que nous avons vu plus haut dans notre étude la fonction de distribution bêta. Or nous avons aussi démontré la relation :

equation   (7.444)

Donc :

equation   (7.445)

Ce qui finalement nous donne :

equation   (7.446)

Ce qui montre que bien que si deux variables aléatoires suivent une fonction Gamma alors leur somme aussi tel que :

equation   (7.447)

donc la fonction Gamma est stable par addition de même que le sont toutes les lois qui découlent de la loi gamma et que nous allons aborder ci-après.

FONCTION DE KHI-DEUX (OU DE PEARSON)

La "fonction de Khi-Deux" (appelée aussi "loi du Khi-Deux" ou encore "loi de Pearson") n'est qu'un cas particulier de la fonction de distribution Gamma dans le cas où equation et equation, avec k entier positif :

equation   (7.448)

Cette relation qui relie la loi du khi-deux à la loi Gamma est important dans MS Excel car la fonction LOI.KHIDEUX( ) donne le seuil de confiance et non la loi de distribution. Il faut alors utiliser la fonction LOI.GAMMA( ) avec les paramètres donnés ci-dessus (à part qu'il faut prendre l'inverse de 1/2, soit 2 comme paramètre) pour avoir la fonction de distribution et de répartition.

Tous les calculs faits auparavant s'appliquent et nous avons alors immédiatement:

equation   (7.449)

exempleExemple:

Tracé de la fonction pour equation en rouge, equation en vert, equation en noir, equationen bleu :

equation
  (7.450)

et tracé de la fonction de distribution et respectivement de répartition pour la loi du khi-deux pour equation:

equationequation
  (7.451)

Dans la littérature, il est de tradition de noter :

equation ou equation   (7.452)

pour indiquer que la distribution de la variable aléatoire X est la loi du khi-deux. Par ailleurs il est courant de nommer le paramètre k "degré de liberté" et de l'abréger "ddl".

La fonction khi-deux découle donc de la loi gamma et par ailleurs en prenant equation nous retrouvons aussi la loi exponentielle (voir plus haut) pour equation :

equation   (7.453)

Par ailleurs, puisque (cf. chapitre de Calcul Différentiel Et Intégral):

equation   (7.454)

la loi du khi-deux avec k égal à l'unité peut s'écrire sous la forme :

equation   (7.455)

FONCTION DE STUDENT

La "fonction de Student" (ou "loi de Student") de paramètre k est définie par la relation :

equation   (7.456)

avec k étant le degré de liberté de la loi du khi-deux sous jacente à la construction de la fonction de Student comme nous allons le voir.

Indiquons qu'elle peut aussi être obtenue dans MS Excel à l'aide des fonctions LOI.STUDENT( ) et sa réciproque par LOI.STUDENT.INVERSE( ).

Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc indirectement...) :

equation   (7.457)

Voyons la démonstration la plus simple pour justifier la provenance de la loi de Student et qui nous sera en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin.

Pour cette démonstration, rappelons que:

R1. Si X, Y sont deux variables aléatoires indépendantes de densités respectives equation, la loi du couple (X,Y) possède une densité f vérifiant (axiome des probabilités!):

equation   (7.458)

R2. La loi N(0,1) est donnée par (voir plus haut):

equation   (7.459)

R3. La loi equation est donnée par (voir précédemment):

equation   (7.460)

pour equation et equation.

R4. La fonction equation est définie pour tout equation par (cf. chapitre de Calcul Différentiel et Intégral):

equation   (7.461)

et vérifie (cf. chapitre de Calcul Différentiel et Intégral):

equation   (7.462)

pour equation.

Ces rappels étant faits, considérons maintenant X une variable aléatoire suivant la loi N(0,1) et Y une variable aléatoire suivant la loi equation.

Nous supposons X et Y indépendantes et nous considérons la variable aléatoire (c'est à l'origine l'étude historique de la loi de Student dans le cadre de l'inférence statistique qui a amené à poser cette variable dont nous justifierons l'origine plus loin):

equation   (7.463)

Nous allons montrer T suit une loi de Student de paramètre n.

Démonstration:

Notons F et f  les fonctions de répartition et de densité de T et  equation,f  les fonctions de densité de X, Y  et (X,Y) respectivement. Nous avons alors pour tout equation:

equation   (7.464)

où:

equation   (7.465)

la valeur imposée positive et non nulle de y étant due au fait qu'elle est sous une racine et en plus au dénominateur.

Ainsi:

equation   (7.466)

où comme X suit une loi N(0,1):

equation   (7.467)

est la fonction de répartition de la loi Normale centrée réduite.

Nous obtenons alors la fonction de densité de T en dérivant F:

equation   (7.468)

car (la dérivée d'une fonction est égale à sa dérivée multipliée par sa dérivée intérieure):

equation   (7.469)

Donc:

equation   (7.470)

En faisant le changement de variable:

equation   (7.471)

nous obtenons:

equation   (7.472)

ce qui est bien la loi de Student de paramètre n.

equationC.Q.F.D.

Voyons maintenant quelle est l'espérance de la loi de Student:

equation   (7.473)

Nous avons:

equation   (7.474)

Mais equation existe si et seulement si equation. En effet pour equation:

equation   (7.475)

et:

equation   (7.476)

Tandis que pour equation nous avons:

equation   (7.477)

Ainsi pour equation, l'espérance n'existe pas.

Donc pour equation:

equation   (7.478)

Voyons maintenant la valeur de la variance. Nous avons donc:

equation   (7.479)

Discutons de l'existence de equation. Nous avons trivialement:

equation   (7.480)

X suit une loi normale centrée réduite donc:

equation   (7.481)

Pour ce qui est de equation nous avons:

equation   (7.482)

où nous avons fait le changement de variable equation.

Mais l'intégrale définissant equation converge seulement si equation.

Donc equation existe si et seulement si equation et vaut alors selon les propriétés de la loi Gamma d'Euler démontrées dans le chapitre de Calcul Différentiel et Intégral:

equation   (7.483)

Ainsi pour equation:

equation   (7.484)

Il est par ailleurs important de remarque que cette loi est symétrique par rapport à 0!

exempleExemple:

Tracé de la fonction de distribution et répartition pour la fonction de Student de paramètre equation:

equationequation
  (7.485)

FONCTION DE FISHER

La "fonction de Fisher" (ou "loi de Fisher-Snedecor") de paramètres k et l est définie par la relation:

equation   (7.486)

si equation . Les paramètres k et l sont des entiers positifs et correspondent aux degrés de liberté des deux lois du khi-deux sous-jacentes. Cette distribution est souvent notée equation ou F(k,l) et peut être obtenue dans MS Excel par la fonction LOI.F( ).

Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc indirectement...) :

 equation   (7.487)

Voyons la démonstration la plus simple pour justifier la provenance de la loi de Fisher et qui nous sera en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin.

Pour cette démonstration, rappelons que:

R1. La loi equation est donnée par (voir plus haut):

equation   (7.488)

pour equation et equation.

R2. La fonction equation est définie pour tout equation par (cf. chapitre de Calcul Différentiel et Intégral):

equation   (7.489)

Soit X, Y deux variables aléatoires indépendantes suivant respectivement les loisequation et equation .

Nous considérons la variable aléatoire:

equation   (7.490)

Nous allons donc montrer que la loi de T  est la loi de Fisher-Snedecor de paramètres n, m.

Notons pour cela F et f  les fonctions de répartition et de densité de T et  equation, f  les fonctions de densité de X, Y  et (X,Y) respectivement.  Nous avons pour tout equation:

equation   (7.491)

où:

equation   (7.492)

où les valeurs positives imposées proviennent de l'origine d'une loi du khi-deux pour x et y.

Ainsi :

equation   (7.493)

Nous obtenons la fonction de densité de T en dérivant F. D'abord la dérivée intérieure:

equation   (7.494)

Ensuite en explicitant puisque:

equation et equation   (7.495)

nous avons alors:

equation   (7.496)

En faisant le changement de variable:

equation   (7.497)

nous obtenons :

equation   (7.498)

equationC.Q.F.D.

FONCTION DE BENFORD

Cette distribution aurait été découverte une première fois en 1881 par Simon Newcomb, un astronome américain, après qu'il se fut aperçu de l'usure (et donc de l'utilisation) préférentielle des premières pages des tables de logarithmes (alors compilées dans des ouvrages). Frank Benford, aux alentours de 1938, remarqua à son tour cette usure inégale, crut être le premier à formuler cette loi qui porte indûment son nom aujourd'hui et arriva aux même résultats après avoir répertorié des dizaines de milliers de données (longueurs de fleuves, cours de la bourse, etc).

Seule explication possible : nous avons plus souvent besoin d'extraire le logarithme de chiffres commençant par 1 que de chiffres commençant par 9, ce qui implique que les premiers sont "plus nombreux" que les seconds.

Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son hypothèse. Rien de plus simple : il se procure des tables de valeurs numériques, et calcule le pourcentage d'apparition du chiffre le plus à gauche (première décimale). Les résultats qu'il obtient confirment son intuition:

Chiffre initial

Probabilité d'apparition

1

30.1 %

2

17.6 %

3

12.5 %

4

9.7 %

5

7.9 %

6

6.7 %

7

5.8 %

8

5.1 %

9

4.6 %

Tableau: 7.7  - Probabilité d'appartion d'un chiffre selon la loi de Benford

A partir de ces données, Benford trouve expérimentalement que la probabilité qu'un nombre commence par le chiffre n (excepté 0) est (nous allons le démontrer plus loin) donnée par la relation :

equation   (7.499)

appelée "fonction de Benford" (ou "loi de Benford").

exempleExemple:

Voici un tracé de la fonction précédente :

equation
  (7.500)

Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-à-dire à des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur une liste de chiffres tirés au hasard.

La loi de Benford a été testée sur toutes sortes de tables : longueur des fleuves du globe, superficie des pays, résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie à presque tous les coups.

Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix d'un supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les mêmes prix convertis en Euros.

Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente. Puis une démonstration générale en a été donnée en 1996, qui fait appel au théorème de la limite centrale.

Aussi surprenant que cela puisse paraître, cette loi a trouvé une application : le fisc l'utilise aux Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction vue plus haut : la loi de Benford ne s'applique que sur des valeurs ayant une signification physique.

S'il existe une distribution de probabilité universelle P(n) sur de tels nombres, ils doivent êtres invariants sous un changement d'échelle tel que:

equation   (7.501)

Si :

equation   (7.502)

alors:

equation   (7.503)

et la normalisation de la distribution donne:

equation   (7.504)

si nous dérivons equation par rapport à equation nous obtenons :

equation   (7.505)

en posant equation nous avons :

equation   (7.506)

Cette équation différentielle a pour solution:

equation   (7.507)

Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de probabilité (elle diverge) et deuxièmement, les lois de la physique et humaines imposent des limites.

Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si le nombre décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la probabilité que le premier chiffre non nul (décimal) soit D est donné par la distribution logarithmique:

equation   (7.508)

Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite.

L'intégrale du dénominateur donne:

equation   (7.509)

L'intégrale du numérateur donne:

equation   (7.510)

Ce qui nous donne finalement:

equation   (7.511)

De par les propriétés des logarithmes (voir le chapitre d'Analyse fonctionnelle) nous avons :

 equation   (7.512)

Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par changement d'échelle mais également à des nombres de provenant de sources quelconques. Expliquer ce cas implique une investigation plus rigoureuse en utilisant le théorème de la limite centrale. Cette démonstration a été effectuée seulement en 1996 par T. Hill par une approche utilisant la distribution des distributions.

Haut de page
PROBABILITES STATISTIQUES (2/2)
 
   


Ce travail est dans le domaine public
W3C - HTMLW3C - CSS
2002-2010 Sciences.ch