FORMATIONS SYSTAT (UNIQUEMENT SUR SITE) :

[ Statistique de base | Comparatif d'échantillons | Régression linéaire simple | Analyse de la variance à plusieurs facteurs ]



Systat : STATISTIQUE DE BASE

Durée

2 journées

Niveau

débutant

Pré requis

Savoir utiliser un micro-ordinateur sous Windows.

Sujets couverts

Analyse d'une variable quantitative (mesures) - Approches paramétriques et non paramétriques

Statistique descriptive :

  • Indicateur de tendance centrales - moyennes; médiane; mode
  • Indicateur de dispersion - variance & écart type; minimum & maximum; quantiles/fractiles; étendues : globale; interquantiles
  • Indicateurs de forme : coefficients d'asymétrie (skweness) brut et standartisé; coefficients d'aplatissement (kurtosis) brut et standartisé
  • Graphiques : histogramme, boîte à moustache,...

Statistique inférentielle - Pris en compte de l'incertitude :

  • Intervalles de confiance : d'une moyenne; d'une médiane; d'une variance et d'un écart type
  • Comparaison à une valeur de référence :
    - d'une moyenne (test t de Student)
    - d'une médiane (tests des signes de Fisher et des rags signés de Wilcoxon)
    - d'une variance ou d'un écart type (test de Fisher)
  • Ajustement à une loi de distribution continue; transformations; diagrammes d'ajustement

Analyse d'une variable qualitative (comptage de modalités)

Statistique descriptive :

  • Comptage; proportion; taux
  • Graphiques : diagramme en barre, camenbert...

Statistique inférentielle - Pris en compte de l'incertitude :

  • Intervalle de confiance d'une proportionTest du Khi2 de comparaison à une structure de référence
  • Ajustement à une loi de distribution discrète

Corrélation entre deux variables quantitatives (mesures)

Statistique descriptive :

  • Coefficient de corrélation
  • Graphiques : nuage de points; matrice de diagrammes de dispersion

Statistique inférentielle - Pris en compte de l'incertitude :

* Significativité d'un coefficient de corrélation

Correspondance entre deux variables qualitatives (comptage de modalités)

Statistique descriptive :

  • Tableau de contingence/tableau croisé dynamique
  • Graphique en barres multiples...

Statistique inférentielle - Pris en compte de l'incertitude :

  • Test du Khi2 d'indépendance

Objectifs

Apprendre - ou se remémorer - les bases de la statistique à partir d'exemples concrets.

Note

Peut-être adapté pour Excel, hors : test de wilcoxon, ajustement de lois et divers graphes.




Systat : COMPARATIF D'ÉCHANTILLON

Durée

2 journées

Niveau

intermédiaire

Pré requis

Connaissance des notions de base (niveau "statistique de base")

Sujets couverts

Approche paramétrique :

Conditions de validité de l'approche paramétrique ("Moindres carrés") :

  • Normalité
  • Homogénéité de variance

Comparaison de deux échantillons appariés : deux états pour les mêmes observations :

  • Différence par observation entre les deux états; normalité de la différence
  • Comparaison de la moyenne des différences à 0 : test t de Student; intervalle de confiance d'une moyenne

Comparaison de deux échantillons indépendants :

  • Normalité intra-groupes; transformations
  • Comparaison des variances : test de Student; variances égales ou inégales; intervalles de confiance de deux moyennes

Comparaison de plusieurs échantillons indépendants :

  • Normalité intra-groupes; transformations
  • Test d'homogénéité de variance : tests de Bartlett et de Levene
  • Analyse de variance (ANOVA) à un facteur :
    - Tableau d'analyse de variance (R2; test de Durbin-Watson)
    - Tests "post hoc" (Tukey, LSD, Scheffe, Bonferroni)
  • Normalité résiduelle

Approche non paramétrique :

Condition de validité de l'approche non paramétrique :

  • Aucune

Comparaison de deux échantillons appariés : deux états pour les mêmes observations :

  • Différence par observation entre les deux états
  • Comparaison de la médiane des différences à 0 : intervalle de confiance d'une médiane; boîte à moustaches
  • Comparaison du rang moyen des différences à 0 : test des signes de Fisher; Test des rangs signés de Mann-Whitney / Wilcoxon

Comparaison de deux échantillons indépendants :

  • Comparaison des médianes : intervalles de confiance de deux médianes; boîte à moustaches multiples
  • Comparaison des rangs moyens : test des rangs signés de Wilcoxon
  • Comparaison des distributions : test de Kolmogorov-Smirnov

Comparaison de plusieurs échantillons indépendants (deux ou plus) :

  • Comparaison des médianes : intervalles de confiance de médianes; boîte à moustaches
  • Comparaison des rangs moyens : test de Kruskal-Wallis
  • Comparaison des distributions : test de Kolmogorov-Smirnov

Objectifs

Apprendre - ou se remémorer - les concepts de la comparaison d'échantillons à partir d'exemples concrets.

Note

Peut-être adapté pour Excel, hors : tests de Bartlett et non paramétriques, divers graphes...




Systat : RÉGRESSION LINÉAIRE SIMPLE

Durée

2 journées

Niveau

intermédiaire

Pré requis

Connaissance des notions de base (niveau "statistique de base")

Sujets couverts

Étude de la relation de cause à effets entre les varations de deux variables quantitatives (mesures), l'une considérée comme une cause(X) l'autre considérée comme une conséquence(Y)

Conditions de validité de la méthodes des "Moindres carrés" :

  • Normalité
  • Homogénéité de variance

Définition du modèle :

  • Estimation des coefficients : Pente & Ordonnée à l'origine
  • Analyse de la variance du modèle (ANOVA); coefficient de détermination (R2 & R2 ajusté)
  • Incertitude sur les coefficients : erreur types; test t de Student; intervalles de confiance et de prédiction

Validation du modèle :

  • Test de normalité résiduelle; graphes
  • Test d'homogénéité de variance résiduelles : généralisation du test de Levene; graphes
  • Tests de séquences temporelles du résidu : Durbin-Watson, autocorrélation d'ordre 1; graphe
  • Repérage d'observations atypiques : résidus "studentisés"; graphes
  • Repérage et gestion de relations curvilignes
    - Ajustement des graphes
    - "observé vs prédit"
    - "Résidus vs X")

Utilisation du modèle :

  • Prédictions à partir du modèle

Objectifs

Apprendre - ou se remémorer - les concepts de la régression linéaire simple à partir d'exemples concrets.

Note

Peut-être partiellemnt adapté pour Excel.




Systat : ANALYSE DE LA VARIANCE À PLUSIEURS FACTEURS

Durée

2 journées

Niveau

Avancé

Pré requis

Connaissance de l'analyse de la variance à un facteur (niveau "Comparatif d'échantillon) et de la régression linéaire simple (niveau "Régression linéaire simple")

Sujets couverts

Étude de la relation de cause à effets entre les changements d'état de plusieurs variables qualitatives et les variations d'un résultat quantitatif

Conditions de validité de la méthode des "Moindres carrés" :

  • Normalité
  • Homogénéité de variance

Notion de facteurs :

  • Facteurs croisés (intéractions) et facteurs imbriqués ou hiérarchisés
  • Facteurs fixes et facteurs aléatoires
  • Redondance des facteurs :
    - Déséquilibre de la structure de recueil et redondance des facteurs
    - Solutions au problème de la redondance des facteurs (solution structurelle/"Le plan d'expériences" - solution méthodologique / la méthode "Moindres carrés")

Adaptation de la méthode des "Moindres carrés" au traitement de variables explicatives qualitatives

Rappels sur la régression linéaire multiple :

  • Estimation des coefficients; algèbre linéaire & calcul matriciel
  • Incertitude sur les coefficients : erreurs type; t Student; intervalles de confiance
  • Analyse de la variance du modèle (ANOVA)
    - ANOVA globale : test "omnibus"; coefficients de détermination (R2 & R2 ajusté)
    - ANOVA détaillé : sommes de crrés de type I et de type II
    - Indicateurs de redondance : VIF & tolérance
    - Prédiction & incertitude de prédiction
    - Observations influentes : leviers; distances de Mahalanobis et de Cook; DFITS;
    résidus standardisés et studentisé
  • Analyse des résidus :
    - Test de normalité du résidu; observations atypiques : résidus standardisés & résidus studentisés; graphes
    - Homogénéité de variance (généralisation du test de Levene); graphes
    - Tests de séquences temporelles : Durbin-Watson; autocorrélation d'ordre 1; graphes

Codage numérique des modaliés d'une variable qualitative; variable indicatrices :

  • Codage binaire
  • Codage "ternaire"
  • Modèles associés
  • Interprétation des coefficients

Mise en oeuvre de l'analyse de variance à plusieurs facteurs :

  • Estimation des"moyennes des moindres carrés"
  • Test "post hoc" : Tukey, LSD, Scheffe, Bonferroni
  • Cas particulier des données équilibrées : estimation directe des moyennes

Objectifs

Apprendre - ou se remémorer - les concepts de l'analyse de la variance à plusieurs facteurs à partir d'exemples concrets.
Note

Peut-être très partiellement adapté pour Excel.