stata stata

Stata par la pratique : Statistiques, graphiques et éléments de programmation

Eric Cahuzac et Christophe Bontemps


Table des matières

Avant-propos

1. La logique Stata

  • 1.1 Un parcours
  • 1.2 Une organisation
    • 1.2.1 Les différents Stata
    • 1.2.2 Les fenêtres
    • 1.2.3 Les fichiers
    • 1.2.4 Les mises à jour
    • 1.2.5 L’ajout de nouveaux éléments
    • 1.2.6 Comment obtenir de l’information
    • 1.2.7 Quelques raccourcis

2. Manipuler les données

  • 2.1 Les données
    • 2.1.1 Importer des données...
    • 2.1.2 ... puis les enregistrer
  • 2.2 Quelques éléments du langage
    • 2.2.1 Les opérateurs
    • 2.2.2 La sélection de données
    • 2.2.3 Des commandes pour décrire les données
    • 2.2.4 Labels et annotations
  • 2.3 Les variables
    • 2.3.1 Les noms des variables
    • 2.3.2 La création de variables
      Le type des variables
      Les variables discrètes
      Les variables quantitatives
      Les variables chaînes
      Les variables système
    • 2.3.3 Le recodage des variables
    • 2.3.4 Changer le type d’une variable
  • 2.4 Les scalaires
  • 2.5 Les macros
  • 2.6 Les matrices
  • 2.7 En résumé
  • 2.8 Les fichiers de données
    • 2.8.1 Trier les données
    • 2.8.2 Combiner des fichiers
    • 2.8.3 Changer les données en mémoire

3. Statistique descriptive

  • 3.1 Statistique descriptive unidimensionnelle
    • 3.1.1 Description de variables discrètes
    • 3.1.2 Description de variables continues
    • 3.1.3 Quelques tests de normalité
    • 3.1.4 Quelques tests d’associations
      Tests paramétriques
      Tests non paramétriques
    • 3.1.5 Les pondérations
  • 3.2 Analyse statistique multidimensionnelle
    • 3.2.1 Analyse de variance
    • 3.2.2 Analyse de données
      Analyse en composantes principales
      Multidimensional scaling
      Analyse factorielle des correspondances
      Analyse des correspondances multiples
      Analyse factorielle discriminante
      Classification automatique

4. Modélisation et inférence

  • 4.1 Les modèles à variables quantitatives
    • 4.1.1 La régression linéaire
      Le résultat de l’ajustement
      Tests de Wald sur les variables
      Test du rapport de vraisemblance (LR)
      Test d’endogénéité
      Test de variables omises
      Test sur les résidus
      Multicolinéarité des régresseurs
      Test de l’homoscédasticité
    • 4.1.2 Les données de comptage
      Modèle de Poisson
      Modèle binômial négatif
      Modèle avec excès de zéros
  • 4.2 Les modèles à variables qualitatives
    • 4.2.1 Les modèles binaires logit et probit
      Tests de Wald sur les variables
      Tests d’ajustement due modèle
      Test du rapport de vraisemblance (LR)
      Utilisation de la commande predict
      Effets marginaux, changements discrets et élasticités
      Odds ratio ou rapport de cotes
    • 4.2.2 Modèles à variables multinomiales
      Modèles non ordonnés
      Logit multinomial
      Probit multinomial
      Modèles ordonnés

5. Analyse graphique des données

  • 5.1 L’interface graphique
  • 5.2 La logique
  • 5.3 Les options
    • 5.3.1 Labéliser les axes et définir les échelles
    • 5.3.2 Un graphe décortiqué : titres, labels, ...
    • 5.3.3 Les marqueurs, symboles
    • 5.3.4 Deux options particulières by() et over()
  • 5.4 Graphiques unidimensionnels (graph)
    • 5.4.1 Sur une variable discrète
      Graphiques en secteurs (pie)
      Diagrammes en bâtons (bar, hbar, dot)
    • 5.4.2 Sur une variable continue
      Boîtes à moustaches (box, hbox)
      Histogrammes et densités (hist, kdens)
  • 5.5 Graphiques bi-dimensionnels (twoway)
    • 5.5.1 Nuages de points et tendances
    • 5.5.2 Séries chronologiques
  • 5.6 Configuration et sauvegarde des graphiques
  • 5.7 Superposition de plus de deux séries
    • 5.7.1 Plusieurs séries sur une même abscisse
    • 5.7.2 Deux séries avec des ordonnées difféentes
    • 5.7.3 Combiner plusieurs graphiques
      Assembler des graphiques
      Matrices de graphiques
  • 5.8 Pour aller plus loin...
    • 5.8.1 Deux ordonnées
    • 5.8.2 Régression simple
    • 5.8.3 Régression non paramétrique
    • 5.8.4 Pyramide des âges
    • 5.8.5 Des points avec des labels
    • 5.8.6 Des barres empilées
    • 5.8.7 Des fonctions spécifiques
    • 5.8.8 Un intervalle de confiance sur un graphe

6. Les sorties pour la publication

  • 6.1 Les sorties Stata en LaTeX
    • 6.1.1 Les résultats de statistiques descriptives
    • 6.1.2 Les résultats des estimations
    • 6.1.3 Les sorties de log au format Stata Journal
  • 6.2 Les sorties vers les suites bureautiques
    • 6.2.1 Copier les résultats dans un traitement de texte
    • 6.2.2 Les résultats des statistiques descriptives
    • 6.2.3 Les résultats des estimations
    • 6.2.4 Copier les graphiques
  • 6.3 Les autres sorties (HTML, log)
    • 6.3.1 Transformer les fichiers log
    • 6.3.2 Les sorties HTML

7. Éléments de programmation

  • 7.1 Bons principes de programmation
    • 7.1.1 Bien écrire
      De la cohérence
      Les délimiteurs : le pour et le contre
      Des espaces de liberté
      Des remarques?
      L’indentation
      Écrire des phrases très longues
    • 7.1.2 Bien penser
      Du tact avec les fichiers
      De la concision
      Du simple au compliqué
    • 7.1.3 Laisser des traces...
      Conserver les résultats
      Conserver l’historique des commandes
    • 7.1.4 Bien gérer
      Compresser les fichiers
      Utiliser des fichiers temporaires
      Préserver et restaurer
      De la mémoire
      Faire le ménage... keep, drop, clear
      Utiliser le système
      Un bon profil : profile.do
  • 7.2 Les briques de base de la programmation
    • 7.2.1 Les macros
      Macros locales et globales
      Du bon usage des “guillemets” (quotes)
      Affichage des macros
      Manipulation des macros
    • 7.2.2 If, else et les contrôles
      Les dessous des “if”
    • 7.2.3 Les commandes répétées
      Les séquences de nombres
      Les traitements par lots (by et bysort)
      while
      forvalues
      foreach
    • 7.2.4 Se servir de ce qui a déjà été calculé
      Les résultats de statistiques descriptives : return list
      Les sorties d’une estimation : ereturn list
      Les modalités des variables : levelsof / distinct / vallist@
      Les paramètres du système : creturn list
  • 7.3 Programmation
    Programmes ou procédures?
    • 7.3.1 Les progammes : do
      Où commencer?
      Un programme simple
      Trouver une erreur
      Des programmes dans des programmes
      Un programme de vérification : assert, confirm, capture
    • 7.3.2 Les procédures : ado
      Différents types de procédures : les classes
      Passer des arguments — Nombre d’arguments fixe
      Passer des arguments — Nombre d’arguments libre
      Des procédures locales

8. Stata par l’exemple

  • 8.1 Sommes, lignes, colonnes, cumulées, totales...
  • 8.2 Calcul de parts de marchés
  • 8.3 Construction d’une matrice
  • 8.4 Tableau de pourcentages
  • 8.5 Compter au sein d’un groupe d’individus
  • 8.6 Compter le nombre d’occurrences différentes
  • 8.7 Former toutes les combinaisons possibles entre variables
  • 8.8 Tester l’occurrence d’une valeur au sein de plusieurs variables
  • 8.9 Tester une condition sur plusiers variables
  • 8.10 Combien de temps prend mon programme?
  • 8.11 Scinder une chaîne sur un séparateur
  • 8.12 Recherche d’observations identiques
  • 8.13 Supprimer les variables “constantes”
  • 8.14 Compléter des observations manquantes
  • 8.15 Remplacer le if... then... else
  • 8.16 Tronquer une chaîne selon une condition
  • 8.17 Calcul de matrices d’écarts
  • 8.18 Renommer toutes les variables
  • 8.19 Réorganiser un fichier
  • 8.20 Correspondances de listes dans une boucle
  • 8.21 Analyse grammaticale de macro-lists
  • 8.22 Sélectionner une partie des données
  • 8.23 Quelques pièges dans lesquels le bon sens pourrait tomber...
    • 8.23.1 Addition de macros
    • 8.23.2 Manipulation avancée de macros
    • 8.23.3 Tests triples

A/ Des messages d’erreur courants

  • A.1 unrecognized command
  • A.2 type mismatch
  • A.3 var already exists
  • A.4 not sorted : r(5)
  • A.5 no rooom to add more obs
  • A.6 matsize too small
  • A.7 op. sys. refuses to provide memory : r(909)

Bibliographie
Index des auteurs
Index général
Index des commandes, options, et fonctions