Contenu - ECONOMETRIE

Econométrie

Voici quelques (tentatives) de définition de l'Econométrie :

Définition 1 Etudes des relations quantitatives de la vie économique faisant appel à l'analyse statistique et à la formulation mathématique.

Définition 2 L'économétrie exprime quantitativement les corrélations pouvant exister entre des phénomènes économiques dont la théorie affirme l'existence. La théorie économique fournit des idées sur les processus qui déterminent les grandeurs économiques, l'économétrie apporte une vérification empirique et établit quantitativement les corrélations qui apparaissent valides.

Définition 3 L'objectif de l'économétrie est de confronter un modèle économique à un ensemble de données (données de panel, série temporelle, etc.) et ainsi d'en vérifier la validité.

Définition 4 L'économétrie est une branche de l'économie qui traite de l'estimation pratique des relations économiques.

Régression linéaire multiple

Ce cours est dispensé en licence IUP IDS.

Sa portée est à la fois restreinte et élargie. " Restreinte " car nous nous intéresserons uniquement aux modèles linéaires à une équation (on parle alors de régression linéaire multiple) ; " élargie " car nous l'appliquerons à des domaines variés autres que l'économie, tous les domaines où il est intéressant d'évaluer des relations de causalité entre des variables statistiques (marketing, écologie, santé, psychologie, sociologie, etc.).

La démarche est toujours la même dans tous les cas : délimiter un champ d'application (population étudiée, individu statistique), formaliser un problème de causalité (endogène, exogènes candidats, résultats attendus), utiliser les données (échantillon) pour valider ou invalider les hypothèses émises (coefficients significatifs, analyse de variance), interpréter et utiliser les résultats (signe et valeur des coefficients, prédiction pour un nouvel individu).

Ressources - ECONOMETRIE

Ressource Accès
Supports de cours et cours en ligne
Recueil de supports sur le traitement statistique des données et le Data Mining. Cours, fichiers de données et exemples traités à l'aide de logiciels libres. Voir la section consacrée à la régression.
Slides et quelques supports en ligne pour mes enseignements
Introduction à l'Econométrie
Introduction à l'économétrie. Définition(s). Démarche économétrique.
Domaines d'application de la régression.
Analyse de corrélation
Diaporama. Analyse de corrélation. Covariance, coefficient de corrélation linéaire de Bravais-Pearson, test de significativité, intervalle de confiance, corrélation brute et partielle.
Analyse de corrélation - Etude des dépendances, variables quantitatives (5 chapitres). Fascicule de cours. Corrélation brute, partielle et semi-partielle. Inférence statistique et transformation de Fisher.
Régression linéaire simple et multiple
Régression linéaire simple. Présentation détaillée de la régression linéaire simple. Tests d'hypothèses, intervalles de confiance, fourchettes de prévision.
Régression linéaire multiple. Présentation détaillée de la régression linéaire multiple. Tests d'hypothèses, intervalles de confiance, fourchettes de prévision.
Econométrie - Régression linéaire simple et multiple (15 chapitres). Fascicule de cours.
Pratique de la Régression Linéaire Multiple
Analyse graphique des résidus et test de Normalité.
Détection et traitement des points atypiques et influents.
Colinéarité : conséquences et traitement. Sélection de variables.
Régression sur exogènes qualitatives. Codage et interprétation des résultats.
Rupture de structure : détection, test de Chow, analyser la nature de la rupture.
Pratique de la Régression Linéaire Multiple - Diagnostic et Sélection de Variables (5 chapitres). Fascicule de cours.
Corrélation, Régression Linéaire Simple et Multiple (autres supports, moins détaillés)
Introduction : Corrélation, régression linéaire simple et multiple (R.R.). Un tour d'horizon global de la problématique de la régression, ses propriétés, sa mise en œuvre dans la pratique.
Présentation rapide de la régression linéaire multiple.
Régression linéaire multiple sur wikipédia
Econométrie des variables qualitatives (Régression logistique)
Diaporama. Régression logistique binaire. Estimation, évaluation et interprétation.
Diaporama. Régression logistique polytomique. Estimation, évaluation et interprétation.
Pratique de la régression logistique. Régression logistique binaire et polytomique (17 chapitres). Fascicule de cours.
Cours de Christophe Hurlin (Université d'orleans - Niveau Master). Econométrie des variables qualitatives.
Autres références en ligne
OpenIntro. Un fabuleux portail de cours en ligne incluant un ouvrage (téléchargeable gratuitement) qui sert de socle au site, des slides de présentation, des exercices pour le logiciel R, des tutoriels vidéos. Le livre décrit principalement l’inférence statistique (estimation et test), puis la régression simple et multiple. Un forum permet de poser des questions. Site à consulter absolument.
Collaborative Statistics. Un site collaboratif de partage de cours. Cette partie traite des enseignements de statistique du parcours licence : statistique descriptive, probabilité, inférence statistique, corrélation, régression simple et multiple. Des labs (exercices) viennent ponctuer et valider chaque chapitre du cours.
NIST -- Handbook of Statistical Methods : voir en particulier le chapitre Models, la démarche de modélisation qui y est décrite peut servir de référence pour les dossiers. Les autres chapitres sont tout aussi intéréssants pour peu que l'on s'intéresse au traitement des données.
Cours de D. Marcotte à l'Ecole Polytechnique de Montreal, avec des annales d'examens.
Statistics - Econometrics - Forecasting -- Une collection de ressources sur les stats, la régression et la prévision. Le cours d'économétrie est très simple et facile à suivre, la plupart des démonstrations sont détaillées. (très très bon site, en anglais certes mais même moi j'arrive à lire...)
Un portail sur l'inférence statistique et les tests, cours et exercices en ligne, etc. (voir la section Prediction)
Régression linéaire simple -- INPL de Nancy
Régression linéaire multiple sur Wikipédia
Recueil de liens (portail) sur des cours en anglais concernant l'économétrie.
Ma série de liens sur les ressources statistiques.
Fichiers exemples en relation avec le cours
La régression simple : estimation des coefficients, test de la régression et des coefficients
Sujet : Expliquer les rendements agricoles
La régression multiple : estimation et tests
Détection des observations atypiques
Sélection de variables
Sujet : Expliquer la consommation des véhicules
Détecter les ruptures de structures, identifier leur nature
Sujet : extrait du livre de Johnston pp.135
Régression sur des exogènes qualitatives, interprétation des coefficients
Sujet : expliquer le niveau des loyers selon le lieu de résidence
TD : Régression et projection
Sujet : expliquer les homicides dans la ville de DETROIT
TD : Régression, détection de la colinéarité et sélection automatique de variables
Sujet : expliquer le taux de CO dans les cigarettes
Didacticiels. Mise en oeuvre de la régression linéaire multiple avec le logiciel gratuit TANAGRA.
Description, jeux de données et résolution.

Quelques serveurs de données. Ca peut être utile pour les exercices, les dossiers. Certains sont particulièrement intéressants car les données sont accompagnées de commentaires : quels sont les traitements les plus appropriés, les résultats que l'on devrait obtenir, les problèmes qui ne manqueront pas de perturber l'analyse. DASL
LibStat (dataset)
Stat Site
DELVE
RegGraph
Logiciels gratuits
Une collection de macros EXCEL qui permettent d'exécuter automatiquement les principales opérations de la régression linéaire multiple : statistiques descriptives, estimation des paramètres, analyse des résidus, étude des points atypiques, étude la colinéarité.

Ce travail a été réalisé en stage de M1 au sein du laboratoire ERIC par Mlle NGUYEN LAO Bao Truc.

REGRESS32 : un logiciel d'économétrie qui suit à la lettre le programme de l'IUP IDS -- L3 et M1.

Quelques fonctionnalités disponibles : régression linéaire multiple, analyse des résidus -- test de normalité à l'aide du skewness et du kurtosis, détection des points atypiques (LEVERAGE et RSTUDENT), détection et traitement de l'autocorrélation, détection et traitment de l'hétéroscédasticité, graphique des résidus.

Le logiciel traite les fichiers au format texte (séparateur tabulation). Avantage de cette méthode, le format texte est universel (Windows, Unix, etc.) et n'est pas susceptible d'être modifié dans le millénaire qui vient (pas de release intempestive avec des formats non compatibles).

NEW (05/2011) : REGRESS peut s'intégrer dans le tableur EXCEL maintenant via la macro complémentaire SIPINA.XLA ! Il peut traiter directement les données chargées dans le tableur. Voir le premier lien ci-contre.

TANAGRA : un logiciel de statistique, d'économétrie et d'analyse de données.

La régression linéaire multiple est disponible, ainsi que la sélection progressive de variables (FORWARD SELECTION) fondé sur le calcul des corrélations partielles. Des tutoriels en ligne permettent de se familiariser avec les fonctionnalités de l'outil. Le mode d'utilisation du logiciel est très proche des logiciels commerciaux tels que SPAD (c), CLEMENTINE de SPSS(c), ENTERPRISE MINER de SAS (c), DATA MINER de STATISTICA (c). Il peut charger directement les fichiers au format EXCEL (c).
N.B.: Pour les curieux, le code source DELPHI (c) est téléchargeable, il vous est possible de modifier le logiciel pour y ajouter de nouvelles techniques.

OPENSTAT : un logiciel de statistique et d'économétrie.

Très simple d'utilisation, il propose de nombreuses techniques relatives à la régression multiple linéaire : sélection progressive, sélection backward, régression logistique. Le niveau technique proposé est très bon.

Il ne traite que les fichiers texte (séparateur tabulation que l'on peut générer facilement à partir d'un tableur), très intéressant, une version DELPHI avec code source peut être téléchargée gratuitement. Une documentation complète est disponible.

GRETL : un logiciel d'économétrie multi-plates-formes.

Très simple d'utilisation, il propose la régression multiple linéaire mais également d'autres techniques spécifiques de régression telles que la régression pondérée, le traitement de l'hétéroscédascticité. Il est également possible de calculer très simplement des statistiques descriptives. Le niveau technique proposé est très intéressant.

Atout indéniable, il charge directement les fichiers EXCEL (c) et on a accès à une documentation convenable.

ARC : un logiciel de statistique qui vient en complément du livre Applied Regression Including Computing and Graphics by R. Dennis Cook and Sanford Weisberg, published by John Wiley & Sons in August, 1999 (ISBN 0-471-31711-X).

Beaucoup de possibilités en matière de régression, de très bonnes fonctionnalités graphiques. Le logiciel ne supporte que le format LSP (LISP), même si c'est un format texte, la préparation des données selon le spécifications requises reste fastidieux.

PopTools : un logiciel de statistique qui se présente comme un add-in pour EXCEL (c).

Beaucoup de fonctionnalités statistiques, mais surtout il peut profiter de tout l'arsenal de traitement de données déjà présent dans le tableur. De très nombreuses techniques statistiques et d'analyse de données sont disponibles (ACP, ANOVA, etc.), y compris la régression linéaire multiple.

SSP : un logiciel déconométrie (Smith's Statistical Package).

Très simple d'utilisation, il implémente la régression linéaire multiple. Quelques techniques inférentielles sont également disponibles. Ne traite que les fichiers au format texte. Pas de documentation.

DATAPLOT : un excellent logiciel du National Institue of Standards and Technology -- Statistical Enginnering Division [NIST].

Une richesse énorme, des calculs très précis, les résultats que le logiciel propose servent souvent de référence pour les différentes implémentations réalisées par les autres programmeurs (je me compare systématiquement à eux). Ils offrent une bibliothèque de données tests, il est également possible d'effectuer des traitement sur ses propres données et... c'est là que le bât blesse. Les programmeurs de cet outil ne doivent pas connaître le concept "user-friendly", la profondeur des menus et leur imbrication s'apparente à un labyrinthe sans fin.

Deux portails avec des liens vers toute une série de logiciels gratuits

Ricco Rakotomalala – Université Lyon 2