Publier
Consulter, acheter et télécharger des documents, présentations, modèles et ebooks sur Needocs (PDF, Word, Powerpoint, Excel)

Introduction aux méthodes économétriques

Téléchargement
Publié par : Superwaldo










L’ANALYSE DES RELATIONS DE CAUSALITE ET DE COINTEGRATION

DANS LES MODELES DYNAMIQUES :

UNE INTRODUCTION AUX METHODES ECONOMETRIQUES







Notes de cours


Version révisée 2009




Serge REY
Professeur





Université de Pau et des Pays de l'Adour
C.A.T.T. Centre d’Analyse Théorique et de Traitement des données économiques, EA 753
Département d' Economie et Gestion
Avenue du Doyen Poplawski
64016 Pau, FRANCE
Tél: 05 59 40 80 06
E-Mail: serge.rey@univ-pau.fr
http://catt.univ-pau.fr/live/



2

AVANT-PROPOS

« Jusqu’à récemment, le vaste ensemble de la théorie économétrique a été basé
sur l’hypothèse que les processus de données sont stationnaires et ergodiques (ergodic), en
dépit d’une non stationnarité manifeste des séries temporelles auxquelles la théorie était
appliquée en économie. Sur le siècle passé, la plupart des variables économiques se sont
souvent radicalement modifiées, en ce qui concerne leur moyenne et souvent leur variance,
de sorte que les deux premiers moments ne sont pas constants. Les conséquences pour les
propriétés statistiques des estimations et les tests sont profondes, comme l’a montré la
littérature sur les spurious regressions ».

Ce commentaire d’Hendry (1986) permet de comprendre le développement
important durant les années 1980 de la théorie économétrique en ce qui concerne à la fois
l’étude de la stationnarité des séries et les relations entre séries non stationnaires.

L’objet de ce travail n’est pas de réaliser un recensement exhaustif de toutes les
méthodes statistiques qui ont pu être élaborées dans ce domaine, d’autant que les
recherches progressent régulièrement, ce qui génère sans cesse de nouvelles techniques
économétriques.

On se fixera plutôt comme objectif de faire le point sur quelques méthodes qui
constituent le socle de ces travaux, le lecteur intéressé par certaines techniques pouvant
toujours approfondir ses connaissances (on donnera ici quelques pistes utiles). En
particulier on s’intéressera aux modèles de causalité, aux modèles dynamiques multivariés
et aux relations entre séries non stationnaires. Si ces trois domaines peuvent paraître à
première vue distincts, il n’en est rien en réalité. D’une part la synthèse a pu être faite entre
modèles dynamiques multivariés et relations entre séries non stationnaires, à travers les
représentations dites à correction d’erreur. D’autre part, le développement des modèles
multivariés a conduit à reconsidérer les problèmes de causalité, soit en amont au moment
de la construction du modèle, soit en aval lorsqu’on a cherché à interpréter certains résultats
des estimations en termes de causalité.


3
1. INTRODUCTION

Dans son réexamen de la théorie quantitative de la Monnaie, M. Allais (1965,
p. 22) regrettait que:
« l’étude des effets héréditaires dans les phénomènes de la
nature, qu’il s’agisse de la nature physique ou de la nature
humaine, ont été indûment négligés »
et il espérait que son travail:
« puisse en particulier contribuer à attirer l’attention des
économistes et des sociologues sur l’importance d’une telle
étude ».



Ce concept d’effet héréditaire ou effet de mémoire avait néanmoins été abordé
dans le cadre des premiers modèles à retards échelonnés1 (distributed lags) ; l’utilité de ces
modèles étant d’autant plus grande que l’analyse économique impose d’identifier les causes
et les effets des phénomènes étudiés. Il subsistait cependant un risque, comme l’ont
souligné Tobin et Brainard, celui d’observer un ordre temporel qui ne soit pas cohérent
avec l’ordre causal (Sims, 1972).

C’est tout l’intérêt du travail de Granger (1969) d’avoir donné une définition de
la causalité qui puisse être vérifiée empiriquement sur la base d’études de séries
temporelles. Le travail initial de Granger complété par celui de Sims (1972) contribua à un
regain d’intérêt pour les modèles à retards échelonnés, ce qui se traduisit par une
multiplication de travaux empiriques concernant la causalité entre variables économiques2 .

Néanmoins, ces études confinées pour l’essentiel à des modèles bivariés
(relation entre deux variables) pouvaient paraître d’une portée limitée pour l’analyse des
phénomènes économiques qui font en général intervenir un plus grand nombre de variables.
Pour lever ces difficultés, Sims (1980) a proposé l’élaboration d’un modèle multivarié dans

1 Cf. WOLD (1938, 1953), KENDALL (1948), TINTNER (1952) KOYCK (1954), ALMON (1965),
GRILICHES (1967), JORGENSON (1966), DHRYMES (1971) et le travail plus récent de MUET (1979).
2 Cf. par exemple FEIGE et PEARCE (1979).


4
lequel chaque variable dépend de son propre passé et du passé de toutes les autres variables
du modèle. La distinction a priori entre variables exogènes et variables endogènes n’a plus
lieu d’être, toutes les variables étant supposées endogènes. On parle alors de Vecteur
AutoRegressif (modèle VAR). Cette approche beaucoup plus statistique qu’économétrique,
dans la mesure où le modèle multivarié a un caractère a-théorique, permet cependant
d’étudier la dynamique des variables du système lorsque l’une d’entre elles est modifiée
(choc sur une variable), ainsi que la contribution de chaque variable du modèle aux
variations d’une d’entre elles (décomposition de la variance de l’erreur de prévision). Pour
ces raisons la méthode proposée par Sims a connu un vif intérêt. Néanmoins, elle s’est très
vite heurtée à certaines limites.
En premier lieu, le fait de supposer que chaque variable dépend du passé de
toutes les variables du système peut conduire à un excès de paramètres à estimer
(surparamétrisation). Plusieurs méthodes ont alors été proposées pour limiter le nombre de
paramètres à estimer, c’est-à-dire limiter le nombre de variables du côté droit des équations.
Parmi les approches possibles, on verra que l’utilisation de tests de causalité du type
Granger permet d’offrir une solution à ce problème. Ces tests peuvent être menés au
moment de la construction du modèle (utilisation de la méthode de Caines, Keng et Sethi
par exemple) ce qui conduit à ne retenir que certaines variables du côté droit. Mais il est
aussi possible de réaliser ces tests a posteriori, c’est-à-dire après une première estimation
du modèle standard. Dans ce dernier cas, on procèdera à une deuxième estimation après
élimination de certaines variables, celles qui ne “causent pas” la variable expliquée.
L’analyse des relations de causalité, limitée originellement à des processus bivariés, trouve
là une extension intéressante dans le cadre des modèles multivariés.
En second lieu, l’estimation de ces modèles VAR, ainsi que la pratique des tests
de causalité, impose que l’on travaille sur des séries stationnaires, c’est-à-dire des séries
dont les moments d’ordre un et deux sont indépendants du temps (stationnarité faible).
Paradoxalement, on sait depuis les travaux de Beveridge et Nelson (1981), Nelson et
Plosser (1982)..., que la plupart des variables macroéconomiques se comportent comme des
marches aléatoires/processus non stationnaires. Si la différenciation permet dans ce cas de
rendre les séries stationnaires, elle conduit cependant à une perte d’information sur les
relations de long terme. Plutôt que de travailler sur des modèles VAR en différences,


5
certains auteurs (Johansen, Juselius...) ont alors proposé des méthodes d’estimations de
modèles VAR en niveau.
Mais le développement des modèles VAR ne s’est pas arrêté là. Parallèlement à
l’étude des représentations autorégressives, de nombreux auteurs et souvent les mêmes que
ceux qui s’intéressaient aux modèles VAR, ont développé une économétrie des séries non
stationnaires. Il s’agissait d’une part de préciser la forme de la non stationnarité des séries
(tests de racine unitaire), et d’autre part de proposer des méthodes d’estimation des
relations de long terme entre des séries qui se comportent comme des marches aléatoires
(relations de cointégration). Ces travaux étant suffisamment avancés, il restait alors à tenter
une synthèse entre l’analyse des relations de court-moyen terme, et l’analyse des relations
de long terme. Cette synthèse s’est opérée sur la base des travaux d’Hendry et alii 3. Ces
auteurs analysent simultanément ces deux types de relations, dans le cadre d’un modèle
unique, appelé encore modèle à correction d’erreur. Appliqué aux modèles multivariés,
cette construction permet d’obtenir un vecteur à correction d’erreur (modèle VECM).

L’objet de ce travail est donc de proposer une présentation de ces méthodes
économétriques, en s’efforçant d’en montrer la complémentarité, qui s’avère précieuse dans
le cadre d’études des relations dynamiques entre variables économiques.

Ainsi dans une première étape (Section 2) on rappellera la notion de causalité
selon Granger ainsi que les principales procédures de tests qui s’y réfèrent. Dans une
deuxième étape (Section 3), on analysera les modèles VAR standard, tout en précisant le
statut du concept de causalité. Enfin, après avoir exposé certaines des principales méthodes
d’analyse des variables non stationnaires (Section 4), on reviendra sur les modèles VAR à
travers les représentations en termes de correction d’erreur (Section 5).






3 Cf. DAVIDSON, HENDRY, SRBA, YEO (1978), HENDRY et MIZON (1978).


6
2. L’ANALYSE DES RELATIONS DE CAUSALITÉ:

On s’attachera ici à rappeler d’une part, d’un point de vue théorique et d’autre
part d’un point de vue pratique, les différentes définitions de la causalité.

2.1. - Le concept de causalité selon Granger

On peut accepter la notion de causalité dans un sens intuitif, en considérant
qu’une variable Y cause une variable Y , si la prise en compte de l’histoire de Y
1
2
1 permet de
réaliser une meilleure prédiction de Y que celle que l’on obtiendrait à partir de la seule
2
information sur le passé de Y .
2
C’est cette notion de prédictibilité qui est au cœur de la définition proposée par
Granger (1969). D’un point de vue statistique, on sera amené à introduire le concept de
prédicteur optimum pour préciser cette notion de causalité. Considérons les définitions
suivantes:


a- ϕ représente toute l’information accumulée dans l’univers à la période t.
t


b- Y et Y sont deux processus stochastiques stationnaires
1
2


c- Y constitue l’ensemble des valeurs passées de Y ; soit l’ensemble
it
it
{
L
Y
.
i t − , j
,
j
= ,1 ,
2
}



d- Y constitue l’ensemble des valeurs passées et présente de Y , soit l’ensemble
it
it
{
L
Y
.
i t − , j
,
j
= ,
1
,
0
,
2
}



e- ϕ − Y représente toutes les informations passées de l’univers non comprises
t
it
celle afférant à Y .
it



7
Ainsi on appellera σ 2 (Y /
la variance (conditionnelle à l’information ϕ ) de
i
ϕ)
l’erreur de prédiction de Y 4. L’analyse de cette variance5 permettra de proposer la
i
typologie suivante des cas de causalité;

1- On dira que Y cause Y si
1
2


2
σ (Y /ϕ )
2
〈 σ Y /ϕ − Y




(2.1)
2
( 2
1 )


En d’autres termes, Y est cause de Y si la prédiction de Y peut être améliorée
1
2
2
(variance de l’erreur de prédiction plus faible) lorsqu’on prend en compte l’information sur
les valeurs passées de Y .
1

2 - On dira que Y cause instantanément Y , si
1
2

σ 2 (Y / Y Y




(2.2)
2
ϕ , )



σ 2
1
( /2ϕ)

Y est mieux “prédit” lorsqu’on prend également en compte la valeur présente
2
de Y , que lorsqu’on ne retient que les valeurs passées de Y 6 .
1
1

3 - On dira que Y cause Y avec un retard L si L est la plus petite valeur de k,
1
2
tel que

2
σ (Y /ϕ −Y (k) 〈 σ ϕ −Y k +
(2.3)
2
) 2
1
(
(
)
1
1
)

4 On admettra que le prédicteur est optimum, ce qui garantit qu’il est non biaisé et de variance minimum. On
reviendra plus loin sur sa définition.
5
2
Dans la mesure où les processus stochastiques sont stationnaires, σ est indépendante du temps, ce qui
garantit que les relations de causalité ne sont pas altérées par le temps (GRANGER 1969, p. 429).
6 Dans la perspective d’un travail empirique, cette définition est importante. En effet, si on décèle une
causalité instantanée, en utilisant par exemple des données trimestrielles, cela peut refléter une relation de
causalité unidirectionnelle qui pourra être mise en évidence à l’aide de données à plus haute fréquence, c’est-


8

avec Y (k) = Y

t
j
j
= k k +
1
{ ,
,
,
1 ...
,
1
}.

La connaissance des valeurs de Y postérieures à Y (t k) ne permet pas
1
1
d’améliorer la prédiction de Y .
2

4 - On parlera de causalité avec feedback (effet de rétroaction) lorsque Y cause
1
Y et Y cause Y , soit
2
2
1

2
σ (Y /ϕ )
2
〈 σ Y /ϕ − Y
2
( 2
1 )



et







(2.4)
2
σ (Y /ϕ )
2
〈 σ Y /ϕ − Y
1
( 1
2 )

La notion de causalité étant précisée sur le plan théorique, il convient alors d’en
donner une définition plus opérationnelle.

2.2. Des définitions opérationnelles du concept de causalité

Le passage d’une définition théorique en termes de variance de l’erreur de
prévision à une définition opérationnelle (testable grâce aux méthodes économétriques)
nécessite la prise en compte d’hypothèses supplémentaires.

1- Comme le suggère Granger, il n’est pas réaliste de supposer que toute
l’information contenue dans l’univers soit nécessaire pour préciser les relations causales.
On admettra que la seule information pertinente est celle qui concerne les processus Y .
i
2- On considérera que le meilleur prédicteur de Y est un prédicteur linéaire,
i
reposant sur l’information passée concernant les variables du modèle.

à-dire mensuelles, hebdomadaires...


9
Ainsi, si on s’en tient à une étude de la causalité entre deux séries stationnaires,
Y et Y (modèle bivarié), le meilleur prédicteur de Y (resp. Y ), utilisant les informations
1
2
1
2
passées de Y et Y , aura la forme suivante;
1
2



(2.5)
Pr(Y /Y ,Y
α
β

1
1
2 ) = ∑
Y1 + ∑ Y
i
t i
i
2t i
i =1
i=1

Où les α et β sont choisis de manière à minimiser 2
σ (Y /Y ,Y .
1
1
2 )
i
i

Dans la pratique, on admettra que le nombre de retards est fini (ici m) et on
pourra préciser la notion de la causalité (ou plutôt de non causalité) à partir d’un modèle
autoregressif de la forme,

m
m


Y = ∑α Y
β
7
− + ∑
Y − + u



(2.6)
t
1
i
t
1
i
i
2t i
t
1
i 1
=
i 1
=
m
m
Y = ∑γ Y
δ
− + ∑
Y − + u



(2.6’)
2t
i
t
1
i
i
2t i
2t
i 1
=
i 1
=

ou de manière équivalente

Y
ψ L Y ψ L Y
u
t
1
= 11( ) t1 + 12 ( ) 2t +


t
1




(2.7)
Y
ψ L Y ψ L Y
u
2t =
21 (
) t1 + 22( ) 2t + 2t
soit encore,

Y
ψ (L) ψ (L) Y  u
 1  =  11
12
 ⋅  1  +  1 


(2.7’)
Y
ψ (L) ψ (L) Y
u
2 
 21
22
  2   2 


7 Par souci de simplification, on néglige les termes constants, ce qui implique que les séries sont de moyenne
nulle.


10
où les ψ (L) représentent les polynomes d’opérateur retard L , tel que
ij
p
L Y = Y
.
t
t p

- u et u sont des innovations bruits blancs de moyenne nulle avec
1
2
u
t
E
1


 (u
u
λ




(2.8)
1s
2 s )

 = t,s ⋅ Ω
u2t


où λ =1 pour t=s, 0 autrement. Ω représente la matrice des covariances.
t ,s

Sur la base du modèle (2.7) on peut retrouver les différentes définitions de la
causalité (ou de la non causalité). Ainsi,

a- on dira que Y cause Y , que l’on notera Y Y , si et seulement si ψ (L) ≠ 0 .
1
2
1
2
21
De manière équivalente, Y ne cause pas Y (noté Y
/ Y ) si ψ (L) = 0 .
1
2
1
2
21


b- on dira que Y et Y se causent simultanément et de manière instantanée (noté
1
2
Y inst. Y ) si la matrice des covariances Ω n’est pas diagonale. De même, Y ne cause pas
1
2
1
instantanément Y ( Y ne cause pas instantanément Y ) si la matrice des covariances Ω est
2
2
1
diagonale.

c- on parlera de causalité dans une direction (unidirectionnelle), lorsque par exemple
Y Y et Y
/ Y ; soit encore ψ (L) ≠ 0 et ψ (L) = 0 .
1
2
2
1
21
12


d- on dira enfin qu’il y a causalité avec feed-back, ou causalité bidirectionnelle, Y
1
Y et Y Y , lorsqu’on vérifie simultanément ψ (L) ≠ 0 et ψ (L) ≠ 0 . De même,
2
2
1
21
12
l’absence de toute relation causale entre Y et Y imposera que ψ (L) = 0 et ψ (L) = 0 .
1
2
21
12

La causalité/la non causalité au sens de Granger ayant été définie, on peut se
demander si ce concept est équivalent à celui d’exogénéïté.



11
2.3. Causalité et exogénéïté

Y-a-t-il équivalence entre la notion de non causalité et celle d’exogénéïté?
Cette question se pose d’autant plus que dans les tests qui vont suivre on verra que Sims
interprète le test de causalité, au sens de Granger, comme un test d’éxogénéïté.
On peut considérer qu’une variable Y est strictement exogène si elle est
t
1
indépendante des erreurs passées, présente et futures89.

Considérons le modèle bivarié,

Y
a1 Y
a2 Y
a3 Y
u
t
1
= ⋅ 2t +
t1−1 + ⋅ 2t−1 +

t


(2.9)
Y
b1 Y
b2 Y
b3 Y
v
2t =
t1 + ⋅ t1−1 + ⋅ 2t−1 + t

Y sera strictement exogène si Y est indépendante des u passées, présente et
2t
2t
futures dans l’équation (2.9). Cette condition sera remplie si on a simultanément b1=0 et b2
=0. Or cette condition est précisément celle qui garantit que Y ne cause pas Y . On peut
1
2
donc dire que l’exogénéïté implique la non causalité. Mais y a-t-il pour autant équivalence
entre ces deux concepts? Si on réécrit le modèle précédent sous forme réduite, soit

Y
π Y
π Y
u
t
1
= 11 ⋅ t1−1 + 12 ⋅ 2t−1 + t1





(2.10)
Y
π Y
π
Y
v
2t =
21 ⋅
t
1 −1 +
22 ⋅
2t −1 +
t
1

1
b .a2 + b2

On dira que Y ne cause pas Y si π
= 0 . Or π =
. On vérifie donc
1
2
21
21
1 − 1
b . 1
a
aisément que la non causalité, soit b1.a2 + b2 =0 n’implique pas l’exogénéïté, puisque
cette dernière impose que simultanément b1=0 et b2 =0. D’un autre côté, on confirme que
l’exogénéïté implique la non causalité. Un test d’exogénéïté pourra donc être considéré

8 Cette présentation est inspirée de Maddala (1992). On peut trouver une réinterprétation de la notion
d’exogénéïté dans Engle, Hendry et Richard (1983).
9 De même, Y sera dite prédéterminée si elle est indépendante des erreurs présente (contemporaine) et
t
1
futures.



12
comme un test de non causalité alors que l’inverse ne sera pas vrai. On peut donc à ce stade
procéder à un exposé des tests de relations causales.

2.4. La détection des relations causales

Sur la base des définitions précédentes, plusieurs tests ont été proposés. Les
premiers se sont attachés à rechercher une relation causale simple entre deux variables. Par
la suite, certains auteurs ont tenté d’analyser des relations de causalité multiples entre
plusieurs variables. Les tests qui seront présentés ici auront en commun le fait qu’ils
s’appuient sur des représentations autoregressives.

2.4.1. La détection de relations causales simples

Traditionnellement, les trois procédures de tests les plus répandues dans la
littérature sont l’approche de Granger, l’approche de Sims et l’approche de Haugh et
Pierce. La méthode de Haugh et Pierce repose sur une étude des coefficients de corrélation
croisés (cross-correlation) calculés pour les résidus des séries filtrées préalablement,
suivant la procédure de Box et Jenkins (modèle Arima)10. Compte tenu des critiques
concernant à la fois la lourdeur de la procédure et le peu de garantie que la relation sur les
résidus soit fidèle à la relation sur les séries brutes11, la plupart des auteurs ont privilégié les
approches de Granger et Sims. On verra alors que les procédures originelles proposées par
ces auteurs ont pu être enrichies pour dépasser certaines critiques concernant la pratique des
tests.

A- L’approche de Granger:

Suite aux travaux de Granger (1969), plusieurs auteurs parmi lesquels on
pourra citer Sargent (1976), Mehra (1977), Gordon (1977), Haugh et Pierce (1977), ont

10 Pour une présentation détaillée de cette procédure, on pourra se reporter à HAUGH et PIERCE (1977),
COLLETAZ (1978).
11 Cf. par exemple SCHWERT (1977).


13
proposé un test qui s’appuie sur le modèle (2.6). En effet, si on retient un processus
autoregressif de cette forme, soit

m
m
Y = ∑α Y
β
− + ∑
Y − + u
t
1
i
t
1
i
i
2t i
t
1
i 1
=
i 1
=
m
m
Y = ∑γ Y
δ
− + ∑
Y − + u
2t
i
t
1
i
i
2t i
2t
i 1
=
i 1
=


sous l’hypothèse nulle que Y ne cause pas Y , on aura β
, ∀ i. Tous les β
i = 0
2
1
i
sont alors nuls. De même, on ne rejettera pas l’hypothèse nulle que Y ne cause pas Y ,
1
2
lorsque tous les γ sont nuls; soit γ
, ∀ i .
i = 0
i

C’est cette hypothèse de nullité conjointe des coefficients β dans l’équation de
i
Y , γ dans l’équation de Y , qui sera testée. En règle générale, la plupart des auteurs
1
i
2
utilisent un F-test pour conclure sur la significativité des coefficients. L’utilisation de ce F-
test peut cependant se heurter à certaines difficultés dans la mesure où le nombre de retards
m est fixé de manière arbitraire. On sait en effet que l’insuffisance ou le nombre excessif de
retards peut être la cause de l’acceptation de l’hypothèse nulle alors qu’en fait elle doit être
rejetée. Dans ce cas l’utilisation d’un critère de sélection du retard optimal permet de
remédier à ce problème. Par exemple, Hsiao (1981) propose une méthode, dite aussi “pas à
pas”, qui permet à la fois de traiter le problème de la détermination du nombre de retards
grâce à l’utilisation du FPE (Final Predictor Error) d’Akaike12, et d’interpréter les résultats
en termes de causalité.
En effet, si on revient à l’équation (2.6), pour obtenir le meilleur modèle, il
serait nécessaire d’effectuer toutes les combinaisons possibles de retards pour Y et pour Y
1
2
afin de choisir la combinaison qui donne le FPE minimum. Ainsi, si on suppose que le
nombre de retard peut varier entre 0 et M pour Y et Y , il faudrait estimer (M + )2
1
1
2

12 Si on considère une équation du type (2.6) avec m retards sur la première variable, n retards sur la seconde,
2
T + m + n uˆt
le FPE sera de la forme : FPE(m, n) =

, où T représente le nombre d’observations.
T m n
T


14
régressions et donc calculer (M + )2
1 FPE. Cette procédure beaucoup trop lourde peut être
améliorée en suivant la démarche de Hsiao.
1- On recherche dans un premier temps le nombre de retards sur Y , appelé m1,
1
tel que FPE soit minimum. Pour cela, on va régresser Y uniquement sur ses valeurs
1
passées.
2- m1 étant déterminé, Y peut être considéré comme une variable contrôlée, et
1
Y comme une variable manipulée. Aussi, on procèdera dans une deuxième étape à une
2
régression de Y sur ses propres valeurs passées (jusqu’à t-m
1
1) et sur les valeurs passées de
Y . Pour cela on augmentera successivement le nombre de retards sur Y , jusqu’à
2
2
déterminer m2 pour lequel le FPE est minimum. Connaissant le FPE minimum, pour m1
d’un côté, pour m1 et m2 de l’autre, on peut interpréter ces résultats en termes de causalité
au sens de Granger. En effet, si on vérifie que FPE(m1,0) > FPE(m1, m2), cela signifie que
Y cause Y . En revanche, si la valeur du FPE ne décroît pas lorsqu’on augmente le nombre
2
1
de retards, on pourra en déduire que Y ne cause pas Y , soit FPE(m
2
1
1,0) < FPE(m1, m2).
Par cette méthode, on peut donc non seulement sélectionner le nombre de
retards optimal, mais aussi établir l’existence de relations de causalité.

Parallèlement à cette approche, on peut interpréter le test de causalité comme
un test de choix entre un modèle général non contraint et un modèle contraint pour lequel
les coefficients d’une des deux variables seraient tous nuls. Les tests de ratios de
vraisemblance permettent précisément de discriminer entre ces modèles. C’est la démarche
suivie récemment par Henry et Pesaran (1993). Ainsi si on appelle LU la valeur du
logarithme de la vraisemblance de l’équation (2.6) (modèle non contraint) et LR cette
valeur lorsque tous les β sont nuls (modèle contraint), la statistique 2.(LU-LR) est
i
distribué suivant un
2
χ (khi carré) à k degrés de liberté (qui dépend de la longueur des
retards). On rejette l’hypothèse nulle Ho selon laquelle Y
/ Y , c’est-à-dire le modèle
2
1
contraint, au seuil α , si 2 (LU - LR) > 2
χα .



15
B- L’approche de SIMS

Partant de la définition de la causalité proposée par Granger, Sims (1972) va
proposer un test direct de causalité unidirectionnelle qui se ramène en fait à un test
d’exogénéïté.

Pour le montrer, sous l’hypothèse de stationnarité de Y et Y , l’équation (2.7) peut
1
2
se réécrire sous la forme suivante:

Y
ϑ (L) ϑ (L)  u
t1  =
11
12
t

 ⋅  



(2.11)
Y
ϑ (L) ϑ (L)
v
2t
 21
22
  t

où les ϑ (L) représentent les polynômes pour un opérateur retard L. Cette expression est
ij
Y
une représentation en moyenne mobile du vecteur  1  . On admet alors que si par exemple
Y2 
Y ne cause pas Y , au sens de Granger, ϑ (L) = 0 . Dans ce cas Y peut être exprimée en
2
1
12
2
fonction des valeurs présente et passées de Y . La proposition démontrée par Sims dans son
1
théorème n0 2 est la suivante:

Y
Si  1  a une représentation autorégressive, Y peut être exprimée
Y
2
2 
comme une fonction à retards échelonnés des valeurs courantes et
passées de Y , avec un résidu qui n’est pas corrélé avec les valeurs de
1
Y , passées ou futures, si et seulement si Y ne cause pas Y , au sens
1
2
1
de Granger ” (Sims 1972, p. 545).

Or précisément, la condition selon laquelle Y n’est pas corrélée avec les
1
résidus se trouve être la condition de stricte exogénéïté de Y .
1


16
Dans la pratique, on acceptera l’hypothèse nulle que Y ne cause pas Y , lorsque
2
1
dans une régression de Y sur les valeurs passées, présente et futures de Y , les coefficients
2
1
des valeurs futures sont tous nuls.
Soit dans une régression de la forme,

+n2
Y




(2.12)
2
= ∑θ ⋅Y1 − +ω
t
i
t i
t
i =−n1

l’hypothèse nulle selon laquelle, Y ne cause pas Y , n’est pas rejetée lorsque tous θ sont
2
1
i
nuls pour i = -1, .., -n1.
De même, dans une régression symétrique, l’hypothèse nulle selon laquelle Y
1
ne cause pas Y ne sera pas rejetée si tous les coefficients des valeurs futures de Y sont
2
2
non significativement différents de zéro. Un F-test sera ici aussi retenu pour tester la nullité
conjointe des coefficients.

Néanmoins, l’acceptabilité de ce test impose que le processus d’innovation ω
t
soit un bruit blanc. Pour que cette condition soit remplie, Sims propose que toutes les
variables utilisées (ici Y et Y ) “ soient exprimées en log et préfiltrées en utilisant le filtre
1
2
(1− 0. L)2
75
”. Chaque variable Y doit donc subir la transformation suivante ;
i
LogY
LogY
LogY
. A supposer que ce filtrage soit satisfaisant13, un
i t
5
,
1
i t
+ 5
,
0 625
,
, 1

i,t −2
dernier problème subsiste, c’est celui de la détermination des retards (n1 et n2). Sims
propose de retenir 8 retards pour les valeurs passées et 4 pour les valeurs futures. On se
heurte alors à une difficulté déjà évoquée lors de l’exposé sur l’approche de Granger, qui
résulte de la détermination plutôt arbitraire des retards. L’utilisation d’un critère de type
Akaïke doit permettre ici aussi d’améliorer l’estimation.



13 Comme le notent FEIGE et PEARCE (1979), “ la plupart des études empiriques qui ont fait suite aux
travaux de SIMS ont utilisé cette procédure de filtrage, sans prendre de précautions supplémentairs, en dépit
du fait qu’il n’y a pas de garanties qu’un tel filtre élimine la corrélation sérielle dans les résidus ”.


17
2.4.2 La détection de relations de causalité multiples

Alors que les tests précédents s’attachent à étudier de manière distincte chaque
relation causale possible entre deux variables, Caines, Keng et Sethi (1980) vont proposer
de tester des relations de causalité multiples entre les différentes variables d’un modèle
dynamique multivarié. Ils présentent cette procédure dans le cas d’un modèle bivarié. On
en rappellera ici les principales caractéristiques.

Si on revient au modèle (2.6) précédent, trois situations de base peuvent refléter
les relations causales. Soit,

état 1: Y cause Y , c’est-à-dire ψ
≠ 0 .
1
2
21

état 2: Y cause Y , c’est-à-dire ψ
≠ 0 .
2
1
12

état 3 : Y cause Y et Y cause Y , c’est-à-dire que l’on a simultanément ψ
≠ 0 et
1
2
2
1
21
ψ ≠ 0 .
12
Dans le cas de ce processus bivarié, il y a donc 23 = 8 interrelations causales
possibles, selon que les états 1, 2 ou 3 sont (ou ne sont pas) vérifiés simultanément. Il faut
donc une méthode qui permette de discriminer entre toutes ces interrelations causales
possibles. Caines et alii vont proposer une procédure en deux étapes.

Dans une première étape, on va tester successivement trois hypothèses de base:
Hypothèse 1:
H1: Y
/ Y et Y ⇒/ Y , soit ψ = 0 et ψ = 0 .
1
2
2
1
21
12

Hypothèse 2:
H2 : Y
/ Y , soit ψ = 0 .
1
2
21

Hypothèse 3:
H3 : Y
/ Y , soit ψ = 0 .
2
1
12

contre une hypothèse alternative.


18

Hypothèse alternative:
Ho : Y Y et Y Y , soit ψ
≠ 0 et ψ ≠ 0 .
1
2
2
1
21
12

Pour procéder à chacun de ces tests on va chercher à discriminer entre un
modèle contraint qui correspond à chacune des hypothèses nulles (H1, H2 ou H3), et le
modèle non contraint (Hypothèse Ho). On fera appel pour cela à un test de rapport de
vraisemblance.
De l’estimation du modèle non contraint (modèle 2.6), on déduit une estimation
de la covariance des termes d’erreurs, notée Σˆ .
De l’estimation du modèle contraint (il y en a en fait trois possibles), on déduit
une estimation de la covariance de termes d’erreurs, notée '
ˆ
Σ . On peut alors construire le
rapport de vraisemblance14,

T
'

ˆ
2
det(Σ ) 
(2.13)


λ = 

ˆ
 det(Σ) 

où T représente le nombre d’observations.
Dans ce cas, la statistique (-2 log λ ) se distribue comme un 2
χ à k degrés de
liberté, où k représente le nombre de paramètres contraints à zéro. Si R représente l’ordre
du modèle15, k peut seulement prendre deux valeurs, R ou 2 R.
Si la statistique (-2 log λ ) est supérieure au
2
χ (k) tabulé, on rejette
l’hypothèse nulle (H1, H2 ou H3) au seuil α , c’est-à-dire qu’on rejette le modèle contraint.

14 CAINES, KENG et SETHI (1980, p. 272) rappellent que dans ce cas, la méthode du maximum de
vraisemblance à information complète fournit une estimation du modèle équivalente à celle que l’on obtient
en appliquant la méthode des moindres carrés.
15 Cet ordre peut être déterminé de manière optimale en utilisant un critère MFPE (FPE multiple) d’Akaïke.
Dans le cas d’un modèle à x variables et avec un terme constant, si p est le nombre de retards et Σ
ˆ
l’estimation de Σ , il vient
T +
x
.
x p + 1
ˆ
MFPE( p) = 
 ⋅ det(Σ)
T − .
x p − 1


19

Dans cette première étape, il y a donc six résultats possibles concernant les tests
d’hypothèses nulles, ce qui conduit au total à huit combinaisons. Le tableau 1 résume ces
résultats.(Cf. infra Tableau 1)




Tableau 1 : Résultats de l’étape 1 de la procédure de Caines et alii

Hypothèses
Résultats possibles
Combinaisons possibles
Explication
Conclusion en
testées
Du test d’hypothèses
Matière de causalité
H1 contre H0 Rejet de H1 (RH1,0)
RH1,0 ;RH2,0 ;RH3,0 (C1) H1,H2,H3<H0
Y Y
1
2
Non rejet de H1(NRH1,0)

RH1,0 ;RH2,0 ;NRH3,0 (C2) H1,H2<H0<H3
Y Y
1
2

et Y
/ Y
2
1
RH1,0 ;NRH2,0 ;RH3,0 (C3) H1,H3<H0<H2
Y Y
2
1

et Y
/ Y
1
2
H2 contre H0 RH2,0
RH1,0 ;NRH2,0 ;NRH3,0 (C4) H1<H0<H2,H3
Indétermination. Etape 2
NRH2,0
Inutile (a)
NRH1,0 ;RH2,0 ;RH3,0 (C5) H2,H3<H0<H1
Y et Y sont indépendants
1
2

NRH1,0 ;NRH2,0 ;RH3,0 (C6) H3<H0<H1,H2
Etape 2
Tester H1 contre H2
H3 contre H0 RH3,0
NRH1,0 ;RH2,0 ;NRH3,0 (C7) H2<H0<H1,H3
Etape 2
NRH3,0
Tester H1 contre H3
NRH1,0 ;NRH2,0 ;NRH3,0 (C8) H1,H2,H3>H0
Etape 2. Tester H1 contre
H2, puis contre H3.
(a) Il y a causalité dans une direction, mais il est impossible de déterminer le sens de cette causalité.




22
Tableau 2 : Résultats de l’étape 2 de la procédure de Caines et alii

Résultats
Hypothèses
Résultats possibles
Combinaisons possibles
Explication
Conclusion en
de l’étape
testées
Du test d’hypothèses
Matière de causalité
C6
H1 contre H2
RH1,2
RH1,2 (C9) H3<H0<H1<H2
Y
/ Y
1
2

et Y Y
2
1

NRH1,2
NRH1,2 (C10) H3<H0<H2<H1
Y et Y sont indépendants
1
2

C7
H1 contre H3
RH1,3
RH1,3 (C11) H2<H0<H1<H3
Y Y
1
2

et Y
/ Y
2
1


NRH1,3
NRH1,3 (C12) H2<H0<H3<H1
Y et Y sont indépendants
1
2

C8
H1 contre H2
RH1,2
RH1,2 et RH1,3 (C13) H0<H1<H2,H3
Il existe une relation causale

dans
une
direction

indéterminée


NRH1,2
RH1,2 et NRH1,3 (C14) H0<H3<H1<H2
Y

/ Y
1
2

et
et Y Y
2
1

RH1,3
NRH1,2 et RH1,3 (C15) H0<H2<H1<H3
Y Y
1
2
H1 contre H3


et Y
/ Y
2
1

NRH1,3
NRH1,2 et NRH1,3 (C16) H0<H2,H3<H1
Y et Y sont indépendants
1
2






23
L’étape 2 s’avère nécessaire lorsque les combinaisons C6, C7 et C8
apparaissent, dans la mesure où on ne peut pas conclure définitivement.
Suivant une démarche similaire à la précédente on va maintenant tester
l’hypothèse nulle H1 contre les hypothèses alternatives H2 et H3. Quatre combinaisons
supplémentaires devront donc ici être prises en compte (cf. tableau 2).

Si on résume le résultat des deux étapes, il y a donc indétermination sur le sens
de la relation causale dans deux cas (C4 et C 13). Afin de préciser le sens de cette relation,
CAINES et alii proposent de retenir un critère de choix de modèle défini par AKAIKE
(1971).
Si l’on doit décider entre les hypothèses H2 et H3, on calcule le critère d’erreur
de prédiction finale pour un modèle contrôlé (Final Prediction Error For Control Model)
qui est défini comme

D
D

X P

X P
ˆ
FPEC(P) = 1 +
 ⋅ 1−

⋅ det(Σ )
D,P

T


T


P représente l’ordre du modèle, X le nombre total de variables et D le nombre
de variables endogènes.
ˆ
Σ est la sous-matrice de Σˆ avec les lignes et colonnes correspondant aux
D, P
P
variables contrôlées (causées). Si on revient au modèle causal simple (comme sous H2 ou
H3) dans un système bivarié dans lequel on a une variable causée ou contrôlée, il vient D =
1 et X = 2. det( ˆ
Σ ) se ramène alors à la somme des carrés des résidus de l’équation du
D, P
modèle qui prend en compte la relation causale. Ce critère FPEC peut donc être réécrit
comme,

T + X
N
P

FPEC(P) =
⋅ ( − R2
1
)⋅∑Y2
T X
t
P
t =1

Y est la valeur actuelle de la variable causée.



24

On a donc deux relations causales possibles, l’une correspondant à l’hypothèse
H2, l’autre à H3. Sous ces deux hypothèses on estime chaque modèle et on calcule le
FPEC. On retient le modèle (et donc la relation causale dans une direction) pour lequel le
FPEC est minimum.

3. CAUSALITÉ ET VECTEUR AUTORÉGRESSIF:

A l’inverse des modèles structurels dont les liens entre les variables sont dictés
par la théorie économique, le modèle autorégressif vectoriel (VAR) apparaît à l’origine
comme un modèle “non-structurel”. Le modèle VAR standard présenté par SIMS (1980)
peut être qualifié de non contraint dans la mesure à chaque variable dépend de son passé et
du passé de toutes les autres variables du modèle. Néanmoins si cette présentation a pour
elle de n’imposer aucune restriction a priori, toutes les variables étant supposées
endogènes, elle peut poser un problème de « surparamétrisation », et conduire à de mauvais
résultats en matière de prévision.
On peut alors montrer “qu’imposer certaines restrictions, que ce soit en
éliminant certains retards dans chaque variable, ou même en éliminant certaines variables
dans quelques équations, peut conduire à une amélioration des performances du modèle en
matière de prévision” (Henry et Pesaran, 1993).
Aussi, après un bref exposé du modèle VAR standard, on sera amené à
présenter une méthode de construction d’un modèle contraint c’est à dire un modèle dans
lequel chaque variable ne dépend que du passé de certaines variables, et non pas
systématiquement du passé de toutes les variables du système. C’est à ce niveau que les
tests de causalité pourront constituer un outil important.

3.1. Présentation des modèles autorégressifs vectoriels

L’intérêt de ces modèles est double. D’un côté ils permettent d’analyser la
réponse d’un système à un choc non anticipé (à une impulsion) sur une variable particulière
appartenant à ce système ; de l’autre, ils renseignent, à partir d’une décomposition de la



25
variance de l’erreur de prévision, sur la contribution de chacune des variables aux
variations de chaque variable endogène.

3.1.1. Modèle VAR et réponse du système à un choc unitaire sur une variable:

Le modèle VAR se construit comme un système d’équations simultanées dans
lequel n’apparaît aucune variable prédéterminée, alors que pourront être introduites des
variables endogènes retardées.

Si Y est un vecteur de dimension K, soit Y
Y
Y
L
=

t
( 1t
Kt )'
t

Ut un bruit blanc de dimension K, tel que U
U
U
L
=
, avec E(U )
.
t
= 0
t
( ,t
Kt )'
1

(
)
E(U U '

t
s )
Σ si t
u
= s Σ
=
défini positif

u
0 sin on

Un processus VAR d’ordre p, noté VAR (p), à K dimensions (K variables) sera
de la forme,



Y = A Y
L




(3.1)
1
−1 +
+ A Y − +U
t
t
p
t p
t
où les Ai sont les matrices des coefficients de dimension (K x K). D’après le théorème de
décomposition de Wold (1938), un processus autorégressif stationnaire en covariance peut
se mettre sous forme d’une moyenne mobile. Soit, si
p
Y = ∑ A Y − +U ,



(3.2)
t
i
t i
t
i =1
il vient


Y = I − Φ(L
1
)
U



(3.3)
t
(
) t
où Φ(L Y
)
= ∑ AY et I représente la matrice identité.
t
i
t i




26
Toutefois, si on admet par construction que la covariance entre les erreurs est
nulle, telle que COV (Ut , Us) = O pour s≠t, il peut exister une relation entre les termes
d’erreurs des différentes équations ce qui oblige à modifier le processus d’innovations de
manière à exprimer chaque variable comme une combinaison linéaire infinie d’innovations
non corrélées. On devra donc procéder à une transformation à l’aide d’une matrice de
passage.
Après transformation, la représentation en moyenne mobile avec des
innovations bruit blanc non corrélées s’écrira,

Y = ∑υ V






(3.4)
t
i
t i
i=0
Ce modèle va permettre de connaître la réponse d’un ensemble de variables à
une impulsion, c’est-à-dire à un choc non anticipé sur une des variables qui compose ce
système (Impulse Response Analysis). En ce sens, il permet l’analyse des effets dynamiques
que l’on peut décomposer en trois phases
1- en premier lieu, il s’agit de la transmission d’un choc unitaire initial et de la
réponse à ce choc, d’une variable particulière,
2 en deuxième lieu, il s’agit de la propagation du choc à l’intérieur du système,
c’est-à-dire de la réaction de toutes les autres variables à ce choc initial.
3 en troisième lieu enfin, il s’agit de la décomposition de ce choc et son évolution
sur toute la période étudiée.

Pour illustrer les deux premiers points, on peut rappeler un exemple fourni par
Lutkhepohl (1991). Supposons un modèle VAR d’ordre 1, sans terme constant. Ce modèle
comprend trois variables (K=3), Y1 représentant l’investissement, Y2 le revenu et Y3 la
consommation. On a donc la relation suivante:

Y
U
 ,1t
 ,1t
Y = AY
Y
Y
et U
U




(3.5)
t =
t =

avec
1 + U
t
t
t
 2,t
 2,t




Y
U
3,t
 3,t

L’estimation de ce modèle donne les résultats suivants:



27

Y
5
,
0
0
0
Y
U
,
1 t


 



,
1 t −1
,
1 t


 

Y
1
,
0
1
,
0
3
,
0
Y
U

(3.6)
2,t  = 
 2,t−1 +  2,t


0
,
0 2
3
,
0 
 

Y
Y
U
3,t

 3,t−1   3,t

On peut alors étudier l’impact d’un choc unitaire sur l’investissement. En t = 0 ,
on aura donc U
= 1 et U
= U = 0 . Ce choc va affecter instantanément Y1, mais pas
,
1 0
2,0
3,0
Y2 et Y3. On aura ainsi en t = 0
Y  U
,
1 0
,
1 0
1




 
Y
Y
U



(3.7)
0 =  2,0  = 
2,0  = 0





Y
U
0
 3,0 
 3,0 
 
Puis, avec un retard d’une période, ce choc initial va se transmettre à
l’ensemble du système. Soit en t = 1

Y
1
,
1


5
,
0




Y
Y
AY


(3.8)
1 =  2 1
,  =
0 =  1
,
0 



Y
0 
 3 1, 



Puis pour t = 2 , il viendra

Y
,
1 2
 ,
0 2 
5


2


Y
Y
AY
A Y



(3.9)
2 =  2,2  =
1 =
0 =  0
,
0 6



Y
0
,
0 2
 3,2 


et ainsi de suite …
On parlera alors de multiplicateur dynamique pour exprimer la réponse du
système à une impulsion. La même procédure pourra ainsi être retenue pour étudier les
effets d’un choc unitaire sur Y2,t ou Y3,t. De manière générale, la réponse à un choc unitaire
sur une variable du système donnera pour la ième période,




28
Y


,
1 i


Y = M
= AY − = AiY


(3.10)
i


i 1
0
Y


K,i
Les éléments de Ai représentent les effets de chocs unitaires dans les variables
du système, après i périodes.
Le modèle offre donc la possibilité d’étudier la transmission d’un choc dans le
temps. Mais il pourra aussi fournir des informations supplémentaires concernant la
contribution de chacune des variables aux variations de chaque variable endogène. Ce
résultat peut être mis en évidence à partir d’une décomposition de la variance de l’erreur de
prévision.

3.1.2. Modèle VAR et décomposition de la variance de l’erreur de prévision

On rappelle la représentation en moyenne mobile du modèle VAR, soit

Y = ∑υ V








t
i
t i
i=0
Dans ce cas, si Y(h) représente la prévision Yt pour l’horizon t+h, l’erreur de
prévision se définit comme,

[Yt+h - Y (h)]Yt+h est la valeur observée de Y pour t+h.

Pour un horizon h, on peut considérer que cette erreur est la résultante de chocs,
c’est-à-dire des innovations sur les variables, entre la période initiale t=0 et la période h-1.
Soit,
h−1
Y
Y h
υ V
t h
( ) =
+
i t+hi
i=0




(3.11)

Considérons un élément particulier de Y, la variable Y . Appelons δ
, un
j
jK
élément de υ qui reflète l’impact d’une innovation concernant la variable K sur la variable
i
j. On peut donc décomposer l’erreur de prévision pour Y comme
j



29

h 1

Y
Y (h) = ∑(δ V
+L + δ V
)

(3.12)
j ,t +h
j
j ,
1 i
,
1 t +hi
jK ,i
K ,t +hi
i =0

Soit la somme de la période 0 à la période h-1 des chocs sur Y ,Y L
,
Y qui se
1
2
K
sont répercutés sur Yj. On peut donc réécrire l’expression précédente comme,

K
Y
Y h
δ V
L
δ
V




(3.13)
j t h
( )
j
= ∑( jk k t h + +
)
, +
,0
, +
jk ,h 1

k ,t 1
+
k 1
=

où les Vk sont non corrélés et de variance égale à un ; soit E( 2
V )
et
k
= 1
E V
(
,V ) = 0
k
∀ ≠ j .
k
j
On déduit la variance de l’erreur de prévision,

E[
K
Y
Y h
δ
L
δ



(3.14)
j t h
( )
j
= ∑ jk + +
, +
]2
( 2
2
)
,0
jk ,h 1

k 1
=
La contribution d’une variable k à la variance de l’erreur de précision de Yj sera donnée par
h−1
2
δ
L
δ
δ . Donc la part de l’erreur de prévision de Yj expliquée par Yk
jk ,0 +
+ 2jk,h 1 =
2

jk,i
i=0
sera donnée par la relation

h−1
h

1
2
2
δ
δ
jk ,i
jk,i

0
0



(3.15)
E[ i=
= i
Y
Y (h 2
1
)
j ,t h
K
h
+
j
]
=

∑∑ 2
δ jk i,
k =1 i=0

3.2. Tests de causalité et construction des modèles V.A.R.

L’estimation directe d’un modèle V.A.R. standard peut poser, on l’a vu,
certaines difficultés. D’une part, on sait que lorsqu’on cherche à préciser la relation de
cause à effet entre deux variables particulières (décomposition de la variance), l’ordre



30
relatif de ces deux variables, plus que l’autre de ces variables par rapport aux autres
variables du modèle, est primordial (Spencer 1989, p. 447)16. D’autre part, lorsqu’il existe
un nombre important de variables, la prise en compte du passé de toutes ces variables peut
conduire à un phénomène de “surparamétrisation”. Pour éviter ce problème, l’idée est alors
de limiter le nombre de paramètres à estimer, en éliminant des variables du côté droit et/ou
en restreignant le nombre de retards. Dans ce cas, si la qualité du modèle et plus
précisément ses performances en matière de prévision peuvent être améliorées en éliminant
du côté droit des équations certaines variables, et en limitant le nombre de retards sur les
variables non éliminées, il faut rechercher des critères de sélection qui permettent
d’effectuer ces choix de manière optimale.
De manière plus précise, plusieurs voies peuvent être empruntées. Doan,
Litterman et Sims (1984) ont proposé de s’en remettre à un modèle BVAR (Bayesian
Vector Autoregressive). On impose ainsi au modèle des restrictions (des a priori) qui
peuvent refléter la théorie économique, des opinions ou des résultats empiriques
précédemment établis (Henry et Pesaran 1993). Une autre voie “consiste à considérer le
modèle VAR comme un cadre de référence dans lequel on peut tester divers types de
restrictions ; exogénéïté, causalité, forme structurelle, anticipations rationnelles, forme des
retards” (Monfort 1993).
On s’intéressera ici plus particulièrement à ce second type d’approche. Dans ce
cadre, deux problèmes doivent être réglés;
1- Quelles variables doit-on éliminer?
2- Quelles longueurs de retards doit-on retenir?

Concernant l’élimination de certaines variables, le problème peut être résolu à
partir de tests de causalité préalables. Ainsi en testant tous les processus bivariés possibles
du modèle général, soit à l’aide d’un test de causalité simple à la Granger, soit à l’aide d’un
test de causalité multiple à la Caines, Keng et Sethi17, on peut montrer que chaque variable
du modèle possède un ensemble de variables “causales”.

16 Cf. aussi les résultats obtenus par FIORI, FLORENS et LAI TONG (1982, tableaux 1 et 2).
17 Cf. par exemple DENIAU, FIORI, MATHIS (1989), BORDES, GIRARDIN ET MARIMOUTOU (1994).



31
Connaissant les variables causales de chaque équation (variable expliquée ou
“causée”) du modèle VAR, il reste à préciser l’ordre du modèle, c’est-à-dire la structure des
retards.
2. Deux stratégies peuvent être suivies pour déterminer la longueur des retards.
La plus simple consiste à retenir la même structure de retards pour toutes les
variables causales. La plus élaborée se fixe pour objectif de déterminer une longueur
spécifique de retards pour chaque variable causale. On est alors amené à construire le
modèle VAR équation par équation. Suivant les travaux de Hsiao (1979,1981), Caines,
Keng et Sethi ont proposé l’adoption d’une procédure séquentielle18. On en rappellera ici
les traits essentiels.

On réalise dans une première étape des tests de causalité multiple pour tous les
processus bivariés. Dans tous les cas l’adoption d’un critère MFPE d’Akaike a permis de
déterminer l’ordre du modèle. On a alors pour chaque variable Yi du modèle un ensemble de
variables causales Yi1, Yi2, ...Yin. Le critère MFPE d’Akaike pourra être réutilisé pour classer
ces variables causales. Si par exemple le MFPE est plus faible dans l’estimation du
processus bivarié (Yi, Yi1) que dans l’estimation du processus (Yi, Yi2), Yi1 sera placée avant
Yi2 du côté droit de l’équation Yi, et ainsi de suite...
C’est à niveau que la procédure pas à pas préconisée par Hsiao, déjà présentée
dans le cadre des tests de causalité, va s’avérer très utile. Si Yi dépend de sa propre valeur
passée et des valeurs passées de Yi1, Yi2 ...Yin, on cherche à déterminer les retards sur Yi, Yi1,
Yi2,... On utilisera pour cela le critère FPE d’Akaike, appliqué à une équation du modèle.
- Dans un premier temps on régresse Yi sur sa propre histoire. On en déduit le
FPE (li, 0) minimum où li représente le nombre de retards sur Yi.
- Dans un deuxième temps, les valeurs retardées de Yi1 sont introduites dans la
régression de Yi. On cherche le nombre de retards pour cette seconde variable (li1),
connaissant li qui rend le FPE minimum, soit FPE (li, lil).
Connaissant li et li1 qui sont maintenant supposés fixés, on cherche 1i2 en
introduisant les valeurs passées de Yi2 ; et ainsi de suite
Finalement, on obtiendra une équation Yi , de la forme

18 D’autres critères peuvent être retenues. HENRY et PASARAN (1993) proposent quant à eux le recours à



32

Y = Φ(l )Y + L + Φ(l )Y



(3.16)
it
i1
it
in
int
Le modèle VAR complet est obtenu en répétant cette procédure pour chaque
variable “causée” Yi.

3.3. Estimation du modèle VAR et interprétation en termes de causalité.

Après avoir rappelé brièvement les techniques d’estimation de modèles
multivariés (3.3.1.), on s’intéressera à une analyse de la causalité ex-post, c’est-à-dire à
partir de l’estimation du modèle (3.3.2.).19

3.3.1. Les méthodes d’estimation

Le choix de la méthode dépend du type de modèle étudié.
*Dans un modèle VAR standard, c’est-à-dire un modèle dans lequel chaque
variable dépend du passé de toutes les autres variables, on peut estimer chaque équation du
modèle par la méthode des moindres carrés ordinaires (Lutkepohl 1993). Si on décide de
procéder ensuite à des tests d’exogénéïté par bloc afin d’éliminer dans une deuxième étape
les variables qui n’auraient pas d’impact significatif (cf. par exemple Henry et Pesaran
1993), une estimation satisfaisante du modèle imposera d’utiliser la méthode du maximum
de vraisemblance.
*Lorsqu’on a affaire à un modèle construit équation par équation, où chaque
variable du côté droit des équations a une structure de retard spécifique (modèle Near-
VAR), une méthode d’estimation adéquate sera celle du maximum de vraisemblance à
information complète (MVIC ; cf Caines, Keng et Sethi 1981, p. 280). On peut aussi
utiliser la méthode SUR (Seemingly Unrelated Regression) de Zellner. Il est de plus
possible d’éliminer dans un second temps des variables retardées dont le coefficient n’est
pas significatif (cf. Deniau, Fiori et Mathis 1989).


un test de rapport de vraisemblance.
19 Cf. notre schéma de l’annexe 1 qui résume ces différentes approches possibles.



33
3.3.2. Mise en évidence des relations de causalité dans un modèle VAR.

Une des applications possibles des vecteurs autorégressifs consiste dans
l’analyse des relations causales entre variables. On peut distinguer deux catégories de tests.
Les premiers se rapportent à un modèle VAR en différence, c’est-à-dire à un système de
variables stationnaires. Les seconds ont été développés dans le cadre d’un modèle VAR en
niveau, qui admet donc des marches aléatoires.
1- Dans le cadre d’un VAR standard (séries stationnaires), les premiers tests
proposés ont été les tests d’exogénéïté par bloc de Sims (1980).
Le principe consiste à imposer un ensemble de restrictions au modèle. Par
exemple on suppose que tous les coefficients d’une variable du côté droit sont nuls. Ces
restrictions devront alors être testées. Pour cela, on peut retenir un rapport de vraisemblance
qui se distribue comme un
2
χ (cf. Sims 1980). Toda et Phihlips (1993) rappellent que pour
ce type de modèle l’utilisation d’un critère de Wald est toujours possible dans la mesure où
cette statistique se distribue asymptotiquement comme un
2
χ .
En restant dans cette optique, Kunst et Marin (1989) ont proposé une méthode
assez simple d’analyse des relations causales. Elle se ramène à tester la significativité des
polynômes hors de la diagonale.
Par exemple, si on retient un modèle VAR à trois variables, de la forme

Y
φ (L) φ (L) φ (L)  Y  U
t1 
 11
12
13
  t1   t1 

Y
φ (L) φ (L) φ (L) Y
U



(3.17)
2t
= 21
22
23
⋅ 2t +



 
  2t
Y  φ (L) φ (L) φ (L) Y  U
 3t
 31
32
33
  3t   t3 

où les φ (L) sont des polynômes d’opérateur retard L., on dira que Y “cause” Y si
2
1
φ (L)est non nul. Les tests de nullité des polynômes, c’est-à-dire de nullité jointe de
12
l’ensemble des coefficients pourront être des tests de rapport de vraisemblance, voire un F-
test si on utilise une méthode d’estimation par les moindres carrés. Il faut cependant noter
que l’efficacité de cette méthode est conditionnée au fait que des variables retardées n’ont
pas été oubliées dans les polynômes φ (L) , sans quoi certaines relations de causalité
ij



34
pourraient ne pas être détectées. La dimension du modèle est donc ici essentielle. Pour
tenter de lever ces difficultés, Kunst et Marin proposent une estimation en deux étapes.
Dans un premier temps, on estime un modèle complet où le nombre de retards est
déterminé grâce à un critère d’Akaike. Dans un deuxième temps, les variables retardées,
hors de la diagonale, dont les coefficients sont non significativement différents de zéro,
sont éliminées. Il ne s’agit donc plus ici de faire un test sur l’ensemble des coefficients,
mais uniquement sur certains coefficients, ceux dont les variables ont été conservées. Une
variable Y “causera” une variable Y si au moins un retard de Y a un coefficient non nul
2
1
2
dans l’équation de Y .
1
2 - Dans le cadre d’un VAR en niveau (séries non stationnaires) du type
Johansen, Toda et Phihlips (1993), prolongeant les travaux de Sims, Stock et Watson
(1990), tentent de développer une théorie limite pour les tests de Wald. Les résultats
auxquels ils parviennent restent très mitigés.

-Ainsi, si on a affaire à un modèle VAR sans relation de cointégration, estimé par la
méthode de moindres carrés, la statistique de Wald a une distribution limite non standard.

- A l’inverse, s’il existe des relations de cointégration, dans un modèle à correction
d’erreur estimé par ha méthode du maximum de vraisemblance, et si certaines conditions
assez restrictives sont remplies (conditions de rang de sous matrices...), il peut être montré
que la théorie limite des tests de Wald est
2
χ (Toda et Phihlips p. 1368).





35
4. DETERMINATION DU DEGRE D’INTEGRATION DES VARIABLES

Il s’agit ici de préciser la stationnarité ou la forme de la non stationnarité des
variables. En effet certaines procédures de stationnarisation peuvent conduire à des résultats
totalement erronés, si elles ne sont pas utilisées à bon escient (Chan et alii 1977 ; Granger et
Newbold 1974 ; Nelson et Kang, 1981, 1984). Dans la littérature des années 1980, la
plupart des auteurs20 ont axé leurs recherches autour de la notion de variable intégrée.

Ainsi une série stationnaire sera dite aussi intégrée d’ordre zéro (notée I(0)).
Elle se caractérisera (Granger, 1986, Engle et Granger, 1987) par;
- une variance finie, ne dépendant pas du temps,
- une mémoire limitée (l’effet d’un choc aléatoire n’est que transitoire),
- des fluctuations autour de la moyenne,
- des coefficients d’autocorrelation qui diminuent rapidement lorsqu’on accroît les
retards (corrélogramme).


A l’inverse, une série non stationnaire intégrée d’ordre un (notée I(1)) révèle;
- une variance qui s’accroît avec le temps,
- une mémoire infinie, dans le sens où tout choc a un effet permanent,
- un processus qui a tendance à s’égarer (non retour vers une valeur d’équilibre de
long terme),
- des coefficients d’autocorrelation qui ne diminuent pas mais tendent vers la valeur
un21.

Cette dernière série pourra cependant être rendue stationnaire par une simple
différenciation. Plus généralement, une série sera dite intégrée d’ordre n (notée I(n))
lorsqu’elle pourra être rendue stationnaire par n différenciations successives.
Cette notion d’intégration n’est cependant devenue opérationnelle qu’à partir
des travaux pionniers de Fuller (1976) Dickey et Fuller (1979, 1981), Phillips (1987),
Phillips et Perron (1988), Perron (1988), qui ont connu un vif intérêt chez les économistes,
dans la mesure où ils se sont attachés à l’élaboration de techniques statistiques, dites aussi

20 Nelson et Plosser (1982), Meese et Singleton (1982), Stock et Watson (1988).



36
tests de racine unitaire, permettent de distinguer entre une série stationnaire (en niveau ou
autour d’un trend) et une série qui comporte une racine unitaire (marché aléatoire). L’idée
de base commune à ces approches étant que

les alternatives les plus plausibles aux hypothèses de racines
unitaires sont la stationnarité, ou la stationnarité autour d’un
trend, avec ou sans terme constant” (Bajo-Rubio et Sosvilla-
Rivero, 1991)

Néanmoins ces premiers tests se devaient d’être complétés dans la mesure où ils
excluaient la possibilité d’une racine explosive. C’est tout l’intérêt du travail de Bhargava
(1986) d’avoir proposé de véritables tests d’un côté (one-sided tests ; Towe (1989), Diba et
Grossman (1988)), c’est-à-dire des tests qui permettent d’étudier d’une part l’alternative
racine unitaire-série stationnaire (racine inférieure à l’unité) et d’autre part l’alternative
racine unitaire-série explosive (racine supérieure à l’unité).
Les premières approches ont par la suite été enrichies, d’une part en prenant en
compte l’existence de ruptures (breaks) dans les tendances des séries, d’autre part en
analysant les cas de degré d’intégration non entiers (intégration fractionnaire), etc.….
Ce sont ces différents tests qu’on se propose d’exposer succinctement. Ils
devront permettre de distinguer entre une marche aléatoire simple, une marche aléatoire
avec dérive (drift ou terme constant), une série stationnaire autour d’un trend, une série
stationnaire en niveau, ou enfin une série explosive.

4.1. Les tests de racine unitaire de Dickey-Fuller

Ces tests sont aujourd’hui largement diffusés dans la littérature. Néanmoins,
leur multiplicité impose un certain ordonnancement qui conduira à l’élaboration d’une
procédure de tests. On présentera donc dans un premier temps les grands traits de cette
procédure avant d’exposer la pratique de ces tests.


21 Cf. notre présentation de ces différents cas en annexe 1.



37
4.1.1. L’élaboration d’une procédure de tests

Trois ensembles de tests de racine unitaire peuvent être menés. Les premiers se
réfèrent à un modèle simple de la forme.

Y = ρY − + U
(4.1)
t
t 1
t
1



Y représente la variable économique étudiée au temps t, ρ le coefficient de Y égal à
t
t 1

un lorsqu’il y a racine unitaire et Ut est une variable aléatoire normale de moyenne nulle et
de variance
2
σ (U N( ,
0
2
σ ) ).
t
1
Les deuxièmes prennent en compte la possibilité d’un terme constant et
recherchent une racine unitaire avec dérive dans un modèle du type,

Y =
Y

ρ
+ a

+U
(4.2)
t
t 1
2t



a* représente ce terme constant.
Enfin la troisième catégorie de tests s’applique à des modèles qui incorporent
un trend déterministe (noté t), soit
~
Y = ρY
~ − + b t + a~ +U
(4.3)
t
t 1
3t




Les tests appliqués à ces modèles peuvent alors être soit des tests simples
portant sur un seul coefficient (
∗ ~
L
ρ, ρ , ρ,a ), soit des tests joints portant sur ∗

ρ et a dans
~
~
le modèle 2, et ~
ρ et b ou ~ρ, b et a~ dans le modèle 3.
La difficulté est alors de choisir le bon modèle (1, 2 ou 3) pour déceler la
présence éventuelle d’une (ou plusieurs) racine(s) unitaire(s). Dans la mesure où l’on sait
que les distributions des statistiques sont sensibles à la présence d’un trend et/ou d’une
constante (paramètres de nuisance), en s’inspirant de Perron (1988), on peut adopter la
procédure séquentielle suivante;




38

1- Dans une première étape, on estime le modèle général (ici le modèle 3). On
peut alors mener22,
~

* soit des tests joints correspondant aux hypothèses nulles ( ~
~
a = ,
0 b = 0 et ρ = 1), et
~
(
~
b = 0 et ρ = 1). Les statistiques notées, Φ pour la première hypothèse jointe, et Φ pour
2
3
la seconde, sont construites comme des F de Fisher (cf. Dickey-Fuller 1981),
~

** soit des t-tests (statistiques t ,t , t ) appliqués respectivement à a
~,b et ρ~ (cf.
a
b
ρ
Dickey-Fuller 1979).
Si les tests joints sont le plus souvent utilisés, leur interprétation peut laisser
subsister certaines ambiguïtés s’ils ne sont pas complétés par des tests simples (t-tests), et si
nécessaire par des tests menés sur des modèles plus restreints (modèles 2 ou 1).
En effet, si on utilise simultanément les statistiques Φ et Φ , deux types de
2
3
situations doivent être envisagées, selon que les résultats auxquels ils conduisent sont ou ne
sont pas convergents.
1) Supposons dans un premier temps que le calcul des statistiques Φ et Φ
2
3
fournisse des résultats convergents.
Ceci peut signifier que l’hypothèse nulle est rejetée ou acceptée pour les deux
tests.

a- Si on rejette Ho pour les statistiques Φ et Φ , on peut considérer que la série
2
3
~
sera stationnaire autour d’un trend. Des tests simples sur a
~ et b permettront de confirmer
ces résultats. La procédure n’a pas donc lieu d’être poursuivie.

b- En revanche, si on ne rejette pas l’hypothèse nulle pour les statistiques Φ et Φ ,
2
3
il y a présomption de racine unitaire. On doit alors poursuivre la procédure en passant à
l’étude d’un modèle plus simple sans terme de tendance (étape 2).
2) Supposons maintenant que les tests basés sur les statistiques Φ et Φ
2
3
conduisent à des résultats différents. On peut penser que cette divergence est le reflet d’une
valeur particulière du terme constant.

a- Si par exemple on rejette l’hypothèse nulle pour Φ , mais on ne la rejette pas pour
2
Φ , on peut s’attendre à ce que le terme constant soit non nul. Un t-test doit permettre de
3

22 Cf. le tableau de synthèse présenté en annexe.



39
préciser ce point. Il y a alors présomption de marche aléatoire avec dérive. Le passage à la
deuxième étape de la procédure, c’est-à-dire au modèle 2 s’impose donc.

b- Si à l’inverse, on rejette l’hypothèse nulle pour Φ , mais on ne la rejette pas pour
3
Φ , on peut penser que le terme constant est non significativement différent de zéro. Un t-
2
test doit permettre de préciser cette éventualité. Il importe alors de passer à un modèle plus
simple sans constante et sans terme de tendance.

2- Dans cette deuxième étape, on va estimer un modèle sans trend déterministe mais
avec une constante ; c’est le modèle 2. Un test joint (statistique Φ ) correspondant à
1
l’hypothèse nulle ( ∗
ρ = 1 et ∗
a = 0 ) va être réalisé.
a- Soit on rejette l’hypothèse nulle. L’hypothèse d’un random walk simple est
remise en cause. Des tests simples sur ∗
ρ (statistique t ∗ρ ) et sur ∗
a ( t ∗ ) devront permettre
a
de préciser la forme de la série. En effet le rejet de cette hypothèse peut tout aussi bien être
compatible avec l’hypothèse d’une marche aléatoire avec dérive (retour à la statistique Φ )
2
ou avec la stationnarité en niveau. La procédure est alors arrêtée.
b- Soit on ne rejette pas l’hypothèse nulle. Il y a donc présomption de racine
unitaire, mais ceci sera confirmé par une estimation du modèle le plus simple, sans terme
constant. Un test simple sur ∗
a devra confirmer la nullité de la constante.


3- Dans la troisième et dernière étape, on estime le modèle 1 sans terme constant.
- soit on rejette l’hypothèse nulle. La série est stationnaire en niveau ou I(0).
- soit on ne rejette pas l’hypothèse nulle. La série comporte donc au moins une
racine unitaire, sans drift ou dérive. Dans ce dernier cas un test de racine unitaire
supplémentaire réalisé sur la série différenciée permettra de confirmer si celle-ci comprend
une (série différenciée stationnaire) ou plusieurs racines unitaires.
Cette procédure étant établie, il reste à préciser comment s’effectuera chaque
test dans la pratique. Le schéma suivant décrit cette procédure.



40
Schéma simplifié de la procédure séquentielle des tests de RU


Etape 1 : Estimation du modèle général


~
Y = ρY
~

− + b t + a
~ +U
t
t 1
3t
~
~
~
H0 : a = ,
0 b = 0 et ρ = 1


Non Rejet de H0
Rejet de H0 : Série TS (Trend Stationary)
Stationnaire autour d’un trend ; I(0)+t


Etape 2 : Estimation du modèle sans trend


Y =
Y

ρ
+ a


+U
t
t 1
2t


H0 : ( ρ = 1 et a = 0 )




Non Rejet de H0
Rejet de H0 : Série stationnaire ; I(0)




Test sur la constante H0 : a = 0



Non Rejet de H0 Rejet de H0
a ≠ 0





Marche aléatoire avec dérive ; I(1)+ dérive




Etape 3 : Estimation du modèle sans trend et sans constante


Y = ρY

− + U
t
t 1
t
1
H0 : ( ρ = 1)






Non Rejet de H0 :
Rejet de H0 :




Marche aléatoire simple ; I(1) Série stationnaire ; I(0)



41
4.1.2. La pratique des tests:

Comme cela vient d’être exposé, on va tester l’hypothèse de racine unitaire,
successivement dans chacun des trois modèles (4-1), (4-2) et (4-3). Cependant, dans la
mesure où l’hypothèse nulle est la présence de racine unitaire, c’est à dire ρ = 1 ou encore
ρ −1 = 0 , les tests seront pratiqués sur ces mêmes modèles réécrits en différence, soit:

'
Y
∆ = (ρ − )
1 ⋅Y − + U



(4-1’)
t
t 1
1t


'
Y
∆ = (ρ − )
1 ⋅ Y − + a + U



(4-2’)
t
t 1
2t
~
~
~
'
Y
∆ = (ρ − )
1 ⋅Y − + b t + a + U


(4-3’)
t
t 1
3t

a- Ainsi, dans le cas par exemple d’un t-test sur le coefficient de Y
dans le
t 1

modèle le plus simple, les valeurs seront tabulées pour la statistique (ρ − )
1 / SE(ρ) , où
SE(ρ) représente l’écart type estimé de ρ . Sous l’hypothèse nulle de racine unitaire, on
aura ρ −1 = 0 .
Dans chacun des trois modèles, cette hypothèse nulle sera rejetée à l’aide des t-
tests, lorsque les t calculés seront négatifs et inférieurs aux t tabulés (cf. Annexe 3.2, tables
n° 8.5.2)2322. Dickey et Fuller ont proposé un autre test simple de racine unitaire à partir de
la statistique K = T (ρ − )
1 . Pour toute valeur du K calculé inférieure au K tabulé, on
rejettera l’hypothèse nulle (cf. Annexe 3.2, tables n° 8.5.1)24.
Pour compléter cet exposé des tests simples, il reste à préciser que des t-tests
devront être effectués pour tester la significativité des termes constants ∗
a et a
~ , et du
~
coefficient du terme de tendance b . Les distributions de ces t étant symétriques (cf. Dickey
et Fuller 1981), un t calculé supérieur en valeur absolue au t tabulé conduira au rejet de
l’hypothèse nulle de non significativité des coefficients (cf. Annexe 3.3, tables n° I,Il ,III
pour les valeurs critiques) 22.


23 Il convient de noter que les distributions des statistiques ( t, Φ ,K) sont non standards sous l’hypothèse nulle
de racine unitaire, et sont obtenues par simulation pour chacun des modèles (Cf. Dickey et Fuller).



42
b- Dans le cas des tests joints, une valeur des statistiques Φ , Φ ou Φ
1
2
3
supérieure à la valeur tabulée (cf. Annexe 3.4,tables n° IV, V, VI) 22 conduira au rejet de
l’hypothèse nulle de racine unitaire.

Si on a tous les éléments pour réaliser à la fois des tests simples et des tests
joints dans le cadre de la procédure séquentielle, il convient de préciser que ces tests
proposés par Dickey et Fuller imposent que les termes d’erreur ne soient pas autocorrélés et
que de plus l’hypothèse d’homoscédasticité des erreurs soit vérifiée. Or, on sait que dans le
cas de certaines variables économiques (variables financières par exemple) ces hypothèses
ne tiennent pas.

c- Pour tenir compte de l’autocorrélation et/ou de l’hétéroscédasticité des
erreurs, deux types de transformation ont été proposées.
*Dickey et Fuller (1979) suggèrent une solution paramétrique pour prendre en
compte le phénomène d’autocorrélation des erreurs. Elle consiste à compléter les modèles
précédents (4.1’), (4.2’), (4.3’) en ajoutant des termes de retards sur Y
∆ du côté droit des
t
équations. On obtient ainsi des modèles de la forme,
1
p
''
Y
∆ = (ρ − )
1 ⋅ Y
+
ϑ ⋅ ∆
+


Y
U


(4.1’’)
t
t 1
i
t i
1t
i 1
=
p 2



'
Y
∆ = (ρ − )
1 ⋅Y − + ∑ϑ ⋅ Y

a
− +
+U

(4.2’’)
t
t 1
i
t i
2t
i 1
=
p3 ~
~
~
~
'
Y
∆ = (ρ − )
1 ⋅Y
ϑ
− + ∑
Y

b
− + ⋅ t + a + U


(4.3’’)
t
t 1
i
t i
3t
i 1
=


Les tests pratiqués sur ces modèles seront appelés des tests augmentés de Dickey-
Fuller, ou de manière abrégée, des tests ADF. Il faut noter que pour ces tests ADF, les
valeurs critiques des statistiques de Dickey-Fuller sont identiques à celles des tests
précédents. On peut enfin remarquer que le nombre de retards (p1, p2 ou p3) pour Y


t i
peut être obtenu en retenant par exemple un critère FPE d’Akaike (cf. I.D).

24 On aura en effet Pr(T (ρ − )
1 〈 Kα ) = α .



43

** La solution non-paramétrique proposée par Phillips (1987), Phillips et
Perron (1988), Perron (1988) offre l’avantage de tenir compte à la fois de l’autocorrélation
et de l’hétéroscédasticité des erreurs. Ces tests sont basés sur les trois modèles précédents.
La seule différence vient du fait que dans le modèle (4.3) le terme de tendance est centré.
On a dans ce cas une relation de la forme,25

~
T
Y = a~ + b t
( −
+ ~
)
ρ Y




(4.4)
1 + U
t
t
t
2

Phillips et Perron vont utiliser les résidus des estimations des modèles (4.1’),
(4.2’) et (4.3’) pour corriger les statistiques (t, K, Φ ) de Dickey et Fuller. Les nouvelles
statistiques, appelées Z(t), Z(K), Z( Φ ) (cf. annexe 4 pour une formulation détaillée) auront
les mêmes valeurs critiques que celles de Dickey et Fuller.

4.2. Les tests de Bhargava (1986)

Les tests de Dickey-Fuller se heurtent à une double difficulté. D’une part, ils ne
permettent de tester que l’alternative racine unitaire-stationnarité; l’hypothèse d’une racine
explosive n’est pas exemple pas envisagée ici. D’autre part, ces tests ont un caractère
asymétrique. En effet si on revient par exemple sur le modèle (4.2’), l’hypothèse nulle
testée est l’hypothèse d’une marche aléatoire avec dérive ( ∗
ρ = 1 et ∗
a ≠ 0 ). Il y a donc un
terme de tendance dont le coefficient est a*. Or si Ho ne tient pas, l’alternative sera une
série stationnaire autour d’un terme constant

a
1
(

− ρ ) , mais sans terme de tendance.
L’introduction d’un trend dans le cas du modèle (4.3’) ne résout pas ce problème
d’asymétrie, car sous l’hypothèse nulle on aura un trend quadratique, alors que sous
l’hypothèse alternative, la série sera stationnaire autour d’une tendance.
Selon Bhargava, la difficulté c’est de déterminer l’alternative ou les alternatives
appropriées à l’hypothèse nulle de racine unitaire avec ou sans drift. La modélisation

25 Pour plus de détails, voir l’annexe



44
traditionnelle n’étant pas satisfaisante, il propose de retenir un modèle à facteur commun
(Sargan 1980, Hendry et Mizon 1978) de la forme,
Y =aU
+



(4.5)
t
t

avec U = ρ U

E U
et ε ∼ N ( ,
0
2
σ )
t
=

où (
)
0
1 + ε
t
t
t
t

Il vient alors dans ce cas
Y
∆ = a∗ 1
( − ρ ∗ ) + (ρ ∗ − Y
)
1



(4.6)
1 + ε
t
t
t

L’asymétrie est ici éliminée puisque sous l’hypothèse nulle ( ∗
ρ = 1) on a une
marche aléatoire simple, alors que sous l’hypothèse alternative, on a (pour ∗
ρ 〈 1), une série
stationnaire autour d’un terme constant.
De même, en introduisant un terme de tendance dans le modèle (4.5), il vient

~
Y = a~ + b t + U
avec U = ρ~ U



(4.7)
1 + ε
t
t
t
t
t

D’où,

~
~
Y
∆ = a~ − ρ~
1
(
) + b ⋅ ρ~ + b
− ρ~
1
(
) ⋅ t + ρ~
(
Y
)
1



(4.8)
1 + ε
t
[
]
t
t

On vérifie alors que sous l’hypothèse nulle ( ∗
ρ = 1), on a une marche aléatoire
avec dérive, donc avec tendance, alors que sous l’hypothèse alternative la série contient un
~
trend dont le coefficient est
~
b 1
( − ρ ) . Sur la base de ces formulations Bhargava va, à l’aide
de ratios de type Von Neumann, proposer deux ensembles de tests. Les premiers
permettront de tester l’alternative marche aléatoire contre série stationnaire (statistique R1),
et l’alternative marche aléatoire contre série non stationnaire (racine explosive pour de
faibles valeurs de la statistique N1 ; ou racine stable pour des valeurs élevées de N1).
Cependant, comme le note Bhargava, ces tests ne sont pas adaptés lorsque les variables
révèlent une tendance marquée, à la hausse ou à la baisse. Il est alors préférable de tester



45
directement pour ces variables, l’alternative marche aléatoire avec dérive (drift) contre la
stationnarité autour d’un trend (statistique R2) et l’alternative marché aléatoire avec dérive
contre la non stationnarité avec présence d’un trend (et soit une racine explosive pour de
faibles valeurs de la statistiqueN2 ; soit une racine stable pour des valeurs élevées de N2).

La marche aléatoire simple

La première alternative concerne la marche aléatoire simple contre la
stationnarité. Bhargava propose de retenir la statistique R1, telle que:

T
T
R
(
) /
(
)



(4.9)
1 = ∑ Y
Y
2
Y
Y 2
t
1
t


t =2
t =1

T
ou T représente le nombre d’observations et

Y = T 1 ∑Y
t
t =1

Pour des valeurs élevées de R126 on rejette l’hypothèse d’une marche aléatoire
simple. On admet donc que la série est stationnaire.

La seconde alternative se rapporte à la marche aléatoire simple contre la non
stationnarité. Mais cette non stationnarité peut être de deux types, soit avec une racine
stable, soit avec une racine explosive. Bhargava définit la statistique N1 comme

T
T
N
(
) /
(
)



(4.10)
1 = ∑ Y
Y
2
Y
Y 2
t
t 1
t


1
t =2
t =2

* Pour de faibles valeurs de N1, on rejette l’hypothèse de marche aléatoire
simple contre l’hypothèse d’une racine explosive.
** Pour des valeurs élevées de N1, on rejette l’hypothèse de la marche aléatoire
simple contre la non stationnarité avec racine stable.

26 Cf annexe 5 pour les valeurs critiques des statistiques Rl et N1.



46

La marche aléatoire avec dérive

Comme le rappelle Bhargava (p. 371), cette hypothèse devient plausible dès
lors qu’une série laisse apparaître une tendance marquée à la hausse ou à la baisse. Cette
tendance peut alors refléter soit une marche aléatoire avec dérive, soit la présence d’un
trend déterministe. Dans ce dernier cas, la série peut être stationnaire autour d’un trend ou
non stationnaire. Ce sont ces différents comportements que Bhargava va tenter de préciser.

La première possibilité concerne la marche aléatoire avec dérive contre la
stationnarité avec présence d’un trend. On retient pour cela la statistique R2 de la forme:

T


2
1
R = ∑ Y
(
Y )


Y
(
Y )2 ) / D


(4.11)
2

t
t 1
T
1

 =

2
(
)
1
t
T

avec
T
D = ∑[

(T − )
1 Y

t − (t − )
1 YT − (T t)Y − (T − )
1 (Y
(
5
,
0
Y + Y ))
/(T
T
− )
1
1
1
]2
2

t 1
=



Pour des valeurs élevées de R227, on rejette l’hypothèse d’une marche aléatoire avec
dérive. La série est donc stationnaire autour d’un trend.


La seconde possibilité sera entre la marche aléatoire avec dérive et la non
stationnarité avec présence d’un trend. Pour tester cette stationnarité, on retient la
statistique N2.

T

1

2
2
N = ∑ (Y Y )


(Y Y )
/ D


(4.12)
2

t
t 1
T
1

1
 =

t
(T
)
1
1

avec


27 Cf. annexe 5 pour les valeurs critiques de R2 et N2.



47
T
1
D
(
)
1
(
)
1
(
) )

1 =
2 ∑ [ T
Y
t
Y
T
t Y
2
t

T
− 1 ]
T
( − )
1
t =1

Pour des valeurs faibles de N2, on rejette l’hypothèse d’une marche aléatoire
avec dérive au profit de la non stationnarité avec racine explosive (et présence d’un trend).
Pour des valeurs élevées de N2, on rejette l’hypothèse d’une marche aléatoire
avec dérive en faveur de la non stationnarité avec racine stable (et présence d’un trend).

On peut considérer que les tests réalisés à partir des statistiques R2 et N2 sont
complémentaires du test de Dickey-Fuller effectué à l’aide de la statistique Φ .
3

4.3. Les tests de stationnarité (extrait de Rey et Varachaud, 2002, version en français)

Le test de Kwiatkowski-Phillips-Schmidt-Shin (KPSS) est un test de stationnarité
(l’hypothèse nulle est la stationnarité en niveau pour KPSS1 et autour d’un trend pour
KPSS2). La séquence des observations est la somme de trois composantes (un trend
déterministe,
une
marché
aléatoire
et
un
terme
d’erreur
stationnaire):
r = βt + y + ε avec y = y
ε

(
est stationnaire, (u une séquence de variables
t )
t )
1 + u
t
t
t
t
t
t
aléatoires i.i.d. (
2
,
0 σ
. La valeur initiale de la marche aléatoire y est notée y
u )
0.
L’hypothèse de stationnarité est H
2
σ
. Dans le cas où β=0, la stationnarité est
u =
0:
0
autour de y0, tandis que dans le cas de stationnarité autour d’un trend, c’est t+y0.. Le test
repose sur la statistique du multiplicateur de Lagrange (LM): la valeur estimée de l’erreur
est
eˆ = r − µˆ ou e
ˆ = r − µ − βt
ˆ
ˆ
;

une
estimation
de
la
variance
est
t
t
t
t
1
2
s 2 (k )
n
k
n
= ∑e
ω j,k
eˆ eˆ
où les ω( j, k ) sont ls poids qui dépendent du choix
t
+ ∑ ( )∑ t tj
n 1
n
t =
j =1
t = j+1
de la fenêtre du spectre (pour KPSS nous utilisons la fenêtre de Bartlett pour laquelle
2
n
t
∑∑ 

eˆ 
i
ω(
j
=  =

j, k ) = 1 −
). La statistique du test est
t 1
i 1
ˆ
η =
; elle est calculée pour
k + 1
n 2s 2 (k )
différentes valeurs/décalages de k. La loi de la statistique est tabulée dans KPSS (1992) et



48
les valeurs critiques sont 0.463 (5 %) et 0.347 (10 %) pour KPSS1, 0.146 (5 %) et 0.119
(10 %) pour KPSS2.

4.4. Les tests de racine unitaire avec break de Perron (extrait de Rey et Varachaud,
2002, version en français)


Nous considérons trois modèles. Dans chacun d’eux, l’hypothèse nulle de
racine unitaire est testée, soit α = 1 en utilisant un t-statistique. Appelons y la variable
dont on cherche les propriétés.
Dans le modèle 1, on admet une modification de la constante à la date de rupture
(TB) dans une régression de la forme:
k
y = µ + θ ⋅ DU + β ⋅ t + δ ⋅ DTB + α ⋅ y
(4.1)
1 + ∑ c
y
∆ − + e
t
t
t
t
i
t i
t
i =1

µ est le terme constant, t le terme de tendance et e le terme d’erreur bruit blanc ; et avec
DU = 1 si t>TB , et 0 autrement; DTB = 1 si t=TB+1 , et 0 autrement


Dans le modèle 2, on admet à la fois une modification de la constante et de la pente
de la tendance à la date de rupture.
k
y = µ + θ ⋅ DU + β ⋅ t + γ ⋅ DT + δ ⋅ DTB + α ⋅ y
(4.2)
1 + ∑ c ⋅ ∆y − + e
t
t
t
t
t
i
t i
t
i =1

avec DT = 1.t si t>TB , et 0 autrement.


Dans le modèle 3, on accepte une modification de la pente mais les deux segments
de la fonction de trend sont joints en TB. La procédure se déroule en deux temps. Dans une
première étape, y est purgée de sa tendance en utilisant une régression de la forme:

y = µ + β ⋅ t + ⋅ DT
γ
y
~
+
t
t
t
avec DT = 1.(t-TB) si t>TB, and 0 autrement. Dans une seconde étape, on teste
l’hypothèse de racine unitaire dans la relation:



49
k
y
~ = α ⋅ y~
~


1 + ∑ c
y
∆ − + e
t
t
i
t i
t
i=1

TB est sélectionnée comme la valeur qui minimise la statistique t pour tester α = 1, et on
choisit une valeur de k, appelé k, tel que le coefficient sur le dernier retard est
significativement différent de zéro et que le coefficient du retard dans une régression
d’ordre supérieur à k est non significatif. La procédure est menée jusqu’à un nombre de
retards maximum, que l’on appellera kmax (ici kmax = 10; cf. Perron 1997 p.358).

Idéalement, on devrait pouvoir retenir pour chaque variable le bon modèle, c’est à
dire le modèle qui rend compte des changements d’ordonnée à l’origine et/ou des
changements de tendance. Les variables étudiées par Perron se prêtent parfaitement à ce
choix. Dans la pratique, l’observation des graphiques ne donne pas toujours des indications
aussi nettes. Toutefois, certains choix entre les différents modèles pouvant sembler
arbitraires, on procèdera pour chaque variable à l’estimation des 3 modèles.


4.5. Les tests de racine unitaire avec break de Saikkonen and Lütkepohl (extrait de
Jaussaud et Rey, 2009)


To examine the statistical properties of the series, we use unit root tests,
specifically, the augmented Dickey-Fuller (ADF) test and the Saikkonen and Lütkepohl test
(hereafter, SL), which take into account the effects of unknown structural changes in the
data. In addition, Saikkonen and Lütkepohl (2002) and Lanne et al. (2002) posit that a shift
may spread over several periods rather than being restricted to a single period (Lütkepohl,
2004). The tests we use enable us to examine the null hypothesis of a unit root based on the
following general specification:
X = µ
.
( )
,




(8)
0 + µ t + f
θ '
1
γ + z
t
t
t
where θ and γ are unknown parameters, t is the time trend, the error term z is generated
by an AR(p) process, and f
is the shift function, which depends on θ and the regime
t θ '
( ) γ
shift date T . We consider three shift functions.
B



50
1. Based on a simple shift dummy,
 ,
0
t < T
f 1
d
.



(9)
t
= ,1 = 
B
t
 ,
1
t TB
2. Based on the exponential distribution function, which allows for a nonlinear
gradual shift to a new level starting at time T ,
B
 ,
0
t <
f 2 (θ ) =
T

B .



(10)
t
1− exp[−θ t
( − T
)
1 ],
t
T
B +
B
3. A rational function in the lag operator applied to a shift dummy,
d


,
1 t

3
1 θ
f θ
( )
 −
.




(11)
t
=
L
d ,1t−1 


1 − L
θ 
We first estimate the deterministic term with generalized least squares (GLS),28 then apply
an ADF test to the adjusted data, which include the series obtained by subtracting them
from the original series.29





Remarque: Les graphiques suivants présentent les différents cas de rupture pris en compte
par Saikkonen and Lütkepohl (cf. Lütkepohl et Kratzig, 2004 p.60).


28 T corresponds to the date at which the GLS objective function is minimized.
B
29
'
The adjusted series are ˆ
X = X
+
t + f
.
t
t
µˆ0 µˆ .1
t θˆ
( ) γˆ



51
Shift Dummy

0
0
Exponential Shift
0
0
Rational Shift
0
0




52

4.6. Les tests d’intégration fractionnaire (extrait de Rey et Varachaud, 2002, version en
français)

Diebold et al (1991), Cheung (1993), Barkoulas et Baum (1998) ou Baum et Al-. (1998),
ont montré que les taux de change pouvaient se comporter comme des processus fractionnaires,
c’est-à-dire des processus pour lesquels le degré d'intégration (d) n'est pas un entier.

Deux cas apparaissent assez fréquemment dans les études sur des variables monétaires et
financières. Le premier est celui d’une mémoire longue, ou de dépendance positive à long terme,
bien que ces variables satisfassent la condition de stationnarité ( 0 < d < 0 5
. ). Le second se réfère
à des processus mean-reverting ou de retour à la moyenne, processus qui ne sont pas stationnaires
( 0 5
. ≤ d <1), mais révèlent une tendance à revenir vers leur valeur moyenne.


Un processus ARFIMA 30 peut être représenté comme un processus ARIMA pour lequel le degré
d’intégration n’est pas entier. On peut revenir à l’équation (3) qui est de la forme
(Φ )B(I− )d
B r Θ
= B
avec
, où maintenant on aura (I − )d
B qui est défini par sa forme
t
( )ε,t
ε ~
t
( 2
,
0σ )
polynomiale

(

k
I B)d
Γ(k d )B
d (d − )
1
d d
d
2
(
)1( 2) 3
= ∑
= − dB +
B
B +

k =
Γ − d Γ k +
0
( ) (
) 1
...
1
!
2
!
3

avec Γ(.) une function gamma.
~
La première étape pour estimer d consiste à différencier les séries et à estimer d dans le
~
~
modèle (I B)d
−1
X
B
B ε
u
ù X
r
r
. d est le degré d’intégration de la
t = Φ
( )Θ( ) t ≡ o
t
t = ( t t 1
− )
~
variable X, c’est-à-dire des variations relatives du taux de change réel. De l’estimation de d , on
déduira le degré d’intégration (d) du taux de change réel en niveau (logarithme), sachant que
~
~
d = 1 + d . Notons que tester d = 0 pour X est équivalent à tester l’hypothèse de racine unitaire
dans r.
~

Pour estimer d , deux méthodes standards retiendront notre attention; la méthode semi-
paramétrique suggérée par Geweke et Porter-Hudak (1983) et la méthode semi-paramétrique
gaussienne développée par Robinson (1995).

30 Voir GRANGER et JOYEUX (1980), et HOSKING (1981).



53
La procédure de Geweke et Porter Hudak (GPH) est basée sur la pente de la fonction de
densité spectrale. Plus exactement, si le périodogramme de X de fréquence ξ est défini par
2
1
ξ
1
I (ξ ) =
n ite (X X ) a ve cX
X ,
t
=
n
t =1
t= t
2 n
π
n
1

la régression spectrale sera

ln{I ξ
(
}

2  ξ

λ
) = β
, λ = ,
1 ....,υ
0 + β
ln
1
4 sin 
 +η
λ
λ

 2 
π
2 λ
avec ξλ =
, n le nombre d’observations, et υ = g(n) << n le nombre de fréquences de
n
Fourier
incluses
dans
la
régression.
En
pratique,
on
retient
g(n) = int[ α
n ],int[ ]é
tant l
a p
art
e e
ntière d
u n
ombre r
ée
l et α prenant successivement les
2
π
valeurs 0.5 , 0.525 , 0.55. En outre, la variance de ηλ est supposée connue et fixée à
(cf.
6
Geweke et Porter-Hudak (1983)). La valeur négative de l’estimateur des moindres carrés
~
ordinaires de la régression, qui est
ˆ
− β , donnera une estimation d consistante et
1
asymptotiquement normale.


La méthode de Robinson (1995) est basée sur une estimation du paramètre H, noté Hˆ
Obtenue en minimisant la fonction

R(H ) =
ˆ
ln G(H ) − (2H
1
)
1
⋅ ∑υ lnξ 31
υ

λ =
λ
1

υ

où les paramètres ont la même signification que plus haut et ˆ
1
G(H )
2 H 1
=
⋅ ∑ ξ
(ξ )
υ
I
. Une
λ 1 λ
λ
=
~
~
estimation de d est obtenue, sachant que
1
H = d +
.
2



31
1−2 H
Nous considérons que la densité spectrale, notée f (ξ ) , se comporte comme f (ξ ) ∼ Gξ
, quand
+
ξ → 0 , pour G ∈( ,
0 ∞) et H ∈ (
)
1
,
0
.



54
5. COINTÉGRATION ET VECTEUR AUTORÉGRESSIF

Si les performances d’un modèle dynamique peuvent être améliorées en
affinant la structure des retards et/ou en éliminant certains paramètres, voire certaines
variables, un pas supplémentaire peut être franchi avec la prise en compte de termes en
correction d’erreur. En effet lorsqu’on estime des modèles autorégressifs, cela nécessite de
travailler sur des processus faiblement stationnaires (moments d’ordre 1 et 2 indépendants
du temps). Ce faisant, on est souvent amené à différencier des séries pour les rendre
stationnaires, et on perd ainsi toute l’information qui a trait à l’évolution de la variable dans
la longue période. Or il est souvent observé que des séries non stationnaires, que l’on
qualifiera d’intégrées, peuvent évoluer de manière convergente dans le long terme. On parle
alors de relations de cointégration. Mais à court et moyen terme, il peut exister un écart
entre la valeur observée d’une variable et sa valeur d’équilibre de long terme. Un modèle
VAR qui ne prendrait pas en compte ces “erreurs d’équilibre”, c’est-à-dire une variable
d’écart, serait mal spécifié (Perron et Campbell, 1992). A fortiori un modèle VAR qui
prendrait en compte un (ou plusieurs) terme(s) en correction d’erreur, réduirait de 40 % en
moyenne l’erreur de prévision qui résulte d’un modèle standard, à un horizon de 20
périodes (Engle et Yoo 1987).
Cependant la prise en compte de relations de cointégration nécessite une
analyse préalable qui permette de préciser en premier lieu l’ordre d’intégration des
variables, et en second lieu les éventuelles relations de cointégration.

5.1. La mise en évidence de relations de cointégration

On en précisera les principales caractéristiques avant de s’intéresser aux tests
liés à la cointégration. On distinguera alors les tests fondés sur une relation statique des
tests de rang de matrice.







55
5.1.1 La notion de cointégration

Si on s’en tient à la définition de Engle et Granger (1987)32, on parlera de
relation de cointégration pour toute combinaison linéaire de variables qui est stationnaire,
chaque variable comportant une racine unitaire I(1). En d’autres termes, seront cointégrées
des variables qui ont une composante stochastique commune. Cette définition très générale
a été précisée ultérieurement par Ogaki et Park (1992).

A. Définitions de la cointégration

Ogaki et Park sont amenées à distinguer la cointégration déterministe de la
cointégration stochastique. Pour illustrer cette distinction, on peut se référer à une
régression statique composée uniquement de variables I(1)33.
Appelons X
Z un vecteur de variables I(1), et considérons
t
1 une variable I(1),
t
l’équation
X
γ


(5.1)
1
= 'Z +U
t
t
t

L’hypothèse de cointégration signifie qu’il existe un vecteur de coefficients '
γ
tel que la combinaison linéaire (X
'
− γ Z soit stationnaire, c’est à dire I(0)34. Le vecteur
t
1
t )
de cointégration est donné par
'
Θ = ,1
(
'
γ
− )

Cette définition de la cointégration que l’on doit à Engle et Granger est
qualifiée par Ogaki et Park de cointégration déterministe. Elle impose que la combinaison
linéaire soit de moyenne constante (ou nulle ici) et de variance constante.
Cependant, il peut exister des cas où cette combinaison linéaire aura une
variance constante, mais une moyenne qui évolue avec le temps. En d’autres termes on aura

32 Des travaux plus récents tentent de rechercher des relations de cointégration entre séries intégrées d’ordres
différents.
33 Cette définition peut être appliquée au cas d’un système multivarié (cf. PERRON et CAMPBELL, 1993).
34
(X
'
− γ Z est nulle.
t
1
t )
On suppose pour simplifier l’exposé que la moyenne de la combinaison linéaire



56
affaire à une combinaison linéaire stationnaire autour d’un trend. Ces auteurs qualifient ce
cas de cointégration stochastique.
Le modèle précédent doit alors être réécrit comme,

X
γ

avec b≠0
(5.2)
1
= 'Z + b t +U
t
t
t

Cette extension du concept de cointégration présente un double intérêt;
- d’un point de vue économique, il peut exister des cas où la convergence entre
plusieurs variables s’effectue autour d’un trend, qui pourrait par exemple refléter des
changements structurels.
- d’un point de vue économétrique, cette définition moins contraignante est
intéressante car elle remplit toutes les conditions pour que le théorème de représentation de
Granger, qui établit qu’un système cointégré a une représentation en termes de correction
d’erreur, soit vérifié (Perron et Campbell, 1993).
Compte tenu de ces différents concepts de cointégration, on peut s’interroger
sur les mécanismes sous-jacents qui produisent ce type de relations.

B. L’origine des relations de cointégration

En s’inspirant de la présentation de Perron et Cambpell (1992) on rappellera
que « deux mécanismes principaux entraînent la présence de cointégration dans un modèle
macroéconomique ».
- Le premier mécanisme est celui d’une relation de causalité entre deux ou
plusieurs variables. On observe alors un lent ajustement vers un équilibre de long terme qui
reflète le jeu des forces économiques.
Au niveau le moins sophistiqué de la théorie économique, on
pense que certaines variables économiques ne devraient pas trop
différer entre elles, du moins à long terme” (Granger 1986).




57
- Le second mécanisme qui engendre des relations de cointégration est celui de
la prévision. En effet si une variable est I(1) et si une autre variable est une prévision
rationnelle des valeurs futures de la première, ces deux variables seront cointégrées.
Il peut aussi se produire des cas où ces deux mécanismes jouent conjointement.
Ainsi, Perron et Campbell rappellent les résultats de King, Plosser et Rebelo (1988) qui
montrent que dans un modèle de cycles réels qui comprend des variables I(1), et dans
lequel les agents optimisent intertemporellement, les variables consommation,
investissement et production sont cointégrées.
Plusieurs procédures ont alors été proposées pour mettre en évidence ces
relations.

5.1.2. Les procédures de tests

Depuis les travaux pionniers de Engle et Granger, de très nombreux tests ont
été proposées pour déceler les relations de cointégration. Les plus simples, et souvent les
plus répandus, sont fondés sur une régression statique, tandis que les plus élaborés
s’attachent à l’analyse de systèmes multivariés. On ne cherchera pas ici à faire un exposé
exhaustif de toutes ces méthodes, mais on s’intéressera plus précisément à l’approche par la
régression statique et à la méthode de Johansen-Juselius qui ont pour point commun de
pouvoir être utilisées à la fois pour tester la cointégration déterministe et la cointégration
stochastique.

A. Les tests fondés sur une régression statique.

Ces tests ne s’appliquent qu’aux variables intégrées d’ordre 1. Dans ce cas, on
suppose qu’une variable du système est la variable dépendante de la régression. On teste
alors l’hypothèse nulle d’absence de relation de cointégration contre l’hypothèse alternative
selon laquelle il existe au moins une relation de cointégration. Tester la cointégration se
ramène ainsi à tester la stationnarité des résidus de la régression statique.
* Pour mettre en évidence une éventuelle relation de cointégration
déterministe, on retient un modèle général de la forme



58

X
= a Z + c + ε


(5.3)
t
1
1
t
1
t
1

ou X est une variable I(1), Z un vecteur de variable I(1), et c un terme constant.
t
1
1
Si on appelle e les résidus de cette régression (estimation de ε ), deux tests
1
peuvent être appliqués.
* Le premier, suggéré par Sargan et Bhargava (1983) se réfère à la statistique
de Durbin-Watson. Si on appelle CRDW, cette statistique,

∑(e e
t
2
t − )
CRDW =
1





(5.4)
2
(e )
t

une valeur élevée de cette statistique, c’est-à-dire une valeur supérieure à la valeur tabulée
(cf. Annexe 6.2 tableau n° 4) conduira au rejet de l’hypothèse nulle de non-cointégration.
** Le second type de test n’est rien d’autre qu’un test de Dickey-Fuller
appliqué aux résidus. Mais dans la mesure où les résidus sont les estimations des termes
d’erreurs, les valeurs tabulées ne seront pas les mêmes que pour les tests de racine unitaire
traditionnels (Engle et Granger, 1987, Engle et Yoo, 1987). Ainsi dans une régression de la
forme,

e
∆ = α e



(5.5)
1 + η
t
t
t

on rejettera l’hypothèse nulle d’une racine unitaire dans les résidus (non-cointégration) si le
tα déduit de l’estimation de (3-7) est négatif et inférieur au tα tabulé (cf. Annexe 6.2,
Tableau 2). Ce même test peut alors être effectué dans un modèle du type (3.6) sans terme
constant, c’est-à-dire lorsqu’on suppose que la combinaison linéaire est de moyenne nulle.
Si on désire prendre en compte la possibilité d’une corrélation sérielle dans les
termes d’erreur (η ), on appliquera aux résidus un test augmenté de Dickey-Fuller (ADF)
(Cf. Annexe 6.2, tableau 3 pour les valeurs critiques). On retient alors une régression de la
forme,



59


P
e
∆ = α e




(5.6)
1 + ∑ϕ
e
∆ − +η
t
t
i
t i
t
i =1

De manière complémentaire on peut, comme cela a été suggéré par Phillips et
Perron pour les tests de racine unitaire, proposer une statistique Z (t )
α qui tienne compte de
la corrélation sérielle et/ou de l’hétéroscédasticité des termes d’erreur. C’est à Phillips et
Ouliaris (1990) que l’on doit une application de cette méthode à la cointégration, c’est-à-
dire aux tests sur les résidus. Ils proposent entre autres une tabulation pour les Z (t )
α et les
tests ADF (Cf. tableau I.b de l’annexe 6.3). Des tests du même type peuvent aussi être
réalisés pour la recherche d’une relation de cointégration stochastique.

*** Pour mettre en évidence une éventuelle relation de cointégration
stochastique, il suffit de réestimer le modèle (3.10) après avoir introduit un terme de
tendance. Soit,

X
= a Z + b t + c + ε




(5.7)
t
1
2
t
2
2
2t

On réalise alors des tests de racine unitaire sur les résidus de l’équation (3.13) à
partir d’une régression du type (3.11) ou (3.12) pour le test ADF. Seules les valeurs
tabulées seront différentes ici (cf. Phillips et Ouliaris (1990) et tableaux n° I.C et II.C de
l’annexe 6.3).

B Les tests de cointégration dans un système multivarié

La méthode développée par Johansen (1988, 1991), Johansen et Juselius (1990)
permet d’estimer le nombre de vecteurs de cointégration. Proposée initialement pour tester
la cointégration déterministe, Campbell et Perron (1993) ont étendu cette méthode au cas de
la cointégration stochastique.
* Pour tester la cointégration déterministe, on retient un modèle de la forme.



60

k
X

= µ + Π X




(5.8)
1 + ∑ Γ
X
∆ − +ξ
t
t
i
t i
t
i=1

X est un vecteur de n variables aléatoires et µ un vecteur de n termes
constants ; Π et Γ sont des matrices de paramètres de dimensions (n x n), etξ ∼ N ( ,
0 Σ) .
i
t
Ce modèle admet des variables I(1) ou I(0), mais interdit l’inclusion de variables I(0) avec
tendance déterministe (Juselius 1991, Perron et Campbell 1992, p.20). La procédure de
Johansen et Juselius permet d’estimer le rang de la matrice Π , ce rang qui correspond au
nombre de relations de cointégration.

Si 0 ≤ rang(Π) = r n , c’est-à-dire s’il existe r relations de cointégration, la
matrice Π doit satisfaire la relation
'
Π = αβ , où α et β sont des matrices de dimension
(n x r). β représente la matrice de cointégration dont les colonnes constituent les vecteurs
de cointégration.
On peut aussi préciser que lorsque rangΠ = n , la matrice Π est dite de plein
rang et X est stationnaire. Dans ce cas, l’application d’un modèle VAR sans contraintes aux
variables brutes est adéquate. A l’inverse si ran Π
g
= 0 , la matrice Π est la matrice nulle et
l’application d’un modèle VAR sans contraintes, aux différences premières, s’impose. Le
modèle (3-13) est alors estimé par la méthode du maximum de vraisemblance.
α, β et Σ sont obtenus en résolvant un problème de valeurs propres (notées λ
ici)35.
Deux tests sont alors possibles pour déterminer le nombre de relations de
cointégration.
1- Le premier repose sur la statistique de la trace.
Ainsi on va estimer le modèle (5.8) et on va tester successivement les
hypothèses nulles selon lesquelles il y a : r = ,
0 r = ,
1 Kr = n − 1 relations de cointégration.
Pour chaque estimation on obtient une vraisemblance qui est comparée à la vraisemblance

35 On pourra se reporter à JOHANSEN 1988, JOHANSEN et JUSELIUS (1990), PERRON et CAMPBELL
(1992), BANERJEE et ahi (1993), JOBERT (1993) pour un exposé détaillé des méthodes d’estimation



61
du modèle (3-13) estimé sous l’hypothèse que toutes les n valeurs propres ( λ ,
)
1 λ
K
,
2
λn
sont retenues, c’est-à-dire qu’il existe n relations de cointégration (modèle non contraint).
La comparaison de ces vraisemblances s’effectue sur la base d’un calcul de rapport, ou de
différence si on retient les logarithmes des vraisemblances.
Ainsi on testera l’hypothèse qu’il existe r relations de cointégration (H(r))
contre l’hypothèse qu’il en existe n (H(n)), à partir de la statistique

n
η
2LogQ(H (r) / H (n))
T
Log 1
(
λ )

(5.9)
r = −
= − ∑
i
i=r +1
Cependant cette statistique ne se distribue pas comme un khi-carré standard car
on a affaire à un processus multivarié I(1) (Banerjee et alii 1993, p. 267). Les distributions
sont tabulées par simulation (Johansen et Juselius 1990, Osterwald-Lenum 1992).
L’hypothèse nulle sera rejetée lorsque la valeur estimée de la trace sera supérieure à la
valeur tabulée (cf. Annexe 7.1). Plus précisément on sera amené à calculer η ,η , η
K
.
0
1
n 1

Le nombre de vecteurs de cointégration retenu sera r+ 1 si la dernière statistique
significative est η .
r

2- Le second test est celui dit du λ max ou de la valeur propre maximum.
Il s’agit ici d’une comparaison de vraisemblance, mais sous des hypothèses un
peu différentes, puisqu’on teste l’hypothèse nulle qu’il existe r relations de cointégrations
contre l’hypothèse alternative qu’il en existe r+1. La statistique retenue est de la forme,

ζ
LogQ H r
H r
T Log
λ


(5.10)
r =
2

(
( ) /
( + )
1 ) = −
1
( −
)
r 1
+

Comme précédemment cette statistique ne se distribue pas suivant un khi-carré
standard (Cf Annexe 7.1). Une valeur du λ max calculée supérieure à la valeur tabulée
conduira au rejet de l’hypothèse nulle selon laquelle il existe r relations de cointégration.

** Pour tester dans un second temps l’hypothèse d’une cointégration
stochastique, on va compléter le modèle (3-13) en introduisant un terme de tendance. Soit




62
k
X

= µ + Π X




(5.11)
1 + δ t + ∑ Γ ∆X − + υ
t
t
i
t i
t
i =1

t représente le terme de tendance, et υ ∼ N ( ,
0 Σ). A l’inverse du modèle (3-14), ce
t
système admet aussi la présence de variables stationnaires autour d’un trend. On dira alors
que “un vecteur de variables Xt est “stochastiquement cointégré” s’il existe au moins un
vecteur non nul β , composé de n éléments, tel que '
β X est I(0). β est appelé le vecteur
i
i
t
i
cointégrant. S’il y a r vecteurs linéairement indépendants, nous dirons que Yt est cointégré
avec un rang r de cointégration. La matrice de cointégration est définie comme
β (β ,K
=
β ) ”. (Perron et Campbell 1993, p. 223)36.
1
r
La procédure de tests appliquée au modèle (5.11) est la même que pour le
modèle sans terme de tendance. Les statistiques de la trace et de la valeur propre maximale
sont calculées de la même manière. Cependant les valeurs critiques tabulées pour ces
statistiques ne seront pas celles de Johansen et Juselius ou Osterwald-Lenum, mais seront
données par Perron et Campbell (1993, table 1, p. 229 - cf. Annexe 7.2). Si des relations de
cointégration sont mises en évidence les modèles antorégressifs pourront être réécrits sous
une représentation en termes de correction d’erreur.

C. Les tests de cointégration en présence de breaks (extrait de Jaussaud et Rey, 2009)


Following Saikkonen and Lütkepohl (2000), Lütkepohl and Krätzig (2004), and
Demetrescu et al. (2008), we test the cointegrating rank of a VAR process when the data
generating process (DGP) y has a deterministic component ( µ ) and a stochastic
component (x). Then, y = µ + x , and we assume µ is generated by a process with a
t
t
t
constant,
linear
trend
and
shift
dummy
variables
of
form
D
= 0 for t T and D =1 for t > T , such that µ = µ + µ t. +δ.D , where t = 1, 2,
TB
B
TB
B
t
0
1
…, T. If µ does not reveal a linear trend (i.e., µ = 0 ), the term may be dropped. We
1

36 On peut noter que la cointégration déterministe impose que β satisfasse une condition supplémentaire,
'
soit β δ = 0 .



63
estimate the parameters of the deterministic part through feasible GLS. Using the
estimates, we can adjust y to obtain xˆ = y − ˆ
µ − ˆµ t −δ D
.
ˆ
..
, and then apply the Johansen
t
t
0
1
likelihood ratio test for the cointegrating rank to xˆ . In other words, the test is based on a
t
reduced rank regression of the system,
p−1
x
∆ˆ = Πxˆ −
.




(6)
1 + ∑ Γ ∆x
ˆ − + u
t
t
i
t i
t
i =1
The critical values depend on the kind of deterministic term included. We consider a
constant37,38 and shift dummies determined by the unit root tests with break

5.2. Les représentations en termes de correction d’erreur

On précisera dans un premier temps le principe et l’intérêt d’une représentation
en terme de correction d’erreur (A). Dans un deuxième temps on appliquera cette
représentation aux modèles vectoriels autorégressifs (B).

5.2.1. L’apport d’une représentation en termes de correction d’erreur

Si récemment ces modèles ont connu un vif intérêt, Granger (1986) rappelle
qu’ils ont été initiés par les travaux de Sargan (1964) et Phillips (1957), puis repris et
développés par Davidson, Hendry, Srba et Yeo (1978), Hendry et Von Ungern Stenberg
(1890), Curry (1981), Dawson (1981), Salmon (1981), ...etc. Ce regain d’intérêt est en fait
lié au développement de l’analyse des séries non stationnaires. On peut dans une première
étape présenter ce concept dans le cadre d’un modèle simple à une équation. Considérons
par exemple deux variables X , X qui sont intégrées d’ordre 1. Si l’on veut préciser les
1
2
relations entre ces deux variables, en appliquant par exemple la technique des moindres
carrés, on sera amené à les différencier de façon à obtenir des séries stationnaires.

37 For space considerations, we do not present the tests with a linear trend orthogonal to the cointegration
relations, though they confirm the precedent conclusions.
38 We also note that each I(0) variable creates an additional cointegration vector. Tests realized without the
I(0) variables (not reported herein) confirm there is always at least one cointegration relationship.



64
Dans le cas de représentations autorégressives, on pourra par exemple retenir
un modèle explicatif pour X , de la forme,
1

X

=ψ (L) X

+ψ (L) X

+U

U N ( ,
0
2
σ )
(5.12)
t
1
11
t
1
12
2t
t
1
t
1

L’inconvénient de cette modélisation est qu’en différenciant X et X , on perd
1
2
l’information sur l’évolution à long terme de ces variables. En particulier il est possible
qu’en longue période X et X évoluent de manière convergente. S’il existe une relation
1
2
de long terme (de cointégration) de la forme X
= A X , la grandeur ( X A X )
t
1
2t
t
1
2t
reflètera les écarts par rapport à cet équilibre de long terme. On pourra parler de terme
d’erreur. Dans ce cas le modèle (5.12) peut être réécrit pour tenir compte du fait que si à
court terme X peut différer de A X , il existe des forces de rappels, prises en compte par
1
2
le terme d’erreur (écart par rapport à la cible), qui contraindront ces variables à converger
dans la longue période. Le modèle (5-12) sera mieux spécifié comme,

X

=ψ (L)∆X +ψ (L)∆X E − +U


(5.13)
t
1
11
t
1
12
2t
t 1
t
1

E = X A X ; θ constituant un coefficient d’ajustement, θ<0 .
t
t
1
2t
Une extension de cette formalisation peut être réalisée pour un modèle
multivarié du type VAR. Si on appelle X un vecteur de n variables, l’existence de relations
de cointégration implique que
'
β X
. Si on appelle E le terme d’erreur, on aura
t = 0
t
E
'
= β X et le modèle VAR est réécrit comme un vecteur à terme de correction d’erreur
t
t
(modèle VECM). Il vient alors

k
X

= µ + Γ E




(5.14)
1 + ∑ Γ
X
∆ − +U
t
e
t
i
t i
t
i =1
où Γ peut être considérée comme une matrice d’ajustement.
e
On doit en fait à Granger (1981, 1983) d’avoir démontré qu’il existait un lien
entre une représentation en termes de correction d’erreur et la notion de cointégration. Plus



65
précisément (cf. Granger 1983, Engle et Granger 1987), on démontre qu’un vecteur Y
composé de n variables aléatoires I(1) et qui admet r relations de cointégration, a une
représentation en termes de correction d’erreur de la forme.

A(L) 1
( − L) X = −Γ E




(5.15)
1 + U
t
e
t
t

où (
A )
0 = I , Γ
. E =
Y
'
β est un vecteur de dimension (r x 1) de variables
e ≠ 0
t
t
aléatoires stationnaires. β représente le vecteur de cointégration.
Si comme nous l’avons rappelé plus haut seul le déséquilibre de la période
précédente ( E
) est considéré comme ayant un pouvoir explicatif, il est possible en
t 1

réarrangeant l’équation (5.15) de faire dépendre X d’un ensemble de valeurs retardées de E.
On peut ainsi préciser un ajustement graduel vers l’équilibre de longue période.
Les modèles à correction d’erreur ayant été définis on peut maintenant
s’intéresser à leur estimation.

5.2.2. Estimation des modèles à correction d’erreur.

A ce stade, deux stratégies de tests peuvent être retenues.
1- Il est possible d’estimer directement le modèle VECM, et ainsi de déterminer
simultanément les paramètres des variables explicatives et d’isoler les différentes relations
de cointégration. C’est la méthode de Johansen-Juselius sur laquelle il n’est donc pas
nécessaire de revenir ici.
2 - On peut aussi procéder en une estimation en deux étapes (Engle et Granger,
1987). Dans un premier temps on recherche des relations de cointégration entre variables
I(1). Dans un second temps on réintroduit les résidus des relations de cointégration, qui
sont une estimation du terme à correction d’erreurs, dans le modèle VAR. Considérons un
modèle VAR standard de la forme (cf. Il-A).

X

= A X




(5.16)
1 ∆
L
−1 +
+ A X − +U
t
t
p
t p
t




66
Si des tests de résidus permettent par exemple de mettre en évidence i relations
de cointégration parmi les variables de X, le modèle VECM s’écrira,


X

= A X
L
K


1 ∆
−1 +
+ A X
∆ − + Γ e
1
,
1 −1 +
+ Γ e , −1 +U
t
t
p
t p
e
t
ei
i t
t
(5.17)

e représente les résidus de la ième relation de cointégration.
i

Le modèle (5.17) peut par exemple être estimé à l’aide de la méthode SUR.




67
CONCLUSION

Le développement des vecteurs autorégressifs, parallèlement à celui de
l’économétrie des séries non stationnaires, a débouché sur l’élaboration de vecteurs à
correction d’erreur. Les modèles peuvent alors servir de cadre pour tester des relations de
causalité, l’exogénéïté de certaines variables, l’existence de relations de cointégration...

Notre travail avait pour but de proposer une introduction à ces nouvelles
méthodes, tout en s’efforçant d’en montrer la complémentarité. Il ne prétendait donc pas à
l’exhaustivité. Aussi certaines approches ont pu être occultées. On va donc préciser
quelques orientations de recherche supplémentaires pour le lecteur intéressé.

1 - L’étude des modèles VAR a aussi connu de nombreux approfondissements. C’est
tout d’abord le dévelopement des modèles VAR dits structurels, sous l’impulsion des
travaux de Bernanke (1986), Sims (1986)39... C’est aussi l’extension des méthodes
bayésiennes aux vecteurs autorégressifs. Ce sont les modèles BVAR analysés par Doan,
Litterman et Sims (1984), Litterman (1986)...

2 - On peut aussi citer certains travaux récents comme ceux de Urbain (1993) qui
proposent de tester à l’exogénéïté faible (au sens de Engle, Hendry et Richard) dans le
cadre de vecteurs à correction d’erreur.

3 - Enfin, on peut rappeler quelques tests de cointégration qui n’ont pas été exposés
ici.
Mackinnon (1991)40 d’un côté propose de tester la stationnarité des résidus à partir de
trois modèles de résidus distincts, le premier n’incorporant ni terme constant, ni terme de
tendance, le deuxième intégrant un terme constant et le troisième prenant en compte à la
fois une constante et un trend déterministe. Cette approche s’inspire de celle présentée pour
les tests de racine unitaire traditionnels (Cf. III A).

39 Cf. GIANNINI (1992)
40 Cf. aussi DAVIDSON et MACKINNON (1993).



68

Stock et Watson (1988, 1989) proposent quant à eux une méthode d’estimation
du nombre de relations de cointégration dans un vecteur à correction d’erreur qui
s’apparente à l’approche de Johansen.




Pour mener à bien l’ensemble des ces estimations on pourra utiliser les logiciels EViews,
RATS et son package CATS pour la cointégration, ainsi que deux logiciels libres Gretl et
JMulTi. Voir aussi le logiciel Easyreg développé par Bierens.
Adresse Web : http://fr.freestatistics.info/stat.php





69
TABLE DES MATIÈRES
Avant-propos

1. Introduction


2. L’analyse des relations de causalité

2.1. Le concept de causalité selon Granger

2.2. Des définitions opérationnelles du concept de causalité

2.3. Causalité et exogénéité

2.4. La détection des relations causales

2.4.1. La détection de relations causales simples

A L’approche de GRANGER

B L’approche de SIMS

2.4.2. La détection des relations de causalité multiples


3. Causalité et vecteur autorégressif

3.1. Présentation des modèles autorégressifs vectoriels

3.1.1. Modèle VAR et réponse du système à un choc unitaire sur une variable

3.1.2. Modèle VAR et décomposition de la variance de l’erreur de prévision
3.2. Tests de causalité et construction des modèles VAR

3.3. Estimation du modèle VAR et interprétation en termes de causalité

3.3.1.Les méthodes d’estimation

3.3.2. Mise en évidence des relations de causalité dans un modèle VAR


4. Détermination du degré d’intégration des variables
4.1. Les tests de racine unitaire de Dickey-Fuller
4.1.1. L’élaboration d’une procédure de tests
4.1.2. La pratique des tests
4.2. Les tests de Bhargava
4.3. Les tests de stationnarité (tests KPSS)
4.4. Les tests de racine unitaire avec break
4.5. Les test d’intégration fractionnaire

5. Cointégration et vecteur autorégressif

5.1. La mise en évidence de relations de cointégration

5.1.1. La notion de cointégration



70
A. Définition de la cointégration


B. L’origine des relations de cointégration


5.1.2. Les procédures de tests


A. Les tests fondés sur une régression statique


B. L’estimation des vecteurs de cointégration dans un système multivarié


5.2. Les représentations en termes de correction d’erreur


5.2.1. L’apport d’une représentation en termes de correction d’erreur


5.2.2. Estimation des modèles à correction d’erreur



Conclusion :


Liste des annexes


Annexe 1 : Les propriétés des séries stationnaires et non stationnaires



A- 1 Tableau synoptique des tests de racine unitaire de Dickey-Fuller et Phillips-Perron


Annexe 1 - 2 Tables de Dickey-Fuller pour les tests simples de racine unitaire


Annexe 1 - 3 : Tables de Dickey-Fuller pour les tests simples sur la constante et le

coefficient du trend

Annexe 1 - 4 : Tables de Dickey-Fuller pour les tests d’hypothèses jointes


Annexe 1-5: Statistiques Z ( ) de Phillips et Perron


Annexe 1-6 : Valeurs critiques pour le test de Bhargava



Annexe 2 : La cointégration

A-2: Tableau synoptique pour les tests de cointégration fondés sur une régression statique
Annexe 2-2: Tables de Engle et Yoo pour les tests de Durbin-Watson, les tests DF et ADF

de cointégration déterministe





Annexe 2-3: Tables de Phillips et Ouliaris pour tests ADF, de cointégration stochastique et

les Z Q tests (cointégration déterministe et stochastique)

Annexe 2-4: Valeurs critiques pour les statistiques de la trace et de la valeur propre

maximum dans le cadre du modèle de JohansenJuselius: Cointégration déterministe










Annexe 2-5: Valeurs critiques pour les statistiques de la trace et de la valeur propre

maximum dans le cadre du modèle de JohansenJuselius : Cointégration stochastique



Annexe 3 : Test de Phillips et Perron (Extrait de Rey et Varachaud, 2002)



71


Annexe 4: Exemple de tests de racine unitaire et de cointégration non paramétriques,
Bierens (1997)








BIBLIOGRAPHIE PARTIELLE

BAJO-RUBIO O. et SOSVILLA-RIVERO S. (1991), “Modelling Foreign Direct
Investment in Spain 1961-1988: An Application of Cointegration Analysis”,
Colloque ASSET, Nov.
BANERJEE, A., J. DOLADO, J. W. GALBRAITH, AND D. F. HENDRY (1993), Co-
Integration, Error-Correction, and the Econometric Analysis of Non-Stationary
Data, Advanced Texts in Econometrics. Oxford University Press, Oxford.
BOUOIYOUR, J. MARIMOUTOU, V. et S. REY (2004), «Taux de change réel d’équilibre
et politique de change au Maroc: une approche non paramétrique », Economie
Internationale, n°97, 1er trimestre 2004, p. 81-104.
DAVIDSON R. et MACKJNNON J.G. (1993), Estimation and Inference in Econometrics,
Oxford University Press.
DENIAU C., FIORI G. et MATHIS A. (1989), “Impact de la dette publique sur quelques
variables macroéconomiques françaises”. Economie et Prévision. n0 90, n0 4.
DENIAU C., FIORI et A. MATHIS (1992), « Sélection sur un nombre de retards dans un
modèle VAR, conséquences éventuelles de choix des critères », Économie et
Prévision, n0 106, pp. 61-69.
DICKEY D.A., FULLER W.A. (1981), “Likelihood ratio statistics for autoregressive time
series with a unit root”, Econometrica, Vol. 55 (2), Mars.
ENGLE R., GRANGER C.W.J., (1987), “Cointegration and Error Correction
Representation, Estimation and Testing”, Econometrica, Vol. 55, n0 2, Mars.
ENGLE R.F. et YOO B.S., (1987), “Forecasting and Testing in Cointegrated Systems”,
Journal of Econometrics, 35, pp. 143-59.
FIORI G., FLORENS J.P., LAI-Tong H.W., (1982), “Analyse des innovations dans un



72
processus multivarié : application à des données françaises”, Annales de 1’IINSEE,
n0 46, Avril/Juin.
GHYSELS, E., N. R. SAWNSON and M. W. WATSON, (2001), Collected Papers of
Clive. W. J. Granger, Volume II: Causality, Integration and Cointegration, and
Long Memory, Cambridge University Press, UK.
GIANNINI C., (1992), “Topics in Structural VAR Econometrics”, Lectures Notes in
Economics and Mathematical Systems. Springer-Verlag, n0 381.
GRANGER C.W.J., (1969), “Investigating Causal Relations by Econometric Models and
Cross-spectral Methods”, Econometrica, Vol. 37, n0 3, Juillet.
GRANGER C.W.J., (1981), “Time Series Data and Econometric Model Specification”,
Journal of Econometric, Vol. 16, n0 1, Mai.
GRANGER C.W.J., (1986), “Developments in the study of cointegrated economic
variables”, Oxford Bulletin of Economic and Statistics, 48.
GRANGER, C. W., AND P. NEWBOLD (1974), “Spurious Regression in Econometrics,”

Journal of Econometrics, 26, 1045–1066.
HANSEN, H. and K. JUSELIUS, (1995), CATS in RATS: Cointegration Analysis of Time
Series, Estima, Evanston, USA.
HSIAO C., (1981), “Autoregressive modelling and money income causality detection”,
Journal of Monetary Economics, Vol. 7, n0 1, Janvier.
JOHANSEN, S. (1988): “Statistical Analysis of Cointegration Vectors,” Journal of
Economic Dynamics and Control, 12, 231–254.
JOHANSEN, S. (1991): “Estimation and Hypothesis Testing of Cointegration Vectors in

Gaussian Vector Autoregressive Models,” Econometrica, 59, 1551–1580
LUTKEPOHL H., (1993), Introduction to Multiple Time Series Analysis, Springer-Verlag,
Berlin.
LUTKEPOHL, H., AND M. KRATZIG (eds.) (2004), Applied Time Series Econometrics,

Themes in Modern Econometrics. Cambridge University Press, Cambridge.
NELSON C., PLOSSER C., (1982), “Trends and Random Walks in Macroeconomic Time
Series: Some Evidence and Implications”, Journal of Monetary Economics, Vol.
10, n0 2, Septembre.
PHILLIPS P.C. ET OULIARIS S., (1990), “Asymptotic Properties of Residual Based Tests



73
for Cointegration”, Econometrica, Vol. 58, n0 1, pp. 165-93.
REY, S., (2001), « Ouverture commerciale, taux de change réel et croissance dans les Pays
Méditerranéens : les enseignements d’un modèle à correction d’erreur », dans
Ouverture et développement économique, M. Boudhiaf et J-M. Siroën (eds),
Economica, 2001, p.49-78.
REY, S. and P. VARACHAUD (2002), “European Real Exchange Rates After Bretton-
Woods : A Re-examination”, Journal of Economic Integration, vol 17, n°1, march
2002, p. 183-219
REY, S. and J. BOUOIYOUR, (2005), « Exchange Rate Regime, Real Exchange Rate,
Trade Flows and Foreign Direct Investments: Morocco », African Development
Review, vol.17, Issue 2, p.302-334, September.
REY, S., (2006), “Effective Exchange rate Volatility and MENA countries’ exports to EU”
, Journal of Economic Development, vol. 31, n°2, December.
REY, S and J. JAUSSAUD, (2009), « Long-Run Determinants of Japanese Exports to
China and the United States: A Sectoral Analysis », à paraître dans Pacific
Economic Review.
REY, S., (2009), « L’apport du Natrex à la modélisation des taux de change d’équilibre :
théorie et application au dollar canadien», à paraître dans L’Actualité Economique,
Revue d’Analyse Economique.
SALMON, M., (1982), “Error Correction Mechanisms”, Economic Journal, Vol. 92, n0
367.
SIMS C., (1972), “Money, Income and Causality”, American Economic Review, Vol. 62,
n04.
SIMS C., (1980), “Macroeconomy and Reality”, Econometrica, Vol. 48, n0 1, Janvier.
STOCK J. WATSON M.W., (1988), “Variables Trends in Economic Time Series”, The
Journal of Economic Perspectives, Vol. 2, n0 3.
SPENCER D, (1989), “Does Money Matter. The Robustness of Evidence From Vector
Autoregressions”, Journal ofMoney. Credit and Banking, Vol. 21, n0 4, Novembre.






74
Annexe 1: Rappels sur les propriétés statistiques de processus AR(1)
1. La marche aléatoire simple : I(1)
Y = Y
2

E ε
V ε
σ
et
Cov
ε
ε ε
pour i ≠0
t
=
t
=
t
t i
=
1 + ε
t
t
t avec
( )
0 ;
( )
( ,
)
0
Par itération il vient
Yt− = Yt− + ε
1
2
t 1

M

Y = Y + ε
1
0
1
Soit si on somme les Y
t
Y
Y
ε
t =
0 + ∑ i
i=1
Moyenne :
t
t
E(Y ) = Y car E(∑ε )
E ε

i
= ∑ ( )i = 0
t
0
i 1
=
i 1
=
Variance :
2
V (Y ) = t.

t
σε
2. La marche aléatoire avec dérive (drift) : I(1)+dérive
Y = Y −1 + b + ε
t
t
t
En procédant comme pour la marche aléatoire simple on obtient ;
t
Y
Y
t b
.
ε
t =
0 +
+ ∑ i
i=1
Moyenne :
E Y
( ) = Y + t b
.
t
0



75
Variance :
2
V (Y ) = t.

t
σε
3. Processus stationnaire au tour d’une constante/en niveau : I(0)
Y = ρ Y
. −
ρ <
1 + c + ε
t
t
t avec
1
Yt− = ρ.Yt− + c + ε
1
2
t 1

M

Y = ρ.Y + c + ε
1
0
1
En remplaçant Yt-1, Yt-2, etc.…, il vient
n
n 1

n 1
Y
ρ Y
c
ρ K ρ
ε
ρ ε
K
ρ ε

t =
. t n + . 1
( +
+ +
) + t + .

t
+ +
.

1

t n 1

lim 1
( + ρ + K +
1
1
n
ρ ) =
Quand n → ∞ , n
ρ → 0 et
1 − ρ
n → ∞
Soit,
c

i
Y =
+ ∑ ρ ε
t
t i
− ρ
.
1
i=0
Moyenne :
c
E(Y )

t
= 1− ρ
Variance :
2
σ
V (Y )
ε

t
=
2
1 − ρ
4. Processus stationnaire autour d’une tendance/trend stationary : I(0)+trend
On considère un processus avec un trend déterministe



76
Y = ρ Y
. −
ρ <
1 + b t
. + c + ε
t
t
t avec
1

En procédant par substitution pour les Yt− , il vient
i
n
n 1

n 1

2
n 1
Y
ρ Y
b t
ρ K ρ
c
ρ K ρ
b ρ
ρ
K
n
ρ
t =
. t n + . . 1
( +
+ +
) + . 1
( +
+ +
) − .( + 2
+ + ( − )
1 .
− )


n 1
+ ε
ρ ε
K
ρ ε
t +
.

t
+ +
.
1

t n 1

et en supposant que n → ∞ ,

b
i
Y = µ
où µ est un terme constant et µ

1 =
0 + µ
t
.
1
+ ∑ ρ ε.
t
t i
0
1 − ρ
i=0
Moyenne :
E Y
( ) = µ + µ t.
t
0
1
Variance :
2
σ
V (Y )
ε

t
=
2
1 − ρ
Dans ce cas la moyenne n’est plus constante puisqu’elle dépend du temps. C’est l’équation
du trend. Mais si on suppose l’écart par rapport au trend, soit
*
Y = Y − (µ + µ .t)
on peut vérifier que E( *
Y )
et V ( *
Y ) = V (Y )
t
= 0
t
t
0
1
t
t
Yt est donc stationnaire autour d’un trend, ou en d’autres termes c’est l’écart entre la
variable et sa tendance qui est stationnaire.








77
Tableau A1 : synoptique des tests de racine unitaire de Dickey-Fuller et Phillips-Perron

Tables pour les
Hypothèses testées
Statistiques
valeurs critiques
Modèle
de référence
Tests d’hypothèses
Tests simples


jointes
tρ~ DF-ADF
Table 8-5-2
Modèle avec constante et tendance
Z (t
Fuller 1976 p.373
~ )
H0 :
ρ PP
~

~
~
ρ −1 = 0
K = T.(ρ − )
1
Y
~
∆ = (ρ −1 Y
Table 8-5-1
− + c
~
).
+ b t. +U
t
t 1
3t
DF-ADF
Fuller 1976 p.371
Z (K ) PP
t

~ DF-ADF
H0 : ~
c = 0
c
Table II Dickey-Fuller

Z (t ) PP
1981 p. 1062
c
~
t~ DF-ADF

H0 : b = 0
Table III Dickey-

b
Z (t ) PP
Fuller 1981 p. 1063
b
H0 :
Φ DF-ADF
Table V Dickey-
~
2
~
~
c = ,
0 b = ,
0 ρ −1 = 0 Z (Φ ) PP
Fuller 1981 p. 1063
2


H0 :
Φ DF-ADF
Table VI Dickey-
~
3
~
b = ,
0 ρ −1 = 0
Z (Φ ) PP
Fuller 1981 p.1063
3
t
DF-ADF
*
ρ
Table 8-5-2
Modèle avec constante
Z (t
PP
FuIler 1976 p.373
* )
H0 :
ρ
*
ρ −

1 = 0
K = T.( *
ρ − )
1
Y
*
∆ = (ρ − )
1 Y
.
Table 8-5-1
− + c* + U

t
t 1
2t
DF-ADF
Fuller 1976 p.371
Z (K ) PP
t DF-ADF

H0 : *
c = 0

*
c
Table I Dickey-Fuller
Z (t ) PP
1981 p. 1062
c
H0 :
Φ DF-ADF
Table IV Dickey-


1
*
c = ,
0
*
ρ −1 = 0
Z (Φ ) PP
Fuller 1981 p. 1063
1
Modèle simple
tρ DF-ADF
Table 8.5.2 Fuller

H0 :
Z (t )
1976 p371
ρ PP
ρ −1 = 0

K = T.(ρ − )
1
Table 8.5.1 Fuller
Y
∆ = (ρ − )
1 Y
.

− + U
DF-ADF
t
t 1
t
1
1976 p371
Z (K ) PP









78
Tables de Dickey et Fuller pour les test simples- Statistique K=T.(ρ-1)

Les valeurs critiques sont présentées (du haut vers le bas) pour le modèle simple, le modèle
avec constante et le modèle avec constante et trend.









79
Tables de Dickey et Fuller pour les test simples- Statistique tρ-1
Les valeurs critiques sont présentées (du haut vers le bas) pour le modèle simple, le modèle
avec constante et le modèle avec constante et trend.









80
Tables de Dickey et Fuller pour les tests simples sur la constante et le coefficient du trend





81
Tables de Dickey et Fuller pour les tests d’hypothèses jointes








82
Statistiques Z( ) de Phillips et Perron











83
Valeurs critiques pour le test de Bhargava



























84



Annexe A2 : Tableau synoptique pour les tests de cointégration fondés sur une régression
statique
Tables pour
Relations de cointégration
Tests pratiqués
Statistiques les valeurs
critiques
Table 4
Test de Durbin Watson
CRDW
Engle et Yoo,
1987
Cointégration
Table 2
déterministe
Test de racine unitaire sur les
tα DF Engle et Yoo,
X
= a Z + c + ε
résidus
t
1
1
t
1
t
1
1987

e
∆ = α e

1 + η
t
t
t
Table 3

tα ADF Engle et Yoo,
1987
ou

Table 11.B
P
e
∆ = α e
p.l89


1 + ∑ϕ
e
∆ − +η
t
t
i
t i
t
Z (t )
α
Phillips et
i =1
Ouliaris, 1990
Table I1.C
p.190
Cointégration
tα ADF Phillips et
stochastique
Test de racine unitaire
Ouliaris, 1990

sur les résidus
X
= a Z + b t. + c + ε
t
1
2
t
2
2
2t
e
∆ = α e

1 + η
t
t
t
Table ll.C
p.190

Z (t )
α
Phillips et
Ouliaris, 1990
NB: Phillips et Ouliaris donnent aussi les valeurs critiques pour les tests sur les résidus quand la
relation de cointégration ne contient ni terme de tendance, ni terme constant.











85
Tables de Engle et Yoo pour les tests de Durbin-Watson, DF et ADF de cointégration
déterministe




NB : Les tables 2 et 3 omettent les signes moins pour simplifier la présentation (Engle et Yoo).
Mais dans la pratique, il faudra retenir ces valeurs critiques avec un signe négatif. N représente le
nombre de variables dans la relation de cointégration. Les valeurs critiques de la table 2 pour N=1
sont un rappel des valeurs critiques des tests de Dickey et Fuller (Cf. Table 8.5.2., p 58).









86
Tables de Phillips et Ouliaris pour les tests ADF et les Z tests








87

Valeurs critiques pour les statistiques de la trace et de la valeur propre maximum dans le
modèle de Johansen-Juselius : cointégration déterministe



















88





Valeurs critiques pour les statistiques de la trace et de la valeur propre maximum dans le
modèle de Johansen-Juselius : cointégration stochastique





















89
Annexe 3: Test de Phillips et Perron (Extrait de Rey et Varachaud, 2002)


Semiparametric tests by Phillips and Phillips Perron (PP) are constructed to test
nonstationarity against the simple stationarity (Phillips), level-stationarity (with a constant)
(PP1) or trend-stationarity (PP2) from models r = r
ρ
= µ + ρ −
or
1 +

, r
r
u
1 + u
t
t
t
t
t
t
r = µ + t
β + r
ρ −
with u a stationary process. In that case ADF statistics presents
1 + u
t
t
t
t
λ
law
∫1W(s)dW(s)+
two
nuisance
parameters
because
n( ˆρ − ) 
 → 0
1

and
 ∫1 2
W (s)ds
 0

1
law
W(s)dW(s)
0
t ρ

 →ω
. These parameters are estimated by nonparametrics methods (a
ˆ
1

2
W (s) 1/2
ds 
 0

Newey-West estimation of ut‘s variance). One can so build two statistics
Z ρ = n( ˆρ − ) ˆ
1
λ ( −

2
/ n ∑ 2
r
which critical values under H
t )
0 are-8 (5 %) and-5.7 (10 %) and
ˆ
σ u
ˆ
Z
t ρ
λ ω n
r
which distribution is the same that for ADF1.
t =
/ ˆ



ˆ
( 2 2t)1/2
ˆ
ω
For PP1 and PP2, statistics Z ρ have for critical values:-14 (5 %) and-11.2 (10 %) in
the case of the alternative of level stationarity and-21.5 (5 %) and-18.1 (10 %) for the trend-
stationarity.



90
Annexe 4: Exemple de tests de racine unitaire et de cointégration non paramétriques,
Bierens (1997)

Extrait de Bouoiyour, Marimoutou et Rey (2004)

1. Les tests de racine unitaire

On va tester l’hypothèse de racine unitaire contre l’alternative stationnaire. Deux
ensembles de tests seront utilisés. Les premiers permettront de discriminer entre la marche
aléatoire et la stationnarité en niveau ou autour d’un trend linéaire ; les seconds retiendront
comme hypothèse alternative la stationnarité autour d’un trend non linéaire.

Hypothèse de racine unitaire contre les alternatives de stationnarité en niveau ou autour
d’un trend linéaire

En pratique, il arrive souvent que les tests de racine unité ne rejettent pas l’hypothèse nulle
de racine unité bien que la fonction d’autocorrelation de l’échantillon s’annule rapidement.
Afin de mieux prendre en compte ce phénomène, Bierens (1993) étend le test de Hasza
(1980) et ceci de deux manières. Tout d’abord en ne supposant pas une forme paramétrique
du processus de génération des données, mais en adoptant une condition de mélange
comme dans Phillips (1987) et Phillips et Perron (1988). Ensuite, en considérant une forme
de la fonction d’autocorrelation légèrement différente de celle de Hasza (1980) ce qui
implique que les distributions limites soient différentes. Les résultats sont résumés dans le
tableau 1:



Tableau 1: Tests de racine unitaire contre les alternatives de
stationnarité en niveau et autour d’un trend linéaire : BIERENS
(1993)


hoac(1,1)
hoac(2,2)
dhoac(1,1)
dhoac(2,2)
lREReff
A(10%)
A(10%)
A(10%)
A(10%)
ltot
A(10%)
A(10%)
A(10%)
A(10%)
louv
R(5%)
R(5%)
R(5%)
R(5%)
lgratio
A(10%)
A(10%)
A(10%)
A(10%)
tbratio
A(10%)
A(10%)
A(10%)
A(10%)
lREReff: log du taux de change réel effectif ; ltot: log des termes de l’échange
externes; louv : log du taux d’ouverture de l’économie (Export+Import)/PIB;
lgratio : log du ratio des dépenses publiques (en pourcentage du PIB) et tbratio : le
ratio de la balance commerciale et le PIB
(d)hoac(i,i): (detrended) higher order aucorrelation test de type (i,i), BIERENS
(1993). A(10%): accepté à 10%. R(10%): rejeté à 10%.





91
Pour les tests hoac et dhoac, on teste respectivement l’hypothèse nulle de racine
unité contre l’hypothèse alternative de stationnarité, et l’hypothèse nulle de racine unité
avec dérive contre l’hypothèse alternative d’un processus stationnaire autour d’une
tendance linéaire. Les résultats sont très contrastés. En général nous acceptons l’hypothèse de la
marche aléatoire sauf pour la variable louv. Nous allons donc devoir mettre en oeuvre un test de
racine unité avec dérive contre l’hypothèse alternative d’une stationnarité autour d’une tendance
non linéaire.

Hypothèse de racine unitaire contre l’alternative de stationnarité autour d’un trend non linéaire

Bierens (1997) propose un test qui exploite le fait que chaque fonction du temps peut
être approximée par une fonction linéaire des polynômes de CHEBYSHEV. Les tests
proposés sont construits sur la base d’une régression auxilliaire avec des tendances
déterministes linéaires et non linéaires où la tendance déterministe non linéaire est
approchée par un polynôme de CHEBYSHEV.

Soit un processus {z . Sous l’hypothèse nulle, il s’écrit comme
t }

H : z



(13)
0
= z 1 µ
− +
+ u
t
t
t

où µ est une constante et u est un processus stationnaire AR(p). Sous l’hypothèse
t
alternative, on a

H : z = g t
( ) + u


(14)
a
t
t

g(t) est une fonction tendancielle qui peut être non linéaire.
Les tests de racine unité sont construits à partir d’un modèle de régression auxiliaire

P
T
(m
z
∆ = α z
)


(15)
1 + ∑φ
z
∆ − +θ P, + ε
t
t
j
t
j
t n
t
j =1






( m)
*
*
*
T
P
(P
t
( ), P
t
( ),K
=
, P
t
( ))
t ,n
0,n
,
1 n
m,n

Sous H
: α = 0 et les m dernières composantes de θ sont nulles.
0

Le rejet de l’hypothèse nulle indique que si z est un processus racine unité, il admet une
t
dérive non linéaire. Précisons que les retards optimaux sont déterminés par les critères
d’Akaïke et de Hannan-Quinn. Le test A(m) est ici modifié en posant Φ )
1
(
au lieu de
1
Φ
car sous H ,
1
Φ peut être négatif. Les p-values des tests ont été simulées puisque les
a
distributions sont non standards. Les résultats sont présentés dans le tableau 2.:




92




Tableau 2: Tests de racine unitaire contre l’alternative de stationnarité autour
d’un trend non linéaire : BIERENS (1997a)


p
m
a(m)
t(m)
A(m)
F(m)
lREReff
0
2
-0.055
-1.15
-7.238
1.366
Ltot
1
2
-0.040
-2.527
-9.008
3.067
Louv
4
2
-0.396
-4.236
-64.884
6.002
Lgratio
4
2
-0.151
-3.270
-23.841
3.621
Tbratio
3
2
-0.234
-3.065
-18.231
3.400
lREReff: log du taux de change réel effectif ; ltot: log des termes de l’échange externes; louv : log
du taux d’ouverture de l’économie (Export+Import)/PIB; lgratio : log du ratio des dépenses
publiques (en pourcentage du PIB) et tbratio : le ratio de la balance commerciale et le PIB .
p: retard optimal; m: longueur du polynôme de Chebyshev ; a(m), t(m) et A(m) sont des tests
d’hypothèse relatifs à α . F(m) est un test joint (cf. annexe).


En conclusion, les variables louv et lgratio sont engendrées par des processus
stationnaires autour d’une tendance non linéaire.

2. Analyse des relations de cointégration
L’estimation d’une relation de cointégration entre le taux de change réel effectif et ses
fondamentaux doit permettre de spécifier une équation d’équilibre de long terme du taux de
change réel, à partir de laquelle on déduira les mésalignements du dirham.

Estimation de la relation de cointégration

Etant donné les résultats sur les propriétés statistiques des différentes variables considérés
dans le modèle, nous ne pouvons pas considérer une inférence du modèle par la méthode
habituelle de Johansen et Juselius (1990) , mais nous pouvons nous placer dans un contexte
de méthode de cointégration non paramétrique telle qu’elle est décrite dans l’article de
Bierens (1997b). L’idée est de donner des tests de cointégration convergents et des
estimateurs convergents sur la base d’un espace de vecteurs cointégrants, où il n’est pas
nécessaire de spécifier le processus de génération des données. Cette approche non
paramétrique se fait dans le même esprit que l’approche de Johansen et Juselius (1990)
dans le sens où les tests statistiques impliqués sont obtenus à partir de solutions d’un
problème de valeur propre généralisée. Les hypothèses testées sont les mêmes, mais dans le
cas considéré ici, les deux matrices, solutions du problème de valeur propre généralisée,
sont construites indépendamment du processus de génération de données. On rappelle que
l’idée de base derrière le concept de cointégration est que, si toutes les composantes d’un
processus z exhibent une racine unité, il existe alors une combinaison linéaire '
ξ z pour
t
t
laquelle il n’existe plus de racine unité. Ces combinaisons linéaires peuvent s’interpréter



93
comme des relations de long terme entre les composantes de z . Cette approche est
t
devenue l’outil standard en macroéconométrie pour l’analyse des relations économiques de
long terme. Toutes les méthodes de cointégration proposées dans la littérature exigent des
estimations consistantes des paramètres de nuisance et/ou des paramètres structurels. Dans
cette étude, étant donné les pathologies observées sur les variables considérées (notamment
des effets de non linéarité), nous ne pouvons considérer la spécification du processus de
génération des données. Pour cette raison les tests considérés sont complètement non
paramétriques. Dans notre cas, les deux matrices sont donc construites indépendamment du
processus de génération de données et on peut utiliser les tables de valeurs critiques pour
tous les cas de cointégration considérés dans Stock et Watson (1988) et Johansen (1988,
1991).
On considère le vecteur y de dimension q=5 suivant:
t

'
y = (lRER , ltot, louv, lg ratio, tbratio)
(16)
t
eff

L’estimation du nombre de vecteurs cointégrants est donné par


−1
q


g '
ˆ (r =
ˆ
)
λ
si
r
0
,
=

m

k m

k=1

−1
qr
q

 

g '
ˆ (r =
ˆ
)
λ
n2r
ˆ
λ 
si r

,
1 ...,
1
(17)
,
∏ ,
=
q
m

k m

k m


k=1
 
k =qr +1

q
g '
ˆ (r = n2q
ˆ
)
λ
si r = q

m
k =1
k ,m

Les résultats sont donnés dans le tableau suivant ;



Tableau 3:Nombre de relation de cointégration

à la BIRENS (1997b)

r
ˆ
g (r), m

λ
m
= 5


0
19.34E+006


1
31.72E+004
68.50E-002

2
59.22E+004
29.84E-002

3
62.52E+005
24.80E-003

4
95.55E+008
10.43E-003

5
76.95E+012
97.75E-005

r :nombre de relations de cointégration. m: longueur du polynôme de

Chebyshev . ˆ
g
)
1
( =31.72E+004 correspond à la valeur minimum.
5

On conclut que r=1 et donc on a une seule relation de cointégration.





94
La distribution limite du test de lambda-min sous l’hypothèse nulle aussi bien que sous
l’hypothèse alternative dépend de la valeur de m ; m est obtenue de façon optimale par le
lemme 5 dans Bierens (1997b). En conclusion nous avons un seul vecteur de cointégration
(0.0841,-0.4919,0.0314,0.2279,1.000)’.
L’estimation du modèle conduit donc à accepter la présence d’une unique relation de
cointégration (r=1). En normant par rapport au taux de change réel effectif, on obtient
l’équation de long terme suivante :

lREReff=5.8489ltot-0.3734louv-2.7099lgratio-11.8906tbratio-28.676 (18)

A long terme une augmentation des termes de l’échange externes conduit à une
appréciation réelle du dirham, ce qui est cohérent avec une supériorité des effets de
dépenses. Une augmentation des dépenses publiques comme un relâchement des
restrictions commerciales (accroissement du taux d’ouverture) sont associés avec une
dépréciation réelle du dirham. Enfin les déficits commerciaux (cf. figure A4), se sont
accompagnés d’une dépréciation réelle du change.




Introduction aux méthodes économétriques
Publier sur Facebook Publier sur Twitter
Informations
Date : 04/02/2011
Langue : Français
Pages : 94
Consultations : 1326
Commentaires : 0
Note :  
Résumé
Description : Cours d'économie : Introduction aux méthodes économétriques.

Catégorie : Académique > Cours > Economie

Tags : Cours d'économie

Sur le même thème
Vues : 3379
Cours d'analyse des données
Pseudo : Superwaldo
Vues : 3379
Date : 04/02/2011
Pages : 151
Langue : Français
Description :
Cours d'économie : Cours d'analyse des données.
Vues : 2462
Théorie C K - Cours de conception innovante
Pseudo : Ingenieur
Vues : 2462
Date : 13/12/2010
Pages : 21
Langue : Français
Description :
Cours d'économie dispensé aux Mines ParisTech sous licence Creative
Vues : 1640
Introduction à la microéconomie
Pseudo : Econoclaste
Vues : 1640
Date : 10/01/2011
Pages : 244
Langue : Français
Description :
Cours de microéconomie : Introduction à la microéconomie.
Vues : 1635
Concurrence oligopolistique
Pseudo : Opencourse
Vues : 1635
Date : 09/12/2010
Pages : 20
Langue : Français
Description :
Cours sur la concurrence oligopolistique dispensé aux Mines ParisTech sous licence Creative Commons :...
Vues : 1631
Cours de Calcul Economique
Pseudo : Opencourse
Vues : 1631
Date : 08/12/2010
Pages : 144
Langue : Français
Description :
Cours de Calcul Economique dispensé aux Mines ParisTech. Cours sous licence CC :...
Vues : 1199
Le pouvoir de marché
Pseudo : Ingenieur
Vues : 1199
Date : 13/12/2010
Pages : 20
Langue : Français
Description :
Cours d'économie dispensé aux Mines ParisTech sous licence Creative
Du même contributeur
Vues : 9000
Méthodologie et outils de l'audit et du contrôle
Pseudo : Superwaldo
Vues : 9000
Date : 04/02/2011
Pages : 104
Langue : Français
Description :
Cours d'audit : Méthodologie et outils de l'audit et du contrôle.
Vues : 7313
Ecart d'acquisition
Pseudo : Superwaldo
Vues : 7313
Date : 04/02/2011
Pages : 42
Langue : Français
Description :
Cours de consolidation : Ecart d'acquisition.
Vues : 4529
Méthodes de consolidation
Pseudo : Superwaldo
Vues : 4529
Date : 04/02/2011
Pages : 37
Langue : Français
Description :
Cours de consolidation : Méthodes de consolidation.
Vues : 4502
Comment rédiger une introduction pour la dissertation juridique ?
Pseudo : Superwaldo
Vues : 4502
Date : 04/02/2011
Pages : 2
Langue : Français
Description :
Comment rédiger une introduction pour la dissertation juridique ?
Vues : 4045
Pourcentage d'intérêt et de contrôle
Pseudo : Superwaldo
Vues : 4045
Date : 04/02/2011
Pages : 24
Langue : Français
Description :
Cours de consolidation : Pourcentage d'intérêt et de contrôle.
Vues : 3558
Histoire de l'audit et du contrôle interne
Pseudo : Superwaldo
Vues : 3558
Date : 04/02/2011
Pages : 39
Langue : Français
Description :
Cours d'audit : Histoire de l'audit et du contrôle interne.
Commentaires
Aucun commentaire pour cette publication
Ajouter un commentaire
Envoyer
Pour envoyer la page de votre document, notez ici les emails destinataires de votre demande :
Séparez les emails par des virgules
Signaler un abus
Vous devez vous connecter ou vous inscrire pour noter un document.
Cliquez ici pour vous inscrire.
Vous devez vous connecter ou vous inscrire pour ajouter un commentaire.
Cliquez ici pour vous inscrire.
Vous devez vous connecter ou vous inscrire pour envoyer le document.
Cliquez ici pour vous inscrire.
Vous ne pouvez pas acheter de documents sur Needocs.
Vous pouvez vous référer aux conditions générales de vente et d'achat du portail pour connaître les modalités d'achat.