1Au sein de la littérature théorique et empirique sur la question de la convergence des économies, une attention particulière a souvent été accordée aux caractéristiques géographiques des données. C'est le cas, par exemple, des études qui soulignent, au niveau des résultats, la coïncidence entre le regroupement géographique des données et les types de convergence animant les groupes de régions associées (Beine et Jean-Pierre, 2000). C'est aussi le cas des études qui s'appuient sur une partition a priori de l'échantillon selon l'appartenance des régions à tel ou tel secteur géographique, à l'aide par exemple de variables muettes, pour estimer les équations de convergence (Baumol, 1986; Grier et Tullock, 1989). L'hétérogénéité de nature géographique au sein des régions européennes pourrait par ailleurs être mise en avant pour expliquer certains résultats obtenus dans la littérature, comme la faiblesse de la vitesse de convergence des régions européennes ou la persistance des disparités de revenus malgré le processus d'intégration économique européen et le taux de croissance plus élevé de certaines régions pauvres.
2La prise en compte effective de la nature géographique des données permet de dépasser les constats évoqués ci-dessus en s'interrogeant, d'une part, sur la significativité statistique de ces schémas géographiques de disparités économiques et, d'autre part, sur le rôle des interactions spatiales dans les processus de croissance et de convergence. Cependant, l'utilisation de données localisées implique également de mobiliser un cadre statistique et économétrique approprié pour détecter et traiter la dépendance de nature géographique entre les données. En effet, en présence d'effets spatiaux (autocorrélation spatiale et/ou hétérogénéité spatiale), les estimateurs des MCO peuvent, soit être biaisés et non convergents, soit être inefficients ; l'inférence statistique fondée sur ces estimateurs n'est alors plus fiable (Anselin, 1988).
3L'objectif de cet article est d'appliquer ces méthodes d'analyse pour traiter l'hétérogénéité géographique du processus de convergence des régions européennes en termes de club de convergence et estimer les effets de débordement géographique au sein de régimes spatiaux.
4Les Analyses Exploratoires de Données Spatiales de la distribution géographique des disparités économiques des régions européennes permettent ainsi de mettre en évidence un schéma significatif et persistant, sur plusieurs années, de polarisation entre les régions riches du nord et les régions pauvres du sud. Cependant, prendre en compte le rôle de la géographie dans la croissance et la convergence des économies régionales nécessite d'aller au delà de cette observation en s'interrogeant notamment sur les mécanismes à la base des disparités géographiques (i.e. les schémas de polarisation de type Centre-Périphérie) et sur les interactions entre les schémas géographiques et les disparités économiques. Les théories de la nouvelle économie géographique apportent par exemple un certain nombre d'explications formelles à ces interactions géographie-croissance en montrant que la localisation des activités économiques est spatialement structurée par des processus cumulatifs d'agglomération dans lesquels les effets de débordement géographiques sont impliqués. L'environnement économique d'une région semble alors influencer le potentiel de développement de cette région. On a ainsi pu estimer, dans des travaux précédents, des effets de débordement géographique de croissance dans le cadre d'un modèle de ?-convergence et montrer qu'il existe une externalité spatiale positive et significative sur les taux de croissance des économies régionales. Tenir compte du schéma de polarisation nécessite maintenant de traiter de manière simultanée l'autocorrélation spatiale et l'hétérogénéité spatiale et d'identifier des clubs de convergence spatiaux au sein des régions européennes. C'est ce que nous réalisons dans cette recherche.
5Après avoir précisé, dans la première partie, le cadre conceptuel relatif aux effets spatiaux dans le contexte de la convergence, nous montrons, dans la deuxième partie, comment les Analyses Exploratoires de Données Spatiales de la distribution des PIB régionaux permettent de souligner les liens entre le schéma régional centre-périphérie des économies européennes et la présence jointe d'autocorrélation spatiale positive et d'hétérogénéité spatiale. Deux clubs de convergence sous la forme de régimes spatiaux sont alors définis : le groupe des régions pauvres du sud et le groupe des régions riches du nord. L'estimation économétrique du processus de convergence est réalisée dans la troisième partie. La modélisation des effets spatiaux dans l'équation de ?-convergence permet, d'une part, d'étudier la variabilité des schémas de développement économique sous la forme d'hétéroscédasticité en groupes et, d'autre part, d'évaluer les effets de débordement géographiques entre les économies régionales par l'estimation d'un modèle à erreurs spatialement autocorrélées. Nous obtenons deux résultats importants. Un effet de débordement géographique significatif et positif sur les taux de croissance caractérise les économies régionales européennes. Cependant, le processus de convergence est différent selon les deux groupes : il est faible au sein du groupe Sud et ne peut être mis en évidence au sein du groupe Nord. Nous complétons enfin l'approche spatiale des processus de convergence par deux analyses. Dans la première, nous exploitons la propriété de diffusion spatiale de chocs aléatoires du modèle spatial à erreurs autocorrélées dans le cas des régimes spatiaux lorsque le choc se produit, soit dans une région du nord, soit dans une région du sud de l'Union Européenne. Dans la seconde analyse, nous proposons une modélisation du processus de convergence intégrant des effets spatiaux différenciés afin d'estimer si les effets de débordements géographiques sont différents suivant qu'ils se produisent dans le club des régions riches ou dans le club des régions pauvres ou entre les deux clubs. Les résultats montrent que la spécification intégrant des effets spatiaux identiques est la plus appropriée.
6La question de la convergence a été largement discutée en macroéconomie de la croissance depuis l'article pionnier de Baumol (1986) et ses extensions formelles, proposées notamment par Barro et Sala-I-Martin (1991,1992,1995), par Sala-I-Martin (1996a, 1996b) et par Mankiw et alii (1992) sur les concepts de?-convergence et de? -convergence. Les critiques faites à ces concepts, tant d'un point de vue théorique que méthodologique, ont conduit à la définition et à la formalisation de concepts de convergence alternatifs tels que les clubs de convergence (Durlauf et Johnson, 1995 ; Quah, 1993a, 1993b, 1996a, 1996b) ou la convergence stochastique(Bernard etDurlauf, 1995,1996; Evans et Karras, 1996). Par ailleurs, les études empiriques de la convergence ont soulevé plusieurs questions économétriques associées aux problèmes d'hétérogénéité, de variables omises, d'endogénéité, d'observations aberrantes, d'erreurs de mesure et plus généralement aux problèmes de « l'incertitude des modèles ». Aux analyses traditionnelles en coupes transversales se sont alors ajoutées les analyses en données de panels (Islam, 1995 ; Caselli et alii, 1996), en séries temporelles (Bernard et Durlauf, 1995,1996 ; Carlino et Mills, 1993,1996a, 1996b ; Evans et Karras, 1996) et en termes de matrices de probabilités de transition (Quah, 1993a, 1996a, 1996b).
7Au sein de cette littérature [1], une attention particulière a souvent été accordée aux caractéristiques géographiquesdes données. C'est le cas, par exemple, des études qui soulignent, au niveau des résultats, la coïncidence entre le regroupement géographique des données et les types de convergence animant les groupes de régions associées (Beine et Jean-Pierre, 2000). C'est aussi le cas des études qui s'appuient sur une partition a priori de l'échantillon selon l'appartenance des régions à tel ou tel secteur géographique, à l'aide par exemple de variables muettes, pour estimer les équations de convergence (Baumol, 1986; Grier et Tullock, 1989).
8C'est ainsi que l'hétérogénéité de nature géographique au sein des régions européennes pourrait être mise en avant pour expliquer certains résultats obtenus dans la littérature : la vitesse de convergence des régions européennes obtenue sur des échantillons globaux semble être très faible (Barro et Sala-I-Martin, 1991,1995; Sala-I-Martin, 1996a, 1996b ; Armstrong 1995a, Neven et Gouyette, 1995) et les disparités de revenus continuent à persister, malgré le processus d'intégration économique européen et le taux de croissance plus élevé de certaines régions pauvres (Rapport de la Commission Européenne, 1996, 1999).
9Cependant, au delà de ces constats, peu d'études empiriques se sont en fait réellement penchées sur trois questions liées à la nature géographique des données. Les deux premières questions permettent de dépasser le stade de la simple coïncidence évoquée ci-dessus en s'interrogeant, d'une part, sur la significativité statistique de ces schémas géographiques de disparités économiques et, d'autre part, sur le rôle des interactions spatiales dans les processus de croissance et de convergence. La troisième question aborde d'une manière générale le contexte économétrique spécifique lié à l'utilisation des données localisées.
10Ainsi, la mise en œuvre d'Analyses Exploratoires de Données Spatiales permet d'étudier la significativité des schémas géographiques de disparités économiques. Plusieurs études statistiques de la distribution géographique des disparités économiques européennes mettent en évidence un schéma significatif et persistant, sur plusieurs années, de polarisation entre les régions riches du nord et les régions pauvres du sud (López-Bazo et alii, 1999; Le Gallo et Ertur, 2003).
11Prendre en compte le rôle de la géographie dans la croissance et la convergence des économies régionales nécessite d'aller au delà de cette observation en s'interrogeant notamment sur les mécanismes à la base des disparités géographiques ( i.e. les schémas de polarisation de type Centre-Périphérie) et sur les interactions entre les schémas géographiques et les disparités économiques. Les théories de la nouvelle économie géographique (Krugman, 1991, Fujita et alii, 1999) apportent par exemple un certain nombre d'explications formelles à ces interactions géographie-croissance (Baumont et Huriot, 1999) en montrant que la localisation des activités économiques est spatialement structurée par des processus cumulatifs d'agglomération dans lesquels les effets de débordements géographiques sont impliqués (Englmann et Walz 1995; Kubo 1995 ; Martin et Ottaviano 1999,2001). L'environnement économique d'une région semble alors influencer le potentiel de développement de cette région. Deux types d'études empiriques ont été proposés pour évaluer ces phénomènes au sein des régions européennes. D'un côté, on peutestimerdes effets de débordement géographique de croissance dans le cadre d'un modèle de?-convergence et montrer qu'il existe une externalité spatiale positive et significative sur les taux de croissance des économies régionales (Le Gallo et alii, 2003). D'un autre côté, en utilisant l'analyse de la dynamique de transition intégrant l'environnement économique régional proposée par Rey (2001), on peut corroborer que l'existence d'un regroupement des régions les plus pauvres au sud de l'Europe constitue, pour le développement de ces régions, un inconvénient majeur sous la forme d'une trappe à sous-développement (Le Gallo, 2004a).
12Enfin, si la dépendance géographique entre les données apparaît plausible, en particulier pour les raisons que nous venons d'évoquer, mais aussi dans un cadre tout à fait général lié à l'usage de données localisées, alors certaines précautions doivent être prises sur le plan économétrique. En effet, en présence d'autocorrélation spatiale et/ou d'hétérogénéité spatiale, phénomènes désignés de manière générique par effets spatiaux, les estimateurs des MCO peuvent, soit être biaisés et non convergents, soit inefficients ; l'inférence statistique fondée sur ces estimateurs n'est alors plus fiable (Anselin, 1988a, b). En conséquence, des méthodologies particulières doivent être mises en œuvre afin de tester la présence de ces effets et d'utiliser les spécifications économétriques spatiales et les méthodes d'estimations appropriées (Le Gallo, 2002a, 2004b).
13Dans ce contexte, l'objectif de cet article est de proposer une modélisation économétrique des interactions spatiales dans l'analyse empirique de la croissance au sein des régions européennes sur la période 1980-1995. Cette modélisation permet de mettre en évidence des effets de débordements géographiques et d'intégrer le caractère fortement polarisé de l'économie européenne. Plus précisément, c'est en tenant compte, de manière simultanée, de l'autocorrélation spatiale et de l'hétérogénéité spatiale, que nous caractérisons le schéma de polarisation économique des régions européennes, que nous identifions les clubs de convergence et que nous les modélisons sous la forme de régimes spatiaux.
14Après avoir précisé, dans la première partie, le cadre conceptuel relatif aux effets spatiaux dans le contexte de la convergence, nous montrons, dans la deuxième partie, comment les Analyses E xploratoires de Données Spatiales de la distribution des PIB régionaux permettent de souligner les liens entre le schéma régional centre-périphérie des économies européennes et la présence d'autocorrélation spatiale positive et d'hétérogénéité spatiale. Deux clubs de convergence sous la forme de régimes spatiaux sont alors définis : le groupe des régions pauvres du sud et le groupe des régions riches du nord. L'estimation économétrique du processus de convergence est réalisée dans la troisième partie. La modélisation des effets spatiaux dans l'équation de ?-convergence permet, d'une part, d'étudier la variabilité des schémas de développement économique sous la forme d'hétéroscédasticité en groupes et, d'autre part, d'évaluer les effets de débordements géographiques entre les économies régionales par l'estimation d'un modèle à erreurs spatialement autocorrélées. Nous obtenons deux résultats importants. Un effet de débordement géographique significatif et positif sur les taux de croissance caractérise les économies régionales européennes. Cependant, le processus de convergence est différent selon les deux groupes : il est faible au sein du groupe Sud et ne peut être mis en évidence au sein du groupe Nord. Nous complétons enfin l'approche spatiale des processus de convergence par deux analyses. Dans la première, nous exploitons la propriété de diffusion spatiale de chocs aléatoires du modèle spatial à erreurs autocorrélées dans le cas des régimes spatiaux lorsque le choc se produit, soit dans une région du nord, soit dans une région du sud de l'Union Européenne. Dans la seconde analyse, nous proposons une modélisation du processus de convergence intégrant des effets spatiaux différenciés afin d'estimer si les effets de débordements géographiques sont différents suivant qu'ils seproduisent dansle clubdes régionsriches ou dans le club des régions pauvres ou entre les deux clubs. Les résultats montrent que la spécification intégrant des effets spatiaux identiques est la plus appropriée.
E ffets spatiaux et analyse de la convergence
Définitions des effets spatiaux : autocorrélation et hétérogénéité spatiales
15L'autocorrélation spatiale se réfère à la coïncidence qui existe entre la distribution des valeurs observées pour un phénomène et leur répartition géographique (Anselin et Bera, 1998). On parle d'autocorrélation spatiale positive lorsque des valeurs similaires de la variable étudiée tendent à se regrouper géographiquement. Dans le cas de l'étude des disparités de revenu, cela signifie que les régions, soit riches, soit pauvres, sont géographiquement proches les unes des autres.
16L'hétérogénéité spatiale se réfère à l'instabilité des comportements dans l'espace. Dans les modèles économétriques, ceci se traduira sous la forme d'une variabilité des coefficients ( i.e. instabilité structurelle) ou d'hétéroscédasticité suivant un schéma spatial : E st-Ouest, Nord-Sud… L'hétérogénéité spatiale est ainsi caractéristique des schémasde développement économique polarisésde type centre-périphérie et peut se représenter sous la forme de régimes spatiaux et/ou d'hétéroscédasticité en groupes lorsqu'un groupe de régions riches (le centre) doit être distingué d'un groupe de régions pauvres (la périphérie).
17Deux principes importants conditionnent l'approche économétrique des effets spatiaux. En premier lieu, les liens entre l'autocorrélation et l'hétérogénéité spatiales sont complexes. Il ne s'agit pas de concepts identiques. Ainsi, comme le souligne Anselin (2001a), les deux effets apparaissent souvent de façon jointe dans les études économétriques en coupe transversale. Il soulève aussi le problème de l'équivalence observationnelle. Par exemple, lorsque l'on travaille sur un schéma de polarisation, le regroupement dans le centre des valeurs extrêmes des résidus peut s'interpréter en termes d'hétérogénéité entre le centre et la périphérie ou peut refléter une autocorrélation spatiale liée à un processus économique à l'origine du regroupement géographique de ces valeurs au centre. Par ailleurs, une autocorrélation spatiale des erreurs peut être due à une mauvaise spécification du modèle, par exemple sous la forme d'une hétérogénéité spatiale non modélisée [2].
18En second lieu, l'inférence statistique produite par les MCO en présence d'autocorrélation spatiale et d'hétérogénéité spatiale n'est pas fiable. Par exemple, on ne peut se fier au test standard d'instabilité structurelle en présence d'autocorrélation spatiale ou d'hétéroscédasticité de nature spatiale. Anselin et Griffith (1988) soulignent que la présence jointe d'autocorrélation spatiale et d'hétérogénéité spatiale dans une régression invalide les propriétés des tests d'hétéroscédasticité de White (1980) et de Breusch-Pagan (1979). Dans ce cas, les tests doivent être étendus pour tenir compte de l'autocorrélation spatiale et les méthodes économétriques appropriées doivent être utilisées (Anselin 1990a, 1990b).
Effets spatiaux et convergence : une revue de la littérature
19La première étude qui, à notre connaissance, s'intéresse explicitement à la question du rôle des effets spatiaux dans l'analyse de la convergence est celle proposée par DeLong et Summers (1991). En s'interrogeant sur les relations de nature spatiale entre les observations, ces auteurs soulèvent ainsi le problème de l'autocorrélation spatiale des erreurs, créée notamment par la non prise en compte de variables pouvant traduire ces relations dans les spécifications estimées :
“Many comparative cross-country regressions have assumed there is no dependence across residuals, and that each country provides as informative and independent an observation as any other. Yet it is difficult to believe that Belgian and Dutch economic growth would ever significantly diverge, or that substantial productivity gaps would appear in Scandinavia. The omitted variables that are captured in the regression residuals seem ex ante likely to take on similar values in neighboring countries. This suggests that residuals in nearby nations will be correlated…” (DeLong et Summers, 1991, p. 456 et annexe 1, p. 487-490)
21L'approche qu'ils développent ne leur permet cependant pas de mettre en évidence une corrélation spatiale sur les résidus estimés de l'équation de croissance qui serait liée à la distance entre les capitales des pays étudiés [3] :
“We are quite surprised at the apparent absence of a significant degree of spatial correlation in our sample…” (DeLong et Summers, 1991, p. 489)
23Par la suite, Mankiw (1995, p. 304-305) s'étonne également que les pays soient considérés comme indépendants les uns des autres dans les analyses économétriques standard :
“For the reported standard errors to be correct, the residual for Canada must be uncorrelated with the residual for United States. If country residuals are in fact correlated, as is plausible, then the data most likely contain less information then the reported standard errors indicate”.
25Plus récemment Temple (1999) attire l'attention sur le problème de l'autocorrélation des erreurs et des externalités spatiales, bien qu'il interprète ces effets comme résultant essentiellement d'un problème de variables omises :
“Without more evidence that the disturbances are independent, the standard errors in most growth regression should be treated with a certain degree of mistrust.” (Temple, 1999, p.130-131)
27La question des effets spatiaux est parfois traitée à travers l'utilisation de variables indicatrices continentales, nationales, régionales ou encore transfrontalières ( Chua, 1993; B arro et Sala-I-Martin, 1995; Easterly et Levine, 1995; Ades et Chua, 1997; Attfield et alii, 2000). Ces variables indicatrices permettent de partitionner l'échantillon entre des groupes de régions jugées a priori similaires, au sein desquelles les interactions spatiales sont supposées a priori plus fortes (comme pour desrégions appartenantà unmême pays) tout en écartant la possibilité d'interactions spatiales entre toutes les régions de l'échantillon.
28Cette approche ad hoc ne peut être satisfaisante à notre sens et ceci pour plusieurs raisons. D'abord, elle réduit les effets spatiaux à la seule hétérogénéité spatiale et ne permet pas de modéliser l'autocorrélation spatiale. Or, comme nous l'avons souligné, les liens qu'entretiennent hétérogénéité spatiale et autocorrélation spatiale sont complexes et l'une ne peut se réduire à l'autre. Par conséquent, on devrait privilégier les approches permettant de les traiter de manière plus appropriée. Ensuite, sur un plan plus technique, elle ne repose pas sur une modélisation ou une représentation du schéma d'interactions (spatiales ou socioéconomiques) fondée explicitement sur un concept de proximité (physique ou socioéconomique). Elle reste donc très succincte sur une problématique qui nous paraît fondamentale dans l'étude des interactions.
29Les outils statistiques et économétriques permettant de détecter et de traiter les effets spatiaux • autocorrélation et hétérogénéité spatiales • de manière explicite dans les modèles économétriques ont été développés dans la littérature à partir de la fin des années 1980 (Anselin, 1988a; Anselin et Florax 1995; Anselin et Bera 1998; LeSage, 1999; Anselin, 2001a). Les études empiriques de la croissance, au niveau interrégional ou international, menées avec de telles techniques se sont alors développées (Conley et Ligon, 2001 et Moreno et Trehan, 1997 sur données internationales ; Fingleton, 1999 sur données régionales européennes; Rey et Montouri, 1999 sur données américaines). Ces études se sont surtout concentrées sur le traitement approprié de l'autocorrélation spatiale détectéedans les différents échantillons étudiés. L'autocorrélation et l'hétérogénéité spatiales n'ont en revanche pas été prises en compte de manière simultanée dans la modélisation économétrique. Nous proposons dans cet article une modélisation économétrique conjointe de ces effets spatiaux et nous l'appliquons à l'analyse du processus de convergence des régions européennes.
Convergence conditionnelle, absolue et clubs de convergence
30Partant du modèle de croissance néoclassique
( Solow, 1956), le concept bien connu de
?-convergence conditionnelle est compatible avec la
persistance des inégalités entre les économies si les
économies ont des états réguliers différents.
L'hypothèse de ?-convergence conditionnelle est
traditionnellement testée à partir du modèleen coupe
transversale suivant (sous forme matricielle) :

où g est le vecteur ( )n ? 1 des taux de croissance T annuel moyen des PIB par tête entre la date initiale 0 et la date finale T; y est le vecteur des niveaux de 0 PIB par tête à la date 0, exprimés en logarithmes, X est la matrice des variables qui permettent de maintenir constant l'état régulier de chaque économie, e est le vecteur unité et ? est le vecteur N d'erreurs munies des propriétés usuelles. Il y a ?-convergence conditionnelle si la valeur estimée de ? est significativement négative, les variables de contrôle et d'environnement contenues dans X permettant de maintenir constant l'état régulier de chaque économie.
31Cette approche est très largement répandue dans les études mobilisant des données en coupes transversales. E lle s'appuie, soit sur une spécification testable dérivée formellement du modèle de croissance (Mankiw et alii, 1992), soit sur des spécifications plus ou moins ad hoc concernant le choix des variables de contrôle et d'environnement (Levine et Renelt, 1992).
32En supposant que toutes les économies sont
structurellement identiques, i.e. caractérisées par le
même état régulier et qu'elles diffèrent seulement
par leurs conditions initiales, onobtient le concept de
?-convergence inconditionnelle ou absolue. Dans ce
cas, toutes les économies convergent vers le même
équilibre ; les économies pauvres connaissent un
taux de croissance plus rapide que les économies
riches, ce qui permet éventuellement aux premières
de rattraper les secondes. L'hypothèse de ?convergence inconditionnelle est traditionnellement
testée sur le modèle en coupe transversale suivant :

Il y a ?-convergence inconditionnelle si la valeur estimée de ? est significativement négative. Cette approche est privilégiée par exemple par Sala-I-Martin (1996a, 1996b) pour l'analyse de la convergence régionale au sein d'un même pays.
33Ces concepts de convergence et la manière de les tester ont été cependant fortement critiqués dans la littérature, tant sur le plan théorique que méthodologique. Mankiw (1995) et Temple (1999) soulèvent en particulier les problèmes d'hétérogénéité, d'endogénéité, de multicolinéarité et d'un biais de variables omises. Si l'on s'intéresse plus précisément au problème de l'hétérogénéité, le concept de clubs de convergence proposé par exemple par Durlauf et Johnson (1995) semble particulièrement intéressant puisqu'il est compatible à la fois avec l'existence d'inégalités persistantes de richesse et la polarisation. La convergence en clubs est basée sur les modèles de croissance endogène, tels que ceux proposés par Azariadis et Drazen (1990), avec la possibilité d'équilibres multiples localement stables. Toutes les économies dont le niveau initial de richesse appartient au même intervalle de valeurs ou “bassin d'attraction” atteignent le même équilibre à l'état régulier et convergent donc entre elles. Dans un tel contexte, il est cependant difficile de discriminer entre les modèles à équilibres multiples et le modèle de croissance néoclassique à l'aide des tests de convergence standard (Durlauf et Johnson, 1995). De plus, Bernard et Durlauf (1996) ont montré qu'un modèle linéaire appliqué à un ensemble de données générées par des économies convergeant vers des équilibres multiples, permettait d'obtenir un coefficient négatif pour la variable des PIB par tête initiaux : le résultat de ?-convergence apparaît alors comme un simple artefact.
34Plus précisément, Durlauf et Johnson (1995) se situent dans un cadre d'analyse à la Mankiw et alii (1992) et travaillent sur la base de données de Summers et Heston sur la période 1960-1985. Ils montrent qu'une partition arbitraire des pays, selon leur niveau initial de PIB par tête et le taux d'alphabétisation des adultes en début de période, produit une convergence plus forte dans les groupes de pays, tandis que les valeurs des coefficients affectées aux variables de contrôle diffèrent de manière significatives entre les groupes. En endogénéisant la méthode de partition (méthode des arbres de régression), ils constatent l'homogénéité géographique des groupes mais ne parviennent pas à prouver la convergence au sein du groupe des pays les plus riches (Amérique du Nord et Europe). Ce résultat est d'ailleurs qualitativement similaire à celui obtenu par De Long (1988). L'instabilité globale des paramètres qu'ils constatent entre les groupes est alors révélatrice de l'existence de différents régimes.
35Galor (1996) montre quant à lui que la multiplicité des états réguliers, et donc la possibilité de clubs de convergence, peut être compatible avec le modèle de croissance néoclassique, si l'hétérogénéité des individus est modélisée. La limite de cette approche est cependant qu'il sera difficile de distinguer ce qui relève d'une convergence en clubs d'une convergence conditionnelle (Islam, 2003).
36Dans un ensemble de contributions, Quah (1993a, 1996a, 1996b, 1997) soutient que la convergence doit êtreétudiée entenant compte à la fois de laforme (unimodale ou multimodale) de la distribution des PIB par tête tout au long de la période d'étude et des variations dans les positions des pays qui s'opèrent aucours de la périodeau sein decettedistribution. En utilisant une approche en termes de matrices de probabilité de transition d'un niveau de richesse à un autre niveau de richesse tout au long de la période, il peut corroborer l'existence de clubs de convergence au niveau international : la distribution bi-modale des revenus traduit la polarisation pays riches • pays pauvres. En appliquant sa méthode à un échantillon de 82 régions européennes sur la période 1980-1989, Quah (1996c) ne peut prouver la présence de clubs de convergence au sein de cet échantillon qui, il est vrai, exclut les régions portugaises et grecques. Au contraire, Le Gallo (2004b), en appliquant la même méthode, mais sur un échantillon plus grand (138 régions européennes) et sur la période 1980-1995, parvient à détecter l'existence de deux clubs de convergence au sein des régions européennes.
37Finalement, Quah (1996c) soulève une critique supplémentaire sur le fait que la dimension spatiale du processus de convergence est négligée : dans les approches standard, les pays ou les régions sont en fait considérés comme des “îles” ou des “entités isolées” alors que les interactions spatiales liées aux externalités spatiales devraient être prises en compte :
“I show that a region's economic wellbeing can be predicted by that inboth surroundingregions and the host state. Both factors matter for regional distribution dynamics. Thus by either consideration, European regions are not isolated islands. More than does the host country's economic performance, that of surrounding regions helps us understand the inequalities across European regions. Thus, for explaining regional distribution dynamics, physical location and geographical spillovers matter more than do national, macro factors;” (Quah, 1996c, p. 953-954).
39C'est en nous situant au sein de la littérature empirique sur les clubs de convergence, dans le prolongement de Durlauf et Johnson (1995), que nous proposons ici une détermination géo-économique de ces clubs en utilisant les techniques de l'analyse exploratoire des données spatiales.
Détection du schéma de polarisation
40La polarisation économique suggère d'identifier les regroupements géographiques de niveaux de richesse. L'identification de ces groupes est ici fondée sur des critères d'association spatiale : les régions appartenant à un même groupe sont caractérisées par un même type d'association spatiale (effet d'autocorrélation spatiale) tandis que le type d'association spatiale diffère entre les groupes (effet d'hétérogénéité spatiale). L es Analyses Exploratoires des Données Spatiales réalisées sur les niveaux de richesse initiale des régions européennes et sur leur taux de croissance moyen sur la période 1980-1995 nous permettent de définir ces clubs spatiaux.
Les données
41La disponibilité des données européennes au niveau régional constitue souvent une limite aux études empiriques, en particulier lorsque l'on souhaite disposer de séries longues et harmonisées sur un ensemble important de régions. En effet, si l'objectif est de réaliser des estimations de modèles de ?-convergence conditionnelle, on doit disposer de données sur des variables de contrôle ou d'environnement en début de période. Ces dernières sont rarement disponibles au niveau régional alors que la disponibilité et la diversité de ces variables pour les études internationales apparaît au contraire très grande comme dans Barro et Sala-I-Martin (1995) ou Mankiw et alii (1992) (banque de données de Summers et Heston, 1988, ou Penn World Table) [4].
42En utilisant les données extraites de la banque de données E UROSTAT-R E GIO [5], nous avons construit un échantillon de 138 régions européennes pour lesquelles nous disposons des valeurs de PIB par tête exprimées en ECU [6] pour les années 1980 et 1995. Ces régionsappartiennent à 11pays de l'Union Européenne et sont, soit renseignées au niveau NUTS1 (pour la Grande-Bretagne), soit au niveau NUTS2 pour les autres pays [7]. Elles se répartissent de la manière suivante : Allemagne (30 régions), Belgique (11), Danemark (1), Espagne (16), France (21), Grande-Bretagne (11), Grèce (13), Italie (20), Luxembourg (1), Pays-Bas (9) et Portugal (5). Notons que notre échantillon est à la fois plus grand et plus cohérent que ceux utilisés initialement par Barro et Sala-I-Martin (1991,73 régions; 1995,91 régions) et par Sala-I-Martin (1996a, 73 régions ; 1996b, 90 régions) car ces échantillons mélangent différentes sources (Button et Pentecost, 1995) [8]. Par ailleurs, l'échantillon à 73 régions ne comprend que des régions prospères de l'Union Européenne (Allemagne de l'Ouest, France, Grande-Bretagne, Belgique, Danemark, Pays-Bas et Italie) excluant les régions espagnoles, portugaises et grecques, ce qui produit un problème de biais de sélection (DeLong, 1988). Pour pallier ce problème, Amstrong (1995a, 1995b) a étendu l'échantillon originel de Barro et Sala-I-Martin (1991) à 85 régions en incluant des régions moins prospères. Cependant, cet échantillon reste encore largement plus petit que celui que nous utilisons.
43Nous restons néanmoins conscients des propres limites de notre échantillon, notamment par rapport au découpage administratif dont nous disposons. En effet, le découpage régional utilisé est basé sur des critères administratifs ce qui, s'il n'est pas entièrement pertinent pour le phénomène économique étudié, peut provoquer une forme « d'illusion écologique » (King, 1997; Anselin et Cho, 2002) ou de “Modifiable Areal Unit Problem” (MAUP) bien connu des géographes (Openshaw et Taylor, 1979, Arbia, 1989). Dans ces conditions, le choix du découpage spatial peut apparaître arbitraire et avoir des impacts en termes d'inférence statistique. Dans notre cas, l'utilisation du découpage NUTS 2 peut apparaître comme trop grand et ainsi masquer une forme d'hétérogénéité créant alors un problème d'illusion écologique : le choix du découpage en NUTS 3 serait de ce fait plus judicieux. Au contraire, si le découpage en NUTS 2 est trop petit, l'autocorrélation spatiale détectée apparaît essentiellement comme un artefact produit par le découpage d'unités spatiales homogènes : dans ce cas, il serait plus pertinent de travailler sur des régions au niveau NUTS 1. Cependant, si idéalement le choix d'un découpage spatial devrait être effectué en fonction de la variable étudiée et selon des considérations théoriques, nous restons contraints dans les études empiriques par la disponibilité des données. Par ailleurs, le choix du découpage en NUTS 2 plutôt qu'en NUTS 1 nous apparaît plus pertinent pour l'étude des schémas de polarisation et de convergence régionale car c'est à ce niveau que sont calculés les critères d'éligibilité à l'Objectif 1 de la Réforme des Fonds Structurels de 1989 (Commission Européenne, 1999) [9].
La matrice de pondérations spatiales
44La matrice de pondérations spatiales W est l'outil essentiel servant à modéliser l'interdépendance spatiale entre les régions. Plus précisément, chaque région est ainsi connectée à un ensemble de régions voisines par l'intermédiaire d'un schéma de connexions spatiales introduit de manière exogène par le modélisateur dans la matrice W. Ces schémas de connexions sont alors essentiellement de nature purement géographique :
“Also, to avoid identification problems, the weights should truly be exogenous to the model (Manski, 1993). In spite of their lesser theoretical appeal, this explains the popularity of geographically derived weights, since exogeneity is unambiguous.”
(Anselin, 1999b, p. 6)
46Les éléments w indiquent la manière dont la région ij i est spatialement connectée à la région j tandis que les éléments diagonaux w de la matrice W sont nuls ii par convention (une région n'est pas connectée avec elle-même). Ces éléments sont non stochastiques, non négatifs et finis. La matrice W est généralement standardisée, ce qui signifie que la somme de chacune de ses lignes est égale à 1 : cette opération permet de normaliser l'influence extérieure de chaque région. La matrice standardisée W permet de définir pour la variable étudiée y, une variable spatialement décalée Wy, qui fournit pour chaque région i, la moyenne pondérée des valeurs associées aux régions voisines.
47De nombreux types de matrices de pondérations spatiales peuvent être considérés : des matrices binaires de contiguïté simple (liées à l'existence d'une frontière commune) ou de distance-seuil (au delà d'une certaine distance, on considère que les effets de dépendance sont négligeables) ou des matrices de distance généralisée plus sophistiquées avec ou sans seuils… La notion de distance doit être entendue dans un sens général puisque des poids définis à partir de “distance sociale” (Doreian, 1980) ou de distance économique" (Case et alii, 1993 ; Conley et Tsiang, 1994, ou Conley, 1999) ont été utilisées [10]. Cependant, les poids définis à partir de la distance géographique sont les plus fréquents et les schémas de connexion entre les observations traduisent le déclin de l'effet de dépendance avec l'éloignement (comme par exemple la distance inverse, la distance inverse au carré, l'exponentielle négative de la distance…). Les seuils, lorsqu'ils sont présents, peuvent être identiques pour toutes les observations (par exemple, on considère que les régions séparées de plus de 100 km ne sont plus connectées) ou spécifiques à chaque région. Le cas des matrices des k plus proches voisins illustre cette situation : le seuil de distance est fixé pour chaque région et correspond àla distance maximale pour que la région i ait exactement k voisins.
48Il faut noter que toutes les analyses spatiales sont conditionnées pas le choix d'une matrice de pondérations spatiales W particulière. Considérer plusieurs matrices est alors une manière d'étudier la robustesse ou la sensibilité des résultats statistiques et économétriques obtenus par rapport au choix de la matrice W. C'est pourquoi nous avons considérédans notre étude différentes matrices de distances en utilisant l'inverse de la distance sphérique au carré, ces distances étant calculées entre les centroïdes des régions.
49Plus précisément, nous considérons quatre matrices
W(k) standardisées (pour k = 1,...,4) de terme général
wij défini formellement de la manière suivante :

où d est la distance sphérique entre les centroïdes ij des régions i et j. Pour k = 1 à 4, on a D Q D Me D Q( ) , ( ) , ( )1 1 2 3 3= = = et D Max( )4 =, qui représentent respectivement le premier quartile (Q1 = 321 miles), la médiane (Me = 592 miles), le troisième quartile (Q3 = 933 miles) et enfin, la distance maximale (Max = 2093 miles) de la distribution des distances sphériques. La matrice est standardisée, si bien que ce sont les distances relatives et non les distances absolues qui sont considérées. Pour chacune des matrices, la distance seuil au-delà de laquelle les interactions sont supposées négligeables est donnée par D(k), sauf pour k = 4, puisque dans ce cas la matrice est pleine (sans seuil).
50Alors que la matrice de contiguïté est souvent utilisée dans les études empiriques, nous avons préféré utiliser une matrice basée sur la distance compte tenu des caractéristiques spatiales particulières de l'Union E uropéenne avec notamment la présence d'Îles et de deux pays (la Grande-Bretagne et la Grèce) qui ne possèdent pas de frontières terrestres communes avec les autres pays de l'Union Européenne. Ainsi, même lorsque le plus petit seuil de distance est utilisé (Q1), chaque région de notre échantillon possède toujours au moins une région voisine [11] : la Sicile, la Sardaigne et les Baléares sont connectées au continent européen. Pour chaque matrice, la Grande-Bretagne est également connectée au continent européen. Enfin, les connexions entre les régions du sud sont aussi garanties : lesrégions de l'est del'Espagne sont connectées aux Îles Baléares, qui sont connectées à la Sardaigne, qui est connectée aux régions italiennes qui sont elles-mêmes connectées aux régions grecques. Ces éléments indiquent que les connexions entre régions appartenant à des pays différents sont aussi assurées pour au moins une région dans chaque pays.
Identification des régimes spatiaux
51Notre analyse de la convergence en clubs au sein des régions européennes est basée sur l'existence de schémas de polarisation mis en évidence par des analyses exploratoires des données spatiales. Plus précisément, ces analyses permettent de détecter, au sein d'un schéma global d'autocorrélation spatiale, la présence d'hétérogénéité spatiale sous la forme de regroupements locaux des régions selon leur niveau de richesse.
52Dans un premier temps, nous testons la présence
d'autocorrélation spatiale globale dans la
distribution des PIB par tête, exprimés en
logarithmes, en début (1980) et en fin de période
(1995) à l'aide du test de Moran. La statistique I de
Moran (Cliff et Ord, 1981) s'écrit sous forme
matricielle de la manière suivante :

où zt est le vecteur des n observations pour l'année t (t = 1980 ou 1995) en déviation par rapport à la moyenne, W(k) est la matrice de pondérations spatiales et S représente la somme de tous les 0 éléments de W(k). Les valeurs de I qui sont supérieures ( respectivement inférieures) à l'espérance mathématique E I k n t [ ( )] /( )= ? ?1 1 indiquent une autocorrélation positive (resp. négative). L'inférence est basée sur une approche en termesde permutationsavec 10 000permutations [12]. Si l'on analyse les résultats obtenus avec la matrice W(1), une forte autocorrélation spatiale positive caractérise la distribution des PIB par tête pour les deux années (pour 1980, la valeur standardisée de la statistique de Moran est de 16,05 tandis que pour 1995, elle est de 15,68). Dans les deux cas, elle est significative et positive avec une probabilité critique de p = 0,0001, ce qui suggère que l'hypothèse nulle d'absence d'autocorrélation spatiale est rejetée et que les régions quipossèdent des niveaux de richesse similaires ont tendance à se regrouper géographiquement au sein de l'Union Européenne. En d'autres termes, les régions qui possèdent des niveaux de richesse supérieurs (resp. inférieurs) à la moyenne sont localisées près des régions qui possèdent des niveaux de richesse supérieurs (resp. inférieurs) à la moyenne, plus souvent que si ses localisations étaient aléatoires. Un résultat similaire est obtenu si l'on analyse la distribution des taux de croissance moyens sur l'ensemble de la période. Ces résultats sont par ailleurs robustes au choix de la matrice de pondérations spatiales [13] W(k) pour k = 2 à 4 dans le sens où une autocorrélation spatiale globale significative et positive est également détectée lorsqu'on utilise ces matrices.
53Pour discriminer au sein de ce schéma global les formes locales d'association spatiale, signes d'une instabilité structurelle sous la forme de régimes spatiaux, nous utilisons le diagramme de Moran (Anselin, 1996). Étant donnée notre analyse de la convergence, nous étudions la présence de régimes spatiaux sur les conditions initiales traduites ici dans le cadre de la ?-convergence par les niveaux de PIB par tête au début de la période et ceci pour éviter le problème de biais de sélection soulevé par De Long (1988).
54L e diagramme de Moran relie les valeurs standardisées de la variable y des PIB par tête à 1980 l'année 1980 à celle de sa variable décalée Wy.
551980 Les quatre quadrants du diagramme de Moran correspondent aux quatre types d'association spatiale locale existant entre les régions et leurs voisines. L'association de type HH (« High-High ») signifie qu'une région riche est entourée de régions riches tandis que l'association HL (« High-Low ») caractérise une région riche entourée de régions pauvres. L'association LL (« Low-Low ») caractérise une région pauvre entourées de régions pauvres et enfin LH (« Low-High ») caractérise une région pauvre entourée de régions riches. Les quadrants HH et LL correspondent à une autocorrélation spatiale positive puisqu'ils indiquent des regroupements de régions aux caractéristiques similaires, tandis que les quadrants L H et HL caractérisant des regroupements de régions dissemblables correspondent à une autocorrélation spatiale négative. Dans ces conditions, le diagramme de Moran permet, d'une part, de visualiser la tendance globale de l'autocorrélation dans l'échantillon en regardant où se situe le plus grand nombre de régions (en HH et LL ou en HL et LH) et, d'autre part, de visualiser les régions atypiques : celles qui se détachent de cette tendance globale. Il permet par ailleurs une décomposition de l'échantillon suivant deux variables de contrôle, une variable y et sa variable décalée Wy (ici y et W ), en tenant 19801980 compte de la manière dont elles interagissent. Enfin, concernant la question des clubs spatiaux, on peut définir un maximum de 4 clubs correspondant aux quatre quadrants du diagramme de Moran.
56Dans notre cas, un très grand nombre de régions se situent effectivement dans les quadrants HH et LL, puisque l'autocorrélation spatiale globale est positive et forte, tandis que les régions atypiques, très peu nombreuses, sont dans les quadrants LH et HL. Le graphique associé au diagramme de Moran des niveaux de PIB par tête initiaux (calculé avec la matrice de pondérations spatiales W(1)) permet de visualiser ces différents résultats (cf. graphique 1) : 90 régions sont caractérisées par une association de type HH et 45 par une association de type LL. 135 régions sur les 138 régions de l'échantillon se réfèrent donc à une autocorrélation spatiale positive. Le diagramme de Moran confirme aussi le schéma dominant de polarisation Nord-Sud au sein des régions européennes : les régions situées au Nord sont plutôt localisées dans le quadrant HH et les régions du Sud dans le quadrant LL. Seules 3 régions appartenant à la Grande-Bretagne montrent une association spatiale négative : le Pays de Galles et l'IrlandeduNord sont localisées dans le quadrant LH et l'Écosse est située dans le quadrant HL.
graphique de Moran pour le log du PIB par tête en 1980

graphique de Moran pour le log du PIB par tête en 1980
57Ces résultats suggèrent une forme d'hétérogénéité
spatiale au sein des économies régionales
européennes : le processus de convergence, s'il
existe, pourrait donc être différent selon les régimes.
Compte tenu de la répartition des régions entre les 4
types d'associations spatiales, nous ne pouvons
retenir ici, sur les quatre clubs potentiels, que les
deux clubs spatiaux composés, d'un côté, des
régions de type HH et, d'un autre côté, des régions de
type LL, appelés Nord et Sud. En effet, les régimes
spatiaux (LH) et (HL) qui sont constitués d'un
nombre très faible de régions ne peuvent être
conservés [14]. Nous étudions donc le processus de
convergence en clubs sur un échantillon de 135
régions qui se répartissent entre le Nord et le Sud de
la manière suivante :
“Nord” = {Allemagne (30 régions), Belgique (11),
Danemark (1), France (21), Grande-Bretagne (8),
Italie (9 régions du nord : Piemonte, Valle d'Aosta,
Liguria, Lombardia, Trentino-Alto Adige, Veneto,
Friuli-Venezia Guilia, Emilia-Romagna et Toscana),
Luxembourg (1), Pays-Bas (9)};
58“Sud” ={Espagne(16 régions), Grèce (13), Italie(11 régions du sud : Umbria, Marche, Lazio, Abruzzo, Molise, Campania, Puglia, Basilacata, Calabria, Sicilia et Sardegna), Portugal (5)}.
59Les régions du régime Sud correspondent aux régions éligibles à l'Objectif 1 de la Réforme des Fonds Structurels et appartiennent, pour la plupart d'entre elles, aux “Pays de la cohésion” au sens de la Commission Européenne.
60Lorsque l'on établit les diagrammes de Moran avec les matrices de pondérations spatiales W ( ),2 W(3) et W(4), on retrouve les mêmes clubs, ce qui souligne, d'unepart, larobustesse de nos résultats aux choix de différents schémas de connexions spatiales et renforce, d'autre part, le schéma régional de polarisation puisque ce dernier reste inchangé malgré la croissance du nombre de voisins considérés [15].
61Sur le plan technique, le diagramme de Moran permet d'illustrer la complexité des interactions entre autocorrélation spatiale globale et hétérogénéité spatiale. En effet, l'autocorrélation spatiale globale est reflétée par la pente de la droite de régression de Wy sur y, la valeur de cette pente étant formellement équivalente à la statistique I de Moran (avec une matrice de pondérations spatiales standardisée). La composition des clubs à partir des quadrants du diagramme de Moran suggère quant à elle une hétérogénéité spatiale sous forme de régimes. Dans ces conditions, les études économétriques du processus de ?-convergence menées dans la partie suivante devront tenir compte de ce double effet. D'une part, les estimateurs des MCO ne sont plus efficients en présence d'autocorrélation spatiale. D'autre part, si nous nous référons aux simulations concernant la valeur et la puissance des tests d'instabilité structurelle en présence d'autocorrélation spatiale des erreurs, nous sommes, comme le souligne Anselin (1990a), potentiellement dans la situation la plus défavorable :
“[…] it is prudent to always carry out a test for the presenceofspatial errorautocorrelation… If thereis a strong indication of spatial autocorrelation, and particularly when it is positive and/or the regimes correspond to compact contiguous observations, the standard techniques are likely to be unreliable and a maximum- likelihood approach should be taken.” (Anselin, 1990a, p. 205)
63La méthodologie empirique suggérée ici soulève néanmoins, de manière générale, le problème de pré-test qui invalide l'utilisation des distributions asymptotiques traditionnelles des statistiques de tests. On peut alors noter que les simulations présentées par Anselin (1990a) indiquent que ce problème n'est pas vraiment préjudiciable dans ce cas.
64Enfin, la détermination des clubs ou des différents régimes devrait de manière idéale être endogène, comme l'ont fait par exemple Durlauf et Johnson (1995) dans un cadre non spatial. Cependant, comme le notentAnselinet Cho(2002, p. 284), iln'existepas encore de méthodes endogènes permettant d'intégrer la dimension géographique des données en présence d'autocorrélation spatiale. Ce type d'étude est en effet beaucoup plus complexe que dans un cadre non spatial du fait de la présence de la matrice de pondérations spatiales et du non ordonnancement “naturel” des observations.
E stimations économétr iques du processus de convergence
65Nous commençons par estimer le modèle de ?-convergence inconditionnelle par les Moindres Carrés Ordinaires(MCO) etréalisonsdifférents tests de diagnostic dans le but de détecter la présence et la forme de l'autocorrélation et de l'hétérogénéité spatiales. Les tests indiquant la présence à la fois d'autocorrélation et d'hétérogéneité spatiales, nous estimons ensuite un modèle avec erreurs spatialement autocorrélées et coefficients variables intégrant l'instabilité spatiale structurelle. Les implications de ce modèle en termes du processus de convergence et des effets de débordements géographiques entre les régions européennes sont explorées dans le cas d'effets spatiaux identiques, quelsque soientlesrégimes, oudifférenciés selonles régimes.
E stimation par les M C O du modèle de ?-convergence inconditionnelle et tests de diagnostic
66Prenons comme point de départ le modèle de
?-convergence inconditionnelle suivant :

où g est le vecteur de dimension n = 135 des taux de T croissance annuels moyens du PIB par tête pour chaque région i entre 1995 et 1980, T y=15,, est 1980 le vecteur des logarithmes des PIB par tête pour chaque région en 1980, ? et ? sont les paramètres inconnus à estimer, en est le vecteur unité et ? est le vecteur d'erreursmuniesdespropriétéshabituelles.
67Les résultats de l'estimation par les MCO de ce modèle sont donnés dans le tableau 1.
68Le coefficient associé au logarithme du PIB par tête initial est significatif et négatif, $? = -0,00797, ce qui corrobore l'hypothèse de convergence pour les régions européennes. La vitesse de convergence associé à ce coefficient estiméest 0,85% (la demi-vie est de 87 années), bien inférieure aux 2% habituellement constatés dans la littérature, mais proche du 1% constaté par Armstrong pour les régions européennes (1995a). Ce résultat indique que le processus de convergence est effectivement très faible.
69Concernant les tests de diagnostic, on observe que le test de White (1980) rejette clairement l'hypothèse nulle d'homoscédasticité. Le test de Breusch-Pagan ( 1979) rejette également l'hypothèse nulle d'homoscédasticité si l'on utilise le logarithme du PIB par tête initial y. C'est aussi le cas si l'on 1980 utilise la variable muette D qui caractérise le régime 1 nord. L'hétérogénéité spatiale semble donc être présente dans notre échantillon et devra être prise en compte dans la modélisation.
70Les différents tests de l'autocorrélation spatiale sont réalisés en s'appuyant, à travers la matrice de pondérations spatiales W, sur le schéma des connexions spatiales entre les observations de l'échantillon. Étant donné le vaste ensemble des matrices de poids possibles et les problèmes économétriques liés à la présence d'autocorrélation spatiale, il est préconisé d'adopter une méthode de sélection de la matrice W qui “maximise” l'autocorrélation spatiale. Dans le cas des matrices de distance seuils, une méthodologie basée sur le corrélogramme des résidus des MCO a été suggérée par Fingleton (1999). Elle est fondée sur l'utilisation de matrices binaires pour lesquelles w est égal à ij l'unité quand la distance entre deux régions se situe dans un intervalle prédéfini. Ici, les intervalles sont déterminés par le minimum, le premier quartile, la médiane, le troisième quartile et le maximum de la distribution des distances sphériques entre centroïdes de régions. Avec l'échantillon de 135 régions que nous considérons maintenant, nous avons les quatre valeurs de distance seuil suivantes : Q1 = 312 miles, Me = 582 miles, Q3 = 928 miles et Max = 1997 miles. La détermination de la valeur seuil qui maximise la valeur absolue de la statistique I de Moran adaptée aux résidus d'une régression (Cliff et Ord, 1981) ou de la statistique du test d'autocorrélation spatiale fondée sur le multiplicateur de Lagrange (Anselin, 1988a, 1988b) conduit à sélectionnerla matrice W(1) correspondant au seuil Q1 = 312 miles.
stimation du modèle de ?-convergence inconditionnel

stimation du modèle de ?-convergence inconditionnel
71Pour détecter l'autocorrélation spatiale et déterminer sa forme, cinq tests ont été effectués : le test I de Moran adapté aux résidus de régression (Cliff et Ord, 1981). Ce test est très puissant contre toutes les formes de dépendance spatiale mais ne permet pas de les discriminer. Pour cela, nous utilisons lesdeuxtests du multiplicateurde Lagrange (LMLAG, LMERR) ainsiqueleurs versions robustes (RLMLAG et RLMERR). LMERR permet de tester une autocorrélation spatiale des erreurs et LMLAG permet de tester une variable endogène décalée. Leurs versions robustes RLMERR et RLMLAG ont une bonne puissance contre leur alternative spécifique (Anselin et alii, 1996, Anselin 2001a, b). Une approche classique de recherche de spécification [16] allant du « spécifique au général », suggérée par Anselin et Rey (1991) et Anselin et Florax (1995) dans le contexte de la modélisation spatiale, peut alors être appliquée pour décider de la spécification spatiale la plus appropriée. Si LMLAG est plus significatif que LMERR et RLMLAG est significatif alors que RLMERR ne l'est pas, alors le modèle le plus approprié est le modèle spatial autorégressif. Inversement, si LMERR est plus significatif que LMLAG et RLMERR est significatif alors que R L ML AG ne l'est pas, alors la spécification appropriée est le modèle avec erreurs spatialement autocorrélées. La performance d'une telle approche est étudiée par Florax et Folmer (1992). En outre, Florax et alii (2003) montrent par des expériences de Monte Carlo que cette approche classique est plus performante que l'approche allant du « général au spécifique » suggérée par Hendry. Au vu des valeurs des tests, cette règle de décision suggère ici la présence d'une autocorrélation spatiale des erreurs plutôt que la présence d'une variable endogène spatialement décalée : le modèle avec erreurs spatialement autocorrélées semble être la spécification économétrique à retenir. Le test du multiplicateur de Lagrange de l'hypothèse nulle jointe d'absence d'hétéroscédasticité et d'absence d'autocorrélation spatiale des erreurs est très significatif quelle que soit la forme supposée de l'hétéroscédasticité.
corrélogramme des résidus

corrélogramme des résidus
72Par conséquent, le modèle de ?-convergence inconditionnelle souffre d'une mauvaise spécification due à l'omission de l'autocorrélation spatiale et de l'hétéroscédasticité des erreurs. Une implication directe de ce résultat est que les estimateurs des MCO ne sont pas efficients et que l'inférence statistique réalisée sur ce modèle n'est pas fiable.
73Le modèle de ?-convergence inconditionnelle doit donc être modifié pour intégrer explicitement cette forme particulière de dépendance et d'hétérogénéité spatiales. De plus, les résultats des tests d'autocorrélation peuvent être trompeurs en présence d'hétéroscédasticité et vice versa (Anselin 1988a; Anselin et Griffith, 1988; Anselin 1990a, b) et doivent donc être interprétés avec prudence. Par exemple, lorsque les tests indiquent la présence d'hétéroscédasticité, cette dernière peut être causée par la présence d'autocorrélation spatiale (McMillen, 1992).
Prise en compte de l'autocorrélation et de l'hétérogénéité spatiales
74Les résultats précédents indiquent la présence
d'erreurs spatialement autocorrélées et
d'hétéroscédasticité. Cette dernière peut être due à
une instabilité structurelle des coefficients entre les
deux régimes précédemment déterminés. Par
conséquent, nous estimons un modèle à deux
régimes spatiaux dans lequel nous supposons que le
même processus autorégressif spatial engendre les
erreurs au sein de chaque régime :


75L'indice 1 se réfère au régime “Nord” et l'indice 2 se réfère au régime “Sud”. Cette spécification permet au processus de convergence de différer d'un régime à l'autre. En fait, cette approche peut être interprétée comme une approche en termes de clubs spatiaux de convergence, dans laquelle les clubs sont identifiés sur la base du graphique de Moran à l'aide d'un critère géo-économique. Cette spécification intègre aussi l'autocorrélation spatiale des erreurs, dont les effetssonttoutefois supposésêtre identiques pourles régions du nord et du sud. Notons néanmoins que toutes les régions interagissent par l'intermédiaire de lamatrice depondérations spatiales. Il semblerait, en effet, dénuéde sensd'estimerséparément lesdeux régressions sur chacun des régimes en supposant des effets spatiaux différenciés basés sur des matrices de pondérations spatiales a priori différentes pour chaque régime. Ceci impliquerait que les régions du « Nord » n'interagissent pas avec les régions du « Sud » et qu'elles sont indépendantes. De plus, il n'y a aucune raison de supposer que les matrices de pondérationsspatialesdoivent différer d'un régime à l'autre étant donné que ces matrices expriment des schémas d'interactions spatiales basés purement sur la distancegéographiqueet sont supposés totalement exogènes.
76Les résultats de l'estimation par le maximum de vraisemblance (MV) sont présentés dans le tableau 3 et l'expression de la fonction de vraisemblance est donnée en annexe dans un cas plus général. On note d'abord que $?1 et $?2 ont tous deux les signes attendus mais que $?1 n'est pas significatif pour le régime Nord. Concernant le régime Sud, $?2 est fortement significatif et négatif. La vitesse de convergence et la demi-vie sont respectivement de 2,94% et de 29 années. L e test de Chow spatialement ajusté ( Anselin, 1988a, 1990a) rejette fortement l'hypothèse nulle jointe de stabilité structurelle et les testsindividuelsde stabilitédescoefficients rejettent les hypothèse nulles correspondantes.
77Concernant les autres tests de diagnostic, il apparaît que le test LMLAG* ne rejette pas l'hypothèse nulle d'absence d'une variable spatialement décalée supplémentaire dans le modèle avec erreurs spatialement autocorrélées. L e test d'hétéroscédasticité de Breusch-Pagan spatialement ajusté contre D n'est pas significatif au seuil de 5%. 1 Étant donné que la probabilité critique est proche de 5% ( 0,065), un modèle intégrant de l'hétéroscédasticité en bloc a également été estimé, sans pour autant que les valeurs des coefficients soient affectées de manière significative. Finalement, cette spécification a également été estimée par la méthode des moments généralisés (GMM) élaborée par Kelejian et Prucha (1999) et nous obtenons des résultats sensiblement similaires pour les paramètres d'intérêt. Le modèle retenu apparaît par conséquent approprié.
78D'un point de vue économique, ces résultats peuvent être interprétés de deux manières. D'abord, ils impliquent que les vitesses de convergence dans le régime Nord et dans le régime Sud sont différentes puisque les paramètres de convergence varient d'un échantillon à l'autre. Plus précisément, s'il existe un processus de convergence entre les régions européennes, il concerne principalement les régions du sud et ne concerne pas les régions du nord ; le paramètre de convergence n'étant pas significatif pour le régime Nord. Ensuite, les états réguliers des revenus par tête dans le sud et le nord différent également puisque les termes constants sont significativement différents d'un régime à l'autre. Considérés conjointement, ces résultats impliquent que les régions du sud convergent vers un état régulier du revenu par tête commun mais qu'un tel processus de convergence n'existe pas pour les régions du nord. Ce résultat pourrait refléter l'existence d'un club de convergence entre les régions du sud et l'absence de mobilité dans la distribution du PIB pour les régions du nord de l'Union Européenne.
79Des analyses complémentaires, portant notamment sur les effets de débordements géographiques et la diffusion spatiale de chocs aléatoires peuvent également être conduites à partir des résultats que nous avons obtenus.
Analyse des effets de débordements géographiques et de la diffusion spatiale
80À partir de l'estimation d'un modèle avec erreurs spatialement autocorrélées, il est possible, d'une part, d'interpréter l'autocorrélation spatiale détectée en termes d'effets de débordements géographiques entre les régions et, d'autre part, d'analyser la diffusion spatiale de chocs aléatoires au sein du système des régions européennes.
81Ainsi, l'estimation du modèle montre qu'une autocorrélation spatiale positive significative est détectée puisque $,? = 0 788. L a présence d'autocorrélation spatiale peut refléter en partie les effets de variablesomises dans le modèle qui seraient elles-mêmes spatialement autocorrélées. Cependant, comme nous ne disposons pas d'informations cohérentes sur toute la période d'étude au niveau régional sur des variables permettant de contrôler les déterminants des états réguliers du revenu, nous considérons comme Fingleton (1999) ou Le Gallo et alii (2003) que l'autocorrélation spatiale peut jouer le rôle de proxy de toutes ces variables omises et capter leurs effets. Ainsi, nous intégrons l'autocorrélation spatiale en lieu et place de variables explicatives supplémentaires dans notre modèle.
estimation du modèle à deux régimes et erreurs spatialement autocorrélées

estimation du modèle à deux régimes et erreurs spatialement autocorrélées
82La réécriture du modèle (6) sous la forme du modèle
spatial de Durbin contraint (7) permet alors de mettre
en évidence des effets de débordements
géographiques entre régions :

(7) g I W D I W DT = ? + ?? ? ? ? 1 1 2 2 ( ) ( )
83+ + +? ? ? 1 1 1980 2 2 1980 D y D y WgT + + +? ? 1 1 1980 2 2 1980 WD y WD y u avec u N I u ( , )02 ? et les deux restrictions non linéaires suivantes : ? ?? 1 1 = ? et ? ?? 2 2 = ?.
84Le test du ratio de vraisemblance et le test de Wald du facteur commun (Burridge, 1981) indiquent que ces restrictions ne peuvent être rejetées (cf. tableau 3).
85Du point de vue de la convergence, cette expression peut être interprétée comme un modèle minimal de ?-convergence conditionnelle intégrant deux variables d'environnement (Le Gallo et alii, 2003). Deux types d'effets de débordement géographique peuvent être mis en évidence et évalués : l'un est porté par les taux de croissance annuels moyens des régions voisines et estévaluépar la valeur estimée du paramètre d'autocorrélation spatiale ? tandis que l'autre est porté par le niveau de richesse initial des régions voisines et évalué dans le cas des régimes spatiaux par les valeurs estimées des paramètres ? 1 pour les régions Nord et ? pour les régions Sud. Les 2 résultats des estimations montrent que quel que soit le régime, le taux de croissance annuel moyen d'une région i est positivement influencé par les taux de croissance annuels moyens des régions voisines par l'intermédiaire de la variable endogène spatialement décalée Wg. Toutefois, il ne semble pas être T influencé par les niveaux de PIB initiaux des régions voisines puisque les coefficients ? et ? ne sont pas 12 significatifs. Cet effetde débordement géographique indique que les schémas d'association spatiale ne sont pas neutres quant aux performances économiques des régions européennes. Plus une région est entourée de régions dynamiques avec des taux de croissance élevés, plus élevé sera son propre taux de croissance. Ce résultat est à rapprocher en particulier des performances économiques qui ont été observées au cours de la période 1980-1995 pour les régions du sud de l'Union Européenne. Il montre par ailleurs que l'environnement géographique a une influence sur les processus de croissance et que les politiques de développement économique doivent tenir compte de cette influence.
86Une analyse de la diffusion spatiale permet
d'illustrer la manière dont les taux de croissance des
régions seraient affectés par un choc aléatoire se
produisant dans une région particulière. Le modèle à
deux régimes et erreurs spatialement autocorrélées
(6) peut en effet s'écrire :

Cette expression montre qu'un choc aléatoire dans une région donnée n'affecte pas seulement le taux de croissance annuel moyen de la région en question mais affecte également les taux de croissance annuels moyens de toutes les autres régions de l'échantillon par l'intermédiaire de la transformation spatiale inverse ( )I W?? ?1.
87Pour illustrer cette propriété nous présentons des résultats de simulation obtenus avec un choc aléatoire fixé à deux écart types estimés du modèle à deux régimes avec autocorrélation spatiale des erreurs affectant la région Île-de-France appartenant au régime Nord (figure 2) et la région de Madrid appartenant au régime Sud (figure 3). Ce choc aléatoire a l'impact relatif le plus important sur l'Île-de-France (resp. Madrid), où le taux de croissance annuel moyen simulé est supérieur de 21,22% au taux de croissance annuel moyen observé sans le choc (resp. 20,90%). De plus, nous observons dans les deux cas un schéma de diffusion spatiale du choc à toutes les régions de l'échantillon. L'ampleur de l'impact relatif du choc se situe entre 1,57% et 3,74% pour les régions voisines de l'Île-de-France et il décroît graduellement lorsque l'on se déplace vers les régions périphériques (figure 2). Pour Madrid, l'ampleur de l'impact relatif du choc se situe entre 3,76% et 8,53% pour les régions voisines. Comme Madrid n'est pas localisée au cœur de l'Europe, l'ampleur du choc décroît fortement lorsque l'on se déplace vers le Nord (figure 3). L'impact du choc est plus élevé dans le régime Sud que dans le régime Nord du fait de la non-significativité du paramètre de convergence pour le régime Nord. Par conséquent, la spécification économétrique avec erreurs spatialement autocorrélées permet d'attirer l'attention sur le fait que la diffusion spatiale des chocs est au moins aussi importante que leur diffusion temporelle dans l'analyse des processus de croissance.
88Le modèle estimé jusqu'à présent suppose que les effets spatiaux, captés par le paramètre d'autocorrélation spatiale ?, sont identiques d'un régime spatial à l'autre. Cette hypothèse devrait faire l'objet d'un test statistique. Nous avons aussi noté qu'estimer deux régressions séparées permettant d'intégrer des effets spatiaux différenciés semble peu satisfaisant parce que cela implique que les régions du Nord n'interagissent pas avec les régions du Sud et vice versa. Nous proposons dans le paragraphe suivant une manière d'estimer ces effets spatiaux différenciés.
diffusion dans le modèle à deux régimes et erreurs spatialement autocorrélées. Variations relatives en % des taux de croissance annuels moyens à la suite d'un choc positif frappant la région Île-de-France (régime Nord)

diffusion dans le modèle à deux régimes et erreurs spatialement autocorrélées. Variations relatives en % des taux de croissance annuels moyens à la suite d'un choc positif frappant la région Île-de-France (régime Nord)
diffusion dans le modèle à deux régimes et erreurs spatialement autocorrélées. Variations relatives en % des taux de croissance annuels moyens à la suite d'un choc positif frappant la région de Madrid (régime Sud)

diffusion dans le modèle à deux régimes et erreurs spatialement autocorrélées. Variations relatives en % des taux de croissance annuels moyens à la suite d'un choc positif frappant la région de Madrid (régime Sud)
Effets spatiaux différenciés
89Rietveld et Wintershoven (1998) ont proposé une
méthodologie d'analyse d'effets spatiaux
différenciés qui permet d'estimer pour chaque
régime un paramètre d'autocorrélation spatiale
spécifique et qui permet par ailleurs d'estimer un
paramètre d'autocorrélation spatiale inter-régimes.
Nous appliquons leur méthode au cas de la
convergence en clubs en considérant la spécification
économétrique suivante :

Cette spécification permet d'intégrer conjointement l'instabilité structurelle et les effets spatiaux différenciés d'un régime à l'autre ( ? et ? ) et entre 12 les deux régimes (? ). La matrice de poids W est 3 maintenant décomposée en trois matrices d'interactions spatiales :W contient uniquement les 1 connexionsspatialesentre les régions appartenant au régime Nord, W contient uniquement les 2 connexionsspatialesentre les régions appartenant au régime Sud et W contient uniquement les 3 connexionsspatialesentre les régions appartenant au régime Nord et les régions appartenant au régime Sud.
90Ces matrices peuvent être construites en utilisant deux approches différentes. La première approche est fondée sur la décomposition de la matrice standardisée précédente W et conduit à des matrices W j( , , )=1 2 3 non standardisées. L'avantage j principal de cette approche est que le test d'homogénéité des effets spatiaux peut être réalisé simplement car le modèle (6) est alors le modèle contraint sous l'hypothèse nulle de coefficients ? j égaux. L'inconvénient est l'utilisation de matrices non standardisées dans l'estimation du modèle (9) par le maximum de vraisemblance, ce qui peut poser problème car les conditions de régularités peuvent alors ne pas être satisfaites. De plus, l'interprétation des coefficients ? comme des coefficients j d'autocorrélation spatiale devient alors ambiguë. La seconde approche est fondée sur la décomposition de la matrice non standardisée W, les matricesW étant j ensuite standardisées. L'inconvénient principal est alors que le modèle (6) ne peut plus être considéré comme le modèle contraint pour le test d'homogénéité.
91Nous utilisons la première approche et estimons le modèle (9) par le maximum de vraisemblance. L'expression de la fonction de vraisemblance est donnée en annexe. Les résultats obtenus sont présentés dans le tableau 4 [17].
92Nous remarquonsque les estimations des paramètres de convergence sont cohérents avec ceux obtenus précédemment. Les paramètres d'autocorrélation spatiale estimés $?1 pour les régions du régime Nord et $?2 pour les régions du régime Sud sont très significatifs et positifs tandis que $?3 représentant les interactions Nord-Sud n'est pas significatif (probabilité critique de 0,924). Ceci peut s'expliquer par le fait que la matrice W des connexions spatiales 3 entre le Nord et le Sud contient un nombre très élevé de valeurs nulles. Le test du ratio de vraisemblance d'égalité des effets spatiaux sous l'hypothèse des régimes spatiaux montre que l'hypothèse nulle d'égalité des effets spatiaux ne peut être rejetée (probabilité critique de 0,793). Nous réalisons aussi le test du ratio de vraisemblance d'absence de régimes spatiaux sous l'hypothèse d'effets spatiaux différenciés et les résultats de l'estimation par le maximum de vraisemblance du modèle contraint sont présentés dans le tableau 5. L'hypothèse nulle d'absence de régimes spatiaux est fortement rejetée (probabilité critique de 0,003). En définitive, ces résultats confirment bien la présence de régimes spatiaux mais invalident l'hypothèse d'ampleurs différentes des effets de débordements géographiques suivant les groupes de régions européennes. De ce fait, le modèle (6) est la spécification la plus appropriée à l'analyse du processus de croissance des régions européennes pour la période étudiée.
estimation du modèle à deux régimes et erreurs spatialement autocorrélées avec effets spatiaux différenciés

estimation du modèle à deux régimes et erreurs spatialement autocorrélées avec effets spatiaux différenciés
estimation du modèle avec erreurs spatialement autocorrélées et effets spatiaux différenciés

estimation du modèle avec erreurs spatialement autocorrélées et effets spatiaux différenciés
Conclusion
93L'objectif de cet article était d'évaluer l'importance de la dépendance et de l'hétérogénéité spatiales dans l'estimation de processus de?-convergence. En nous basant sur un échantillon de 138 régions européennes sur la période 1980-1995, nous avons montré qu'elles jouaient un rôle certain dans les processus de croissance. Nous avons alors proposé une spécification empirique qui nous semble bien plus satisfaisante que les modèles empiriques standard dont les insuffisances aussi bien sur le plan théorique qu'économétrique sont bien établies.
94D'abord, sur le plan de la méthodologie économétrique, il est bien connu que les procédures d'inférence statistique standard fondées sur les estimateurs des MCO sont insatisfaisantes en présence d'erreurs non sphériques. En utilisant les outils économétriques adéquats, nous avons détecté de l'autocorrélation spatiale et nous avons surmonté ce problème en estimant le modèle avec erreurs spatialement autocorrélées qui peut s'interpréter comme un modèle minimalde ?-convergence conditionnelle. Concernant l'hétérogénéité spatiale, il nous est apparu que le problème était essentiellement dû à l'instabilité structurelle entre deux régimes spatiaux bien distincts. Ces régimes spatiaux que nous interprétons comme des clubs spatiaux de convergence ont été déterminés en utilisant l'analyse exploratoire des données spatiales, et plus précisément à l'aide d'un diagramme de Moran. Nous avons ainsi pris en compte l'autocorrélation spatiale détectée conjointement avec l'instabilité structurelle. L'estimation du modèle à deux régimes spatiaux et erreurs spatialement autocorrélées nous a permis de mettre en évidence le fait que le processus de convergence diffère bien d'un régime à l'autre. De plus, nous avons montré que le processus de convergence était en fait inexistant pour le régime Nord tandis qu'il est très faible pour le régime Sud. Ce résultat de non convergence pour les régions riches est cohérent avec celui obtenu par DeLong (1988) et par Durlauf et Johnson (1995) pour les pays riches en utilisant des données internationales. Il pourrait être dû à de l'hétérogénéité intra-régime non prise en compte. L'inclusion de variables additionnelles dans un contexte de ?-convergence conditionnelle pourrait conduire à un résultat de convergence pour le régime Nord en utilisant par exemple le modèle de Mankiw et alii (1992). Toutefois, les données homogènes, comparables et fiables pour mener une telle étude ne sont pas disponibles pour notre période d'étude et au niveau régional NUTS2 dans la banque de données Eurostat-Regio.
95Ensuite, sur le plan économique, nous avons estimé un effet de débordement géographique dans le cadre des clubs de convergence. Cet effet, fortement significatif, indique que le taux de croissance annuel moyen d'une région donnée est positivement affecté par les taux de croissance annuels moyens des régions voisines. L'environnement géographique joue donc un rôle important dans l'étude des processus de croissance. Le processus de diffusion spatial impliqué par ce modèle est aussi mis en évidence par des simulations.
Annexe
96Modèle à deux r égimes spatiaux et er reur s spatialement autocorrélées avec effets spatiaux différenciés

De manière équivalente, ce modèle s'écrit sous forme matricielle :

Nous pouvons plus généralement réécrire ce modèle de la manière suivante :

où y est le vecteur de dimension n des observations de la variable expliquée, ? est le vecteur de dimension k des paramètres inconnus, X est la matrice de dimension (n, k) des observations des k variables explicatives, u est un vecteur d'erreur tel que u N I ( , )02 ? et :

où W1 est la matrice comportant uniquement les connexions spatiales entre les régions appartenant au régime Nord, W2 est la matrice comportant uniquement les connexions spatiales entre les régions appartenant au régime Sud et W3 est la matrice comportant uniquement les connexions spatiales entre les régions appartenant au régime Nord et celles appartenant au régime Sud. Ces matrices sont construites telles que W W W W 1 2 3 + + =, où W est la matrice de poids standardisée.
98Notons que le modèle avec deux régimes spatiaux et erreurs
spatialement autocorrélées (6) n'est qu'un cas particulier de
ce modèle obtenu en posant :

Nous ne détaillerons donc pas l'estimation par le maximum de vraisemblance du modèle (6).
99Fonction de vraisemblance
100La fonction de vraisemblance de y par rapport aux
coefficients inconnus ? ? ? ?, , , 1 2 3 et ?2 est donnée par :


101Score

Les estimateurs du maximum de vraisemblance sont obtenus en résolvant le système d'équations S ( )? = 0. Ce système n'est pas linéaire et n'admet pas de solutions analytiques. Pour le modèle (A3), les solutions issues des conditions du premier ordre (A7) et (A9) permettent de construire une fonction de log-vraisemblance concentrée.
103Fonction de vraisemblance concentrée
104Des conditions de premier ordre (A7) et (A9), on tire les
estimateurs de ? et de ?2, notés $? et $?2, qui dépendent de $,?i
i = 1,2 et 3.

105La substitution de (A10) et (A11) dans la fonction de
log-vraisemblance ( A6) aboutit à la fonction de
vraisemblance concentrée, qui ne dépend plus que des
paramètres spatiaux, ? ? 1 2, et ?3 :

106Matrice d'information
107La matrice d'information du vecteur de paramètres ?, notée
I ( )?, est donnée par :

On obtient :


108Matrice des variances-covariances
109Nous supposons que les conditions habituelles de régularité
sont respectées. Dans ces conditions, les estimateurs du
maximum de vraisemblance, solutions du système S ( )? = 0,
sont asymptotiquement normaux et efficients. Cela
implique que la matrice asymptotique des
variances-covariances de $? atteint la borne inférieure de
Cramer-R ao, donnée par l'inverse de la matrice
d'information :

La matrice estimée $ ( $ )Vas ? des variances-covariances est obtenue en remplaçant les paramètres par leurs estimations du maximum de vraisemblance.
Notes
- (*)Université de Bourgogne, LEG UMR- 5118 CNRS
- (**)Université d'Orléans, LEO UMR 6221 CNRS
- (***)Université de Franche-Comté, CRESE. E-mail : ccatherine. baumont@ u-bourgogne. fr E-mail : ccem. ertur@ univ-orleans. fr E-mail : llegallo@ iut-bm. univ-fcomte. fr Des versions antérieures de cet article ont été présentées au “56th Econometric Society European Meeting”, Lausanne, août 2001, au “48th North American Meetings of the Regional Science Association International”, Charleston, South Carolina, novembre 2001, au “1st Spatial Econometrics Workshop”, Gremaq, Toulouse 1, juin, 2002 et au “Spatial Inequality and Development Conference”, Cornell/LSE/WIDER, Londres, Juin, 2002. Nous remercions L. Anselin, R.J.G.M. Florax, R. Haining, A. Heston, P. Krugman, J. LeSage, A. Venables et Q. Xie pour leurs commentaires ainsi que tous les participants à ces conférences. Nous remercions également les rapporteurs anonymes pour leurs suggestions. Nous remercions enfin Eurostat : G. Decand et A. Behrens du Département de la Statistique Régionale (divisionE4) ainsi que J. Recktenwald et I. Dennis pour l'aide apportée sur la banque de données Eurostat-Regio. Les auteurs restent seuls responsables des erreurs et insuffisances que pourraient comporter cet article.
- (1)Cf. Durlauf et Quah, (1999), Islam (2003), Mankiw (1995) ou Temple (1999) pour différentes synthèses de ces débats.
- (2)Cf. Brundson et alii (1999) pour un exemple.
- (3)Plus précisément, leur approche consiste à régresser le produit normalisé des résidus estimés dans l'équation de croissance pour toutes les paires de pays, sur différentes formes fonctionnelles de la distance entre les capitales des pays.
- (4)Levine et Renelt (1992) recensent ainsi plus de 50 variables utilisées dans les différentes études.
- (5)Cette base de données est utilisée dans plusieurs études empiriques, pour des échantillons différents du nôtre soit par la taille soit par la période étudiée : par exemple, López-Bazo et alii (1999), Neven et Gouyette (1995), Quah (1996), Beine et Jean-Pierre (2000).
- (6)L'ECU a été remplacé par l'Euro en 1999.
- (7)Le terme NUTS désigne la nomenclature utilisée par Eurostat : “Nomenclature des Unités Territoriales pour la Statistique”.
- (8)Par exemple, pour l'échantillon de 91 régions utilisé par Barro et Sala-I-Martin (1995), pour la période avant 1970, il s'agit des données de PIB utilisées par Molle (1980) et pour la période récente des données fournies par Eurostat, tandis que pour les régions espagnoles il s'agit des données de revenu fournies par la Banque de Bilbao.
- (9)Destiné aux régions en retard de développement (dans lesquelles le PIB par tête est généralement inférieur à 75% de la moyenne de l'Union Européenne). Plus de 60% des ressources de l'Union Européenne consacrées aux politiques structurelles sont assignées à l'Objectif 1.
- (10)Il faut cependant dans ces cas s'assurer de l'exogénéité du schéma de connexion, comme l'ont rappelé Anselin et Bera (1998, p.244) : “… indicators for the socioeconomic weights should be chosen with great care to ensure their exogeneity, unless their endogeneity is considered explicitly in the model specification”.
- (11)Cela signifie qu'il n'y a pas de lignes ou de colonnes uniquement composées de 0 dans W, ce qui ne serait pas le cas, par exemple, si on utilisait une matrice de contiguïté.
- (12)Tous les calculs sont réalisés à l'aide du logiciel SpaceStat 1.90 (Anselin, 1999a).
- (13)Ces résultats sont aussi robustes au choix de matrices de plus proches voisins (pour 10,15,20 et 25 voisins). L'ensemble des résultats est disponible auprès des auteurs.
- (14)En plus d'un manque de représentativité, cela conduirait, dans les études économétriques de la partie suivante, à un niveau insuffisant de degrés de liberté.
- (15)Les calculs effectués avec les matrices de plus proches voisins donnent également la même polarisation Nord-Sud. Les résultats complets sont disponibles auprès des auteurs et dans Le Gallo (2002b).
- (16)Toutefois, nous devons souligner que cette approche classique a trois inconvénients majeurs : les niveaux de significativité de la séquence de test sont inconnus, chacun des tests est conditionné par des hypothèses arbitraires, elle ne conduit pas toujours au « meilleur modèle ». Certain auteurs préfèrent filtrer les variables pour se débarrasser de l'autocorrélation spatiale (c'est le cas par exemple de Getis et Griffith, 2002). Conley (1999) propose une approche alternative intéressante fondée sur l'estimation non-paramétrique des matrices de variances-covariances fournissant des écarts-types estimés qui sont robustes par rapport à l'autocorrélation spatiale et l'hétéroscédasticité. Son approche est l'extension à l'espace de l'approche élaborée en séries temporelles par Newey et West (1987) ou Andrews (1991).
- (17)Les programmes Gauss sont disponibles auprès des auteurs.