1 L’étude de l’homogamie, c’est-à-dire le fait qu’un couple soit composé de deux personnes du même groupe social, revêt de multiples dimensions. Dans les sociétés pour lesquelles il n’existe pas d’interdit légal ou religieux à la formation de couples hétérogames, on pourrait penser que la formation du couple relève du hasard et ne favorise a priori ni la formation de couples homogames, ni celle de couples hétérogames. Ce n’est pas le cas : l’ouvrage d’Alain Girard (1964) marque, en France, le début d’une importante littérature, réactualisée récemment par Bouchet-Valat (2014, 2015). Elle montre que le conjoint d’un individu appartient plus fréquemment au même groupe social (profession et catégorie socioprofessionnelle, niveau d’éducation, etc.) que si le hasard en décidait. De fait, quand l’appartenance aux divers groupes sociaux reflète les inégalités, on peut penser que cette tendance à l’homogamie contribue à maintenir les inégalités socioéconomiques au sein de la société. Notamment, la tendance à l’union d’individus ayant des niveaux d’éducation similaires (homogamie éducative) est susceptible de renforcer au niveau du ménage des inégalités de rémunération présentes sur le marché du travail entre les individus les moins et les plus diplômés.
2 Les évolutions de l’homogamie éducative sont bien documentées et sont très différentes selon les pays et au cours du temps (pour une revue de littérature, voir Blossfeld, 2009) [1]. En France, Bouchet-Valat (2014) montre par exemple une diminution nette de l’homogamie éducative entre 1969 et 2011. Par ailleurs, plusieurs travaux réalisés dans différents contextes nationaux ont cherché à mesurer l’impact de l’homogamie éducative sur la répartition du revenu entre les ménages et sa contribution à l’augmentation générale des inégalités : ils convergent globalement sur l’idée que l’effet de l’homogamie éducative est relativement faible (Breen et Andersen, 2012 ; Eika et al., 2014 ; Greenwood et al., 2014 [2] ; Harmenberg, 2014 ; Boertien et Permanyer, 2019). En France, les analyses disponibles se sont principalement intéressées à l’effet de l’homogamie sur les inégalités entre ménages en considérant les seuls revenus salariaux (Frémeaux et Lefranc, 2015 ; Courtioux et Lignon, 2015a) et montrent, dans la lignée des travaux internationaux, un impact limité.
3 Dans la littérature, l’estimation des effets de l’homogamie éducative est généralement basée sur des échantillons qui écartent les individus les plus jeunes et les plus âgés afin de limiter les biais de génération (Eika et al., 2014 ; Greenwood et al., 2014 ; Boertien et Permanyer, 2019). La méthode de construction du contrefactuel « sans homogamie éducative » généralement utilisée consiste à considérer que les individus des générations les plus âgées peuvent se retrouver « par hasard » en couple avec les individus des générations les plus jeunes. Les restrictions de champ retenues limitent donc ce biais, mais les résultats ainsi produits ne peuvent être directement comparés avec les indicateurs usuels d’inégalités de niveau de vie calculés en population générale, c’est-à-dire sur l’ensemble des individus, quel que soit leur âge.
4 Cette note de recherche a pour objectif de calculer la part des inégalités de niveaux de vie imputables à l’homogamie éducative en proposant une méthode originale qui permette de raisonner en population totale. Elle contribue à l’analyse du cas français en approfondissant trois dimensions peu explorées dans la littérature, qui semblent nécessaires afin de déterminer l’effet de l’homogamie éducative sur les inégalités de revenu.
5 Premièrement, les répercussions propres à l’homogamie éducative sur les écarts de niveau de vie sont peu étudiées à partir de données françaises. Or, le niveau de vie permet d’englober l’ensemble des éléments qui contribuent à la formation du revenu des ménages (revenus du travail salarié et indépendant, revenus de remplacement, impôts et prestations sociales) et de tenir compte de la composition du ménage en appliquant une correction fondée sur les unités de consommation qui incluent les économies d’échelle induites par la vie à plusieurs. Il permet de considérer simultanément deux éléments qui ne sont pas neutres sur les inégalités : le rôle redistributif du système socio-fiscal d’une part, et la mutualisation des revenus tirés du marché du travail au sein des couples d’autre part. Pour l’instant, seuls Boertien et Permanyer (2019) ont analysé le cas français dans le cadre d’une comparaison internationale. Ils montrent à ce titre que, lorsqu’on se limite aux revenus du travail, l’impact estimé de l’homogamie éducative sur les inégalités est inférieur à celui sur le niveau de vie. Toutefois, leur indicateur concerne la population des 30-64 ans et retient une définition peu détaillée de l’homogamie éducative se limitant à quatre niveaux de diplôme.
6 Deuxièmement, les travaux qui mesurent l’effet de l’homogamie éducative sur le niveau de vie comparent la situation observée à un contrefactuel dans lequel le diplôme du conjoint est déterminé aléatoirement, quelle que soit la cohorte de naissance de l’individu (Greenwood et al., 2014). Cette approche ne permet pas d’appréhender pleinement le rôle joué par le développement de l’enseignement supérieur et la progression des niveaux d’éducation. En effet, la probabilité d’être en couple avec un individu d’un niveau de diplôme donné, même déterminée aléatoirement, dépend de la structure éducative de l’offre de conjoints qui a tendance à évoluer au fil des générations. Pour mieux tenir compte de cette évolution de la structure éducative, certains travaux cherchent à conditionner la construction du contrefactuel à l’âge de l’individu de référence en distinguant deux classes d’âges (Boertien et Permanyer, 2019). Cette note propose une méthode alternative fondée sur des régressions logistiques multinomiales permettant de prendre en compte de manière encore plus fine les « effets générationnels [3] » de structure de diplôme. Dans le cas français, ce contrôle fin est important dans la mesure où l’évolution de l’homogamie n’est pas uniforme selon les niveaux d’éducation. Si l’homogamie éducative a globalement tendance à diminuer au cours du temps en France, Bouchet-Valat (2014) observe son renforcement au sein des diplômés des grandes écoles.
7 Troisièmement, une analyse complète de l’effet de l’homogamie éducative doit documenter les « marges » de la distribution. En effet, son rôle pour les diplômés des grandes écoles (Bouchet-Valat, 2014) suggère que l’effet de concentration des revenus est potentiellement plus important dans le haut de la distribution. Or, les indicateurs généralement utilisés par la littérature, tels que le Gini, prennent mal en compte cette dimension, et ce d’autant plus que la mesure de l’homogamie ne s’appuie pas sur une distinction entre les diplômés des grandes écoles et les autres diplômés de l’enseignement supérieur. Cette note produit une analyse originale qui permet de vérifier l’existence d’« effets de marges » de l’impact de l’homogamie éducative sur les inégalités. Pour cela, on combine une approche fine du niveau de diplôme (i.e. neuf catégories, alors que la littérature retient généralement un nombre plus limité de niveaux d’éducation [4]) et le calcul d’un indicateur permettant d’évaluer la concentration des inégalités dans le haut et le bas de la distribution. Trois indicateurs usuels sont retenus en complément du Gini : la part de richesse détenue par les 10 % de ménages les plus riches, la part de ménages aisés (well-off) [5] et la part de ménages en situation de risque de pauvreté monétaire.
8 Pour approfondir l’analyse des répercussions de l’homogamie éducative sur les inégalités en population générale selon ces trois axes (étude des niveaux de vie à un niveau fin de diplôme, prise en compte des effets générationnels et analyse des marges), cette note de recherche s’appuie sur les Enquêtes revenus fiscaux (ERF) et les Enquêtes revenus fiscaux et sociaux (ERFS) disponibles pour les années 2003 à 2013. La première section présente et discute la méthodologie retenue pour mesurer l’effet propre de l’homogamie éducative sur les inégalités. La deuxième section expose les résultats obtenus et montre que l’effet de l’homogamie éducative sur les inégalités relève d’un effet générationnel qui joue de manière plus évidente sur le haut de la distribution des revenus.
I. Construire une population contrefactuelle pour mesurer l’ampleur de l’homogamie éducative
1. Les enjeux d’un contrôle des effets générationnels
9 Pour mesurer l’ampleur de l’effet propre à l’homogamie éducative sur les inégalités, il convient de construire une population contrefactuelle dans laquelle les unions seraient aléatoires en matière de diplôme. Lorsque l’analyse se concentre sur l’une des dimensions de l’homogamie – la dimension éducative –, on utilise généralement une « méthode par imputation [6] ». Elle consiste à construire la population de couples contrefactuels sur la base des couples observés, en appliquant un coefficient de correction c à leur poids dans la population initiale (notée P). D’un point de vue technique, ceci nécessite une variable qualitative de contrôle de la structure d’homogamie (par exemple le diplôme E) renseignée pour chacun des individus composant le couple (Ei et Ek). Deux éléments doivent être identifiés pour construire une population contrefactuelle : (a) la probabilité théorique d’appariement aléatoire (probabilité d’observer le couple Ei et Ek), notée pt, sous l’hypothèse d’absence d’homogamie éducative (i. e. la probabilité pour un homme d’avoir une conjointe d’un niveau de diplôme Ek indépendamment de son propre niveau de diplôme Ei) ; (b) la probabilité d’appariement observée avec homogamie éducative, notée po. La méthode par imputation consiste à corriger les pondérations d’un coefficient c égal au rapport entre pt et po [7]. Dans la littérature (Greenwood et al., 2014 ; Harmenberg, 2014 ; Boertien et Permanyer, 2019), l’estimation du coefficient c repose sur la constitution de deux tableaux de contingence : le premier donnant les fréquences d’appariement entre diplômes dans la situation observée (pour estimer po) et le second les fréquences avec indépendance de Ek et Ei (pour estimer pt).
10 Cette méthode, usuelle, présente au moins deux limites. La première réside dans le fait qu’elle ne tient pas compte de l’évolution de la distribution des diplômes des conjoints potentiels au fil des générations. En effet, Greenwood et al. (2014) calculent par exemple le coefficient c sans conditionner pt et po à la génération de naissance, tandis que Boertien et Permanyer (2019) distinguent seulement deux classes d’âges. La seconde limite concerne les niveaux très agrégés des variables d’éducation retenues pour l’analyse. Ce manque de précision est justifié compte tenu de la méthode et des données mobilisées, notamment pour conserver des effectifs suffisants dans le calcul des fréquences de paires de diplômes (voir infra). Elle n’est cependant pas sans implication sur la caractérisation de l’ampleur de l’homogamie éducative. En France par exemple, à niveau d’éducation équivalent, les diplômés d’un master professionnel à l’université et les diplômés d’écoles de commerce n’ont pas la même propension à l’homogamie : les diplômés d’écoles de commerce sont plus homogames et ont en moyenne de meilleurs salaires, toutes choses égales par ailleurs (Courtioux et Lignon, 2015a). Pour construire la population contrefactuelle, c’est la distance entre le degré d’homogamie et un appariement aléatoire qui détermine le coefficient de correction c. Dans le cas où la construction du contrefactuel s’appuie sur une classification distinguant les écoles de commerces des autres masters, les couples de diplômés d’écoles de commerce se verront appliquer un coefficient de correction plus proche de 0 (et les couples de diplômés de masters professionnels à l’université plus éloigné de 0) comparativement à une classification dans laquelle ces formations ne seraient pas distinguées. Une approche fine du diplôme conduit donc à réduire plus fortement la part de couples de diplômés d’écoles de commerce formés « par hasard » dans la population contrefactuelle sur laquelle est calculé un indicateur d’inégalité sans homogamie éducative. Dans le cas français, plus le niveau de diplôme retenu pour mesurer l’homogamie éducative est précis et distingue les diplômés des grandes écoles des autres diplômes, plus son effet potentiel sur les inégalités est susceptible d’être important.
11 Pour surmonter ces limites, une méthode de construction d’une population contrefactuelle permettant de corriger l’homogamie éducative à un niveau fin, tout en tenant compte de la progression des niveaux d’éducation au fil des générations, est proposée.
2. L’introduction d’un contrôle générationnel fin sur les données françaises
12 Pour évaluer l’effet de l’homogamie sur les inégalités, une méthode par imputation est appliquée aux Enquêtes revenus fiscaux (ERF) et Enquêtes revenus fiscaux et sociaux (ERFS) pour chacune des années de la période 2003-2013. Ces données apparient les ménages de l’enquête Emploi avec la ou les déclarations fiscales des individus qui les composent. Les données permettent donc de disposer d’informations fiables sur les revenus (car établies à partir des données administratives et d’un nombre important d’observations (environ 50 000 par an). Elles fournissent aussi des renseignements sur le niveau de vie des ménages, la composition de leurs ressources et leurs caractéristiques. Sur ce dernier point, l’ERFS permet d’analyser finement l’homogamie éducative dans la mesure où 9 niveaux de diplômes sont identifiés : (1) sans diplôme ; (2) CAP/BEP/Brevet de technicien ; (3) Baccalauréat ; (4) Bac + 2 (BTS, IUT) ; (5) Bac + 3/ Bac + 4 ; (6) Bac + 5 – Université ; (7) Bac + 5 – Grandes écoles, (8) Doctorat hors santé, (9) Doctorat en santé. Cela représente 81 possibilités et catégories d’appariement pour les couples.
13 Tous les ménages composés d’au moins un couple de sexe opposé sont conservés [8]. Tenir compte à la fois de l’hétérogénéité des niveaux d’éducation et de leur évolution au fil des générations pose un problème d’effectifs pour certaines catégories d’appariement dans le tableau de contingence servant à calculer le coefficient c. Plutôt que d’arbitrer en faveur d’une agrégation des catégories des diplômes, cet article propose une méthode originale visant à estimer le coefficient c (et donc les probabilités théoriques ptet observées po) à partir de régressions logistiques multinomiales. Ces modèles peuvent être utilisés dans une approche descriptive d’estimation des probabilités, sans hypothèse causale sous-jacente (Afsa-Essafi, 2003).
14 Pour construire la population contrefactuelle en contrôlant des effets générationnels (notée Pc), on s’appuie sur les enquêtes ERF et ERFS empilées afin d’estimer deux modèles logistiques multinomiaux qui déterminent pour un individu de sexe masculin et en couple [9] les probabilités que sa conjointe ait un niveau de diplôme donné. Le premier modèle [1] est destiné à estimer po, c’est-à-dire la probabilité d’appariement en présence d’homogamie éducative, et a la forme suivante :
[1]
![[1]](./loadimg.php?FILE=POPU/POPU_2202/POPU_2202_0325/Equa_1.jpg)
[1]
15 Où la probabilité que le conjoint k de l’individu i ait un diplôme de la modalité E dépend de Ei le diplôme de l’individu i et de gi une tendance générationnelle [10] permettant d’identifier les évolutions de l’offre de conjoint en termes de diplôme. Cet effet générationnel est donc propre à chaque niveau de diplôme. Pour identifier d’éventuels effets de « tassement » ou « d’amplification » de cette tendance, on introduit également le carré de cette variable de génération (gi2). Ce choix permet d’inclure les individus en cours d’études pour les plus jeunes générations de la période examinée. Les estimateurs correspondant aux vecteurs αk, βk, δk et γk sont reportés dans le tableau annexe A.1 (partie A).
16 Le modèle [2] est destiné à déterminer pt, la probabilité d’appariement théorique en l’absence d’homogamie (tableau annexe A.1, partie B) : il repose sur une spécification qui ne retient que la tendance générationnelle comme variable explicative et prend donc la forme suivante :
[2]
![[2]](./loadimg.php?FILE=POPU/POPU_2202/POPU_2202_0325/EQUA_2.jpg)
[2]
17 À partir des estimateurs des fonctions fo et ft il est possible de calculer les probabilités [11] po et pt permettant de déduire le coefficient de correction c et de construire la population contrefactuelle Pc en appliquant ce coefficient de correction aux pondérations des ménages de la population P. Dans la section suivante, Pc est la population sur laquelle peuvent être calculés les « indicateurs d’inégalités avec appariement aléatoire entre diplômés avec contrôle de la génération ».
18 Afin d’identifier plus clairement l’apport de l’introduction d’un contrôle générationnel (c’est-à-dire les vecteurs de coefficient δk et γk), on a également construit une population contrefactuelle Pd ne cherchant pas à contrôler les effets générationnels dans l’estimation des effets de l’homogamie éducative. Cette méthode s’appuie sur la comparaison de l’estimation des modèles [3] avec diplôme (appariement observé) et [4] sans diplôme (appariement aléatoire théorique) dont les spécifications ne retiennent pas de tendance générationnelle et peuvent donc s’écrire de la manière suivante :
[3]
![[3]](./loadimg.php?FILE=POPU/POPU_2202/POPU_2202_0325/Equa_3.jpg)
[3]
[4]
![[4]](./loadimg.php?FILE=POPU/POPU_2202/POPU_2202_0325/Equa_4.jpg)
[4]
19 Dans la section suivante, les résultats produits à partir des équations [3] et [4] sont appelés « indicateurs d’inégalités avec appariement aléatoire entre diplômés sans contrôle de la génération ». Les résultats sont très proches de la méthode usuelle de la littérature utilisant les tableaux de contingence présentée dans la section II.
3. Les indices d’inégalités retenus
20 À partir des populations P, Pc et Pd, il est possible de calculer différents indicateurs d’inégalités. Les travaux sur l’homogamie éducative ont généralement recours au coefficient de Gini. Pour aller au-delà de cette appréhension synthétique des inégalités, le Gini est complété par d’autres indicateurs permettant de mieux analyser les marges de la distribution. Pour rendre compte de ces marges, deux indicateurs complémentaires sont retenus : (i) le taux d’aisés, un indicateur utilisé dans les débats récents sur le rétrécissement des « classes moyennes » et défini comme le rapport entre le nombre d’individus dont le niveau de vie est supérieur à deux fois le niveau de vie médian et le nombre total d’individus dans la population (Atkinson et Brandolini, 2011 ; Courtioux et al. , 2021) ; (ii) l’indicateur classique de concentration des richesses qui est la part de revenu (mesuré par le niveau de vie) détenue par les 10 % de ménages les plus riches [12]. Ces indicateurs sont complétés par le taux de pauvreté monétaire qui permet de rendre compte des effets de l’homogamie éducative dans le bas de la distribution des revenus.
21 Afin de pouvoir tester la significativité statistique des écarts sur ces indicateurs entre populations observée et contrefactuelle, on a procédé par bootstrap. Par construction, les populations Pc et Pd sont issues de la population P. Sur la base de leur poids dans P, on a tiré aléatoirement avec remise les ménages présents afin d’obtenir 1 000 échantillons de la population P (P1, P2,..., P1000) de la même taille que P. Sur la base des résultats obtenus précédemment, on peut déduire pour chacun des échantillons de P les échantillons de Pc et de Pd correspondants (Pc1, Pc2,... Pc1000 ; Pd1, Pd2,... Pd1000). En calculant les indices d’inégalités sur ces échantillons, il est alors possible d’apprécier la significativité statistique des résultats présentés dans la section suivante.
II. Résultats
22 Un résultat préliminaire important concerne l’estimation des modèles logistiques multinomiaux correspondant aux équations [1], [2], [3] et [4]. Pour les quatre modèles estimés, l’ensemble des coefficients sont statistiquement significatifs au seuil de 1 % (tableaux annexes A.1 et A.2). Utiliser ces estimateurs pour corriger les pondérations afin d’obtenir les deux populations contrefactuelles Pc et de Pd (voir supra), permet de produire une analyse robuste. De même, lorsque l’on s’intéresse aux indicateurs d’inégalités calculés sur ces populations contrefactuelles (figure 1), la question de savoir s’il est possible d’interpréter directement ces différences ou si elles sont de trop faible ampleur pour être statistiquement significatives se pose. Le résultat de tests de différences de moyennes effectués à l’aide de techniques de bootstrap indique que les écarts entre ces indicateurs sont statistiquement significatifs pour toutes les années de la période analysée ici (tableau annexe A.3).
Effet de l’homogamie éducative sur l’évolution de quatre indicateurs d’inégalités de niveau de vie

Effet de l’homogamie éducative sur l’évolution de quatre indicateurs d’inégalités de niveau de vie
23 Les résultats présentés ici montrent l’importance de contrôler des effets de génération pour estimer l’impact de l’homogamie éducative sur les inégalités de niveaux de vie lorsque l’on produit des indicateurs en population générale.
24 Tout d’abord, la figure 1 montre clairement que l’effet de l’homogamie éducative sur les inégalités de niveau de vie est plus important au sein des générations qu’entre les générations : la courbe grise est systématiquement supérieure à la courbe noire. Techniquement, un appariement aléatoire entre diplômés, qui corrige l’homogamie éducative, réduit plus les inégalités quand cet appariement a lieu au sein d’une génération que lorsque cet appariement concerne toutes les générations. Cette différence est de l’ordre de 0,3-0,7 point de pourcentage sur la période pour le coefficient de Gini, de 0,2-0,6 pour le pourcentage de revenu des 10 % les plus aisés, de 0,1-0,4 pour le taux de pauvreté et de 0,2-0,5 pour le taux d’aisés. Une explication de ce résultat réside dans le fait que les diplômes, moins courants au sein des générations les plus anciennes, ont moins d’effets sur l’échelle des revenus. Calculer un indicateur d’inégalités sans contrôler des effets de génération revient alors à « mettre en couple » des individus des anciennes générations moins diplômées mais avec une situation relativement favorable sur le marché du travail du fait de leur expérience, avec des individus plus jeunes et plus diplômés pour lesquels le diplôme constitue un élément plus important pour caractériser l’insertion sur le marché du travail et les différences de revenus.
25 Au-delà de la différenciation claire de ces deux effets du point de vue démographique, la population contrefactuelle qui « fait sens » est celle qui tient compte du fait que les mises en couple se font principalement entre des individus de générations proches. La distance entre la courbe grise et la courbe noire commentée supra (figure 1) permet d’illustrer l’étendue de l’erreur que l’on est susceptible d’avoir en population générale si l’on utilise une méthode qui ne contrôle pas des effets de générations. Ce sont donc les indicateurs obtenus avec appariement aléatoire entre diplômes avec contrôle de la génération qui doivent être comparés aux indicateurs usuels calculés en population générale (respectivement les courbes en noir et en pointillés sur la figure 1).
26 De ce point de vue, la figure 1 met en lumière un résultat important : l’effet d’augmentation des inégalités porté par l’homogamie éducative concerne principalement le haut de la distribution des revenus et valide en cela l’hypothèse formulée précédemment à partir des résultats de Bouchet-Valat (2014). En effet, la figure 1 montre que pour les trois indicateurs qui prennent en compte le haut de la distribution (le Gini, le pourcentage de revenu des 10 % les plus aisés, le taux d’aisés), l’absence d’homogamie éducative réduit les inégalités observées [13], alors que ce résultat n’apparaît pas clairement quand on ne contrôle pas l’appartenance générationnelle. À l’inverse, pour le taux de pauvreté, qui est un indicateur décrivant le bas de la distribution, l’appariement aléatoire entre diplômes avec contrôle de la génération diffère peu du taux de pauvreté observé et la différence n’est pas stable sur la période, si bien qu’il est difficile d’interpréter de manière évidente l’effet de l’homogamie.
27 L’avantage de la méthode proposée est qu’elle permet de comparer plus directement ces résultats avec les indicateurs usuels d’inégalités en population générale. Sans surprise, ils confirment les résultats présents dans la littérature, à savoir qu’il s’agit d’un phénomène de faible ampleur. L’importance des effets mesurés se traduit par l’impact de l’homogamie éducative sur le Gini, largement inférieur à celui qui est par exemple associé à la redistribution opérée par les prélèvements obligatoires et les prestations sociales. Blasco et Picard (2019) montrent que ces derniers, pris dans leur ensemble, réduisent le Gini d’environ 20 % en 2016. L’ampleur de l’influence de l’homogamie éducative sur les inégalités demeure cependant supérieure à l’effet des réformes successives du système socio-fiscal sur la période récente : les travaux d’André et al. (2017) soulignent que les mesures intervenues en 2013, 2014 et 2015 ont influencé à la baisse sur le Gini de l’ordre de 0,002 point par an, alors qu’un appariement aléatoire entre diplômés réduit le Gini de 0,004 point en moyenne : sur les trois années, les réformes ont donc largement compensé l’effet de l’homogamie éducative sur les inégalités.
28 Concernant l’ampleur des effets mesurés pour les autres indicateurs d’inégalités de la figure 1, il n’existe pas pour l’instant de travail comparable. Néanmoins, sur la distribution des hauts revenus, en prenant comme référence l’augmentation du taux d’aisés qui a suivi la crise de 2008 (Courtioux et al., 2020), il est possible d’observer que l’impact moyen de l’homogamie éducative sur le taux d’aisés (0,2 point de pourcentage) reste inférieur à « l’effet crise » qui est de 0,5 point de pourcentage entre 2008 et 2011.
Conclusion
29 Cette note de recherche présente une méthode originale pour estimer l’impact de l’homogamie éducative sur les niveaux vie en population générale, appliquée aux données françaises pour la période 2003-2013. Les résultats montrent que l’homogamie éducative augmente très faiblement (mais de manière statistiquement significative) les inégalités de niveau de vie, principalement par un effet générationnel, dans la partie supérieure de la distribution des revenus.
30 Il est important de bien distinguer l’influence de l’homogamie éducative des autres effets, notamment en contrôlant l’évolution de la structure des diplômes au fil des générations. Les résultats invitent à poursuivre l’analyse des effets générationnels et des conséquences de l’homogamie éducative sur les hauts revenus, en particulier dans une perspective comparative européenne. De ce point de vue, la France se caractérise par une baisse générale de l’homogamie éducative depuis les années 1970, exception faite du groupe d’individus issus des filières d’élite pour lesquels elle s’est renforcée (Bouchet-Valat 2014). Dans ce cadre, une analyse comparative permettrait d’identifier l’hétérogénéité de l’impact de l’homogamie éducative dans des cadres institutionnels variés, tant du point de vue du degré de ressemblance entre les conjoints et de l’évolution du système éducatif que de l’architecture du système socio-fiscal.
Annexes
Estimateurs des modèles d’appariement avec tendance générationnelle (logit multinomial)


Estimateurs des modèles d’appariement avec tendance générationnelle (logit multinomial)
Estimateurs des modèles d’appariement sans tendance générationnelle (logit multinomial)


Estimateurs des modèles d’appariement sans tendance générationnelle (logit multinomial)
Moyennes des différences entre indicateurs d’inégalités sur les différentes populations obtenues par bootstrap


Moyennes des différences entre indicateurs d’inégalités sur les différentes populations obtenues par bootstrap
Notes
-
[1]
À titre d’exemple, l’homogamie éducative augmente aux États-Unis depuis les années 1960 (notamment pour les niveaux d’éducation les plus élevés, cf. Chiappori et al., 2020), tandis qu’elle a diminué en Grande-Bretagne depuis les années 1970 (Halpin et Chan, 2003). Une diminution de l’homogamie des moins diplômés et une hausse pour les plus diplômés a également été observée en Espagne entre 1920 et 1970 (Esteve et Cortina, 2006).
-
[2]
Cet article a fait l’objet d’un corrigendum publié le 18 juin 2015 (Greenwood et al., 2015), la version initiale de la recherche surestimant très largement l’impact de l’homogamie sur les inégalités de niveau de vie.
-
[3]
L’expression « effet générationnel » est préférée à celle d’« effet d’âge » compte tenu de la méthode et des données utilisées (cf. infra). On applique dans ces modélisations l’année de naissance des individus qui, contrairement à l’âge, a l’avantage de demeurer constante quelle que soit l’année de référence.
-
[4]
À titre illustratif, cinq catégories sont mobilisées par Greenwood et al. (2014), trois par Cornelson et Siow (2016), quatre par Boertien et Permanyer (2019).
-
[5]
Au sens de Atkinson et Bandolini (2011), c’est-à-dire les ménages dont le niveau de vie est deux fois supérieur au niveau de vie médian.
-
[6]
Notamment Harmenberg (2014) et Courtioux et Lignon (2015b) pour une comparaison de la méthode par imputation avec d’autres méthodes.
-
[7]
Pour les diplômes associés à de faibles effectifs mais à une forte homogamie (les grandes écoles par exemple), le coefficient c est largement inférieur à 1 dans la mesure où la probabilité théorique (pt) est bien en deçà de la probabilité observée (po).
-
[8]
Contrairement à certains articles (Greenwood et al., 2014), on a choisi de ne pas écarter a priori les ménages complexes qui peuvent réunir plusieurs couples et représentent 5 % des ménages des ERFS 2003-2013. Par ailleurs, les couples de même sexe ne sont pas pris en compte. Il est malheureusement impossible de les étudier sur la base de l’ERFS compte tenu de leurs effectifs trop faibles (0,4 % de la base) et des potentielles erreurs de déclaration sur le sexe qui peuvent avoir des conséquences importantes, au regard du faible nombre de couples co-résidents de même sexe.
-
[9]
Le choix du sexe est conventionnel. Dans la mesure où ce travail est effectué seulement sur des couples constitués, il n’y a pas de raison de penser que ce choix influence les résultats.
-
[10]
Cette variable, exprimée en nombre d’années, correspond à l’écart entre l’année de naissance de l’individu et l’année 1970 prise ici de manière conventionnelle comme référence.
-
[11]
Pour une présentation plus détaillée de la méthode, voir Afsa-Essafi (2003).
-
[12]
L’étude des indicateurs d’inégalités de niveaux de vie est réalisée ici en retenant comme unité de base le ménage.
-
[13]
Avec une exception pour l’année 2006 dans les cas du Gini et du pourcentage de revenu détenu par les 10 % les plus aisés (figure 1). Des décompositions effectuées par ailleurs montre que cette année est particulièrement sensible aux corrections de pondération appliquées aux diplômés d’un doctorat en santé. L’effet moyen observé pour les autres années conduit à considérer cette année 2006 comme non représentative de l’impact moyen de l’homogamie éducative sur les inégalités.