1 Le développement de l’enseignement supérieur apparaît, au niveau national et européen, comme une priorité des politiques publiques dans la mesure où il contribue à la croissance économique et permet aux individus d’avoir de meilleures trajectoires sur le marché du travail. Afin d’appréhender les effets de la poursuite des études sur les carrières individuelles, une approche courante en économie consiste à considérer l’éducation comme un investissement qui engendre des coûts (frais d’inscription, renonciation au salaire que l’individu pourrait percevoir en intégrant directement le marché du travail) et génère des bénéfices pour les individus (plus grande stabilité dans l’emploi, meilleur salaire, etc.). La mise en perspective des coûts et des bénéfices de l’éducation permet d’en évaluer le rendement.
2 Cette mesure de la rentabilité des études a été particulièrement développée par la théorie du capital humain afin d’expliquer les décisions individuelles de poursuivre ou non des études. Sur ce point, les travaux disponibles montrent que l’éducation supérieure est un investissement particulièrement rentable pour les individus. Ces analyses ont toutefois deux limites. D’une part, elles reposent sur des indicateurs en « moyenne » qui ne permettent pas d’apprécier la diversité des rendements et la part d’individus concernés par des rendements faibles voire négatifs. D’autre part, les gains pris en compte concernent uniquement les salaires perçus sur le marché du travail et non les autres éléments qui concourent à la formation du revenu (minima sociaux, impôts, etc.).
3 Dans ce cadre, cet article a pour objectif de fournir, pour le cas français, une analyse de la distribution des rendements du supérieur en décomposant l’effet de différents transferts socio-fiscaux. Les résultats produits dans cet article peuvent être interprétés sous deux angles distincts. Ils peuvent être simplement appréhendés comme des indicateurs de la rentabilité des études et la manière dont le système-socio fiscal influe sur le rendement de l’éducation. Ils peuvent également être mis en perspective avec la théorie du capital humain afin de mesurer les risques de l’investissement éducatif ou évaluer dans quelle mesure les instruments socio-fiscaux peuvent jouer un rôle d’incitation à la poursuite des études.
4 Sur la base d’un modèle de simulation des carrières individuelles, le taux de rendement moyen de l’éducation que nous calculons (9,6 %) semble indiquer, dans la lignée de la littérature sur le sujet, qu’il existe de fortes incitations à poursuivre des études supérieures. Notre analyse permet néanmoins d’apporter deux éléments originaux. Tout d’abord, nous montrons que les rendements sont fortement hétérogènes au sein de la population. En effet, la part des rendements négatifs est loin d’être négligeable ce qui conduit à relativiser la conclusion des travaux qui montrent que l’investissement éducatif est rentable du point de vue individuel (OCDE, 2008). Le découpage par diplôme que nous effectuons indique que l’hétérogénéité des rendements est faible pour les diplômes des grandes écoles mais importante parmi les diplômes universitaires. Une part non négligeable de ces derniers est d’ailleurs caractérisée par des rendements négatifs.
5 Un second apport de notre démarche est de montrer que certains instruments sociaux et fiscaux (notamment les allocations chômage et les pensions de retraite), dont l’impact peut sembler faible sur le rendement moyen ou médian augmentent les rendements dans le bas de la distribution : il constitue de ce point de vue une garantie de valorisation des études supérieures.
6 L’Union européenne a adopté en 2010 la stratégie EU2020 dont le but est de promouvoir un cadre économique favorable à une croissance « durable, intelligente et inclusive ». Pour atteindre cet objectif, la Commission européenne a fixé une série de priorités parmi lesquelles le développement de l’enseignement supérieur occupe une place centrale car il participe à l’« Europe de la connaissance » voulue par l’Union européenne. Cependant, les modalités de financement de ce choix stratégique ne sont pas clairement tranchées. Pour fournir des éléments d’analyse économique sur cette question, l’Organisation de coopération et de développement économique (OCDE) produit un certain nombre d’indicateurs financiers pour ses pays membres. Ces indicateurs s’inspirent assez largement de la théorie économique où l’éducation est considérée comme un investissement dont le rendement peut être évalué pour les individus, l’État, ou la société dans son ensemble ; ils sont respectivement qualifiés de rendement privé, de rendement public et de rendement social. Dans ce cadre, c’est l’indicateur de rendement privé retenu par l’OCDE – le taux de rendement interne (TRI) – qui nous intéresse particulièrement. Le TRI est une mesure de la rentabilité de l’investissement éducatif inspirée des travaux de Becker (1964) qui correspond au taux d’escompte égalisant les bénéfices et les coûts réels privés de l’investissement éducatif sur le cycle de vie
7 – Maguain (2007). Il est généralement interprété comme un indicateur de l’incitation à se former pour les individus. Jusqu’en 2008 [1], l’OCDE fournit des TRI moyens différenciés par niveau de diplôme pour une série de pays. Dans l’ensemble, il apparaît que, malgré une forte disparité internationale [2], les rendements de l’enseignement supérieur ont un niveau sensiblement plus élevé que le niveau des taux d’intérêt par exemple. Pour l’OCDE (2008, p.14), l’existence de rendements moyens élevés justifie la mise en place d’une politique de partage des coûts (cost-sharing) entre les différents bénéficiaires du système éducatif, à savoir l’État, les ménages et les entreprises. Il nous semble cependant qu’une telle recommandation ne peut pas faire l’économie d’une analyse de la distribution des rendements et donc des risques liés à l’investissement éducatif pour les étudiants. En effet, si les risques de valorisation des études supérieures et l’hétérogénéité des TRI sont importants, la mise en place d’une politique de cost-sharing peut s’avérer contradictoire avec des objectifs d’incitation à poursuivre des études supérieures. Ces dernières années, les mouvements étudiants qui ont suivi l’augmentation des droits d’inscription en Angleterre en 2011 (les autres composantes du Royaume-Uni, notamment l’Écosse n’étaient pas concernées) et au Québec en 2012 soulignent la sensibilité de la question des incitations financières à la poursuite d’études supérieures. Une augmentation uniforme des droits d’inscription augmente les coûts privés de l’éducation mais également le risque de faible valorisation lié à l’incertitude qui caractérise les positions occupées tout au long de la carrière. Dans ce cadre, l’élasticité de la demande d’éducation à la distribution des risques peut ne pas être homogène au sein d’une génération et dépendre notamment de l’origine sociale et de la capacité qu’ont les familles des étudiants ou la collectivité à couvrir ce risque, toutes choses égales par ailleurs [3]. En outre, il convient de noter, de manière plus générale, que l’analyse de la distribution des rendements de l’éducation est une voie d’analyse encore peu développée en économie (Dickson et Harmon, 2011).
8 Dans ce travail, nous cherchons à identifier les éléments du système socio-fiscal les plus favorables financièrement à la poursuite d’études supérieures. Nous utilisons un modèle de microsimulation dynamique dédié à l’analyse des liens entre éducation et marché du travail pour décomposer les rendements privés des études supérieures et préciser les éléments du système socio-fiscal qui concourent à réduire les risques de faible valorisation des études. De ce point de vue, l’objectif principal de cet article est de compléter les résultats de l’OCDE en analysant la distribution des TRI du supérieur sur la base d’un exercice de microsimulation dynamique [4] qui considère la diversité des carrières salariales. Plus généralement, l’originalité de notre démarche se caractérise par i) la prise en compte la plus complète possible du système socio-fiscal [5] et de ses effets non linéaires, ii) une attention particulière portée à l’hétérogénéité du système éducatif et aux conséquences qu’elle peut avoir sur la diversité des carrières individuelles. Les estimations de rendements que nous produisons ici ne reposent pas sur une modélisation structurelle causale des choix éducatifs ; néanmoins, elles ont vocation à être intégré à l’estimation d’un modèle structurel dynamique caractérisé par une information imparfaite des individus sur leurs propres talents et sur leur carrière future. Ces aspects qui renvoient à la distinction entre rendements ex ante et rendements ex post sont discutés plus en détail dans la suite de cet article.
9 Dans la première partie, nous exposons la méthodologie de décomposition des rendements privés de l’éducation. Trois points y sont successivement abordés. Nous présentons tout d’abord la méthode retenue pour calculer les rendements de l’enseignement supérieur ainsi que son interprétation économique, puis, dans un deuxième temps, la manière dont un modèle de microsimulation dynamique permet de produire un panel générationnel stylisé nécessaire au calcul des rendements qui nous intéressent ici. Dans la mesure où ce panel stylisé n’est pas directement observé, nous retenons le terme de pseudo-cohorte pour le qualifier [6]. Un troisième point situe et discute notre méthode par rapport aux travaux qui portent sur les risques liés aux choix éducatifs. Dans une seconde partie, nous présentons les résultats obtenus quant à la distribution des rendements de l’enseignement supérieur et sa décomposition en fonction des différents éléments du système socio-fiscal français.
Décomposer les rendements de l’enseignement supérieur par un exercice de microsimulation
10 Selon Maguain (2007), le calcul du TRI est l’une des deux méthodes traditionnellement utilisées pour estimer les rendements privés de l’éducation. L’objectif du TRI est de mesurer la rentabilité des choix éducatifs en comparant les coûts et les bénéfices qu’ils génèrent tout au long du cycle de vie. En effet, un individu qui investit dans sa formation en retire, tout au long de sa carrière, des gains financiers (notamment du fait de l’existence d’un supplément de revenu selon son niveau d’éducation) mais il subit également des coûts directs et indirects (cf. infra). Dans ce cadre, le TRI correspond au taux qui égalise les bénéfices et les coûts réels sur le cycle de vie : il permet en ce sens d’apprécier le rendement marginal de l’éducation. L’avantage du TRI est qu’il fournit une approche globale de la rentabilité des investissements éducatifs privés qui peut être déclinée par groupes d’individus (niveau de diplôme, sexe, etc.). Une deuxième méthode d’évaluation des rendements a été initiée par Mincer (1974). Elle repose sur l’estimation d’équations de salaire où l’éducation intervient à travers le nombre d’années d’études comme variable explicative. Sous certaines hypothèses, cette méthode permet notamment d’apprécier l’effet marginal d’une année d’étude supplémentaire sur le niveau de salaire à partir de la lecture directe des coefficients de l’équation de salaire. Elle permet de pallier l’absence de données de panel sur longue période ; en effet, ces données rarement disponibles sont nécessaires pour calculer un TRI. En revanche, on reproche généralement à cette méthode de ne pas tenir compte des probabilités d’être au chômage dans le calcul des rendements alors même que ces probabilités varient fortement selon le niveau d’étude – cf. notamment Maurin (2009), p. 56. Si les résultats obtenus par ces deux méthodes convergent généralement, nous nous concentrons ici sur celle du TRI. En effet, le TRI est davantage adapté à l’estimation d’une distribution des rendements différenciée par niveau de diplôme qui va au-delà des indicateurs moyens proposés par l’OCDE (2008). Par ailleurs, cet indicateur correspond à la formulation canonique des déterminants théoriques des choix éducatifs de Becker (1964).
11 L’objectif de cette partie est d’exposer une méthode qui permet de produire une distribution des TRI en tenant compte de l’hétérogénéité des flux financiers (coûts, bénéfices) liée à l’investissement éducatif. Dans un premier point, nous rappelons la méthode de calcul du TRI et discutons de l’interprétation économique que l’on peut donner à une distribution des rendements. Dans un deuxième point, nous présentons brièvement le modèle de microsimulation auquel nous avons recours pour identifier les éléments nécessaires au calcul du TRI et à sa décomposition. Enfin, dans un dernier point, nous présentons l’apport de notre modélisation par rapport aux résultats disponibles dans la littérature économique, notamment celle sur l’évaluation des rendements ex ante.
La mesure des rendements de l’éducation
12 En économie, depuis les travaux de Becker (1964), l’indicateur des rendements de l’éducation tient une place centrale dans l’analyse des choix éducatifs. Dans ce cadre, si X correspond aux flux financiers liés au choix de ne pas se former et Y correspond aux flux financiers liés au choix de se former, il est possible d’identifier le retour financier d’un investissement éducatif. En effet, le choix de se former induit un coût d’opportunité en début de cycle de vie qui correspond aux flux de revenu que l’individu aurait obtenu sur le marché du travail s’il n’avait pas décidé de se former. Par ailleurs, le gain lié à la poursuite de la formation se mesure en référence aux flux financiers que l’individu aurait eus s’il n’avait pas été formé. Nous considérons ici que l’âge auquel l’individu peut se porter sur le marché du travail (c’est-à-dire 16 ans, l’âge minimum légal de fin d’étude) est le premier âge pertinent pour ce calcul ; il est donc de manière conventionnelle indicé à 1. Dans ce cadre, si a est l’indice de l’âge et m correspond à la durée de vie d’un individu, le taux de rendement interne r, vérifie l’égalité suivante :

∑a =1 (1a+ r)aa
(1) = 0
13 Pour un individu ayant choisi d’investir dans l’éducation, la valeur actualisée des flux financiers Y intègre à la fois les coûts directs et les revenus nets qu’il perçoit tout au long de sa vie en fonction de sa formation initiale. Les revenu nets correspondent ici à l’ensemble des revenus (salaires, minima sociaux, allocations diverses, pensions de retraite) nets d’impôts. En effet, durant les premières périodes (correspondant à la poursuite des études), l’individu ne perçoit aucun revenu mais effectue des dépenses (frais d’inscription [7], etc.). En revanche, une fois son insertion sur le marché du travail effectuée, il perçoit un salaire correspondant à son niveau de diplôme. Nous pouvons donc nous attendre à ce que Y soit nul ou négatif durant les premières périodes correspondant à la formation et positif dès lors que l’individu perçoit un salaire. Pour l’individu, la valeur actualisée des flux financiers X correspond quant à elle aux coûts d’opportunité : il s’agit de la chronique de revenus nets qu’il aurait perçus en intégrant directement le marché du travail. En plus des coûts directs dont il doit s’acquitter, l’individu qui décide de poursuivre ses études renonce donc à un revenu durant sa période de formation. Une fois ses études initiales terminées, il peut néanmoins espérer bénéficier d’un supplément de revenu par rapport à une situation où il n’aurait pas été formé compte tenu de son niveau d’éducation plus élevé : Y > X sur cette période du cycle de vie.
14
Pour chaque individu diplômé du supérieur, nous
définissons comme le flux financier net lié à
l’investissement dans l’éducation à l’âge a. Si Wa est
le salaire de l’individu à l’âge a, Da le montant de
l’allocation chômage, Ra le montant de la pension de
retraite, Ma les minima sociaux (minimum vieillesse
et RMI [8]), Ta le montant des impôts (composé de la
somme de l’impôt sur le revenu
et de la taxe sur la
valeur ajoutée
) et Xa le coût d’opportunité, ce
flux net peut s’écrire :

15 avec

16 Où l’indice supérieur d indique que les flux correspondent à ceux d’un individu diplômé.
17 Le montant de chacune des composantes dépend des règles du système socio-fiscal. À un âge donné, plusieurs de ces composantes peuvent être nulles : elles dépendent bien évidemment de la situation vis-à-vis du marché du travail à l’âge a (les personnes qui ne sont pas en emploi ont par exemple un salaire Wa égal à zéro) mais également de la situation et des revenus de l’individu aux âges précédents (le montant et les droits aux allocations chômages résultent des chroniques passées de salaire et de la durée au chômage).
18 Bien évidemment, il n’est pas possible, pour un individu donné, d’observer simultanément le flux de ses revenus avec diplôme et le flux de ses revenus sans diplôme. Dans une perspective strictement comptable, pour estimer un TRI individuel, il est donc nécessaire de poser des hypothèses complémentaires. Dans cet article, nous adoptons une approche générationnelle qui consiste à comparer les chroniques de revenus des sans diplôme d’une génération avec les chroniques de revenus de chacun des diplômés de cette même génération - les implications de ce choix sur l’interprétation qu’il est possible de faire de nos résultats sont discutées infra. Plus précisément, nous retenons un revenu contrefactuel des diplômés du supérieur (Xa ) pour chaque âge qui correspond au revenu moyen des individus du même âge qui ne sont pas diplômés du supérieur et ont terminé leurs études [9]. Sur la base du nombre d’individus non diplômés du supérieur ayant terminé leurs études à cet âge (Na ) et de leurs revenus, le contrefactuel d’un diplômé du supérieur à l’âge a peut donc être calculé comme suit :

(4) Xa =
Na
19
Dans notre analyse, le taux de rendement individuel
est donc estimé sur le flux financier net individuel
des diplômés du supérieur () disponible sur
l’ensemble de leur cycle de vie. Il inclut les éléments
décrits précédemment : les revenus nets d’impôt
(revenus salariaux, allocations chômage et minima
sociaux), les revenus des non diplômés du supérieur
qui permettent d’évaluer le supplément de revenu lié
à l’obtention d’un diplôme et le coût d’opportunité
durant la période de formation initiale. Le TRI
individuel calculé pour une cohorte donnée permet
alors de disposer d’une distribution des rendements
de l’enseignement supérieur et d’identifier les
diplômés les plus exposés à des risques de faible
valorisation [10]. Pour estimer les effets des
différentes composantes du système socio-fiscal sur
la distribution des rendements, nous procédons à une
décomposition comptable : l’effet propre du salaire
sur le TRI est estimé en fixant conventionnellement
Da , Ra , Ma et Ta à 0 à la fois dans le calcul de
et
dans celui de Xa ; l’effet propre du salaire et des
allocations chômage est calculé en fixant
conventionnellement Ra , Ma et Ta à 0 à la fois dans le
calcul de
et dans celui de Xa et ainsi de suite.
20 Une décomposition des TRI selon cette méthode suppose de disposer de deux éléments : les chroniques de revenus des diplômés du supérieur sur l’ensemble de leur cycle de vie et les chroniques de l’espérance de revenu des individus non diplômés de la même cohorte sur l’ensemble de leur cycle de vie. De telles données ne sont pas disponibles. Pour surmonter cette difficulté et produire de telles données, nous avons recours à un exercice de microsimulation dynamique.
Prendre en compte la diversité des carrières : un exercice de microsimulation dynamique
21 Une solution permettant de surmonter l’absence d’enquêtes longitudinales suffisamment renseignées pour estimer les rendements de l’éducation avec l’approche présentée précédemment consiste à simuler la diversité des carrières des individus et les chroniques financières pour une pseudo-cohorte. Dans cet article, nous utilisons un modèle de microsimulation dynamique qui permet de produire de telles données.
22 À partir de la méthode de calcul des rendements du supérieur présentée précédemment, nous calculons un TRI pour chaque individu diplômé présent dans notre base de données. De ce point de vue, notre méthodologie diffère de celle d’O’Donoghue (1999) qui calcule un TRI moyen pour plusieurs sous-populations : sur la base des données en coupe présentes dans le modèle Euromod, cet auteur reconstruit des pseudo-chroniques de revenus en faisant la moyenne des revenus par âge et par niveau de diplôme. Le principal intérêt de son approche est d’utiliser le modèle de microsimulation statique Euromod pour calculer des revenus nets de cotisations sociales et d’impôt contrairement à ce qui est généralement fait dans les comparaisons internationales sur le sujet – par exemple Psacharopoulos (1994). La technique utilisée permet de décomposer les différents éléments du revenu net des individus, mais elle n’est pas à proprement parler de la microsimulation dynamique. En effet, la simulation du système socio-fiscal a lieu en amont de la construction des chroniques de pseudo-revenu. Elle ne permet donc pas d’intégrer les dispositifs sociaux et fiscaux en prenant en compte les trajectoires individuelles (le niveau des retraites dépendant de la carrière salariale, le droit et le montant de l’allocation chômage des chroniques passées de salaires, etc.).
23 Un premier apport de notre modélisation dynamique est de simuler les éléments des trajectoires individuelles nécessaires au calcul sur barème des dispositifs socio-fiscaux pour mener des analyses économiques dans le champ de l’éducation [11]. De ce point de vue, pour le cas français, elle prolonge les travaux de Courtioux (2010) et Courtioux et alii (2012) i) en améliorant le calcul des allocations chômages et des pensions de retraite (nous nous appuyons sur la simulation d’un revenu brut sur barème et non sur l’application d’un taux forfaitaire au salaire net simulé) et ii) en introduisant de nouveaux éléments du système socio-fiscal français nécessaires si l’on veut produire une analyse en termes incitatifs (notamment le revenu minimum). Un deuxième apport de notre exercice de microsimulation par rapport à O’Donoghue (1999) mais également à l’OCDE (2008) consiste à tenir compte de la dépendance d’état dans la simulation des trajectoires individuelles. En effet, dans notre modélisation, les transitions entre différents états ne se réduisent pas à un processus markovien d’ordre 1 (cf. infra). Pour ce faire, certains travaux s’appuient sur des techniques de microsimulation dynamiques, par exemple, ceux de Flannery et O’Donoghue (2011) qui comparent les différents modes de financement de l’éducation du supérieur envisageables en Irlande [12] ; ou encore ceux de Courtioux et alii (2011) ou d’Allègre et alii (2012). Néanmoins, ces études ne s’intéressent pas aux rendements privés des études supérieures, à l’exception de Courtioux (2010, 2012) qui calcule des TRI pour la France. Par rapport aux résultats disponibles, l’apport principal de cet article est d’éclairer les enjeux de l’architecture du système socio-fiscal sur la constitution des rendements de l’enseignement supérieur.
24 Le principe de notre modèle de microsimulation dynamique est relativement simple : sur la base de l’hétérogénéité ex ante d’une cohorte au sortir de la formation initiale (sexe, diplôme, âge d’entrée sur le marché du travail), il simule les trajectoires des individus tout au long de leur cycle de vie en fonction de leurs caractéristiques individuelles. Le système socio-fiscal tel qu’il est simulé dans notre modèle intègre les revenus assurantiels (allocations chômage et pensions de retraite), les impôts (limités ici à l’impôt sur le revenu (IR) et à la TVA) et les minima sociaux (RMI et minimum vieillesse) en prenant comme base la législation de 2008 ; pour assurer la cohérence des estimations, tous les montants monétaires sont exprimés en euros 2005. La simulation sur barème du système socio-fiscal suit un ordre bien précis qui correspond aux assiettes légales utilisées pour le calcul des différents transferts. Nous respectons également cet ordre lors de la présentation de nos résultats concernant l’impact du système socio-fiscal sur la distribution des rendements (cf. infra). Nous simulons tout d’abord les droits au chômage et à la retraite car ils sont basés sur le salaire brut. Une fois ces revenus intégrés, nous pouvons simuler l’impôt sur le revenu. Le minimum vieillesse et le RMI sont introduits en aval de l’IR car ils y échappent. Le dernier temps de la simulation est celui de la TVA qui doit prendre en compte les revenus disponibles pour la consommation après impôt sur le revenu, y compris les minima sociaux.
25 Dans la suite de cette partie, nous développons la présentation du modèle en définissant d’une part la base de données de départ sur laquelle est effectuée l’exercice et en présentant d’autre part les étapes de la simulation des trajectoires des individus tout au long de leur cycle de vie (en l’occurrence, la simulation des transitions sur le marché du travail, des revenus tirés du marché du travail et du système socio-fiscal français).
La base de données en entrée de la simulation
26 En entrée de la simulation, nous utilisons une base de données artificielle représentant la cohorte des individus de la génération 1970. Elle respecte leur hétérogénéité en termes de sexe, de diplôme et d’âge de fin d’études. Dans sa construction, cette base de données artificielle estime la répartition par diplôme, sexe et âge de fin d’études de la génération 1970 par celle des individus nés entre 1968 et 1972 disponible dans les enquêtes Emploi en continu (EEC) 2003-2007. Pour développer avec précision une étude sur les rendements de l’enseignement supérieur, le modèle distingue vingt diplômes dont quinze de l’enseignement supérieur. Cette base en entrée a comme limite de ne représenter que des pseudo-célibataires (cf. infra) et non des ménages ou des familles (ce qui a notamment un impact sur la simulation du système socio-fiscal). Ce croisement nous permet de distinguer 457 catégories avec leurs pondérations relatives : par exemple, les femmes diplômées d’une école de commerce entrant sur le marché du travail à 25 ans constituent une de ces catégories. Nous calons alors les pondérations effectives des observations sur le nombre de naissances en 1970 (850 000). Sur la base de ces 457 classes nous créons 120 201 observations artificielles pour lesquelles nous tirons aléatoirement un secteur industriel (correspondant à un regroupement en sept catégories des codes de la Nomenclature d’activités française (NAF) de l’Insee) dans la distribution observée de l’enquête Emploi selon le sexe et le diplôme pour les individus en emploi de moins de 30 ans. Une fois qu’un individu s’est vu affecter un secteur, ce dernier ne change plus durant le processus de simulation de la carrière ; nous considérons qu’il s’agit d’un élément de spécialisation du diplôme qui influe sur les transitions entre emploi et non-emploi sur le marché du travail ainsi que sur les salaires, toutes choses égales par ailleurs (cf. annexe).
27 Par ailleurs, pour tenir compte de la corrélation entre niveau d’éducation et espérance de vie, nous attribuons à chaque individu selon son diplôme et son sexe une fonction de survie. La simulation de la mortalité selon le sexe, l’âge et l’éducation que nous retenons reprend les résultats de Courtioux et alii (2011, p. 847-848, p. 862-865). Pour obtenir leurs estimations, les auteurs commencent par transformer les tables de mortalités par âge et catégories socioprofessionnelles disponibles dans Robert-Bobée et Monteil (2005) en table de mortalité par type de diplôme en imputant ces tables aux individus de l’enquête Emploi 2003-2005. La modélisation retient un effet génération, un effet lié à l’âge et une constante. Chacun de ces effets comprend un effet moyen et un effet propre au diplôme des individus. Afin de pouvoir projeter les taux de mortalité par diplôme obtenus par cette méthode au cours du temps, la modélisation reprend les projections de mortalité pour 1995-2049 selon le sexe disponibles dans Vallin et Meslé (2001) et applique une formule de lissage inspirée de celle appliquée dans le modèle Destinie de l’Insee (1999).
28 Dans les calculs présentés supra, pour obtenir la pondération individuelle à chaque âge, on corrige la pondération originelle de cette fonction de survie. Dans notre simulation, la pondération de l’individu diminue alors au fil de sa trajectoire pour devenir quasi-nulle en fin de cycle de vie. Le graphique 1 présente quelques résultats agrégés des fonctions de survie utilisées lors de la simulation pour la pseudo-cohorte 1970.
29 À partir de cette base artificielle, le modèle simule la trajectoire des individus tout au long de leur cycle de vie selon une démarche en trois temps : la simulation des transitions sur le marché du travail, la simulation des salaires et la simulation du système socio-fiscal. La simulation débute à 16 ans, âge légal d’entrée sur le marché du travail, et se termine à 100 ans. Nous posons comme hypothèse qu’à cet âge tous les individus de la pseudo-cohorte sont décédés.
fonction de survie agrégée selon le sexe et le diplôme

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
âge
16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
Hommes (diplômés Bac+5 et plus) Hommes (diplômés < Bac+5) Hommes (non diplômés)
Femmes (diplômées Bac+5 et plus) Femmes (diplômées < Bac+5) Femmes (non diplômées)
fonction de survie agrégée selon le sexe et le diplôme
Note : les lignes correspondant aux femmes diplômées de niveau Bac+5 et plus et celle correspondant aux femmes diplômées avec un diplôme inférieur au niveau Bac+5 sont très proches et se confondent sur le graphique.Champ : pseudo-cohorte de naissance 1970.
Les transitions sur le marché du travail
30 Le modèle simule les transitions des individus sur la base d’une périodicité annuelle.
31 Une première étape consiste à construire des profils agrégés de taux d’activité et de chômage par âge pour la pseudo-cohorte. On s’appuie pour cela sur l’estimation du modèle détaillé en annexe. Dans la simulation présentée ici, pour calculer les profils d’activité de la pseudo-cohorte, nous faisons l’hypothèse que le taux de chômage courant se fixe à 8 % pour toute la durée de la simulation. Ceci permet d’aboutir à une représentation du devenir de la pseudo-cohorte de naissance vis-à-vis du marché du travail en fonction du temps écoulé : le chronogramme d’activité estimé pour la pseudo-génération 1970 est présenté dans le graphique 2.
32 Une deuxième étape vise à déterminer les transitions qu’effectuent les individus tout au long de leur cycle de vie en fixant comme contrainte le respect des cibles agrégées par âge déterminées dans la première étape. Pour cela, nous avons besoin d’un modèle permettant d’estimer la probabilité relative de transition sur le marché du travail des individus de la génération correspondant à notre pseudo-cohorte. Pour estimer ces probabilités individuelles à un âge donné et conditionnellement à la trajectoire passée, nous nous appuyons sur les transitions annuelles observées dans l’enquête Emploi 2003-2007 et des modèles logit (cf. annexe). Un certain nombre de variables de contrôle susceptibles d’influencer les transitions sur le marché du travail (le fait d’être une femme et d’avoir un jeune enfant, ou, pour les seniors, d’avoir franchi un âge où se concentrent les transitions vers l’inactivité, etc.) sont introduites pour ne pas biaiser les autres estimateurs des modèles logit. Dans la simulation, les variables de contrôle directement liées à l’âge n’ont pas d’effet car elles servent à déterminer les probabilités relatives de transition entre différents états d’individus ayant le même âge. Il convient de noter que l’effet des pics d’âge de transitions vers l’inactivité par exemple, sont pris en compte dans la simulation grâce aux cibles agrégées par âge. Par ailleurs, les variables de contrôle liées à la situation familiale ne sont pas introduites dans la simulation car le modèle de microsimulation n’a pas vocation à simuler ici la formation de la famille ni l’évolution de la situation familiale tout au long du cycle de vie.
chronogramme d’activité

80 %
60 %
40 %
20 %
0 %
Âge
Inactivité Chômage Emploi
chronogramme d’activité
Note : hypothèse d’un taux de chômage courant de 8 % durant toute la période.Champ : pseudo-cohorte de naissance 1970.
33 La simulation s’appuie sur un processus pseudo-markovien : connaissant les caractéristiques d’un individu en t, on établit les probabilités relatives qu’il transite vers un état donné à partir d’un modèle estimé en amont. Sur la base du tirage d’une variable aléatoire et d’un calage sur marge, on attribue in fine à l’individu une position en t + 1. Les caractéristiques déterminantes des probabilités relatives de transition sont le diplôme, le sexe, le secteur d’activité, la position précédemment occupée et des éléments de la trajectoire individuelle passée (durée d’inactivité).
34 Pour cette simulation des transitions sur le marché du travail, nous faisons l’hypothèse que les probabilités relatives de transition sont indépendantes de la cohorte de naissance. En revanche, à caractéristiques individuelles et trajectoire passée données, la probabilité effective de transiter vers tel ou tel état du marché du travail à un certain âge dépend des caractéristiques propres de la génération, c’est-à-dire son chronogramme d’activité et sa composition (notamment en termes de diplômes).
Les salaires
35 Une fois les transitions des individus obtenues pour l’ensemble du cycle de vie, nous simulons le salaire net des personnes en emploi conditionnellement à leurs caractéristiques individuelles et leur trajectoire passée. La modélisation des salaires s’appuie sur des équations de gain à la Mincer et cherche à capturer des profils de revenus par âge tout au long de la carrière, différenciés selon le diplôme : le traditionnel effet de l’expérience est ici estimé par diplôme. La forme de l’équation de gain estimée est la suivante :

(5) log (we,s,i ) = αe ei + βe xe,i +δe (xe,i)
+ ηe,s s + μe fe,i + εe,i
36 Où we,s,i est le salaire mensuel tel qu’il est renseigné dans l’enquête Emploi 2003-2007 pour l’individu i avec un diplôme e, travaillant dans le secteur s et où x est le nombre d’années d’expérience, f une indicatrice indiquant si l’individu est dans un emploi public, et εe est un résidu conditionnel au diplôme e (les résultats de ces estimations sont présentés et commentés plus en détails dans l’annexe).
37 Il convient ici de noter que l’utilisation d’équations à la Mincer ne nous sert pas directement à estimer les rendements ; elles servent à produire un estimateur sans biais de l’effet du diplôme et de l’expérience en emploi (conditionnellement au diplôme) afin de projeter les salaires des individus sur le cycle de vie. En économie de l’éducation, on considère généralement que l’estimation de l’effet du diplôme sur les salaires à partir d’équations de gain à la Mincer est biaisée car les résidus de l’équation de salaire ne sont pas indépendants du nombre d’années d’études du fait de l’endogénéité des choix éducatifs et des capacités productives intrinsèques que l’on mesure également à travers le salaire : ceux qui décident de se porter directement sur le marché du travail ont des caractéristiques productives différentes (talent, valorisation plus forte de la vie hors travail, etc.) de ceux qui poursuivent leurs études. Notre stratégie de modélisation permet de corriger fortement ce type de biais. En effet, nous nous situons à un niveau suffisamment fin pour considérer que les caractéristiques productives individuelles intrinsèques jouant sur les choix éducatifs sont capturées uniquement par l’effet diplôme : l’hétérogénéité inobservée est beaucoup moins forte que dans les spécifications usuelles qui regroupent les diplômes par niveau d’éducation ou nombre d’années d’études.
38 La distribution empirique des résidus (εei) conditionnelle au diplôme est également utilisée durant la simulation. Dans la mesure où nous nous situons à un niveau fin de diplôme, nous interprétons ce résidu comme le résultat d’un appariement entre l’individu et son poste de travail : la distribution de εei nous donne alors les Lois empiriques de ces répartitions pour chaque diplôme e. En cohérence avec cette interprétation, sur la base d’un tirage aléatoire, le modèle de microsimulation affecte à chaque individu un résidu observé conditionnellement à son diplôme dès qu’il obtient un emploi. Durant la simulation du cycle de vie, le résidu est conservé jusqu’à ce que l’individu quitte une situation d’emploi. Quand il retrouve une situation d’emploi, un nouveau résidu est tiré.
39 Cette stratégie d’estimation connait bien évidemment des limites pour identifier des changements de l’effet propre du diplôme sur le salaire au fil des générations. Dans la mesure où nous travaillons sur des données en coupe cherchant à rendre compte d’effets de carrière différenciés selon le diplôme à un niveau relativement fin, nous ne pouvons appréhender que très imparfaitement les effets de type « dévalorisation du diplôme » au fil des cohortes sortant du système éducatif liés à la démocratisation de l’enseignement supérieur. En effet, la fenêtre d’observation de l’enquête Emploi 2003-2005 est trop courte pour identifier simultanément un effet carrière du diplôme et un effet cohorte au niveau du diplôme. Nous considérons donc par hypothèse qu’il n’y a pas d’effets croisés diplôme et cohorte sur les salaires. Ceci revient à supposer que les mesures des effets de cohortes sur le rendement de l’éducation généralement mis en avant par la littérature sur le sujet passent principalement par deux effets que nous contrôlons : i) un effet de composition de la cohorte en termes de diplômes - pour mémoire, nos estimations sont faîte un niveau plus fin que ce qui est habituellement proposé dans la littérature, notamment Buchinsky et Leslie (2010), Chamoz et alii (2013)-, ii) un effet d’exposition au chômage de la cohorte. Dans la simulation, le contrôle de ce dernier effet passe alors par celui de l’effet propre du taux de chômage courant sur le chronogramme d’activité de la cohorte ; le jeu des probabilités relatives de non emploi des individus au sein de la cohorte (cf. supra, la modélisation des carrières) détermine alors le nombre d’années passées effectivement en emploi (l’expérience), et l’effet propre de l’expérience accumulée sur le salaire individuel à un moment donné du temps (qui est estimé dans l’équation de salaire).
40 Les salaires bruts sont nécessaires pour calculer sur barèmes les allocations chômage et les pensions de retraite. La différence entre le salaire brut et le salaire net dépend du statut de l’individu (cadre, non cadre, fonctionnaire) et du montant de sa rémunération brute par rapport au barème fixé : il existe plusieurs tranches qui servent à fixer la proportion et l’assiette des cotisations sociales. Dans le modèle de microsimulation, on calcule le salaire brut à partir du salaire net sur la base du barème de l’année 2008. Au terme de cette opération, nous disposons d’une chronique annuelle des positions vis-à-vis du marché du travail et des montants de salaires bruts perçus qui permettent de calculer sur barème le montant des allocations chômage et le montant des pensions de retraite.
Les allocations chômage
41 Pour les allocations chômage, seule l’ARE (allocation d’aide au retour à l’emploi) est simulée. L’ARE est calculée à partir de la position occupée sur le marché du travail et des chroniques de salaires passés. Perçoit une allocation chômage, pour une période donnée, tout individu qui occupe la position « chômage » et qui a ouvert, par ses cotisations salariales passées, ses droits à l’assurance chômage. Les taux appliqués et les modalités précises de mise en œuvre de ce calcul sont ceux découlant de la législation de 2008 pour laquelle on retient une version simplifiée calée sur un pas annuel.
Les pensions de retraite
42 Le modèle simule les principales composantes du système de retraite : le régime général, le régime complémentaire et le régime public. Le montant des pensions est établi en fonction des transitions et des revenus individuels sur le marché du travail (salaires et allocations chômage). La retraite de base est calculée à partir des vingt-cinq meilleures années de salaire. Les retraites complémentaires (AGIRC, ARRCO) sont simulées en fonction du statut individuel : les individus dont le diplôme est au moins équivalent à un Bac+5 sont considérés comme cadres et bénéficient du régime AGIRC. Les retraites du secteur public sont simulées et appliquées aux individus qui ont travaillé plus de quarante-et-un ans dans le secteur public. Le système de retraite qui s’appliquera à la génération 1970 laissera une certaine flexibilité quant à l’âge de départ à la retraite (notamment grâce au système de bonus/malus) ; or l’élasticité de l’âge de départ à la retraite à ces incitations financières est difficile à estimer. Par ailleurs, il convient également de noter que ces modifications de comportements qui ont lieu à la fin du cycle de vie et leurs implications financières sont par construction moins valorisées dans le calcul du TRI. Ainsi, nous avons choisi de retenir une version très simplifiée des déterminants de la liquidation des droits à la retraite : à partir de 65 ans les personnes qui sont ou deviennent inactives liquident leurs droits à la retraite. Pour mémoire, les profils d’activité sont estimés à partir d’individus qui ont la possibilité légale de partir à la retraite à 60 ans (cf. annexe), ce qui se traduit par une relative précocité du passage en inactivité de la pseudo-cohorte (graphique 2). Notre pseudo- cohorte correspond donc au cas où il n’y aurait pas d’ajustement des comportements d’activité de la génération née en 1970 aux nouvelles règles de calcul des droits à la retraite [13].
L’impôt sur le revenu
43 L’impôt sur le revenu est calculé pour chaque étape du cycle de vie en appliquant les barèmes de 2008 aux revenus des individus. Pour chaque année, le revenu brut global est approximé par la somme des salaires nets (avec un abattement de 10 %), des allocations chômage nettes et des pensions de retraite nettes. Conformément à la législation en vigueur, le RMI est écarté. Par convention, le revenu net global imposable est égal au revenu brut global. On applique alors le taux d’imposition correspondant aux différentes tranches de revenu. Par ailleurs, le modèle retenu simule également la décote. Pour être exprimés en euros 2005, on applique à l’ensemble des différents seuils de l’impôt sur le revenu un coefficient d’actualisation obtenu sur la base des indices de prix à la consommation de l’Insee.
Le revenu minimum
44 La simulation des minima sociaux dans le modèle se fait en aval des précédents éléments puisqu’ils ne font l’objet d’aucun prélèvement direct analysé ici et prennent la forme d’allocations différentielles distribuées sous condition de ressources. Pour calculer le RMI et le minimum vieillesse, nous appliquons la législation en vigueur en 2008. Pour le minimum vieillesse, nous avons attribué une allocation pleine ou différentielle aux individus de plus de 65 ans dont les revenus étaient inférieurs au plafond de ressources fixé par la sécurité sociale. De façon similaire, nous attribuons à l’individu le RMI de base total ou différentiel en fonction du plafond de ressources fixé. Le RMI socle est complété par un intéressement et une prime de retour à l’emploi si l’individu reprend une activité l’année suivante. Dans le cas d’une reprise d’emploi, les individus peuvent cumuler leur allocation avec leur revenu d’activité pendant trois mois. Au-delà de trois mois, la législation distingue deux cas : celui où les individus exercent une activité mensuelle de moins de 78 heures et celui où ils travaillent plus que ce quota. Dans le premier cas, les individus ont droit à une prime forfaitaire de 150 euros par mois du quatrième au douzième mois assorti d’une prime de retour à l’emploi égale à 1000 euros [14]. Dans le second, ils ont uniquement droit à un abattement de 50 % sur leurs revenus dans le calcul de leur allocation différentielle. Pour déterminer si l’individu travaille plus ou moins de 78 heures mensuelles, nous effectuons une comparaison entre leur salaire brut annuel et le Smic brut annuel pour 78 heures de travail mensuel.
taux d’effort pour acquitter la TVA selon l’âge et le niveau de revenu

Taux d’effort
20 %
15 %
10 %
5 %
0 %
21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 Âge
R1 R2 R3
taux d’effort pour acquitter la TVA selon l’âge et le niveau de revenu
Champ : personnes seules.Note : médiane glissante sur la base d’une tranche de 10 ans. Le revenu est composé des revenus d’activité et des revenus sociaux. R1 : revenus annuels < 10 Smic mensuels ; R2 : 10 Smic mensuels < revenus annuels ≤ 3,5 Smic annuels ; R3 revenus annuels > 3,5 Smic annuels.
La TVA
45 Les montants de TVA acquittés individuellement font l’objet d’un calcul basé sur des taux d’effort qu’il est possible d’estimer à partir de l’enquête Budget des familles (Insee). Théoriquement, le montant acquitté et sa dynamique tout au long de la vie dépendent des choix inter-temporels relatifs à l’arbitrage entre consommation et épargne. Ces choix sont susceptibles d’être influencés par des facteurs familiaux (on peut par exemple penser qu’il est plus difficile d’épargner durant la phase de son cycle de vie que l’on consacre à élever des enfants). Ils sont donc complexes à appréhender sur la base des données en coupe dont nous disposons. Dans ce cadre, pour retenir une dynamique crédible d’acquittement de la TVA tout au long du cycle de vie, nous décidons de retenir une valeur centrale : la médiane. Par ailleurs, pour rester cohérent avec notre appréhension des autres éléments du revenu indépendamment du patrimoine, nous décidons d’appliquer au revenu disponible un taux d’effort en fonction de l’âge et du revenu. Trois tranches de revenus sont ainsi distinguées auxquelles correspondent respectivement trois séries de taux d’efforts (graphique 3). Dans la simulation, suivant la tranche de revenu à laquelle l’individu appartient à un âge donné, il est alors possible d’estimer le montant de TVA dont il s’acquitte.
46 Notre modèle apporte donc des éléments complémentaires aux méthodes de calcul des TRI proposées dans la littérature (Flannery et O’Donoghue, 2011 ; OCDE, 2008 ; O’Donoghue, 1999) dans la mesure où il tient compte de la dépendance d’état tout au long de la trajectoire (16 à 100 ans), de l’hétérogénéité des diplômes à un niveau fin et des différentes composantes du système socio-fiscal. Toutefois, certaines limites de notre simulation doivent être discutées.
47 Une première limite tient au fait que la microsimulation dynamique est utilisée pour simuler un panel dont nous ne disposons pas. Si cette simulation repose sur des hypothèses raisonnables, nous sommes limités par la fenêtre d’observation de l’enquête Emploi pour les estimations en amont de la simulation (équations de gain, déterminants des probabilités relatives de transition sur le marché du travail). Néanmoins, pour une analyse des rendements sur la pseudo-cohorte 1970, les hypothèses retenues et les tests de robustesse permettent de dresser un premier bilan - pour une appréciation de la robustesse de l’exercice de microsimulation, cf. l’annexe.
48 Une deuxième limite tient au fait que la formation de la famille n’est pas simulée. Du point de vue du système socio-fiscal, ceci conduit à exclure de l’analyse la dimension familiale des politiques sociales et fiscales qui est pourtant importante en termes redistributifs – cf. Bechtel et alii (2005). Cela ne nous permet pas de rendre compte, dans la simulation, des potentielles polarisations de trajectoires liées aux dynamiques familiales. Néanmoins, les résultats présentés infra peuvent permettre à terme de mener une analyse plus complète de l’effet propre des trajectoires familiales sur les interactions entre les positions occupées tout au long du cycle de vie et leurs conséquences sur la distribution des rendements des études supérieures.
49 Enfin, plus généralement, la manière stylisée avec laquelle nous construisons une pseudo-cohorte de référence correspond à une hypothèse de régime stationnaire avec pérennité du système socio-fiscal. Elle suppose que les conditions macroéconomiques et démographiques durant toute la période du cycle de vie de la pseudo-cohorte ne se traduisent pas par des contraintes de financement conduisant à revoir l’architecture du système socio-fiscal, ou du moins qu’elles n’affectent pas les anticipations des individus sur les trajectoires possibles liées à l’obtention de tel ou tel diplôme.
Rendements ex post, rendements ex ante et risques liés à l’investissement éducatif
50 Avant de présenter nos résultats, il est important de mettre en perspective la distribution des TRI que nous produisons avec la littérature économique qui s’intéresse aux risques liés à l’investissement éducatif. Comme nous l’avons souligné en introduction, l’analyse de la dispersion des rendements est importante du point de vue des choix d’éducation : dans une logique d’investissement, on peut penser que les individus qui sont confrontés au choix de poursuivre leurs études se basent davantage sur la distribution des rendements que sur les rendements moyens, ces derniers ne permettant pas d’appréhender la disparité des gains et les risques liés à l’obtention d’un niveau de diplôme donné. Dans ce cadre, sur la base de modèles structurels, certains travaux montrent que le risque joue de manière non négligeable sur les choix d’éducation (Belzil et Leonardi, 2007 ; Brodaty et alii, 2014).
51 Dans la distribution des rendements, il convient de distinguer, selon Cunha et Heckman (2007), deux éléments : la variabilité qui renvoie à des facteurs inobservables du point de vue de l’économètre et le risque qui relève de facteurs inobservables par l’économètre et l’individu (chance, événements non anticipés, etc.). Pour décrire l’incertitude pesant sur les rendements, Cunha et Heckman (2007) établissent une distinction entre les rendements ex post (rendements réalisés correspondant à la dispersion intégrant à la fois la variabilité et le risque) et les rendements ex ante (rendements anticipés par les individus dont la dispersion porte uniquement sur le risque). Autrement dit, si les rendements ex post correspondent à un indicateur comptable sur la rentabilité des études, les rendements ex ante renvoient eux à la distribution qui préside aux choix de se former des individus.
52 De ce point de vue, la distribution des rendements que nous produisons correspond à une distribution ex post qui tient compte de façon très précise de la diversité des filières, des transitions de long terme sur le marché du travail et des effets du système socio-fiscal. Néanmoins, comme expliqué précédemment, nous faisons nos estimations sur une pseudo-cohorte et pas sur une cohorte observée. Si nous avions voulu produire une distribution de rendement ex post cohérente pour la cohorte 1970, il aurait fallu intégrer à la simulation l’évolution de la situation sur le marché du travail depuis 1986 et son impact sur le chronogramme d’activité de la cohorte. De même, il aurait fallu adapter le calcul sur barème de la législation socio-fiscale à son évolution sur la période considérée. De ce point de vue, produire une distribution de rendements ex post peut avoir un intérêt en termes d’histoire économique, mais il ne permet pas l’analyse d’un système socio-fiscal donné appliqué à des trajectoires de vie.
53 Cependant, il est également possible d’arguer que notre méthode ne permet pas d’identifier des rendements ex ante stricto sensu. En effet, si notre méthode de calcul permet d’identifier les diplômes les plus rentables sur la base d’individus appartenant à la même génération, elle ne tient pas compte du fait que les individus qui choisissent de ne pas poursuivre leurs études peuvent avoir des caractéristiques productives (talents, valorisation de la vie hors travail, etc.) différentes de ceux qui décident de les poursuivre (cf. équation 4). Cette absence de contrefactuel « pur » ne nous autorise pas à interpréter directement les résultats que nous obtenons comme une distribution ex ante au sens de Cunha et Heckman (2007) – c’est-à-dire une distribution des rendements qui préside aux choix d’éducation des individus.
54 Pour qu’une telle interprétation soit néanmoins possible, il est nécessaire de poser certaines conditions. Ces dernières sont évidemment restrictives, mais elles s’inscrivent dans un ensemble de travaux visant à ouvrir de nouvelles perspectives de recherche en économie de l’éducation, notamment celles relatives aux risques. Il convient de noter que la perspective d’interprétation que nous retenons ici ne permet pas de lever l’hypothèse selon laquelle face aux choix éducatifs « les adolescents raisonnent comme des économètres » que Manski (1993) suggère pourtant de lever en s’appuyant plus systématiquement sur des données subjectives pour analyser la formation des anticipations de salaire par les individus en étude.
55 Plus précisément, cinq hypothèses doivent être posées : 1) il y a une incertitude sur les revenus futurs pour des individus ayant obtenu un diplôme donné ; 2) l’étudiant ne connait pas ses propres capacités/ talents pour apprendre, ni les effets de ces capacités/ talents sur ses revenus futurs ; 3) les choix éducatifs ne concernent pas une année marginale d’éducation mais une filière ; 4) le choix de la filière éducative est irréversible, il est fait à l’âge où l’étudiant peut entrer légalement sur le marché du travail ; 5) sans présager de la réussite de sa scolarité et des potentielles réorientations en cours d’étude, les individus savent qu’ils peuvent sortir du système éducatif avec un diplôme du supérieur.
56 L’introduction d’une dose d’incertitude sur les revenus futurs (hypothèse 1) est une voie de recherche en développement de l’analyse économique des choix éducatifs ; mais les travaux développés jusqu’à présent retiennent un niveau de spécification des diplômes relativement grossier – cf. par exemple, Buchinsky et Leslie (2010), ou Flannery et O’Donoghue (2011).
57 L’hypothèse 2 revient à considérer que la dispersion dans les rendements est principalement due à des facteurs inobservables par les individus et par l’économètre, ce qui n’est pas totalement le cas comme le montrent Cunha et Heckman (2007). En effet, selon les estimations de ces derniers qui s’appuient dans leur identification sur un jeu d’hypothèses sur les préférences indiviudelles et la structure du marché, 50 % de la distribution des rendements est connue par les individus au moment où ils effectuent leur choix d’éducation. Dans le cadre de notre estimation, nous pouvons néanmoins penser que le niveau de découpage fin des diplômes que nous retenons réduit fortement la part de la dispersion due à la variabilité, c’est-à-dire aux caractéristiques observables par les individus et non observables par l’économètre (notamment le « talent »). Par ailleurs nous produisons une distribution des rendements ex ante à 16 ans, c’est-à-dire quelques années en amont du choix effectif de poursuivre des études supérieures. On peut donc penser que la part de distribution des rendements correspondant au risque est plus importante que dans Cunha et Heckman (2007) : durant la poursuite de son parcours scolaire dans le secondaire, l’élève continuera à obtenir des informations sur ses propres capacités à poursuivre des études.
58 Concernant la troisième hypothèse, suivant l’argument d’Altonji et alii (2012), nous pensons qu’une analyse en termes de filières éducatives et de spécialisations est une voie de recherche qui permet de renouveler l’approche habituelle en termes d’année marginale d’éducation. De plus, il est également possible d’argumenter qu’une approche en termes de filières correspond mieux au système d’enseignement supérieur français – cf. par exemple Courtioux et alii (2011).
59 Les hypothèses 3 et 4 correspondent quant à elle à une simplification d’un processus de choix plus complexe : les choix éducatifs sont par nature séquentiels ; de plus, chaque séquence de choix a des conséquences irréversibles sur les séquences suivantes. Il convient cependant de noter que cette simplification ne constitue pas une limite consubstantielle à notre modèle de microsimulation : la distribution ex ante des rendements pourrait être compilée chaque année pour un individu en étude secondaire dont on connaîtrait la probabilité de réussir tel ou tel diplôme du supérieur en fonction par exemple de sa trajectoire académique passée. De ce point de vue, le modèle de microsimulation dont nous tirons quelques résultats simples pour cet article a bien vocation à terme à être intégré à un modèle structurel de choix éducatif plus complet permettant de rendre compte de la dynamique des choix avec une spécification de l’incertitude sur les trajectoires et de la contrainte budgétaire correspondante beaucoup plus précise que ce qui est habituellement développé dans ce champ de la littérature économique.
60
La cinquième hypothèse est une simplification qui
nous semble éclairante pour analyser les risques de
valorisation dans l’enseignement supérieur. En effet,
en toute rigueur, l’intégralité des rendements
correspondant au choix de poursuivre des études
supérieures devrait inclure les trajectoires
individuelles qui se sont traduites par un échec dans
l’obtention d’un diplôme tertiaire quel que soit la
nature du diplôme et les diverses réorientations
testées lors du curriculum. L’OCDE (2010) suggère
qu’en France, environ 21 % des étudiants
correspondent à cette situation. Cependant, nous
appuyant principalement sur l’enquête Emploi, nous
ne sommes pas en mesure d’identifier au sein des non
diplômés du supérieur ceux qui sont entrés dans le
système d’enseignement supérieur mais n’ont
jamais été diplômés. On peut néanmoins penser
qu’inclure cette partie de la distribution conduirait à
accentuer encore nos résultats sur les risques de
faible valorisation (cf. infra) : ce type de trajectoire
est très coûteux en termes de coût d’opportunité dans
la mesure où il se traduit généralement par une entrée
tardive sur le marché du travail : dans l’équation (1),
l’âge a à partir duquel la différence () est
positive est plus élevé.
61 Une autre limite à cette cinquième hypothèse est qu’elle n’intègre pas les potentiels effets d’auto-sélection des élèves liée à la connaissance qu’ils ont de leur capacité à poursuivre des études. La connaissance de ces capacités fait notamment référence aux biais psycho-sociaux identifiés par des sociologues - par exemple Convert (2010). Ils correspondent notamment au fait que les étudiants issus des milieux défavorisés ont du mal à se projeter dans des études longues et intenses compte tenu de leurs faibles dotations en capital économique, social et culturel. Ces biais commencent à être intégrés à l’analyse économique ; par exemple Flacher et Harari-Kermadec (2011) l’intègrent dans leur cadre et relativisent fortement les résultats analytiques de Gary-Bobo et Trannoy (2008). Manski (1993) insiste également sur la nécessité de lever l’hypothèse usuelle d’homogénéité de formation des anticipations pour analyser les choix éducatifs même si lui-même ne cherche pas à la mettre en œuvre.
62 Dans notre analyse, le principe de décomposition permis par la microsimulation nous permet de discuter des effets d’une levée partielle de cette hypothèse. En effet, nous pouvons par exemple considérer alternativement la distribution des rendements ex ante pour les individus qui considèrent ne pouvoir accéder qu’au segment le moins prestigieux de l’enseignement supérieur et ceux qui considèrent pouvoir accéder de toute façon au segment le plus prestigieux. Par ailleurs, il convient de noter que la capacité à pouvoir réussir des études supérieures ou même à réussir une grande école ne permet pas a priori d’anticiper avec précision l’endroit où l’individu se trouverait dans la hiérarchie des salaires s’il avait décidé de ne pas suivre des études supérieures : les « talents » d’un artisan ayant un niveau de revenu élevé ne sont pas forcément les mêmes que les « talents » nécessaires pour rentrer dans une grande école. En information parfaite, ce dernier point justifie le fait de comparer, dans le calcul des rendements, les revenus des diplômés du supérieur – notamment les individus issus des filières prestigieuses – avec ceux des non-diplômés du supérieur.
63 En résumé, la convention comptable que nous avons retenue pour les équations (1) et (2) n’est pas consubstantielle aux techniques de microsimulation et au modèle que nous utilisons. Il reste possible de calculer des rendements ex ante à d’autres âges ou avec d’autres groupes de contrôle. Par exemple, le rendement ex ante des études supérieures pourrait être calculé pour les individus qui viennent d’obtenir le Bac c’est-à-dire en excluant du contrefactuel X les individus qui n’ont pas obtenu ce diplôme. Dans cet article, nous avons choisi de présenter des rendements calculés à 16 ans car cela permet de montrer plus directement l’apport de notre approche et la manière dont elle permet de compléter les résultats de l’OCDE déjà disponibles. Dans une perspective d’analyse économique des choix d’éducation, qui prendrait au sérieux l’information imparfaite que les individus ont sur leurs capacités productives et sur la manière de les valoriser durant leur cycle de vie, les résultats que l’on peut obtenir à l’aide de la microsimulation dynamique ont vocation à enrichir une base de données observant des choix d’éducation afin de pouvoir caractériser dans l’estimation d’un modèle structurel, la sensibilité des individus aux risques de faible valorisation des études toutes choses égales par ailleurs.
Résultats
64 À partir de la pseudo-cohorte produite par l’exercice de microsimulation, il est possible de calculer un indicateur de rendement moyen comparable à celui de l’OCDE. L’ensemble des publications de l’OCDE donne une fourchette indicative des rendements de l’enseignement supérieur pour la France : en 2003, la moyenne des TRI privés était de 8,4 % pour les hommes et 7,4 % pour les femmes ; ce taux moyen était de 12,2 % pour l’ensemble en 1999 (OCDE, 2003). Sur ce point, notre modèle de microsimulation permet d’obtenir des résultats proches puisque nous estimons le rendement moyen à 12,9 % pour notre pseudo-cohorte.
65 Dans la suite de cette partie, nous commençons par présenter l’effet du système socio-fiscal sur la distribution des TRI en nous appuyant sur une décomposition de l’effet marginal des instruments socio-fiscaux. Puis, sur la base d’une décomposition de la distribution des TRI par type de diplôme, nous analysons la mesure dans laquelle les effets identifiés sont vérifiés pour les différents segments de l’enseignement du supérieur en distinguant les grandes écoles des diplômes universitaires.
Un impact non négligeable du système socio-fiscal sur la distribution des rendements
66 Le graphique 4 présente la distribution des taux de rendement de l’enseignement supérieur. Pour le mode de calcul des coûts d’opportunité, en cohérence avec le cadre analytique développé ici, nous avons choisi de conserver celui présenté supra qui prend comme contrefactuel pour l’ensemble du cycle de vie (y compris la période de formation initiale) le revenu moyen des non-diplômés du supérieur.
67 Dans le cadre analytique défini précédemment (la capacité d’un individu à poursuivre des études lui est inconnue), c’est cette distribution qui préside aux choix d’entreprendre une formation supérieure : tout se passe donc comme si les individus, avant de poursuivre leurs études supérieures pouvaient observer les risques de valorisation. L’intensité de l’incitation financière à poursuivre des études est différente selon la sensibilité des individus à ces risques : un individu accordera d’autant plus d’importance aux valeurs prises par le TRI dans le bas de la distribution que son aversion au risque est forte.
68 Le graphique 4 montre que les prestations et les prélèvements réduisent les rendements dans le haut de la distribution mais les augmentent dans le bas de la distribution. Ce résultat n’a rien de trivial : il indique que les diplômés du supérieur avec une dynamique de revenu défavorable bénéficient davantage du système socio-fiscal que la moyenne des non-diplômés. Ce résultat ne correspond pas en-soi à un objectif de politique publique, mais il en constitue bien un effet collatéral qui a son importance dans le cadre d’une politique plus générale visant à promouvoir le développement de l’enseignement supérieur. Il indique qu’en dynamique, une redistribution s’effectue en faveur des diplômés du supérieur ayant les trajectoires les moins avantageuses et en défaveur des non-diplômés du supérieur. Dans la mesure où ces catégories bénéficient du même système socio-fiscal, c’est la dynamique des trajectoires d’emploi propre au diplôme et les risques sociaux qui pèsent sur certains diplômés du supérieur qui expliquent cet effet différentiel. Dans nos simulations, pour un individu diplômé du supérieur ayant un rendement négatif (après prestations et prélèvements), c’est-à-dire un des diplômés connaissant la trajectoire la plus défavorable, la durée moyenne de non-emploi entre 25 et 35 ans est de 3,4 périodes [15] ; alors qu’un individu non-diplômé du supérieur connaît en moyenne 2,7 périodes de non-emploi.
69 Quand on s’intéresse à la distribution des rendements (cf. tableau 1), il apparaît que, pour l’ensemble des diplômés du supérieur, la médiane des TRI est de 12,4 % [16]. Cette valeur centrale est assez proche de la moyenne mais ne rend pas compte de l’ampleur des risques de valorisation des études supérieures. En effet, on note que le dernier quartile (P75) et le premier quartile (P25) sont estimés respectivement à 20,1 % et 6,8 %. Globalement ces niveaux élevés de rendement ne remettent pas en cause les conclusions générales de l’OCDE sur l’intérêt financier à se former : ces taux restent supérieurs au taux de croissance et aux taux d’intérêt de long terme de type Obligations assimilables du Trésor (OAT).
centiles des taux de rendement de l’enseignement supérieur

40 %
35 %
30 %
25 %
20 %
15 %
10 %
5 %
0 %
- 5 %
- 10 %
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Avant prestations et prélèvements Après prestations et prélèvements
centiles des taux de rendement de l’enseignement supérieur
Note : pour la courbe « Avant prestations et prélèvements », les valeurs des TRI correspondant aux centiles les plus bas ne sont pas reportées car nous ne pouvons pas les définir de manière robuste.Champ : diplômés du supérieur, pseudo-cohorte 1970. Lecture : 5 % des étudiants (ceux compris entre le 85ème et le 90ème décile) ayant effectué des études supérieures en ont retiré un rendement, après prestations et prélèvements, compris entre 25 % et 30 %.
70 Néanmoins, les diplômés du supérieur ont un risque non négligeable de ne pas valoriser financièrement leurs études. En effet, la part des rendements négatifs s’établit à 10,9 %. De manière générale, la mesure des risques de faible valorisation dépend de la méthode retenue pour appréhender les coûts d’opportunité durant la période de formation. En effet, dans sa formulation même, le TRI tend à valoriser plus fortement les premières périodes du cycle de vie. En reprenant le mode de calcul des coûts d’opportunité de Courtioux (2010) [17], nous trouvons une part de rendement négatif sensiblement plus faible. Cette part se fixe à 4 % ce qui conduit à une différence d’environ 6 points de pourcentage avec la méthode retenue ici. La différence de taux de rendement peut être très importante dans le bas de la distribution [18]. Cependant, la différence est moins importante pour les valeurs plus centrales de la distribution : 1,4 point pour le premier quartile, 1,5 point pour le dernier quartile et 2,4 points pour la médiane. Ceci suggère que les queues de distribution (notamment les rendements du bas de la distribution) sont assez sensibles au mode de calcul retenu.
71 Pour mémoire, Courtioux (2012) montre que la mise en place d’un Prêt à remboursement conditionnel au revenu a un impact négatif sur le TRI médian de l’ordre de 1/10ème de point de pourcentage. Le tableau 1 indique qu’à ce même point de la distribution des TRI, l’impact de l’assurance chômage et celui de l’impôt sur le revenu [19] sont négatifs mais environ 6 fois plus importants ; l’impact du système de retraite est négligeable ; l’impact des minima sociaux négatif mais huit fois plus important. Seule la TVA a un impact positif sur le TRI médian de l’ordre de 3/10ème de point de pourcentage. Ce résultat suggère que l’effet incitatif ou désincitatif d’une mesure visant à augmenter la contribution des diplômés du supérieur doit bien être appréciée au regard de l’ensemble du système socio-fiscal. En outre, on constate que les différents instruments socio-fiscaux n’ont pas le même impact voire le même signe selon le point de la distribution des TRI auquel on s’intéresse. En effet, le tableau 1 montre que pour le premier quartile (qui peut être interprété comme un risque de faible valorisation de l’enseignement supérieur), la prise en compte des allocations chômage dans le calcul des rendements n’a pas d’effet par rapport à la situation où l’on considère uniquement le salaire net des individus. Les pensions de retraite jouent quant à elles de manière positive.
(a) | (b) | (c) | (d) | (e) | (f) | |
Salaire net… | … et Allocation chômage | … et Pensions de retraite | … et Impôt sur le revenu | … et Minima sociaux | … et TVA. | |
Premier quartile (P25) | 6,9 % | 6,9 % | 7,1 % | 6,8 % | 6,1 % | 6,3 % |
Médiane (P50) | 13,6 % | 13,0 % | 13,0 % | 12,4 % | 11,6 % | 11,9 % |
Dernier quartile (P75) | 22,9 % | 21,3 % | 21,3 % | 20,1 % | 19,3 % | 19,8 % |
Part des rendements négatifs | 12,7 % | 11,7 % | 11,1 % | 10,9 % | 11,4 % | 11,3 % |

les rendements de l’enseignement supérieur selon le type de revenu considéré
Champ : diplômés du supérieur, pseudo-cohorte 1970.Lecture : en considérant uniquement les salaires nets dans le calcul des rendements, la médiane s’établit à 13,6 %. Prendre en compte les allocations chômage réduit ce rendement médian à 13 %. De même, si l’on s’intéresse uniquement aux salaires nets, la part de rendements négatifs s’établit à 12,7 % parmi les diplômés du supérieur. Intégrer les allocations chômage, les pensions de retraite et les minima sociaux perçus par les individus ainsi que les impôts dont ils s’acquittent (paiement de l’impôt sur le revenu et de la TVA) réduit la part de rendements négatifs à 11,3 %.
72 Le graphique 5 propose une présentation plus systématique de l’impact marginal des différents instruments fiscaux et sociaux le long de la distribution des TRI. Le graphique 5a montre tout d’abord que l’impact de l’assurance chômage n’est pas homogène : il est positif et de l’ordre de 3 points de pourcentage dans le bas de la distribution, mais négatif et de l’ordre de 2 voire 3 points pour les valeurs les plus élevées du TRI. Ces effets différenciés s’expliquent par une dépendance à l’assurance chômage qui varie fortement parmi les diplômés du supérieur. En effet, dans le haut de la distribution, on retrouve des diplômés qui ont suivi des études longues et sont peu exposés aux périodes de chômage : les concernant, la prise en compte des allocations chômage a tendance à augmenter le coût d’opportunité de la période de formation tout en réduisant l’écart de revenu avec les non-diplômés du supérieur qui sont davantage concernés par le risque de chômage. À l’inverse, le bas de la distribution regroupe des diplômés du supérieur qui rencontrent des trajectoires instables marquées par un recours plus fréquent aux allocations chômage, notamment au début de leur carrière. Dans ce cadre, l’assurance chômage joue de manière indirecte un rôle d’assurance face aux risques de faible valorisation des diplômes : son impact sur le revenu intertemporel est plus important pour les diplômés du supérieur les plus défavorisés que pour les non-diplômés.
73 L’effet marginal du système de retraite est quant à lui beaucoup plus homogène : il est positif dans le bas de la distribution (de l’ordre de 1,8 point de pourcentage) mais diminue et se stabilise autour de zéro pour les points supérieurs de la distribution. Ce faible impact s’explique en partie par le fait que les pensions de retraite interviennent en fin de cycle de vie : cette période est par construction moins valorisée dans le calcul du TRI. On notera cependant que, malgré cette particularité, le système de retraite joue également un rôle dans la couverture du risque de faible valorisation pour les diplômés du supérieur : il bénéficie en effet davantage aux diplômés du supérieur qui ont les trajectoires les plus défavorables qu’aux non-diplômés. Ceci tient pour partie au fait que, dans sa logique contributive, le système de retraite reproduit les différences de salaire déployées au cours du cycle de vie (les diplômés du supérieur ont potentiellement des salaires plus élevés que les non-diplômés).
effet marginal des prestations et prélèvements sur la distribution des taux de rendement de l’enseignement supérieur
a. Éléments « contributifs » (Assurance chômage et pensions de retraite)

4,0
3,0
2,0
1,0
0,0
- 1,0
- 2,0
- 3,0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Assurance chômage (1) Pensions de retraite (2)
effet marginal des prestations et prélèvements sur la distribution des taux de rendement de l’enseignement supérieur
a. Éléments « contributifs » (Assurance chômage et pensions de retraite)
Éléments « beveridgiens » (Prélèvements et minima sociaux)

4,0
3,0
2,0
1,0
0,0
- 1,0
- 2,0
- 3,0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Impôt sur le revenu (3) Minima sociaux (4) TVA (5)
Éléments « beveridgiens » (Prélèvements et minima sociaux)
Note : pour les courbes du graphique a, les valeurs des TRI correspondant aux centiles les plus bas ne sont pas reportées car nous ne pouvons pas les définir de manière robuste.Lecture : au niveau du 15ème centile de la distribution des rendements, les allocations chômage augmente les rendements de 0,7 point de pourcentage. À ce même niveau de la distribution, l’effet des pensions de retraite est de 0,4 point de pourcentage.
Champ : diplômés du supérieur, pseudo-cohorte 1970.
74 Concernant les autres éléments du système socio-fiscal, le graphique 5b montre que l’effet marginal de l’impôt sur le revenu le long de la distribution des TRI suit une forme comparable à celui de l’assurance chômage. En effet, l’impact de l’IR est positif dans le bas de la distribution (de l’ordre d’un point de pourcentage) et négatif pour les TRI les plus élevés (il atteint 2 points de pourcentage). Là encore, les effets mis en évidence ne sont pas triviaux : ils montrent que les diplômés connaissant les trajectoires les plus défavorables sont financièrement moins pénalisés par l’impôt que la moyenne des non-diplômés. Ceci souligne qu’un impôt progressif dans une perspective statique ne l’est pas forcément en dynamique – pour une illustration de ces effets dynamiques du coté des politiques publiques, cf. par exemple le cas des subventions individuelles implicites pour l’éducation du supérieur illustré par Courtioux et alii (2011).
75 Les minima sociaux (RMI et minimum vieillesse) jouent négativement et de manière assez homogène le long de la distribution des TRI (soit environ -1 point de pourcentage). En effet, ces prestations contribuent à augmenter sensiblement le revenu des personnes les plus éloignées du marché du travail, en particulier les femmes inactives sans diplôme. Dans ce cadre, les minima sociaux jouent moins sur la dynamique de revenu des diplômés du supérieur que sur le niveaux des coûts d’opportunité à la poursuite d’études supérieures en augmentant l’espérance de revenu des non-diplômés. Du point de vue de la logique du système socio-fiscal, cet effet indique une différence importante entre les dispositifs de protection sociale de type assurantiel et les dispositifs d’assistance. Compte tenu des risques de chômage, les premiers accentuent la redistribution au sein des diplômés du supérieur. Les seconds quant à eux ont un effet négatif assez homogène dans la mesure où les diplômés du supérieur sont relativement protégés des trajectoires hors emploi non indemnisées.
76 L’effet marginal de la TVA est légèrement croissant le long de la distribution des rendements. Il est globalement positif, excepté dans le bas de la distribution. Cet effet de la TVA s’explique en partie par l’importance des effets d’âge dans les taux d’effort pour acquitter la TVA. Jusqu’à 30 ans environ (cf. graphique 3), les taux d’effort des revenus les plus faibles sont très élevés, contribuant ainsi à diminuer le coût d’opportunité des individus qui entreprennent des études longues. De plus, à ces âges, le taux d’effort apparaît beaucoup moins important pour les individus ayant un revenu élevé (cf. graphique 3).
La fonction assurantielle du système socio-fiscal sur la valorisation des diplômes est plus forte pour le segment le moins favorisé de l’enseignement supérieur
77 Les commentaires des résultats proposés jusqu’à présent n’établissaient pas de distinction entre les types de diplômes obtenus alors que l’enseignement supérieur est fortement segmenté. Prendre en compte cet aspect peut s’avérer important, notamment dans l’évaluation des rendements de l’éducation. L’objectif est ici de reconsidérer les résultats précédents en les différenciant selon que l’on s’intéresse aux filières de type grandes écoles (école de commerce ou école d’ingénieurs) ou aux filières universitaires. Dans le cadre d’une interprétation en termes de rendements ex ante, cela revient à postuler que les individus connaissent en partie leurs capacités à poursuivre des études supérieures (relâchement de l’hypothèse 2), mais ne connaissent pas le degré de corrélation entre ces capacités et la « qualité » de la trajectoire qu’ils seront à même de réaliser sur le marché du travail. Cette certitude peut bien évidemment renvoyer à des dotations très différentes en termes de capital économique, social et culturel (notamment avoir des parents diplômés du supérieur, appartenir à une famille qui peut assurer un confort matériel suffisant pour étudier dans de bonnes conditions, etc.).
78 La distribution des taux de rendement correspondant aux grandes écoles est présentée dans le graphique 6. Sur la même plage que précédemment (du centile 10 au centile 90), on constate que les rendements sont beaucoup plus élevés (ils varient entre 10 et 30 %). L’effet du système socio-fiscal est par ailleurs beaucoup moins incitatif : il tend à réduire les rendements pour tous les points de la distribution présentés [20].
79 Par rapport au cadre interprétatif proposé précédemment, la distribution présentée dans le graphique 6 correspond à l’hypothèse selon laquelle l’individu sait qu’il peut réussir une grande école ; quel que soit le classement de cette école. De ce point de vue, nos résultats suggèrent que la « certitude » que peut avoir un individu sur sa capacité à obtenir un diplôme d’une grande école ne pose que des problèmes incitatifs marginaux : les rendements de l’enseignement supérieur sont à un niveau plus élevé que le taux d’intérêt du marché par exemple, et ce, tout le long de la distribution.
80 En revanche, on peut interroger l’effet incitatif du système socio-fiscal pour les individus qui considèrent ne pouvoir accéder qu’au segment le moins prestigieux de l’enseignement supérieur. La connaissance de ces capacités fait référence ici aux biais psycho-sociaux évoqués supra. Ainsi, on peut penser que, pour ces individus, la distribution ex ante des rendements correspond à celle présentée dans le graphique 7 qui décrit la distribution des TRI des diplômes universitaires.

40 %
35 %
30 %
25 %
20 %
15 %
10 %
5 %
0 %
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Avant prestations et prélèvements Après prestations et prélèvements
centiles des taux de rendement des grandes écoles
Champ : diplômés Bac +5 (écoles de commerce et écoles d’ingénieurs), pseudo-cohorte 1970.Lecture : avant prélèvement et prestations, le rendement médian des diplômés des grandes écoles est de 22,2 %. Il diminue à 19,2 % après transferts socio-fiscaux.
81 Globalement, la forme de cette distribution est similaire à celle du graphique 4. Cependant, le point de croisement des courbes de TRI intervient à un niveau légèrement plus élevé dans la distribution (le percentile 20 versus le percentile 17). L’effet assurantiel du système socio-fiscal est en outre plus marqué pour les risques de faible valorisation. Au quinzième percentile par exemple, l’effet du système socio-fiscal sur le TRI est de 0,5 point de pourcentage pour l’ensemble des diplômés du supérieur (cf. graphique 4), mais de 1,5 point de pourcentage pour les diplômes universitaires (cf. graphique 7).
centiles des taux de rendement des diplômes universitaires

30 %
25 %
20 %
15 %
10 %
5 %
0 %
- 5 %
- 10 %
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Avant prestations et prélèvements Après prestations et prélèvements
centiles des taux de rendement des diplômes universitaires
Champ : diplômés de l’Université (Deug, Licence, Maîtrise, DEA, DESS et Doctorat hors médecine), pseudo-cohorte 1970.Note : pour la courbe « Avant prestations et prélèvements », les valeurs des TRI correspondant aux centiles les plus bas ne sont pas reportées car nous ne pouvons pas les définir de manière robuste.
Lecture : avant prélèvement et prestations, le rendement médian des diplômes universitaires est de 11,4 %. Il diminue à 10 % après transferts socio-fiscaux.
82 Le graphique 5 montrait que les instruments socio-fiscaux ayant l’impact marginal le plus important sur les risques de faible valorisation du côté assurantiel étaient l’allocation chômage et, du côté « beveridgien », l’impôt sur le revenu. En décomposant leurs effets pour deux types de population sélectionnés en fonction de leur profil de formation (les diplômés des grandes écoles versus les diplômés des universités), on obtient l’effet marginal de chacun de ces instruments sur la distribution des TRI. Les graphiques 8 et 9 présentent ces résultats différenciés selon la sous-population de notre pseudo-cohorte.
effet marginal de l’assurance chômage sur la distribution des taux de rendement de l’enseignement supérieur

effet marginal de l’assurance chômage sur la distribution des taux de rendement de l’enseignement supérieur
Champ : diplômés du supérieur, pseudo-cohorte 1970. (a) diplômés de l’Université (Deug, Licence, Maîtrise, DEA, DESS et Doctorat hors médecine) ; (b) diplômés Bac +5 (écoles de commerce et écoles d’ingénieurs).Note : pour la courbe (a), les valeurs des TRI correspondant aux centiles les plus bas ne sont pas reportées car nous ne pouvons pas les définir de manière robuste.
Lecture : l’assurance chômage diminue le rendement médian de 0,5 point de pourcentage pour les diplômes universitaire et de 1,4 point de pourcentage pour les diplômés des grandes écoles.
83 En considérant que la distribution que nous obtenons correspond à une distribution ex ante, nous observons que, pour les individus qui « savent » pouvoir réussir une grande école, l’effet marginal de l’assurance chômage est négatif et décroissant le long de la distribution (cf. graphique 8). En revanche, pour les individus qui « savent » qu’ils vont rester cantonnés au segment le moins valorisé de l’enseignement supérieur, l’effet incitatif de l’assurance chômage dans le bas de la distribution est plus important que lorsqu’ils n’ont aucune information sur leur capacité à poursuivre des études.
84 De même, le graphique 9 montre que l’effet positif de l’impôt sur le revenu dans le bas de la distribution (protection contre les risques de faible valorisation) est inexistant pour les individus qui « savent » qu’ils réussiront à accéder à une grande école. Par contre, si les individus savent qu’ils ne pourront accéder qu’au segment universitaire, l’impact marginal de l’impôt sur le revenu sur les risques de faible valorisation reste important dans le bas de la distribution mais demeure comparable à ce que l’on peut obtenir pour l’ensemble des diplômés du supérieur.
effet marginal de l’impôt sur le revenu sur la distribution des taux de rendement de l’enseignement supérieur

2,0
1,0
0,0
- 1,0
- 2,0
- 3,0
- 4,0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Centiles
Diplômes universitaires (a) Ensemble des diplômés du supérieur
Grandes écoles (b)
effet marginal de l’impôt sur le revenu sur la distribution des taux de rendement de l’enseignement supérieur
Champ : diplômés du supérieur, pseudo-cohorte 1970. (a) diplômés de l’Université (Deug, Licence, Maîtrise, DEA, DESS et Doctorat hors médecine) ; (b) diplômés Bac +5 (écoles de commerce et écoles d’ingénieurs).Lecture : l’impôt sur le revenu diminue le rendement médian de 0,6 point de pourcentage pour les diplômes universitaire et de 1,5 point de pourcentage pour les diplômés des grandes écoles.
Conclusion
85 Nos résultats montrent que les rendements de l’éducation du supérieur sont fortement hétérogènes et que l’impact des divers instruments socio-fiscaux sur la distribution des TRI est loin d’être négligeable. En effet, notre analyse montre que l’assurance chômage, les pensions de retraite et dans une moindre mesure l’impôt sur le revenu ont un effet marginal important sur le bas de la distribution des rendements des diplômes du supérieur : ces instruments jouent de facto le rôle d’une assurance couvrant les risques de faible valorisation des diplômes et ont potentiellement des effets importants sur les choix éducatifs. En France, du fait des différences entre diplômés du supérieur et non-diplômés quant à la dynamique des trajectoires sur le marché du travail (notamment l’enchaînement des périodes de chômage), le système socio-fiscal semble donc contribuer à inciter financièrement à une formation tertiaire.
86 De plus, une décomposition selon le type de diplôme du supérieur, permet de montrer que ce rôle assurantiel est accentué pour les individus qui poursuivent des études à l’université. En effet, l’impact de ces instruments socio-fiscaux sur la distribution des rendements des diplômes universitaires, qui constituent le segment le moins valorisé de l’éducation supérieure, est plus élevé.
Annexe : le modèle de microsimulation Gameo
87 Cette annexe présente plus en détail les choix méthodologiques des deux principaux modules du modèle de microsimulation Gameo utilisés dans cet article : le module de simulation des carrières individuelles et le module de simulation des salaires. Pour mémoire, les estimations introduites dans le modèle s’appuient sur l’enquête Emploi 2003-2007 (Insee) disponible en ligne (http://www.insee.fr), l’enquête Emploi 1968-2002 et les enquêtes Budget des familles 2001 et 2006 (Insee) fournies par les Archives de Données Issues de la Statistique Publique – ADISP (réseau Quetelet). Le modèle de microsimulation Gameo est développé à l’Edhec Business School ; outre les auteurs, Stéphane Gregoir et Dede Houeto ont également contribué au développement du modèle.
La modélisation des carrières
88 Dans notre simulation, nous commençons par estimer des taux agrégés cibles pour les différents âges d’une pseudo-cohorte donnée. La modélisation permettant de calculer le taux d’activité, le taux de chômage et la part d’emploi indépendant dans l’emploi total est présentée dans le tableau A1. Pour les estimations, les enquêtes Emploi 1968-2005 sont utilisées afin de construire des points d’observation qui croisent : génération, âge, taux de chômage courant, ainsi que le taux d’activité (respectivement : le taux de chômage et la part d’emplois indépendants) de la cohorte concernée. Les coefficients sont estimés par la méthode des moindres carrés ordinaires.
89 Sur la base des estimations présentes dans le tableau A1 et en ajoutant une hypothèse, à savoir que la part d’emploi public représente une part fixe de l’emploi quel que soit l’âge considéré (20 %), il est possible de construire le chronogramme décrivant la répartition entre cinq états (l’inactivité, l’activité indépendante, l’emploi dans le secteur public, l’emploi dans le secteur privé et le chômage) d’une pseudo-cohorte au cours du temps. Dans la simulation, la position sur le marché du travail à un âge donné d’un individu de la pseudo-cohorte est déterminée par sa probabilité relative vis-à-vis des autres individus de la cohorte de se trouver dans cette position et un jeu de tirages aléatoires.
90 Pour calculer les probabilités de connaître différentes transitions, nous avons estimé des modèles logit binomiaux sur l’enquête Emploi 2003-2007. Les variables retenues comprennent la position précédente sur le marché du travail, des variables socio-économiques et le diplôme. Les résultats de ces estimations sont présentés dans le tableau A2.
91 Plus précisément, la microsimulation des transitions individuelles tout au long de la vie répète la même opération pour chaque âge. Tout d’abord, la probabilité de transition des individus vers l’activité est calculée, puis la transition est déterminée en comparant sa probabilité avec un tirage individuel dans une loi uniforme. Lors de la simulation, le volume total des transitions aux différents âges est ajusté pour correspondre effectivement aux taux d’activité de la génération à l’âge considéré (cf. supra). Dans un deuxième temps, sachant que l’individu est actif, la probabilité d’être indépendant est calculée et le statut d’indépendant déterminé selon le même procédé. Ensuite, sachant que l’individu est actif mais pas indépendant, on calcule sa probabilité de transiter vers l’emploi public, puis on détermine ce statut. Sachant qu’il est actif, mais ni indépendant, ni salarié du secteur public, on calcule sa probabilité de transition vers l’emploi salarié et on détermine ce statut selon le même procédé. Les personnes au chômage sont les personnes qui n’ont pas été affectées à un autre état lors du processus.
92 Dans la mesure où nous travaillons sur des pseudo-cohortes qui s’appuient à la fois sur les comportements observés des cohortes passées et des hypothèses sur la situation économique à laquelle est exposée la pseudo-cohorte, il est difficile de procéder à une vérification systématique de la qualité des transitions sur le marché du travail produites par la simulation. En effet, une partie des transitions vers le chômage de la génération née en 1970 n’a pas encore été observée. Néanmoins, nous pouvons envisager un protocole de validation partielle sur la base d’une correspondance entre les taux de chômage de la génération 1970 sur la fenêtre d’observation de l’enquête Emploi 2003-2007 et les taux de chômage de la pseudo-cohorte aux âges correspondant dans notre simulation. Quand on compare les individus de notre simulation de 33 à 37 ans avec les individus nés entre 1968 et 1970 observés de 2003 à 2007, on observe plutôt de bonnes performances de simulation (tableau A3).
estimation des modèles générationnels de taux activité, de taux de chômage et de part d’emplois indépendants
Transformation logistique du taux d’activité | Transformation logistique du taux de chômage | Transformation logistique de la part d’emplois indépendants | ||||
Hommes | Femmes | Hommes | Femmes | Hommes | Femmes | |
Constante | - 21,25** | - 27,11** | 3,53** | 3,25** | - 6,47** | - 7,15** |
Âge | 1,75** | 2,74** | - 0,56** | - 0,43** | 0,28** | 0,31** |
Âge à la puissance 2 | - 0,04** | - 0,10** | 0,01** | 0,01** | - 0,007** | - 0,008** |
Âge à la puissance 3 | 0,00042** | 0,00153** | - 0,00010** | - 0,00007** | 0,0001** | 0,0001** |
Âge à la puissance 4 | - 0,000002** | - 0,00001** | ||||
Taux de chômage courant | - 3,44** | - 1,81** | 0,26** | 0,03** | 2,30ns | - 0,83ns |
R2 | 0,97 | 0,92 | 0,82 | 0,82 | 0,94 | 0,90 |

estimation des modèles générationnels de taux activité, de taux de chômage et de part d’emplois indépendants
Note : l’année 1970 sert de référence pour ce modèle qui est estimé avec des indicatrices pour chaque génération dont les résultats ne sont pas reproduits dans ce tableau. (**) Significatif au seuil de 1 %, (ns) non significatif.Transition vers l’activité | Transition vers l’emploi (indépendant) | Transition vers l’emploi (secteur public) | Transition vers l’emploi (secteur privé) | |
Constante | 0,107** | 2,244** | 1,714** | 2,393** |
Statut précédent et éléments de trajectoire | ||||
Inactif | référence | - 5,372** | - 5,364** | - 2,253** |
Chômeur | 2,446** | - 6,391** | - 6,450** | - 1,922** |
Indépendant | 4,852** | référence | - 5,861** | - 2,328** |
Salarié du secteur public | 4,218** | - 9,431** | référence | - 3,510** |
Salarié du secteur privé | 3,864** | - 7,907** | - 6,324** | référence |
Années d’expérience | - 0,015** | 0,032** | 0,047** | 0,025** |
Années d’expérience (au carré) | 0,0001** | - 0,001** | - 0,0003** | |
Durée d’inactivité (en années) | - 0,383** | |||
Statut socio-économique | ||||
Femme | - 0,169** | - 0,582** | 0,632** | - 0,057** |
Nombre d’enfant(s) – pour les femmes | - 0,115** | 0,041** | - 0,011** | - 0,061** |
Présence d’un jeune enfant – pour les femmes | - 1,612** | 0,263 | 0,265 | - 0,064 |
Âge 55 et plus | - 1,530** | |||
Âge 60 et plus | - 1,384** | |||
Âge 65 et plus | - 0,168** | |||
Diplôme | ||||
Pas de diplôme du supérieur | ||||
CAP/BEP | 0,355** | 0,033** | 0,474** | 0,306** |
Bac Général | 0,333** | 0,375** | 0,502** | 0,345** |
Bac Professionnel | 0,942** | 0,151** | - 0,402** | 0,653** |
Bac Technique | 0,633** | - 0,161** | 0,639** | 0,540** |
Capacité en Droit | 0,223** | - 0,188* | - 0,892** | - 0,437** |
Bac +2 | ||||
DEUG | 0,133** | 0,785** | 0,383** | 0,050** |
DUT/DEUST | 0,718** | 0,235** | 0,176** | 0,734** |
BTS | 0,759** | 0,344** | - 0,064** | 0,684** |
Autre diplôme de technicien supérieur | 0,469** | 0,765** | 0,034* | 0,290** |
Diplôme paramédical | 0,674** | 2,286** | 3,345** | 0,972** |
Bac +3 | ||||
Licence | 0,327** | 0,567** | 0,842** | 0,537** |
Autre diplôme Bac +3 | 0,814** | 0,963** | 0,089** | 0,310** |
Bac +4 | ||||
Maîtrise | 0,445** | 0,505** | 0,733** | 0,446** |
Bac +5 | ||||
DEA | 0,725** | 0,245** | 0,954** | 0,046** |
DESS | 1,022** | 0,061** | 0,448** | 0,508** |
Écoles de commerce | 0,943** | - 0,916** | 0,618** | |
Écoles d’ingénieurs | 0,943** | 0,540** | 0,057** | 0,785** |
Plus de Bac +5 | ||||
Doctorat (sauf Médecine) | 0,979** | 0,124** | 1,028** | 0,212** |
Doctorat (en Médecine) | 0,999** | 1,262** | 3,031** | 1,111** |
D de Sommer | 0,957 | 0,952 | 0,906 | 0,699 |
Pourcentage concordants | 97,8 | 97,3 | 95,1 | 84,4 |
Pourcentage de discordants | 2,1 | 2,1 | 4,4 | 14,5 |
Pourcentage joints | 0,1 | 0,6 | 0,5 | 1,2 |

Diplôme | EEC(*) | Simulation(**) |
Ensemble | 8,1 % | 7,5 % |
Non-diplômés du supérieur | 9,2 % | 8,4 % |
Diplômés du supérieur | 5,5 % | 6,1 % |

La modélisation des salaires
93 Pour simuler les salaires, nous estimons l’équation (5) sur les enquêtes Emploi 2003-2007. Le principal avantage de cette enquête est de fournir un niveau de détail très fin sur le diplôme. En effet, les enquêtes Emploi avant 2003 n’utilisent pas de variables aussi détaillées sur le diplôme c’est pourquoi nous ne les avons pas retenues pour nos estimations.
Des équations estimées à un niveau fin de diplôme
94 Dans le tableau A4 qui présente les résultats des estimations, la variable expliquée est le logarithme du salaire mensuel net. Dans l’enquête Emploi 2003-2007, la variable de salaire mensuel repose sur la déclaration des individus. Ce mode de collecte est par nature moins précis que des sources administratives et peut être sujet à erreurs de déclaration. Pour pallier ce problème qui peut s’avérer important dans la mesure où nous travaillons sur des échantillons relativement petits de diplômés, nous avons choisi de retenir une modélisation en deux étapes. Pour commencer, nous estimons une première fois l’équation de salaire. Puis nous écartons 10 % des observations : celles dont le résidu se situe en queue de distribution (5 % de chaque coté de la distribution). Nous estimons alors à nouveau l’équation de salaire sur cette population réduite. Dans le cas où les résidus suivent une loi normale, cette méthode a l’avantage d’écarter les observations extrêmes sans modifier la médiane ni la moyenne des salaires de la population simulée et donc d’obtenir un jeu d’estimateurs plus robustes. Cependant, nous calculons et conservons les résidus pour l’ensemble de la population. Ils sont utilisés lors de la simulation afin de respecter la distribution de salaires mensuels observée dans l’enquête Emploi. Par ailleurs, de manière plus générale, pour éviter d’introduire du bruit dans la simulation, après avoir vérifié que leur absence n’impactait pas de manière significative nos estimateurs, nous avons choisi de retirer pour les estimations finales les coefficients qui n’étaient pas significativement différents de zéro.
estimation des équations de salaire par diplôme (logarithme de salaire)
Sans diplôme ou titulaires d’un CAP/BEP | Bac Pro. | Bac général, Bac tech., Capacité en droit et DEUG | DUT/ DEUST | BTS, Techniciens du supérieur, Diplôme paramédical | Licence, Autre Bac +3 et Maîtrise | DESS, DEA, Écoles de commerce, doctorat | Écoles d’ingénieurs | |
Constante | 6,94** | 6,96** | 6,99** | 7,07** | 7,07** | 7,19** | 7,36** | 7,52** |
Années d’expérience | 0,021** | 0,036** | 0,026** | 0,043** | 0,034** | 0,043** | 0,053** | 0,047** |
Années d’expérience féminine | - 0,014** | - 0,018** | - 0,016** | - 0,013** | - 0,013** | - 0,016** | - 0,015** | - 0,012** |
Années d’expérience (au carré) | - 0,0002** | - 0,0005** | - 0,0001** | - 0,0005** | - 0,0003** | - 0,0005** | - 0,0008** | - 0,0007** |
Fonctionnaire | 0,26** | 0,12** | 0,19** | 0,07** | 0,10** | 0,23** | 0,08** | 0,06** |
Secteur d’activité | ||||||||
Secteur manufacturier et BTP | 0,05** | 0,06** | 0,06** | 0,07** | 0,08** | 0,07** | 0,19** | 0,07** |
Énergie | 0,20** | 0,22** | 0,17** | 0,10** | 0,09** | 0,28** | 0,23** | 0,18** |
Finance | 0,19** | 0,13** | 0,10** | 0,09** | 0,11** | 0,12** | 0,09** | |
Services aux entreprises | - 0,03** | 0,01** | 0,07** | 0,02** | 0,04** | 0,08** | 0,07** | |
Services aux particuliers | - 0,23** | - 0,11** | - 0,26** | - 0,27** | - 0,19** | - 0,25** | - 0,34** | - 0,25** |
Administration | - 0,17** | - 0,13** | - 0,08** | - 0,07** | - 0,09** | - 0,18** | - 0,15** | - 0,24** |
Autre secteur | - 0,002** | - 0,04** | - 0,03** | - 0,07** | - 0,13** | 0,079** | ||
Indicatrice de diplôme | ||||||||
Sans diplôme | - 0,08 | |||||||
CAP/BEP | référence | |||||||
Bac Général | référence | |||||||
Bac Technique | - 0,04** | |||||||
Capacité en droit | - 0,16** | |||||||
DEUG | 0,11** | |||||||
BTS | référence | |||||||
Autre diplôme de technicien sup. | référence | |||||||
Diplôme paramédical | 0,17** | |||||||
Licence | 0,10** | |||||||
Autre diplôme Bac +3 | 0,11** | |||||||
Maîtrise | référence | |||||||
DEA | référence | |||||||
DESS | référence | |||||||
École de commerce | 0,12** | |||||||
Doctorat (sauf médecine) | 0,08** | |||||||
Doctorat (médecine) | 0,25** | |||||||
Variance des résidus | 0,21 | 0,14 | 0,22 | 0,16 | 0,17 | 0,22 | 0,25 | 0,15 |
R2 | 0,37 | 0,40 | 0,42 | 0,53 | 0,41 | 0,45 | 0,47 | 0,54 |
Méthode d’estimation | IV | simple | IV | simple | simple | IV | simple | simple |

estimation des équations de salaire par diplôme (logarithme de salaire)
Note : (**) pour significatif au seuil de 1 %.95 Dans l’équation (5), la somme des effets des secteurs d’activité est contrainte à 0. De plus, afin d’identifier la spécificité des carrières féminines, l’estimateur de l’expérience (β) est décomposé en deux effets : β1 un effet global et β2 un effet propre au fait d’être une femme caractérisé dans l’équation (5.1) par l’indicatrice F .

96 Par ailleurs, du fait du faible nombre d’observations disponibles pour certains diplômes, nous avons effectué des regroupements. Ces regroupements se sont appuyés sur une analyse de données « à la française » des liens entre diplôme et marché du travail mettant en œuvre des classifications ascendantes hiérarchiques (CAH) des individus observés dans l’enquête Emploi sur la base d’un grand nombre de variables socio-économiques. Cette analyse préalable nous a permis de séparer les individus en différents groupes dont il était possible d’identifier la composition en termes de diplôme. Pour les estimations, nous avons regroupés les diplômes qui composaient de manière « évidente » un même groupe ou des groupes très proches en supposant que cette proximité était un indice du fait que la distribution des capacités productives inobservées entre ces individus n’était pas de nature à biaiser notre estimation de l’effet du diplôme sur les salaires. Quand le regroupement n’était pas évident au vue de la CAH, nous avons regroupé les individus par niveau de diplôme sur la base des mêmes hypothèses.
97 Finalement, nous avons retenu huit équations de gain dont six concernent des diplômes de l’enseignement supérieur. Dans le cas de ces regroupements de diplômes, nous identifions l’effet spécifique de chaque diplôme par une indicatrice. L’effet du diplôme (α) est alors décomposé en deux effets : l’effet du diplôme de référence du regroupement (αe1) et l’effet spécifique du diplôme (αe2).

Le traitement de l’expérience
98 Le nombre d’années d’expérience en emploi n’est pas une variable directement observable dans l’enquête Emploi. Cependant, la différence entre l’âge courant et l’âge d’entrée sur le marché du travail constitue une limite supérieure de cette expérience en emploi et par extension une variable proxy de l’expérience en emploi. Pour un individu, la distance entre cette variable proxy et le nombre d’années d’expérience effective dépend bien évidemment des difficultés d’insertion sur le marché du travail et des périodes de non-emploi. Le degré de cette exposition aux difficultés d’insertion varie fortement selon le diplôme. On peut par exemple penser que pour les ingénieurs cette variable proxy est bien meilleure que pour les individus non-diplômés plus fortement exposés au chômage.
99 Dans la simulation, l’expérience en emploi effective d’un individu à un âge donné dépend de deux facteurs : 1) de l’impact du taux de chômage courant sur la trajectoire du niveau d’emploi agrégé des individus qui composent la pseudo-cohorte (cf. supra) ; 2) tout au long de sa trajectoire passée, des probabilités relatives d’être en emploi de l’individu par rapport aux autres individus qui composent la pseudo-cohorte. Lors de la simulation, l’utilisation d’une variable proxy de l’expérience en emploi pour estimer l’effet de l’expérience sur les salaires poserait problème : toutes choses égales par ailleurs, les individus d’une pseudo-cohorte exposés à une mauvaise conjoncture lors de leur entrée sur le marché du travail se traduisant par des périodes de chômage prolongées ne verraient pas cet effet se traduire par des salaires plus bas, consécutivement à une baisse effective de leur expérience en emploi. En effet, la simulation imputerait à tous les individus qui composent la pseudo-cohorte un effet moyen conditionnel au diplôme, mais indépendant des conditions générales du marché du travail - par exemple, pour un diplôme de licence, l’effet serait homogène, qu’il appartienne à une cohorte comportant un fort taux de diplômés du supérieur ou une cohorte comprenant un taux très faible - et de l’employabilité relative des individus, alors même que cette employabilité dépend de la trajectoire individuelle toutes choses égales par ailleurs (cf. la modélisation des transitions individuelles). Or, pour notre simulation, nous cherchons à estimer l’effet propre de l’expérience en emploi, afin de pouvoir différencier, au niveau individuel, l’effet de l’expérience sur les salaires conditionnellement à la trajectoire passée. En cohérence avec notre modélisation qui nous permet de simuler des trajectoires d’emploi robustes, nous avons donc besoin de corriger directement l’impact de l’erreur de mesure de l’expérience dans l’estimation des équations de salaire.
100
Compte tenu des données disponibles, nous avons cherché à
corriger au mieux l’impact de l’expérience sur les salaires en
utilisant la méthode des variables instrumentales (IV) et en
considérant que nous avions potentiellement une erreur de
mesure sur ce régresseur. Soit x* l’expérience en emploi et x̂
l’expérience potentielle observée dans l’enquête Emploi, à
diplôme donné e, on considère que l’expérience en emploi
() est fonction d’un ensemble de variables (Z) et d’un
résidu indépendant de ces variables
:

101 Sur la base de l’équation 7, l’expérience potentielle peut s’écrire :

102 Avec :

103
Où l’erreur de mesure de l’expérience () est
indépendante de Z et du résidu (εe, x) de l’équation (7). Dans
ce cadre, pour que l’instrumentation de l’effet de
l’expérience par Z soit valide, il faut que xe, x le résidu de
l’équation (8) et le résidu de l’équation (5) ne soient pas
corrélés. Pour corriger l’effet de l’expérience en emploi de
l’erreur de mesure de l’expérience à diplôme donné, nous
cherchons des instruments explicatifs de l’expérience mais
indépendant de l’erreur de mesure de l’expérience et du
résidu de l’équation de salaire. Le choix des instruments
correspond à notre stratégie de modélisation à un niveau fin
de diplôme : à ce niveau fin, nous pouvons considérer que
l’endogénéité des choix éducatifs et des caractéristiques
productives intrinsèques ne joue pas.
104 Nous retenons comme instruments des variables dont on considère a priori qu’elles ne sont pas corrélées avec le résidu de l’équation de salaire conditionnellement au diplôme (εe) de l’équation (5), soit : (i) la part des moins de 25 ans au chômage l’année d’entrée sur le marché du travail (on considère en effet qu’un marché du travail dégradé lors de l’entrée sur le marché du travail se traduit par une insertion plus longue ce qui réduit d’autant l’expérience en emploi), (ii) un ensemble de variables différenciées par genre sur la situation familiale (nombre d’enfants de 0 à 18 mois, de 18 mois à trois ans, de trois ans à 6 ans, de 6 ans à 18 ans, enfants majeurs, indicatrice de famille monoparentale). On considère que la situation familiale permet d’expliquer d’éventuels retraits passés du marché du travail indépendamment du poste occupé et une « intensification » de l’effet de l’expérience sur le salaire (notamment dans le cas d’individus délestés de leurs charges familiales/ domestiques par leurs conjoints).
105 L’hypothèse de non-corrélation entre εx, e et le résidu de l’équation de salaire (εe) peut être discutée. Néanmoins, il est possible d’arguer que l’hétérogénéité des réponses aux situations économiques, incitations fiscales et évènements familiaux dépend de préférences personnelles largement indépendantes du résidu de l’équation de salaire (εe) ; que l’on interprète ce dernier comme les capacités productives intrinsèques des individus (et notamment leur performance académique) ou, comme nous le faisons ici, comme le résultat d’un appariement de ce « talent » avec le poste de travail.
106 Pour vérifier le pouvoir explicatif des instruments, on effectue une régression des variables d’intérêt (les variables expérience et expérience féminine) sur l’ensemble des instruments utilisés. On décide de ne conserver la méthode des variables instrumentales pour corriger les estimateurs que lorsque les instruments permettent d’expliquer « suffisamment » l’expérience. On considère alors que le pouvoir explicatif est suffisant quand le R2 est supérieur ou égal à 0,35. Ceci nous conduit à ne pas introduire de correction pour les diplômes d’ingénieurs, les diplômes d’écoles de commerce, les masters universitaires, les doctorats, les BTS, techniciens du supérieur et diplômes paramédicaux, les DUT/Deust et les diplômés d’un bac professionnel. Le tableau A5, permet de comparer les résultats obtenus pour les estimateurs centraux de nos équations de salaire selon la méthode d’estimation (méthode des moindres carrés ordinaires versus méthode de correction par instrumentation). On notera par exemple que la correction de la méthode instrumentale joue dans le sens attendu, notamment pour les sans diplôme et les autres diplôme Bac+3 : l’effet propre du diplôme (α) diminue mais l’impact de l’expérience effective en emploi (β1) augmente. A contrario, on ne retrouve pas cet effet pour les DEA et les DESS qui se situent en dessous de la limite du R2 que nous avons choisi pour mettre en œuvre la méthode instrumentale.
estimation des équations de salaire par diplôme (logarithme de salaire)
Moindre carrés ordinaires | Méthode instrumentale | ||||||||
α |
1 β |
2 β | δ | α |
1 β |
2 β | δ | R2 ( [*]) | |
Sans diplôme | 6,88 | 0,017 | - 0,011 | - 0,0001 | 6,86 | 0,021 | - 0,014 | - 0,0002 | 0,50 |
CAP/BEP | 6,96 | 0,017 | - 0,011 | - 0,0001 | 6,94 | 0,021 | - 0,014 | - 0,0002 | 0,50 |
Bac général | 6,94 | 0,030 | - 0,011 | - 0,0002 | 6,99 | 0,027 | - 0,016 | - 0,0001 | 0,43 |
Bac technique | 6,91 | 0,030 | - 0,011 | - 0,0002 | 6,95 | 0,027 | - 0,016 | - 0,0001 | 0,43 |
Capacitée en Droit | 6,81 | 0,030 | - 0,011 | - 0,0002 | 6,83 | 0,027 | - 0,016 | - 0,0001 | 0,43 |
DEUG | 7,05 | 0,030 | - 0,011 | - 0,0002 | 7,10 | 0,027 | - 0,016 | - 0,0001 | 0,43 |
Licence (Université) | 7,06 | 0,041 | - 0,010 | - 0,0005 | 7,19 | 0,043 | - 0,016 | - 0,0005 | 0,38 |
Maîtrise (Université) | 7,17 | 0,041 | - 0,010 | - 0,0005 | 7,30 | 0,043 | - 0,016 | - 0,0005 | 0,38 |
Autre diplôme Bac +3 | 7,28 | 0,041 | - 0,010 | - 0,0005 | 7,19 | 0,043 | - 0,016 | - 0,0005 | 0,38 |
DEA | 7,27 | 0,053 | - 0,015 | - 0,0008 | 7,28 | 0,058 | - 0,022 | - 0,0009 | 0,34 |
DESS | 7,36 | 0,053 | - 0,015 | - 0,0008 | 7,37 | 0,058 | - 0,022 | - 0,0009 | 0,34 |
École de commerce | 7,48 | 0,053 | - 0,015 | - 0,0008 | 7,49 | 0,058 | - 0,022 | - 0,0009 | 0,34 |
Doctorat (sauf médecine) | 7,44 | 0,053 | - 0,015 | - 0,0008 | 7,44 | 0,058 | - 0,022 | - 0,0009 | 0,34 |
Doctorat (médecine) | 7,62 | 0,053 | - 0,015 | - 0,0008 | 7,65 | 0,058 | - 0,022 | - 0,0009 | 0,34 |
BTS | 7,07 | 0,034 | - 0,013 | - 0,0003 | 7,07 | 0,036 | - 0,019 | - 0,0003 | 0,32 |
Technicien du supérieur | 7,07 | 0,034 | - 0,013 | - 0,0003 | 7,05 | 0,036 | - 0,019 | - 0,0003 | 0,32 |
Diplôme paramédical | 7,24 | 0,034 | - 0,013 | - 0,0003 | 7,27 | 0,036 | - 0,019 | - 0,0003 | 0,32 |
DUT/DEUST | 7,07 | 0,043 | - 0,013 | - 0,0005 | 7,02 | 0,050 | - 0,018 | - 0,0006 | 0,31 |
École d’ingénieur | 7,52 | 0,047 | - 0,012 | - 0,0007 | 7,02 | 0,050 | - 0,018 | - 0,0006 | 0,27 |
Bac Pro. | 6,96 | 0,036 | - 0,018 | - 0,0005 | 6,91 | 0,044 | - 0,026 | - 0,0005 | 0,22 |

estimation des équations de salaire par diplôme (logarithme de salaire)
Note :α est l’estimateur de l’effet du diplôme, β1 celui de l’expérience, β2 celui du correcteur d’expérience féminine,δ celui de l’expérience au carré. Tous les coefficients sont significatifs au seuil de 1 %.Notes
-
[*]
Edhec Business School.
E-mail : pierre.courtioux@edhec.edu -
[**]
Lors de la rédaction de cet article, Vincent Lignon était doctorant au Centre d’économie de la Sorbonne (CES, Université Paris 1 Panthéon-Sorbonne) et à l’Institut national d’études démographiques (Ined). Il était également associé à l’Edhec Business School. Il occupe désormais un poste d’économiste à la Caisse nationale des allocations familiales (Cnaf) ; il est par ailleurs associé au CES.
E-mail : vincent.lignon@univ-paris1.fr -
[1]
Depuis 2009, l’OCDE a recours à un autre indicateur : la Valeur Actuelle Nette (VAN). Dans cet article, nous nous centrons sur les rendements de l’éducation du supérieur car il s’agit de l’indicateur le plus discuté dans la littérature qui porte sur les risques liés à la poursuite des études. Par ailleurs, il convient de noter que la VAN est un indicateur conceptuellement proche du TRI (pour mémoire, le TRI est le taux d’intérêt qui annule la VAN).
-
[2]
À titre d’exemple, le TRI moyen privé lié à l’obtention d’un diplôme de niveau tertiaire pour les hommes est de 11 % pour les États-Unis, de 8,4 % pour la France et de 5,1 % pour la Suède (OCDE, 2008).
-
[3]
À ce titre, l’analyse sociologique de Charles (2012) indique qu’en France, la famille a un rôle traditionnel de soutien financier pour les étudiants.
-
[4]
Pour une présentation de la microsimulation, cf. par exemple Blanchet (1998), Bourguignon et Spadaro (2003), Legendre (2004).
-
[5]
À l’exclusion de la dimension familiale du système socio-fiscal (quotient familial, allocations familiales, etc.).
-
[6]
Si le terme de pseudo-cohorte n’est pas sans rappeler les méthodes d’estimation dites de pseudo-panel proposées par Deaton (1985) – cf. Cardoso et Gardes (1996) pour une application sur données françaises, la pseudo-cohorte au sens où nous l’entendons consiste à reconstruire une cohorte à partir d’une base de données individuelles en coupe, permettant d’appréhender des transitions courtes, et d’un chronogramme agrégé sur longue période. Il ne s’agit pas de reconstruire des cohortes à partir de base de données individuelles en coupe disponibles à différents points du temps.
-
[7]
Dans nos calculs, nous n’intégrons pas les frais d’inscription car ils sont marginaux par rapport au coût d’opportunité. De manière générale, le coût total est peu différent du coût d’opportunité dans les pays où, comme en France, les études sont gratuites ou quasi-gratuites pour l’étudiant – cf. Gurgand (2005).
-
[8]
Depuis 2008, le RMI et le minimum vieillesse ont été remplacés par le RSA et l’ASPA. Nous avons cependant souhaité rester en cohérence avec l’année de législation retenue par le modèle. Par ailleurs, il convient de noter que le RSA est composé de deux éléments : la partie « socle » qui est très proche du RMI et la partie « activité » qui relève moins d’un minimum social que d’un dispositif d’incitation à l’activité. Cette dernière composante serait par ailleurs difficile à simuler dans la mesure où elle dépend de l’activité infra-annuelle des individus (transitions entre emploi et chômage à l’intérieur d’une année, reprise progressive d’activité au cours de l’année, etc.). Depuis le 1er janvier 2016, le RSA activité a été remplacé par la prime d’activité que notre modèle de microsimulation ne reproduit pas.
-
[9]
Courtioux (2010, 2012) retient une méthode de calcul des coûts d’opportunité durant la période de formation plus complexe que celle que nous retenons ici. Les effets du choix de la méthode retenue sur la distribution des TRI sont discutés infra.
-
[10]
Pour mémoire, en cohérence avec notre modèle de microsimulation, nous n’avons pas imposé une forme fonctionnelle connue à F(a), la fonction individuelle des flux financiers nets en fonction de l’âge. Rien ne garantit donc que l’équation (1) admette une solution unique pour chaque individu. Pour identifier les TRI individuels, nous les recherchons sur la plage]-99 % ; 99 %[et nous retenons la solution la plus proche de 0. Si aucune solution n’est trouvée sur cette plage, on considère par convention que r a une « très grande valeur » non définie respectivement positive ou négative selon sa valeur actualisée nette au point où r = 0.
-
[11]
Le modèle de microsimulation dynamique Destinie a déjà développé ce type de projections dans le champ des retraites – cf. Insee (1999).
-
[12]
Ils utilisent le modèle de microsimulation dynamique populationnel LIAM (O’Donoghue et alii, 2009) dont la structure est proche du modèle français Destinie (Insee, 1999).
-
[13]
Nous testons par ailleurs les effets d’un ajustement « complet » des comportements d’activité de la génération née en 1970 à l’évolution de la législation sur les retraites. Pour ce faire, nous prolongeons les profils d’activité agrégés de 5 ans au point où le taux d’emploi est le plus élevé.
-
[14]
Ces montants sont tirés de la dernière législation (loi du 23 mars 2006) portant sur les primes et les intéressements associés au RMI et ont été actualisés en euros 2005. Nous retenons cette législation car elle est restée en vigueur durant l’année 2008.
-
[15]
Dans la simulation, ces périodes sont exprimées en années.
-
[16]
Dans notre commentaire, nous reprenons ici la colonne (d) du tableau 1 car la définition du revenu est plus proche de la définition retenue par l’OCDE et permet donc une comparaison plus directe – cf. OCDE (2003, 2008, 2010).
-
[17]
Le mode de calcul du TRI de Courtioux (2010) conduit à obtenir un coût d’opportunité (
) plus important durant la période de formation, car il inclut dans le calcul du contrefactuel les personnes diplômées du supérieur déjà rentrées sur le marché du travail afin de tenir compte du fait que les personnes qui continuent leurs études renoncent à des opportunités de salaire plus élevées que la moyenne des non-diplômés du supérieur : pour obtenir un diplôme Bac+5, l’individu renonce aux opportunités d’un emploi de Bac+4.
-
[18]
Au niveau de risque correspondant au 6ème centile des TRI, cette différence peut atteindre 80 points de pourcentage.
-
[19]
En diminuant le revenu moyen de la population contrefactuelle (les non-diplômés du supérieur), l’impôt sur le revenu affecte négativement le coût d’opportunité. Cela favorise notamment les diplômés du supérieur qui ont les trajectoires les moins favorables sur le marché du travail et ne paient pas d’impôt, d’où un effet global négatif sur la part des rendements inférieurs à zéro.
-
[20]
Cependant, dans notre exercice de microsimulation, si l’on étend la plage des rendements analysés, le système socio-fiscal a un effet positif sur les rendements en dessous du 5ème centile de TRI.