CAIRN.INFO : Matières à réflexion
linkThis article is available in English on Cairn International

1Aujourd’hui, une partie du système de surveillance des comportements de santé des Français est assurée par un dispositif d’enquêtes transversales en population générale. Parmi les plus anciennes et les plus fréquentes de ces enquêtes figurent les Baromètres santé, menés tous les cinq ans depuis 1992 par Santé publique France [1].

2Ces enquêtes reposent sur un échantillonnage aléatoire de numéros de téléphone. Leur méthodologie a constamment évolué pour s’adapter aux contraintes techniques et administratives imposées par la fin du monopole national des télécommunications, puis la diversification des équipements et des usages téléphoniques (Beck et Guilbert, 2007 ; Beck et al., 2013 ; Richard et al., 2014).

3Depuis vingt ans, ces enquêtes déclaratives permettent de suivre les principaux comportements, attitudes et perceptions liés aux prises de risque et à l’état de santé de la population résidant en France (Beck, 2011). Ces enquêtes fournissent de très nombreux indicateurs de santé (Drees-DGS, 2013 ; Drees, 2015) et des données rétrospectives peuvent être mobilisées à des fins d’analyse biographique ou longitudinale rétrospectives, comme cela a notamment été fait pour documenter les diffusions du tabac et du cannabis dans la population (Bricard et al., 2015 ; Legleye et al., 2011, 2014, 2016 ; Pampel et al., 2015).

4Une grande partie des informations obtenues est impossible à recueillir autrement, celles qui relèvent de comportements individuels ne donnent lieu à aucun enregistrement (par exemple l’usage de drogues illicites ou le nombre de verres d’alcool bus en une occasion, lorsque les données de vente ou de budget des ménages ne renseignent que sur une disponibilité de boissons alcoolisées), mais surtout celles qui relèvent de la mesure des attitudes, des perceptions ou des opinions de la population.

5Toutefois, parce que ces enquêtes sont transversales et téléphoniques, les possibilités de documenter avec fiabilité (et dans un temps raisonnable compatible avec la tenue de l’enquête) les parcours de vie sont très réduites, car les erreurs de remémoration peuvent être importantes et socialement différenciées, ce qui peut biaiser les résultats. De même, la collecte d’informations précises relatives à l’état de santé (sur les maladies chroniques ou certaines affections) ou aux consommations de soins est très difficile, tout comme celle relative aux prestations sociales.

6Ces enquêtes ne permettent pas non plus d’assurer le suivi des personnes dans le temps. La mortalité pourrait par exemple être étudiée avec profit s’il était possible de connaître à terme les causes de décès des participants à chacune des enquêtes. Un exemple récent développé à partir d’une enquête épidémiologique menée en Lorraine en 1996 montre le potentiel intérêt d’un tel appariement aux données de mortalité (Khlat et al., 2014). Disposer d’informations relatives à la carrière professionnelle ainsi qu’aux données de santé entre l’interrogation lors de l’enquête et le décès permettrait d’accroître d’autant la robustesse des analyses.

I – État des pratiques

7Le recueil d’informations prospectives est l’apanage des cohortes. Pour de très nombreuses thématiques, l’utilisation de données de cohortes est bien plus informative que celle des enquêtes transversales, notamment lorsqu’il s’agit d’explorer des relations causales. Mais il y a peu de cohortes de grande taille représentatives de la population générale et documentant les comportements de santé, car la plupart sont à finalité plus directement médicale et ciblent des populations particulières ou sont moins attachées à la représentativité (Goldberg et al., 2013). L’attrition est aussi une source de biais non négligeable pour les cohortes. Dans l’enquête Erfi (Étude sur les relations familiales et intergénérationnelles) par exemple, le taux d’attrition est de 43 % en 6 ans (après deux vagues de collecte) pour une interrogation initiale de 10 079 individus (Régnier-Loilier et Guisse, 2012) ; celui séparant deux vagues – soit 4 ans – de l’enquête Santé et protection sociale (SPS) [2] est d’environ 55 % pour une taille initiale d’environ 12 000 individus (Jusot et al., 2008), tandis que l’attrition dans Tempo [3] est d’environ 60 % depuis le début de l’enquête pour 1 103 participants au recrutement. Il est bien sûr possible de redresser statistiquement les échantillons pour compenser l’attrition, mais cela diminue très fortement la précision et devient impossible lorsque le nombre de répondants est trop faible. De plus, l’attrition est très largement un phénomène sélectif socialement et possiblement en lien avec l’état de santé (souvent plus difficile à corriger par le système de redressement), ce qui pose encore la question du caractère généralisable des résultats. Enfin, si les données recueillies lors des interrogations successives d’une cohorte sont irremplaçables, les coûts financiers et organisationnels de tels dispositifs s’avèrent très importants, et il est difficile d’imaginer le montage de cohortes représentatives de taille suffisante, spécialisées dans toutes les thématiques à aborder en matière de santé publique.

8Les panels et les cohortes sont aujourd’hui fréquemment appariés à des fichiers administratifs ou médicaux. C’est le cas de l’enquête SPS, dont le tirage de l’échantillon est fait dans le registre des bénéficiaires du régime général de l’assurance maladie et qui est appariée au Système national d’information inter-régimes de l’assurance maladie (Sniiram), de Constances [4] (Sniiram et Cnav – caisse nationale d’assurance vieillesse –), de Tempo (Sniiram), etc. Cela en accroît d’autant la précision et la qualité, car une partie des informations n’a plus à être collectée auprès des répondants. Toutes ces cohortes sont par ailleurs appariées aux données du Centre d’épidémiologie sur les causes médicales de décès (CépiDc-Inserm), permettant d’accéder aux causes de mortalité. L’un des avantages de ces appariements est qu’ils permettent, en recueillant de l’information sur les personnes perdues de vue, de fournir des éléments pour, au moins en partie, décrire et contrôler l’attrition.

9De même, de très nombreuses enquêtes de la statistique publique font appel à des données administratives sociales ou fiscales, notamment pour le tirage des échantillons. Plus rarement, elles peuvent faire appel à des données médico-administratives pour l’enrichissement des bases de données : l’enquête décennale santé de 2003 et l’enquête handicap-santé de 2008-2009 furent les premières du genre (Montaut et al., 2013).

10Pourrait-on améliorer de la même manière les enquêtes transversales en population générale qui ne sont pas du domaine de la statistique publique afin de disposer d’un recueil d’informations relatives au revenu, à la carrière professionnelle et à l’état de santé grâce à un appariement avec des données administratives, médicales et de mortalité ? Le contexte de réalisation de ces enquêtes diffère dans la mesure où elles sont réalisées sans base de sondage et par téléphone, ce qui diminue l’acceptabilité de l’enquête et les possibilités de redressement statistique, ainsi que le taux de participation, et rend d’autant plus utile le recours à des données externes de ce type.

1 – Le Numéro d’identification au répertoire (NIR) et les coordonnées de naissance

11Le NIR (autrement appelé numéro de sécurité sociale) permet en théorie d’accéder à de nombreuses bases médico-administratives : Sniiram-PMSI (produites par la Caisse nationale d’assurance maladie des travailleurs salariés (Cnamts) et l’Agence technique de l’information sur l’hospitalisation (Atih), dates et causes de décès (issues de l’Insee et du CépiDc-Inserm), certaines données de carrière professionnelle provenant de la Cnav ainsi qu’éventuellement certaines données fiscales. L’obtention de ces informations permettrait des analyses longitudinales relatives à la mortalité ou aux consommations de soins, de tester des questions relatives aux comportements de santé, au recours aux soins, et de proposer des stratégies de redressement statistiques.

12Les coordonnées de naissance permettent de récupérer le NIR par recherche dans le répertoire national d’identification des personnes physiques (RNIPP) ou le répertoire national inter-régimes des bénéficiaires de l’assurance maladie (RNIAM), géré par la Cnav) [5], et ainsi d’apparier un fichier d’enquête à toutes les données externes précitées.

2 – Contexte légal

13En pratique, des barrières administratives et légales existent. Dans une enquête, il doit notamment être explicitement demandé à la personne son consentement éclairé pour l’obtention de ces informations, ce qui signifie qu’elle doit être informée des conséquences de son acceptation et que la question de son acceptation doit lui être adressée dans des termes simples et univoques. Jusqu’au récent changement législatif de 2016, un décret en Conseil d’État était nécessaire pour la mise en œuvre de cette procédure (article 27 de la loi 78-17 du 6 janvier 1978, dite loi Informatique et libertés).

14Le contexte légal a en effet récemment évolué, avec la promulgation de la loi de modernisation de notre système de santé en janvier 2016 et l’examen d’une nouvelle loi régissant les conditions d’accès de la recherche à des données administratives (loi n° 2016-1321 du 7 octobre 2016 pour une République numérique). Ces textes visent notamment à simplifier les conditions d’usage du NIR, qui ne nécessitera plus, comme c’était le cas jusqu’à présent, l’adoption d’un décret en Conseil d’État mais seulement, sous réserve d’un traitement cryptographique préalable appliqué automatiquement dès le recueil, une autorisation de la Commission nationale de l’informatique et des libertés (Cnil). Ce type de cryptage dès l’opération de saisie nécessite le recours à un logiciel spécifique validé mais ne pose pas de problème informatique rédhibitoire dans le cadre d’une enquête téléphonique.

15Bien que toute demande d’autorisation de recherche, d’étude ou d’évaluation non interventionnelle dans le domaine de la santé soit soumise à l’évaluation d’un comité d’expertise qui statuera sur la pertinence du traitement par rapport aux finalités déclarées et que l’Institut national des données de santé (INDS) statuera sur l’intérêt public des finalités déclarées, l’évolution qui se dessine facilite l’appariement sécurisé et anonyme à des données administratives et invite clairement à une réflexion sur l’usage qui peut en être fait dans le domaine des enquêtes en population générale. Il est par ailleurs toujours possible, en l’état actuel des textes, que le recueil du NIR demeure plus encadré sur le plan réglementaire et sur les outils à mettre en œuvre pour sa sécurisation, que le recueil d’identifiants sur les coordonnées de naissance, ce qui incite à distinguer les deux types de recueil dans la réflexion.

16L’objectif de ce travail est de fournir une première base de réflexion. Il vise plus précisément à mesurer les différentiels de sensibilité de la population à la question du chaînage des données la concernant, et à apporter ainsi des éléments informatifs sur les biais de sélection qu’est susceptible de comporter une étude fondée uniquement sur des individus ayant accepté de fournir des données directement identifiantes (NIR ou coordonnées de naissance).

17Pour atteindre cet objectif, nous avons mené une expérimentation consistant, au sein du Baromètre santé 2014, à demander aux personnes si elles accepteraient de fournir des renseignements permettant de collecter des informations administratives sur leur situation. L’étude vise à tester l’acceptabilité de deux demandes différentes : la fourniture du NIR ou celle des nom, prénom, date et commune de naissance. Nous présentons ici brièvement la méthode du Baromètre santé, le protocole de l’expérimentation et ses résultats quantitatifs. Nous nous sommes appliqués en particulier à décrire les acceptants du point de vue sociodémographique ainsi qu’en termes d’état de santé perçu, afin de tester l’existence de biais afférents qui pourraient altérer la représentativité de l’échantillon d’acceptants.

II – Méthodes

1 – Le Baromètre 2014

18Le Baromètre santé est une enquête transversale, téléphonique, reposant sur un échantillon probabiliste. Il n’entre pas dans le domaine de la statistique publique et n’a pas de caractère obligatoire. Le sondage est à deux degrés : les numéros de téléphone sont dans un premier temps générés de façon aléatoire, puis l’individu est sélectionné au hasard au sein des membres éligibles du ménage. La réalisation de l’enquête, par système de Collecte assistée par téléphone et informatique (Cati), a été confiée à l’institut Ipsos. Le terrain s’est déroulé du 11 décembre 2013 au 31 mai 2014. De nombreux efforts ont été accomplis pour faciliter la réalisation de l’entretien : proposition d’un rendez-vous téléphonique en cas d’indisponibilité, numéros appelés jusqu’à 40 fois avant abandon, formation des enquêteurs pour convaincre le maximum de personnes éligibles à participer. Les numéros de téléphone étant effacés au terme de l’entretien, toutes les données recueillies demeurent strictement confidentielles et ne sont analysées qu’à des fins statistiques.

19Le plan de sondage des Baromètres santé a été modifié en 2000 afin d’inclure les individus inscrits sur liste rouge (Beck et Guilbert, 2007), en 2005 pour inclure les individus équipés exclusivement d’un téléphone mobile, puis en 2010 pour inclure ceux en dégroupage total. Ces nouvelles approches ont permis d’améliorer la représentativité de l’enquête, et ceci est d’autant plus important qu’elles permettent d’inclure des personnes qui ont des caractéristiques particulières en termes de comportements de santé. En 2014, du fait de l’utilisation préférentielle du téléphone mobile par une partie de la population, y compris parmi ceux disposant d’une ligne fixe, deux échantillons « chevauchants » (c’est-à-dire non disjoints) ont été constitués : l’un interrogé sur ligne fixe, l’autre sur téléphone mobile, sans filtre sur l’équipement téléphonique du ménage. L’échantillon comprend au total 15 635 individus (7 577 sur ligne fixe et 8 058 sur mobile). Le taux de participation s’est établi à 61 % pour l’échantillon des fixes et à 52 % pour celui des mobiles. La passation du questionnaire a duré en moyenne 33 minutes.

20Les données ont été pondérées par les nombres d’individus éligibles et de lignes téléphoniques au sein du ménage (les probabilités multiples d’inclusion des deux échantillons chevauchants sont donc prises en compte par un partage des poids) et calées sur les données de référence nationales de l’Insee les plus récentes au moment de l’enquête, à savoir l’enquête Emploi 2012. Ce calage sur marges tient compte du sexe croisé avec la tranche d’âges, de la région de résidence, de la taille de l’agglomération, du niveau de diplôme et du fait de vivre seul ou non.

2 – L’expérimentation : deux questions en fin de questionnaire

21L’expérimentation a consisté en une randomisation simple de l’échantillon de répondants. À la fin du questionnaire, un cinquième s’est vu poser la question suivante : « Accepteriez-vous, dans le cadre d’une étude scientifique, de nous donner votre numéro de Sécurité sociale ? », et un autre cinquième la question suivante : « Accepteriez-vous, dans le cadre d’une étude scientifique, de nous donner vos nom, prénom, lieu et date de naissance ? ». Ces informations seront nommées « coordonnées de naissance » ci-après. Les réponses possibles étaient oui, non, ou ne sait pas / ne veut pas répondre. Notre expérimentation porte donc sur un cas hypothétique et ne recueille pas les informations évoquées.

3 – Les variables sociodémographiques et de santé associées

22La caractérisation sociodémographique a été faite en utilisant des variables sociodémographiques classiques (présentées dans le tableau 1). Les variables décrivant l’état de santé objectif ou subjectif sont le tabagisme quotidien, la consommation quotidienne d’alcool, la déclaration d’au moins une alcoolisation ponctuelle importante par mois (6 verres ou plus en une même occasion), l’obésité (définie par un IMC ≥ 30), la sédentarité (pas d’activité physique en général au cours des 12 derniers mois), le renoncement à des soins pour raisons financières au cours des 12 derniers mois, la perception de sa santé comme mauvaise, la déclaration d’une maladie ou d’un problème de santé chronique, et la limitation de mobilité corporelle depuis au moins 6 mois à cause d’un problème de santé (aucune, modérée, forte). Leur association avec les caractéristiques sociodémographiques est présentée dans le tableau 2.

III – Résultats

1 – Les répondants sont plus favorables au fait de donner leurs coordonnées de naissance que leur NIR

23La proposition de déclaration du NIR a été faite à 3044 personnes, celle relative aux coordonnées de naissance à 3 041 personnes. Globalement, 34,9 % (n = 1114, sd – déviation standard ou écart type = 1,06 %) des individus ont répondu qu’ils accepteraient de fournir leur NIR, 64,4 % ont indiqué qu’ils refuseraient (n = 1912, sd = 1,07 %) et 0,7 % (n = 18, sd = 0,23 %) n’ont pas souhaité répondre. Les proportions correspondantes pour la fourniture des coordonnées de naissance sont : 51,9 % (n = 1572, sd = 1,10 %), 48,0 % (n = 1463, sd = 1,10 %) et 0,16 % (n = 6, sd = 0,07 %). Il y a donc nettement plus d’acceptations pour la deuxième proposition. Dans la suite, les non-répondants seront éliminés des analyses.

24Le tableau 1 montre que les hommes sont plus nombreux que les femmes à accepter l’une ou l’autre proposition, mais que ces taux d’acceptation ne varient pas significativement avec l’âge. Il y a en revanche un biais éducatif et socioéconomique. Accepter de fournir son NIR est plus répandu parmi les plus diplômés et les cadres ou professions intermédiaires et moins répandu parmi les ouvriers et les quelques personnes dont la PCS n’a pas pu être établie ; les personnes appartenant aux ménages les plus aisés sur le plan financier répondent aussi plus souvent positivement. Accepter de fournir ses coordonnées de naissance a tendance à être plus fréquent parmi les peu diplômés (bien que cela soit non significatif), mais reste plus fréquent parmi les personnes aux revenus élevés ; si elle varie peu suivant le groupe socioprofessionnel, l’acceptation est également aussi fréquente parmi les ouvriers que les cadres (55,0 % vs 53,1 %).

25Pour les deux propositions, on ne trouve pas d’association significative avec la taille de l’agglomération de résidence, la situation professionnelle ou le fait de vivre seul. En revanche, pour les deux, l’acceptation est plus répandue lorsque l’interrogation a été faite sur un téléphone fixe que sur un mobile.

Tableau 1

Caractéristiques sociodémographiques et de santé des répondants et taux d’acceptation de la communication du NIR ou des coordonnées de naissance

NIRNom, prénom, date et lieu de naissance
NTaux d’acceptation %(a)NTaux d’acceptation %(a)
Échantillon total3 02634,93 03551,9
Sexe0,0010,001
 Femme (Réf.)1 64332,01 60747,4
 Homme1 38337,91 42856,6
Âge0,1980,852
 15-24 ans (Réf.)41535,037752,4
 25-34 ans45829,754650,8
 35-44 ans58336,954153,1
 45-54 ans61234,959352,5
 55-64 ans54635,958249,9
 65-75 ans41236,939653,6
Niveau de diplôme0,0010,082
 Inférieur au Bac (Réf.)59730,658355,3
 Bac1 31434,01 35450,6
 Bac+240041,237551,9
 Bac+3 ou plus71541,772349,1
Taille d’agglomération0,2610,554
 Rural (Réf.)28236,742553,1
 2 000-19 99921338,628152,4
 20 000-99 99912936,422552,1
 100 000-200 0007942,99357,8
 200 000-1 000 00025537,931351,8
 Île-de-France15633,323549,3
Situation professionnelle0,7940,774
 Actifs occupés (Réf.)1 76235,11 81252,2
 Chômeurs23333,222949,9
 Autres inactifs1 03135,099452,1
PCS0,0010,359
 Agriculteurs, artisans… (Réf.)21735,122850,4
 Cadres54541,759653,1
 Professions intermédiaires79641,176151,6
 Employés88431,380349,7
 Ouvriers53030,159855,0
 NR5427,04948,3
Revenus / UC0,0010,001
 1er tercile (faibles) (Réf.)72531,272051,8
 2e tercile1 04836,599255,8
 3e tercile (élevés)1 07643,91 14354,1
 NSP/ Refus1777,318026,1
Vit seul0,3960,192
 Non (Réf.)2 39434,62 39851,4
 Oui63236,563754,6
Échantillon d’appel0,0340,001
 Fixe (Réf.)1 45137,01 50658,7
 Mobile1 57533,31 52946,9

Caractéristiques sociodémographiques et de santé des répondants et taux d’acceptation de la communication du NIR ou des coordonnées de naissance

(a) Pour chaque variable, la première ligne indique la p-valeur associée au test du Chi² de Pearson, les suivantes indiquent les pourcentages associés aux différentes modalités.
Les p-valeurs inférieures à 0,05 sont en gras.
Source : Baromètre santé 2014.

26Le tableau 2 montre qu’en analyse bivariée, l’acceptation de la déclaration du NIR n’est significativement associée qu’à la déclaration d’un problème de santé chronique (42,0 % vs 31,2 %) ou de limitation physique (33,2 % parmi les personnes se déclarant non limitées, 40,0 % parmi les autres). Après contrôle des principaux effets de structure, accepter de fournir son NIR reste un comportement masculin, surtout fréquent parmi les 15-24 ans. Il apparaît très peu lié à des comportements de santé : il est significativement plus fréquent parmi les personnes déclarant des problèmes de santé chroniques (OR = 1,52) et tendanciellement moins présent parmi les personnes sédentaires que les autres (OR = 0,81).

Tableau 2

Modélisation logistique de l’acceptation de la communication du NIR ou des coordonnées de naissance (% et odds ratios (OR) ajustés –Ora- avec intervalles de confiance à 95 %) ; modèles ajustés sur PCS/revenus/UC/Échantillon d’appel (fixe ou mobile)

Tableau 2
Variables NIR Nom, prénom date et lieu de naissance N %(a) OR(ab) IC 95 % N %(a) OR(ab) IC 95 % Sexe 0,001 0,055 0,001 0,001 Femme (Réf.) 1 643 31,2 1 1 607 47,4 1 Homme 1 383 37,9 1,20 1,00-1,45 1 428 56,6 1,39 1,16-1,66 Âge 0,198 0,004 0,852 0,008 15-24 ans (Réf.) 415 35,0 1 377 52,5 1 25-34 ans 458 29,7 0,56 0,41-0,76 546 50,8 0,74 0,55-0,99 35-44 ans 583 36,8 0,78 0,58-1,06 541 53,1 0,73 0,54-0,99 45-54 ans 612 34,9 0,68 0,50-0,93 593 52,5 0,65 0,48-0,88 55-64 ans 546 35,8 0,69 0,51-0,93 582 49,9 0,58 0,43-0,78 65-75 ans 412 36,9 0,56 0,41-0,76 396 53,6 0,74 0,55-0,99 Fumeur quotidien 0,524 0,122 0,058 0,591 Non (Réf.) 2 285 34,5 1 2 248 50,8 1 Oui 741 35,8 1,17 0,96-1,42 787 54,6 1,05 0,88-1,26 Alcool quotidien 0,099 0,531 0,006 0,150 Non (Réf.) 2 753 34,4 1 2 757 51,1 1 Oui 273 39,2 1,11 0,80-1,56 278 59,5 1,27 0,92-1,77 Alcoolisation ponctuelle importante (c) mensuelle 0,665 0,335 0,700 0,454 Non (Réf.) 2 552 35,0 1 2 523 51,8 1 Oui 474 34,0 0,89 0,70-1,13 512 52,7 0,92 0,74-1,15 IMC (c) 0,134 0,453 0,003 0,174 Normal (Réf.) 1 822 33,5 1 1 858 50,9 1 Surpoids 866 37,4 1,12 0,92-1,37 855 55,6 1,11 0,92-1,35 Obésité 338 35,0 1,13 0,85-1,50 322 48,5 0,85 0,64-1,11 Sédentarité 0,202 0,091 0,001 0,001 Non (Réf.) 2 564 35,4 1 2 552 50,6 1 Oui 462 32,4 0,81 0,64-1,03 483 58,2 1,53 1,23-1,89

Modélisation logistique de l’acceptation de la communication du NIR ou des coordonnées de naissance (% et odds ratios (OR) ajustés –Ora- avec intervalles de confiance à 95 %) ; modèles ajustés sur PCS/revenus/UC/Échantillon d’appel (fixe ou mobile)

(a) Pour chaque variable, la première ligne indique la p-valeur associée au test du Chi² de Pearson, les suivantes indiquent les pourcentages associés aux différentes modalités.
(b) Pour chaque variable, la première ligne indique la p-valeur associée au test de significativité globale de la variable dans le modèle, les suivantes indiquent les OR ajustés associés aux différentes modalités.
(c) Voir la description des variables dans la section Méthodes.
Les p-valeurs inférieures à 0,05 sont en gras.
Source : Baromètre santé 2014.

27La déclaration des coordonnées de naissance apparaît pour sa part davantage liée à des caractéristiques de santé (tableau 2) : on note une déclaration plus fréquente parmi les buveurs quotidiens (59,5 % vs 51,1 %), les personnes se jugeant en mauvaise santé (65,9 % vs 50,8 %), celles déclarant une maladie chronique (57,5 % vs 49,1 %) ou celles déclarant des limitations fonctionnelles (59,6 % parmi celles se jugeant fortement limitées, 53,0 % parmi celles se jugeant limitées mais pas fortement vs 50,9 % parmi les autres), ainsi qu’une tendance accrue à la déclaration parmi les fumeurs quotidiens (54,6 % vs 50,8 %). Toutes choses égales par ailleurs le tableau 2 montre que les associations se maintiennent pour le sexe masculin (OR = 1,39), la tranche d’âges 15-24 ans (tous les OR des tranches d’âges plus élevées sont significativement inférieurs à 1), la santé perçue comme mauvaise (OR = 1,58), les maladies chroniques (OR = 1,44), tandis que la relation à la sédentarité apparaît alors significative (OR = 1,53).

28Pour les deux analyses, on note que l’âge, qui n’était pas significativement lié à l’une ou l’autre acceptation, présente au contraire une association significative dans le modèle multivarié : l’acceptation de l’une ou l’autre proposition est plus fréquente parmi les 15-24 ans que dans le reste de la population. À l’inverse, les limitations fonctionnelles étaient associées à l’acceptation, alors que ce n’est plus le cas dans l’analyse multivariée. Les associations avec le revenu se maintiennent en multivarié mais celle avec la PCS ne se maintient que pour la déclaration du NIR, tandis que la situation professionnelle n’est jamais significative (chiffres non présentés).

29Le détail montre enfin que les personnes interrogées sur téléphone mobile acceptent moins souvent de livrer leurs coordonnées de naissance que celles interrogées sur téléphone fixe (OR = 0,55) alors que ce n’est pas le cas pour le NIR (OR = 0,94).

IV – Discussion et conclusion

1 – Résumé des résultats

30Une proportion plus élevée de personnes accepteraient de communiquer leurs coordonnées de naissance plutôt que leur NIR (51,9 % vs 34,9 %), les hommes plus souvent que les femmes, avec un gradient social au profit des personnes les plus diplômées, des cadres (NIR) ou des revenus élevés (NIR et coordonnées de naissance). Les personnes interrogées via un téléphone mobile acceptent également moins souvent ces propositions, alors que c’est le contraire pour les personnes déclarant des problèmes de santé, sédentaires, buvant quotidiennement de l’alcool ou s’estimant en mauvaise santé.

2 – Interprétation

31Ces résultats montrent que la déclaration de données individuelles permettant l’accès à des données médico-administratives semble acceptable pour une part importante des répondants à une enquête en population générale comme le Baromètre santé, en particulier pour les coordonnées de naissance. Cette acceptation est sujette à un gradient social modéré, et est plus répandue parmi les personnes en mauvaise santé. Ce dernier point peut s’interpréter de deux façons. Il suggère d’abord que la démarche n’effraie pas les personnes malades qui pourraient redouter un contrôle de leurs dépenses de santé ou de leurs consommations de soins, ce qui souligne l’utilité potentielle de la démarche pour les enquêtes. Il peut aussi s’interpréter dans le cadre de la théorie générale de la saillance et du levier (Groves et al., 2000) selon laquelle la décision de participer à une enquête résulte d’une analyse de compromis entre l’effort requis pour participer et une motivation portée par l’intérêt pour la thématique et la croyance en l’utilité des résultats. Il est en effet vraisemblable que les personnes dont la santé est défaillante se soient senties davantage concernées par la thématique santé de l’enquête, et qu’elles aient éprouvé plus de satisfaction à répondre à des questions qui leur étaient en apparence plus personnellement adaptées et auxquelles elles pouvaient répondre de façon spécifique. Cette satisfaction pourrait expliquer une acceptation plus fréquente de la proposition de communiquer son NIR ou ses coordonnées de naissance. Cette meilleure adhésion, notable dans toutes les enquêtes dès lors qu’un exposé de la thématique et des objectifs a été fait, s’en trouve ici confirmée.

32La divergence de résultats entre la demande du NIR et des coordonnées de naissance permet également de formuler un certain nombre d’hypothèses. Elle semble indiquer que la population considère qu’un numéro d’identification est une information plus sensible, plus identifiante et « traceuse » que les coordonnées de naissance. Ce jugement est rationnel, le NIR étant effectivement une donnée très identifiante, mais n’était pas nécessairement attendu, compte tenu du caractère officiel et engageant que l’on confère généralement à l’adjonction de son nom sur un document. Il est cependant possible que l’effort de remémoration à fournir, dans la cadre d’une enquête téléphonique, pour donner son NIR, soit à l’origine d’une partie des refus. Ce résultat permet d’une part de constater qu’il pourrait sembler préférable, pour avoir le taux de répondants maximum, de privilégier la demande des coordonnées de naissance par rapport au NIR, mais qu’en contrepartie, les biais de sélection générés par ce choix sont différents, les personnes en moins bonne santé étant davantage sélectionnées en utilisant les coordonnées de naissance. Il s’agit donc là d’une information susceptible de guider le protocole de recueil de futures enquêtes transversales ou cohortes. Enfin, que les personnes interrogées via un téléphone mobile soient plus réticentes que les autres à accepter l’une ou l’autre des propositions de déclaration de données identifiantes pourrait aussi s’interpréter en regard des circonstances de passation : il est probable qu’une partie d’entre elles ne se trouvaient pas chez elles ou seules au moment de l’interrogation, ou du moins pas dans un contexte aussi familier que les personnes interrogées sur leur téléphone fixe à leur domicile. Cela pourrait induire une gêne à livrer oralement des informations personnelles pouvant être entendues d’autrui.

3 – Comparaisons avec d’autres études

33À notre connaissance, aucune expérimentation similaire n’a été menée lors d’une enquête aléatoire téléphonique. Les échantillons des enquêtes SPS et Constances étant extraits des fichiers de l’assurance maladie, les données médico-administratives y sont connues pour l’ensemble des individus sélectionnés, répondants et non-répondants : la situation est donc inverse et nettement plus avantageuse. Des appariements d’enquête ont été réalisés dès 1970 (enquête décennale santé Insee-Credoc) ; la pratique n’est toutefois pas courante. Plus récemment, lors de l’enquête décennale Santé 2003, les deux tiers des personnes interrogées avaient accepté de fournir leur NIR tandis qu’elles étaient 75 % dans l’enquête handicap-santé 2008-2009. Dans ces deux cas, les taux d’acceptation sont bien supérieurs, comme d’ailleurs les taux de participation à ces enquêtes. Il faut souligner toutefois que la présence d’enquêteurs de l’Insee au domicile et le caractère obligatoire (pour l’enquête handicap-santé) sont des éléments de contexte jouant positivement, tout comme la renommée de l’Insee, qui est nettement supérieure à celle d’instituts comme l’Inpes. Les auteurs de l’expérimentation d’appariement de l’enquête handicap-santé soulignent toutefois d’importantes difficultés pratiques pour l’identification et l’appariement du NIR avec les bases médico-administratives (Montaut et al., 2013). En revanche, nous n’avons pas d’exemple comparable pour le recueil des coordonnées de naissance.

4 – Limites

34Notre étude porte sur une situation hypothétique ; il est donc possible qu’une partie des personnes adhérant à la démarche se rétractent en situation réelle. Toutefois, cet effet pourrait être compensé par un exposé convaincant des motifs et conditions d’utilisation des données, car les taux d’acceptation étaient très supérieurs à nos résultats dans l’enquête décennale santé et l’enquête handicap-santé (Montaut et al., 2013) : il est possible de considérer que le taux observé pour le NIR soit donc un taux minimal. En effet, dans notre expérimentation, seule la mention d’une étude scientifique est faite, sans qu’aucune finalité ne soit fournie : il n’y a pas d’argumentaire spécifique. De plus, nous n’avons pas la possibilité d’évaluer la qualité des NIR et coordonnées de naissance que pourraient fournir les individus ; or les travaux effectués sur les enquêtes ayant collecté le NIR suggèrent qu’une part non négligeable des NIR collectés ne peut être appariée, ce qui introduit des biais sociodémographiques et éventuellement en lien avec l’état de santé. S’il est probable que les répondants connaissent mieux leurs coordonnées de naissance, qui leur sont plus fréquemment demandées que le NIR dans des formulaires administratifs, il n’en reste pas moins qu’elles ne permettent pas de reconstituer le NIR dans tous les cas, ce qui viendra limiter le succès de l’opération de recueil.

35Il eût été utile de sonder l’opinion des acceptants et des non-acceptants à propos de la démarche de recueil ou du type de données identifiantes demandées (NIR ou coordonnées de naissance). En particulier, chaque répondant n’avait à se prononcer que sur un type de données : certains refusants auraient peut-être répondu favorablement à la question portant sur l’autre type de données. Malheureusement, les contraintes de durée de questionnaire ont rendu impossible l’ajout de questions.

36Par ailleurs, les démarches de demande d’autorisation légales n’ont pas été entamées, et il est possible que des restrictions et des limitations importantes soient imposées dans la mise en œuvre de la procédure. Les exemples des enquêtes décennales Santé et Handicap-santé soulignent toutefois que des solutions techniques existent pour pallier un certain nombre de difficultés, notamment la possibilité de crypter directement le NIR et les coordonnées de naissance pour maintenir l’anonymat des données.

37Notre étude porte sur une étape d’un processus très long. L’estimation de la qualité finale de l’opération devra donc faire l’objet d’une étude expérimentale dédiée.

5 – Conséquences pour les futurs Baromètres santé

38Un appariement avec les données de santé est donc envisageable pour les prochains Baromètres, ce qui permettrait un suivi longitudinal du sous-échantillon de volontaires pour fournir leur NIR ou coordonnées de naissance et l’enrichissement des analyses classiques avec les variables médico- administratives. La procédure testée consistait à demander l’acceptation de l’appariement à la fin du questionnaire : si la restriction de l’échantillon aux seuls volontaires est tentante pour des raisons économiques évidentes, un tel protocole devrait identifier les acceptants au début du questionnaire, ce qui nécessiterait une autre expérimentation. Il est de plus à craindre qu’une telle demande formulée plus tôt dans le cours du questionnaire génère un taux de refus plus élevé, ou soit cause d’abandon du questionnaire car la finalité et l’intérêt de l’enquête seraient moins connus des enquêtés.

39Les taux d’acceptation mesurés restent faibles et il est nécessaire de les accroître pour profiter au mieux des possibilités de l’appariement : des réflexions sur le protocole sont donc encore à fournir. Par exemple, un argumentaire pourrait être fourni aux hésitants et, compte tenu de l’écart important d’acceptation de déclaration du NIR et des coordonnées de naissance, il pourrait être envisagé de demander séquentiellement le recueil du NIR et, en cas de refus, celui des coordonnées de naissance, pour maximiser le succès de la démarche d’appariement ultérieur. Afin d’augmenter la représentativité de l’échantillon de volontaires, des efforts pourraient également être déployés en direction des personnes les plus réticentes, c’est-à-dire, dans notre étude, celles qui sont les moins favorisées socialement et économiquement ou qui refusent de communiquer les revenus de leur ménage. Une autre piste, théoriquement plus efficace, pourrait consister à effectuer un tirage dans les bases de l’assurance maladie, à l’instar de ce que pratiquait l’Irdes dans l’enquête ESPS. Toutefois, cela reviendrait à modifier totalement le protocole actuel de l’enquête.

Notes

  • [1]
    En 2016, l’InVS, l’Inpes, l’Eprus et Adalis se sont unis pour créer Santé publique France. Auparavant, les Baromètres santé étaient réalisés par l’Inpes (Institut national pour la prévention et l’éducation à la santé).
  • [2]
    L’enquête Santé et protection sociale recueille depuis 1988 des données sur l’état de santé, la couverture maladie, la situation sociale et le recours aux soins d’un échantillon de 8 000 ménages ordinaires, soit 22000 personnes. Elle a lieu tous les deux ans et interroge les mêmes ménages tous les quatre ans (www.irdes.fr).
  • [3]
    Tempo est une cohorte d’enfants des participants à la cohorte épidémiologique Gazel qui avait été mise en place en 1989 par l’Inserm, en coopération avec plusieurs services d’EDF-GDF. Tempo vise à mieux comprendre certains besoins de santé des jeunes adultes en France (http://www.tempo.inserm.fr/).
  • [4]
    Constances est une cohorte épidémiologique « généraliste » constituée d’un échantillon de 200000 adultes âgés de 18 à 69 ans à l’inclusion, consultants des Centres d’examens de santé (CES) de la Sécurité sociale (www.constances.fr).
  • [5]
    La recherche du statut vital et des causes de décès pour les personnes décédées à l’étranger peut être difficile. En revanche, les étrangers ou nés à l’étranger sont également inscrits dans le RNIPP dès qu’ils résident en France et ont fait quelques démarches administratives (démarche pour un travail légal ou demande de remboursement de soins). L’accès à des données administratives hors décès est donc presque toujours possible et celui aux causes de décès très majoritaire. En revanche, les résidents clandestins ne sont pas enregistrés.
linkThis article is available in English on Cairn International
Français

Les enquêtes téléphoniques en population générale sont indispensables à la description des comportements de santé de la population. Nous avons testé la faisabilité de la demande de deux types de données identifiantes permettant des appariements à des données administratives et médico-administratives dans le Baromètre santé 2014 de Santé publique France : le NIR, numéro d’inscription au répertoire (dit de Sécurité sociale), et les coordonnées de naissance (CDN) comme les nom, prénom, date et lieu de naissance. Chacune était adressée à un sous-échantillon aléatoire de plus de 3000 répondants. L’étude ne portait pas sur la fourniture réelle de ces identifiants mais sur l’intention de le faire. Davantage de personnes accepteraient de communiquer leurs CDN plutôt que leur NIR (51,9 % vs 34,9 %). Les hommes accepteraient plus fréquemment ces propositions et il existe un gradient social au profit des plus diplômés et des cadres (NIR) ou des revenus élevés (NIR et CDN). Les personnes interrogées via un téléphone mobile acceptent moins souvent ces propositions, alors que c’est l’inverse pour celles déclarant des maladies chroniques ou des limitations fonctionnelles, sédentaires, buvant quotidiennement de l’alcool ou s’estimant en mauvaise santé. Les modalités pratiques restent à tester lors d’une prochaine enquête.

Mots-clés

  • baromètre santé
  • appariement sécurisé
  • enquête en population générale
  • essai randomisé

Références

  • Beck F., 2011, « Perception des risques et surveillance des comportements de santé : l’apport des Baromètres santé » in Astagneau P., Ancelle T. (dir.), Surveillance épidémiologique, Paris, Lavoisier, p. 296-302.
  • Beck F., Guilbert P., 2007, « Baromètres santé : un éclairage sur leur méthode et leur évolution », in Beck F., Guilbert P., Gautier A. (dir.), Baromètre santé 2005 : Attitudes et comportements de santé, Saint-Denis, Inpes, p. 27-43.
  • Beck F., Gautier A., Guignard R., Richard J.-B., 2013, « Méthode d’enquête du Baromètre santé 2010 », Saint-Denis, Inpes, 28 p.
  • En ligneBricard D., Jusot F., Beck F., Khlat M., Legleye S., 2015, « L’évolution des inégalités sociales de tabagisme au cours du cycle de vie : une analyse selon le sexe et la génération », Économie et statistique, n° 475-476, p. 89-112.
  • DREES-DGS, 2013, « Indicateurs de suivi de l’état de santé de la population : Révision 2013, Rapport final », Paris, Drees, Sources et Méthodes, n° 44, p. 524.
  • DREES, 2015, « L’état de santé de la population en France », Paris, Drees, Études et statistiques, 326 p.
  • Goldberg M., Guéguen A., Sitta R., Zins M., 2013, « Le point de vue de l’épidémiologiste : être représentatif ou universel ? » in Selz M. (dir.), La représentativité en statistique, Paris, Ined, Méthodes et savoirs, n° 8, p. 109-128.
  • En ligneGroves R.M., Singer E., Corning A., 2000, « Leverage-saliency theory of survey participation », Public Opinion Quarterly, 64(3), p. 299-308.
  • En ligneJusot F., Khlat M., Rochereau T., Sermet C., 2008, « Job loss from poor health, smoking and obesity : A national prospective survey in France », Journal of Epidemiology and Community Health, 62(4), p. 332-337.
  • En ligneKhlat M., Legleye S., Falissard B., Chau N., Lorhandicap G., 2014, « Mortality gradient across the labour market core-periphery structure : A 13-year mortality follow-up study in north-eastern France », International Archives of Occupational and Environmental Health, 87(7), p. 725-733.
  • En ligneLegleye S., Khlat M., Beck F., Peretti-Watel P., 2011, « Widening inequalities in smoking initiation and cessation patterns : A cohort and gender analysis in France », Drug and Alcohol Dependence, 117(2-3), p. 233-241.
  • En ligneLegleye S., Piontek D., Pampel F., Goffette C., Khlat M., Kraus L., 2014, « Is there a cannabis epidemic model ? Evidence from France, Germany and USA », International Journal of Drug Policy, 25(6), p. 1103-1112.
  • En ligneLegleye S., Khlat M., Mayet A., Beck F., Falissard B. et al., 2016, « From cannabis initiation to daily use : Educational inequalities in consumption behaviours over three generations in France », Addiction, 111(10), p. 1856-1866.
  • Montaut A., Calvet L., Bouvier G., Gonzalez L., 2013, « L’appariement handicap-santé et données de l’Assurance-maladie », Paris, Drees, Document de travail, série Sources et méthodes, n° 39, 35 p.
  • En lignePampel F., Legleye S., Goffette C., Piontek D., Kraus L., Khlat M., 2015, « Cohort changes in educational disparities in smoking : France, Germany and the United States », Social Science and Medicine, 127, p. 41-50.
  • Régnier-Loilier A., Guisse N., 2012, « La déperdition au fil des trois vagues de l’enquête longitudinale ERFI-GGS », Communication au 7e colloque francophone sur les sondages, Rennes, 16 p., http://sondages2012.ensai.fr/wp-content/uploads/2011/01/Article_Regnier_La-déperdition-au-fil-des-trois-vagues.pdf
  • Richard J.-B., Gautier A., Guignard R., Léon C., Beck F., 2014, « Méthode d’enquête du Baromètre santé 2014 », Baromètre santé, Saint-Denis, Inpes, 20 p.
Stéphane Legleye
Institut national de la statistique et des études économiques (Insee), Paris (France) ; CESP, Faculté de médecine, Université Paris Sud, Faculté de médecine UVSQ, Inserm, Université Paris-Saclay, Villejuif, France.
Correspondance : Stéphane Legleye, Insee, 18 bd Adolphe Pinard, 75014 Paris, France
Jean-Baptiste Richard
Santé publique France ; CESP, Faculté de médecine, Université Paris Sud, Faculté de médecine UVSQ, Inserm, Université Paris-Saclay, Villejuif, France.
Grégoire Rey
Inserm, CépiDc, Le Kremlin-Bicêtre, France.
François Beck
Institut national de la statistique et des études économiques (Insee), Paris (France) ; CESP, Faculté de médecine, Université Paris Sud, Faculté de médecine UVSQ, Inserm, Université Paris-Saclay, Villejuif, France.
Cette publication est la plus récente de l'auteur sur Cairn.info.
Mis en ligne sur Cairn.info le 29/03/2018
https://doi.org/10.3917/popu.1704.0729
Pour citer cet article
Distribution électronique Cairn.info pour Ined Éditions © Ined Éditions. Tous droits réservés pour tous pays. Il est interdit, sauf accord préalable et écrit de l’éditeur, de reproduire (notamment par photocopie) partiellement ou totalement le présent article, de le stocker dans une banque de données ou de le communiquer au public sous quelque forme et de quelque manière que ce soit.
keyboard_arrow_up
Chargement
Chargement en cours.
Veuillez patienter...