Accès au site web du Recensement de la population 1999 Portail Internet Insee

> Documentation >> Exploitation des résultats

LE DÉNOMBREMENT

Le dénombrement est la première exploitation effectuée après la collecte. Il permet d’obtenir les comptages de population et de logements pour tous les échelons géographiques (du district de recensement aux différentes circonscriptions administratives). À partir du niveau communal, la combinaison de ces résultats à ceux de l’état civil et des recensements de la population précédents permet d’obtenir les évolutions de population (mouvements naturel et migratoire).

Ces comptages sont obtenus à partir des bordereaux récapitulatifs établis lors de la collecte. Les informations saisies, pour chaque district, sont le nombre de logements et la population des ménages, celles des communautés et les doubles comptes.

Les résultats du comptage des bulletins individuels sont authentifiés par un décret.

Haut de page

LES EXPLOITATIONS STATISTIQUES

Après le dénombrement, viennent les exploitations statistiques. À partir des imprimés (essentiellement le bulletin individuel ou BI, la feuille de logement ou FL et le dossier d’immeuble collectif ou DIC) remplis par la population ou l’agent recenseur, l’INSEE procède aux exploitations statistiques.

Ces imprimés sont saisis par des façonniers extérieurs en deux étapes : saisie des informations de l’exploitation principale, puis saisie de l’exploitation complémentaire après sélection par l’INSEE des bulletins à traiter.

L’INSEE procède ensuite au codage automatique des questions (par exemple transformer un libellé de commune en code) et aux traitements statistiques nécessaires pour obtenir un fichier de données individuelles anonymes "propre" (imputation des valeurs manquantes, redressements, recodifications) pour préparer la diffusion des résultats.

Les exploitations statistiques s’effectuent en deux temps de manière à mettre à disposition, le plus rapidement possible, l’essentiel des résultats.

Haut de page

L'EXPLOITATION PRINCIPALE

La première exploitation statistique dite « principale » (ex-exploitation « légère ») est exhaustive, c’est-à-dire qu’elle traite la totalité des bulletins individuels et des feuilles de logement.

Les résultats de cette exploitation principale correspondent au traitement de la plupart des critères d’étude sur tous les bulletins.

Les résultats socio-économiques qui s’en dégagent peuvent être classés en 12 thèmes (10 pour les DOM) :

Population (âge, sexe, état matrimonial, actifs ou inactifs,...) ;
Activité (taux d’activité par sexe, chômage, conditions d’emploi,...) ;
Emploi (salariés ou non, temps partiel ou complet,...) ;
Navettes domicile-travail ;
Formation (scolarisation et lieu d’études, diplômes, niveau d’études,...)  ;
Migrations (lieu de naissance, lieu de résidence au 1/1/90) ;
Nationalité(nationalité selon l’âge, sexe, taille des ménages,...) ;
Immigration(français de naissance ou par acquisition, étrangers,...)  : uniquement métropole ;
Ménages (sexe, âge et activité de la personne de référence,...) ;
Logements (type, nombre de pièces,...) ;
Résidences principales (date d’emménagement, statut d’occupation, surface, garage-box-parking, confort/chauffage, nombre de voitures,...) ;
Immeubles (date d’achèvement, nombre d’étages, nombre de logements, HLM ou non, chauffage collectif, évacuation des eaux, digicode, gardien,...) : uniquement métropole.

Haut de page

L'EXPLOITATION COMPLÉMENTAIRE

La seconde exploitation statistique dite « complémentaire » (ex-exploitation « lourde ») permet d’affiner les caractéristiques de l’emploi et de procéder à l’analyse détaillée de la composition des ménages et des familles.

Ces variables sont plus complexes à obtenir, c’est pourquoi l’exploitation complémentaire procède par sondage en métropole. Les départements d’outre-mer et certaines zones de métropole sont traitées exhaustivement (voir la note « Tirage des échantillons »).

Pour permettre la validation des traitements statistiques (imputation des valeurs manquantes, redressement, recodification) et la diffusion plus rapide des premiers résultats sur les catégories sociales et l’activité économique, une exploitation au 1/20 (par sélection d’un cinquième de l’échantillon du quart) est également réalisée pour la métropole.

Les résultats socio-économiques qui s’en dégagent peuvent être classés en 12 thèmes (11 pour les DOM) :

 - il s’agit des thèmes déjà présentés lors de la première exploitation enrichis d’une analyse sur les catégories socioprofessionnelles et sur le secteur d’activité, seul le thème immeuble n’est pas repris ;
- un thème nouveau apparaît lors de cette exploitation statistique : le thème Familles (couples, familles monoparentales, nationalité et catégorie socioprofessionnelle de la personne de référence, nombre et âge des enfants,...).

Haut de page

TIRAGE DES ÉCHANTILLONS

Le tirage des échantillons du quart

Le sondage au 1/4 est un tirage systématique de 1 unité sur 4 sur fichier trié. Cette méthode donne des résultats similaires à un tirage stratifié sur les mêmes critères de tri.

Le tirage s'applique sur les logements pour les ménages et assimilés et les logements vides, et sur les individus pour les communautés et assimilés.

Pour les ménages et assimilés, les enregistrements sont triés selon 5 critères :

- le département et la commune de résidence ;
- une catégorie sociale approchée de la personne de référence du ménage ;
- un type de ménage ;
- la taille du ménage ;
- une catégorie sociale approchée du conjoint.

Pour les logements vides, les enregistrements ont été triés sur le département et la commune.

Pour les communautés et assimilés, le tirage d'individus est réalisé sur un fichier trié selon la commune, le type de communauté et la date de naissance.

Les extensions géographiques

Certaines zones géographiques traitées à l'exhaustif ont été intégrées à l'exploitation complémentaire. Il s'agit plus particulièrement des départements d'outre-mer, des deux départements de la Corse, de quelques communes et de certaines zones infracommunales (petites Zones Urbaines Sensibles et certains îlots).

Le tirage de l'échantillon du vingtième

L'échantillon du 1/20 est issu directement de l'échantillon du sondage au 1/4, par tirage d'un cinquième des bulletins sur les mêmes critères. Certaines populations particulières ont toutefois été traitées à l'exhaustif : il s'agit des mariniers rattachés administrativement à la commune et de la population des établissements n'ayant pas de résidence personnelle (ou dont la feuille de logement correspondant à l'adresse de leur résidence personnelle n'a pas été retrouvée).

Haut de page

PRÉCISIONS DES RÉSULTATS

Quels que soient les efforts employés lors de la collecte, les questionnaires du recensement présentent des imperfections dues à des causes diverses : unités non recensées, personnes recensées deux fois, absence de réponse à certaines questions, réponses inexactes. Ces imperfections affectent surtout les unités se trouvant dans une situation complexe ou marginale. En outre, certaines erreurs de traitement ont pu se produire lors de l'opération de saisie-chiffrement.

L'existence de ces imperfections, inhérentes à toute opération statistique, ne doit pas être oubliée même si elles ne ressortent pas clairement de l'examen des résultats, puisque, lors de la codification, on a pu corriger des incompatibilités et, dans certains cas, attribuer une valeur plausible aux variables non renseignées.

Dans le cas des résultats tirés de l'exploitation complémentaire, il s'ajoute une incertitude due à l'échantillonnage, sauf si la zone d'intérêt a été traitée exhaustivement.

La théorie des sondages permettrait d'estimer la précision de chaque donnée, pour chacune des méthodes utilisées, à condition de procéder à des tabulations complexes pour chacune d'elles. Dans des études expérimentales, on a pu constater le bien fondé de la théorie avec des simulations qui en précisent les indications.

L'incertitude sur un total est essentiellement fonction de l'effectif à estimer ; on peut ainsi en première approximation prendre comme intervalle de confiance à 95 % (un tel intervalle a 95 chances sur 100 de recouvrir le résultat que donnerait un dépouillement exhaustif) :

 , arrondi à , si le résultat est tiré du sondage au 1/20

, arrondi à , s'il est issu de l'exploitation complémentaire

Le tableau ci-dessous donne les intervalles de confiance ainsi calculés pour quelques valeurs de x :

 

Intervalle de confiance à 95%

Résultat

1/20

1/4

1 000 000

991 000 - 1 009 000

996 000 - 1 004 000

100 000

97 100 - 102 900

  98 700 - 101 300

10 000

9 100 - 10 900

  9 600 - 10 400

1 000

710 - 1 290

  870 - 1 130

100

10 - 190

  60 - 140

Il y a lieu de remarquer que les petits nombres peuvent être entachés d'une erreur relative très importante. Néanmoins, ils ont été maintenus dans les tableaux. Ainsi la cohérence comptable des tableaux est satisfaite ; de plus, cela rend possible d'éventuels regroupements ainsi que des recoupements entre tableaux différents.

Haut de page