Le 17 mars 2026, la base SocFace a mis en ligne 291 millions de noms extraits des recensements de population français de 1836 à 1936.
Ce projet porté par l’INED utilise l’intelligence artificielle pour transcrire automatiquement des millions de pages manuscrites.
Un outil prometteur pour les généalogistes, à condition d’en connaître les limites : le taux d’erreur de transcription oscille entre 15 et 20%, et certaines données sont simplement inexploitables.
Cet article vous explique comment utiliser SocFace efficacement, identifier ses failles et croiser vos sources pour obtenir des résultats fiables.
01. SocFace, de quoi parle-t-on ?
SocFace n’est pas un outil conçu pour les généalogistes, mais un projet de recherche scientifique devenu accessible au grand public.
L’objectif initial de l’INED et de l’École d’économie de Paris était d’analyser les transformations de la société française entre 1836 et 1936 en exploitant les recensements de population.
Pour traiter cette masse documentaire considérable, les chercheurs ont fait appel à l’intelligence artificielle et aux technologies de reconnaissance automatique d’écriture manuscrite, développées par la société Teklia.
Le résultat est une base de données interrogeable gratuitement sur le portail FranceArchives, qui indexe actuellement 291 millions de notices nominatives provenant de 55 Archives départementales, 7 Archives municipales et les Archives nationales d’outre-mer.
L’objectif final est d’atteindre 400 millions de notices d’ici l’été 2026, soit l’intégralité des recensements quinquennaux disponibles sur cette période.
1.1 Les données disponibles dans SocFace
Pour chaque individu recensé entre 1836 et 1936, SocFace fournit, lorsque l’information était présente dans le document source : le nom de famille, le ou les prénoms, l’âge au moment du recensement, le lieu de naissance, la profession exercée, et le lien avec le chef de ménage (épouse, fils, domestique, pensionnaire, etc.). Ces informations permettent de reconstituer la composition des foyers et d’observer les migrations, les changements de profession ou les évolutions familiales sur plusieurs décennies.
La base intègre au total 3,2 milliards de données structurées, ce qui en fait le plus vaste index nominatif jamais constitué sur la population française du XIXe et du début du XXe siècle. Chaque fiche de résultat renvoie vers la date et la commune du recensement, ainsi que l’indication de la page et de la ligne dans le document numérisé conservé par les Archives départementales.
1.2 Comment accéder à SocFace
L’accès à SocFace se fait exclusivement via le portail FranceArchives.
La présentation officielle du projet est disponible à l’adresse , et sur son interface de recherche..
Aucune inscription n’est requise, et l’utilisation est entièrement gratuite. L’interface de recherche propose trois champs principaux : nom, prénom(s) et localité. Vous pouvez remplir un seul champ ou combiner plusieurs critères pour affiner vos résultats.
Des opérateurs de recherche sont disponibles pour compenser les variations orthographiques fréquentes dans les documents manuscrits du XIXe siècle.
L’astérisque (*) remplace une séquence de caractères indéterminée :
- (par exemple, « Mart » pour « Martin », « Martinet », « Martineau »),
- tandis que le point d’interrogation (?) remplace un caractère unique (« D?pont » pour « Dupont » ou « Depont »).
Ces opérateurs sont particulièrement utiles pour les noms à orthographe fluctuante ou les prénoms transcrits de manière approximative.
1.3 Comprendre les résultats affichés
Les résultats s’affichent sous forme de liste, avec pour chaque entrée le nom, le prénom, l’âge, le lieu et la date du recensement.
En cliquant sur une fiche individuelle, vous accédez à l’ensemble des informations indexées : profession, lieu de naissance, lien avec le chef de ménage, et autres membres du foyer présents dans le même recensement.
Cette vue d’ensemble permet de reconstituer rapidement la cellule familiale complète.
Pour consulter le document original numérisé et vérifier la transcription, il faut cliquer sur le bouton « Consulter le document numérisé ».
Ce lien vous redirige vers le site des Archives départementales concernées, où vous pourrez visualiser l’image de la page de recensement.
Cette étape de vérification est indispensable, car elle permet de corriger les erreurs de transcription automatique et de contextualiser les informations trouvées.

Institut National de Démographie

L'École de l'économie de Paris

Recensements de la population et le projet SocFace

SocFace
02. Quel est le taux de fiabilité réel de SocFace ?
Les concepteurs du projet ne cachent rien : SocFace n’est pas une base infaillible.
Le taux d’erreur de transcription est estimé entre 15 et 20%, ce qui signifie qu’une donnée sur cinq à sept peut être incorrecte.
Ce chiffre varie considérablement selon la qualité du document source, la période concernée, et la complexité de l’écriture manuscrite.
Les recensements de la seconde moitié du XIXe siècle, souvent plus normalisés et lisibles, donnent de meilleurs résultats que ceux de la première moitié, parfois rédigés de manière très cursive.
La Revue française de Généalogie indique que le taux de réussite oscille entre 70% et 98% selon les périodes et la structure des documents.
Cela signifie que certains recensements sont exploitables avec confiance, tandis que d’autres nécessitent une vérification systématique.
Sur les forums de généalogie, plusieurs utilisateurs rapportent des expériences décevantes, décrivant SocFace comme « pratiquement inutilisable » en raison du volume d’erreurs rencontrées. D’autres, au contraire, saluent un outil précieux pour débloquer des recherches, à condition de croiser les sources.
2.1 Les erreurs de transcription automatique
Les erreurs de transcription proviennent de la difficulté inhérente à la reconnaissance automatique d’écriture manuscrite.
Les lettres cursives mal formées, les abréviations non standardisées, les ratures et les surcharges dans les documents originaux perturbent les algorithmes.
Un « Dubois » peut être lu « Dubors », un « Marie » devenir « Marié », un âge de 42 ans être transcrit en 12 ans. Les prénoms composés sont parfois tronqués, et les professions aux appellations régionales peuvent être mal interprétées.
Les noms de lieux sont particulièrement sensibles aux erreurs. Un hameau écrit en abrégé ou avec une graphie dialectale peut être complètement méconnaissable dans l’index.
Les adresses incomplètes ou les numéros de rue mal lus rendent difficile la localisation précise d’un ancêtre. Ces approximations sont d’autant plus problématiques que l’utilisateur se fie parfois aveuglément à la transcription sans consulter l’image source.
2.2 Les lacunes héritées des documents originaux
Au-delà des erreurs de l’IA, SocFace reproduit mécaniquement toutes les lacunes des recensements originaux.
Certaines communes n’ont pas été recensées lors de périodes de conflit ou de crise administrative. Des volumes entiers ont été détruits lors de la Première Guerre mondiale, notamment dans le Nord et l’Est de la France.
Des individus ont été omis par les agents recenseurs, volontairement ou par négligence. Ces absences ne sont pas imputables à SocFace, mais elles limitent la couverture effective de la base.
Les regroupements de ménages erronés, déjà présents dans les documents manuscrits, se retrouvent également dans l’indexation automatique.
Un pensionnaire peut être rattaché au mauvais chef de famille, ou une famille éclatée sur deux pages consécutives peut apparaître comme deux ménages distincts. Ces erreurs structurelles compliquent la reconstitution des lignées et imposent un travail de recoupement manuel.
2.3 Les limites techniques de la base
Un problème récurrent signalé par les utilisateurs concerne l’indication de page et de ligne dans les résultats.
Celle-ci ne correspond pas toujours à la numérotation des fichiers numériques disponibles sur les sites des Archives départementales.
Pour les grandes communes dont les recensements sont découpés en plusieurs volumes, il est parfois impossible de savoir dans quel ordre l’IA a traité les documents.
Résultat : vous savez qu’un ancêtre figure dans un recensement, mais vous devez éplucher plusieurs centaines de pages pour le localiser.
Le lien vers les images numérisées n’est pas encore intégré directement dans SocFace.
Il faut passer par une redirection vers le site des Archives départementales, puis naviguer manuellement dans l’arborescence pour retrouver le bon recensement.
Cette rupture dans le parcours utilisateur rallonge considérablement le temps de recherche et décourage les utilisateurs moins expérimentés.
03. Comment exploiter SocFace malgré ses limites ?
SocFace reste un outil précieux si vous l’utilisez comme un index de départ et non comme une source de vérité.
La méthode consiste à repérer rapidement les occurrences potentielles d’un ancêtre, puis à vérifier systématiquement les informations sur le document original.
Cette double approche permet de tirer parti de la puissance de l’IA pour gagner du temps, tout en conservant l’exigence critique du généalogiste sur la fiabilité des données.
La stratégie la plus efficace consiste à lancer plusieurs requêtes en variant les orthographes possibles du nom recherché.
Si vous cherchez un « Lefebvre » né vers 1850, testez aussi « Lefèvre », « Lefebure », « Lefèbvre », avec ou sans tiret.
Utilisez les opérateurs de recherche pour élargir les résultats, puis triez manuellement les occurrences pertinentes en croisant avec d’autres informations connues : âge approximatif, commune de résidence, profession du père.
3.1 Vérifier systématiquement le document source
Une fois un résultat identifié dans SocFace, la première étape consiste à consulter l’image numérisée du recensement.
Cela permet de corriger les erreurs de transcription évidentes, mais aussi de contextualiser l’information.
Vous découvrirez peut-être que l’ancêtre vivait avec des parents non mentionnés dans l’indexation automatique, ou que sa profession a été mal interprétée. Le document manuscrit contient souvent des annotations marginales, des ratures ou des précisions absentes de la transcription.
Cette vérification est indispensable pour les données critiques : un âge, une date de naissance, un lieu d’origine. Ne reproduisez jamais directement dans votre arbre généalogique une information issue de SocFace sans l’avoir confrontée à l’image source.
Les erreurs de transcription automatique peuvent se propager d’un recensement à l’autre si elles ne sont pas corrigées, et fausser l’ensemble de votre lignée.
3.2 Croiser avec les autres bases de FranceArchives
FranceArchives ne se limite pas à SocFace. Le portail propose également des indexations d’état civil, de matricules militaires, de registres de Morts pour la France 14-18, et de nombreux autres fonds d’archives.
Croisez les informations trouvées dans SocFace avec ces autres bases pour confirmer ou infirmer vos hypothèses.
Un individu recensé à Paris en 1896 peut avoir un acte de décès dans la même ville quelques années plus tard, ou figurer dans les matricules militaires avec une date de naissance précise.
Ces croisements permettent aussi de débloquer des recherches lorsque SocFace ne donne aucun résultat.
Si un ancêtre est absent des recensements indexés, vous pouvez tenter de le retrouver via son mariage, sa conscription ou son décès, puis remonter vers les recensements en connaissant sa commune de résidence approximative.
Cette approche indirecte compense partiellement les lacunes de la base.
Pour approfondir une recherche ou confirmer l’identité d’un individu, les chercheurs peuvent notamment s’appuyer sur la Base des noms de FranceArchives, qui fédère des millions de personnes, familles, collectivités et organismes mentionnés dans les fonds d’archives français.
Accessible librement en ligne, cet outil constitue un complément particulièrement intéressant aux données issues de SOCFACE, en permettant d’élargir les investigations vers d’autres fonds documentaires conservés par les services d’archives publics.
3.3 Consulter directement les Archives départementales
Pour les recherches approfondies, il est souvent plus efficace de consulter directement les recensements numérisés sur les sites des Archives départementales, plutôt que de passer par SocFace.
Si vous connaissez déjà la commune et la période approximative de résidence d’un ancêtre, un feuilletage manuel des recensements vous évitera les erreurs de transcription et vous donnera une vision complète des familles présentes dans le lieu.
Cette méthode est particulièrement recommandée pour les petites communes rurales, où les recensements sont courts et faciles à parcourir.
Pour les grandes villes, SocFace reste utile comme point d’entrée, mais la vérification manuelle s’impose ensuite.
Certaines Archives départementales proposent leurs propres indexations collaboratives, réalisées par des bénévoles associatifs, qui sont parfois plus fiables que la transcription automatique de SocFace.

État civil en ligne

Registres matricules numérisés et indexés

Guerre de 1914-1918. Fichier des Morts pour la France

Fonds d'Archives
04. SocFace et l'avenir de la recherche généalogique
SocFace marque une étape importante dans l’automatisation du traitement des archives, mais il ne remplace pas le travail du généalogiste.
L’intelligence artificielle excelle à traiter des volumes considérables de documents, mais elle échoue encore sur les cas complexes : écritures irrégulières, documents abîmés, informations ambiguës.
Le rôle du chercheur reste central pour valider, corriger et contextualiser les données extraites automatiquement.
Généatique 2026 a intégré un onglet dédié permettant d’interroger directement SocFace depuis le logiciel.
Cette intégration facilite l’accès à la base, mais ne résout pas le problème de la fiabilité. Les utilisateurs doivent conserver un esprit critique et ne jamais considérer un résultat issu de l’IA comme définitif.
La qualité d’un arbre généalogique repose toujours sur la capacité du chercheur à croiser les sources, à identifier les incohérences et à remonter aux documents originaux.
SocFace comme complément, pas comme substitut
La leçon à tirer de SocFace est que l’IA ne supprime pas le besoin de compétences généalogiques solides.
Elle accélère certaines étapes de la recherche, mais n’élimine ni les erreurs, ni les lacunes, ni la nécessité de vérifier les sources.
Un généalogiste expérimenté saura tirer parti de SocFace en l’intégrant dans une démarche méthodique de croisement des données.
Un débutant risque au contraire de se perdre dans les faux positifs et les informations erronées.
Les associations de généalogie et les Archives départementales ont un rôle à jouer pour former les utilisateurs aux bonnes pratiques d’utilisation de SocFace.
Expliquer les limites de l’outil, montrer comment vérifier une transcription, enseigner les techniques de recherche alternative en cas d’échec : autant de compétences indispensables pour transformer SocFace en véritable levier de recherche plutôt qu’en source de confusion.
Conclusion
SocFace ouvre l’accès à 291 millions de noms issus des recensements de population français entre 1836 et 1936.
C’est un outil puissant pour localiser rapidement des ancêtres, reconstituer des parcours migratoires ou débloquer des recherches au point mort. Mais cette puissance a un prix : un taux d’erreur de 15 à 20% qui impose une vérification systématique des données sur les documents originaux.
Le généalogiste averti utilisera SocFace comme un index de départ, jamais comme une source définitive.
Il croisera les informations avec les autres bases de FranceArchives, consultera les registres numérisés des Archives départementales, et conservera un œil critique sur toute transcription automatique.
Avec cette méthode, SocFace devient un gain de temps précieux. Sans elle, il risque de devenir une source d’erreurs qui se propagent d’un arbre à l’autre.




