L’intelligence artificielle (IA) s’est invitée dans le quotidien des généalogistes : aide à la lecture d’actes anciens, transcription, traduction, recherche d’informations, rédaction de synthèses…
En quelques mois, des outils grand public ont rendu ces usages accessibles à tous, sans formation technique particulière.
Mais derrière cette apparente facilité, deux réalités doivent être clairement rappelées :
- d’une part, l’IA sur-interprète souvent les documents, en complétant ce qui lui manque par des suppositions plausibles, mais parfois totalement fausses ;
- d’autre part, l’IA ne s’utilise pas hors du droit : archives publiques, données personnelles, droit d’auteur, droit à l’image sont encadrés par des textes précis (Code du patrimoine, RGPD, etc.), qui s’appliquent aussi aux généalogistes.
L’objectif de cet article est double :
- expliquer pourquoi et comment l’IA peut se tromper lorsqu’elle est confrontée aux archives ;
- rappeler les limites juridiques à respecter pour que la généalogie reste une pratique rigoureuse, respectueuse des personnes et conforme au droit.
1. Pourquoi l’IA “sur-interprète” les archives
1.1. Un fonctionnement par probabilité, pas par compréhension
L’IA dite “générative” (comme les grands modèles de langage) ne “comprend” pas un texte au sens humain : elle prédit le mot le plus probable à la suite d’une suite de mots, sur la base de modèles statistiques entraînés sur de très grandes quantités de données.
Concrètement, lorsqu’on lui demande de lire un acte ou d’expliquer un document, l’IA :
- analyse les caractères qu’elle perçoit (ou le texte déjà extrait) ;
- repère des motifs qu’elle connaît (formes de dates, formules d’actes, patronymes fréquents, etc.) ;
- reconstruit ensuite une phrase qui lui semble cohérente, même si plusieurs lectures sont possibles, ou si le passage est partiellement illisible.
Si l’information est claire, le résultat peut être très pertinent. Mais dès que le document est abîmé, mal numérisé, écrit dans une graphie difficile, ou que le contexte lui manque, l’IA “comble les trous” par ce qui lui semble le plus vraisemblable, ce que l’on appelle couramment des “hallucinations” : des affirmations précises mais fausses.
En généalogie, cette logique probabiliste peut entraîner des conséquences importantes : une date légèrement modifiée, un prénom altéré, un lien de parenté inventé… tout cela paraît plausible, mais ne repose sur aucun acte réel.
1.2. Des archives anciennes particulièrement délicates pour l’IA
Les archives utilisées par les généalogistes cumulent plusieurs difficultés pour l’IA :
- Graphies anciennes et paléographie : lettres similaires (s, f, l…), abréviations, latin, formules juridiques anciennes ;
- Dégradations matérielles : taches, déchirures, encre passée, zones illisibles ;
- Numérisations incomplètes ou de mauvaise qualité : résolution insuffisante, contraste faible, ombres ;
- Contexte lacunaire : un acte isolé consulté hors série, sans vue d’ensemble de la paroisse, de la commune ou de la famille.
L’IA peut alors :
- confondre des patronymes proches ;
- interpréter une rature comme un mot ;
- “deviner” une date en se basant sur la logique des registres (par exemple, en interpolant entre deux années) ;
- attribuer un lien de parenté parce que plusieurs noms apparaissent dans la même page, sans que l’acte ne l’indique explicitement.
En résumé, les archives anciennes sont pour l’IA un terrain d’incertitude, où la tentation de compléter, extrapoler, extrapoler encore… est permanente.
1.3. Exemples typiques de sur-interprétation
Sans citer de cas réels ni de personnes identifiables, on peut illustrer les risques de la manière suivante :
- Patronymes confondus : un nom comme “Martinon” lu en “Martin” ou “Martinet”, l’IA considérant que le patronyme le plus fréquent est le plus probable.
- Dates reconstituées : un acte partiellement effacé où “7bre” (septembre) devient “8bre” (octobre), ou où une année incomplète est “complétée” par analogie avec les pages voisines.
- Liens familiaux inventés : la présence d’un même patronyme dans deux actes conduit l’IA à proposer une filiation inexistante (“il s’agit probablement du fils de…”), alors que les actes ne le disent pas.
- Lecture abusive de mentions marginales : une note en marge mal déchiffrée est transformée en information détaillée sur un mariage, un décès ou un déménagement.
Ces erreurs sont d’autant plus problématiques qu’elles sont présentées par l’IA avec beaucoup d’assurance. Pour un utilisateur peu averti, il est parfois difficile de distinguer ce qui vient réellement de l’archive et ce qui est le fruit d’une interprétation automatique.
2. Les limites juridiques de l’IA appliquée aux archives
Le deuxième volet de la question est juridique : même lorsque l’IA fournit une réponse techniquement correcte, son utilisation reste encadrée par le droit français et européen.
2.1. Les archives publiques : un accès libre, mais sous conditions
En France, le Code du patrimoine définit le régime des archives publiques. Le livre II précise notamment :
- les conditions de communication des documents (délais de communicabilité, cas de restriction, etc.) ;
- les règles de réutilisation des informations publiques ;
- les responsabilités des services d’archives dans la conservation et la mise à disposition des documents.
De nombreux documents anciens sont librement communicables, mais certaines catégories restent protégées pendant un certain temps (vie privée, dossiers médicaux, dossiers judiciaires, mineurs, etc.).
Utiliser une IA pour analyser, combiner ou republier ces informations ne dispense pas le généalogiste de respecter ces règles. L’outil n’efface ni les délais de communicabilité, ni les restrictions liées à la nature du document.
2.2. Le RGPD : protéger les personnes vivantes
Le Règlement général sur la protection des données (RGPD) encadre tout traitement de données à caractère personnel, c’est-à-dire toute information se rapportant à une personne physique identifiée ou identifiable.
En généalogie, cela concerne particulièrement :
- les personnes encore en vie ;
- les données permettant de les identifier directement ou indirectement (nom, adresse, date de naissance, liens familiaux, etc.) ;
- les données dites sensibles (santé, opinions, religion, etc.), qui bénéficient d’une protection accrue.
Faire analyser par une IA un fichier comportant des personnes vivantes, ou lui demander de reconstituer des informations sur un individu contemporain à partir de fragments de données, revient à effectuer un traitement de données personnelles, qui doit respecter :
- une finalité déterminée et légitime (par exemple, une recherche strictement familiale) ;
- une base juridique appropriée (consentement, intérêt légitime équilibré, etc.) ;
- des garanties en matière de sécurité et de confidentialité.
L’usage d’une IA hébergée sur des serveurs extérieurs, parfois hors de l’Union européenne, pose des questions supplémentaires (transferts internationaux de données, conditions d’utilisation des services, etc.).
2.3. Droit d’auteur et réutilisation des contenus numérisés
Beaucoup de documents anciens peuvent être tombés dans le domaine public (plus de 70 ans après la mort de l’auteur, en principe), mais les numérisations ou les mises en forme proposées par les institutions publiques ou privées peuvent être protégées par :
- le droit d’auteur sur la numérisation ou l’édition ;
- les conditions générales d’utilisation (CGU) des sites d’archives ou des bibliothèques numériques.
Certains services d’archives autorisent la consultation mais limitent la réutilisation ou l’extraction massive d’images ou de données. Utiliser une IA pour :
- télécharger automatiquement un grand nombre d’images,
- les réinjecter dans un autre service,
- ou en produire des dérivés sans respecter les CGU
peut contrevenir à ces conditions.
Le généalogiste reste responsable de la façon dont il collecte, transforme et republie les données, même si l’outil technique est extérieur.
2.4. Droit à l’image et respect de la vie privée
Le droit à l’image découle du droit au respect de la vie privée. Publier ou faire circuler des photographies ou des images de personnes identifiables suppose, en principe, leur accord, sauf cas particuliers (personnalités publiques dans l’exercice de leurs fonctions, événements d’actualité, etc.).
Dans un contexte d’IA, plusieurs questions se posent :
- demander à une IA de générer ou modifier le portrait d’une personne identifiable à partir d’une photo ancienne ;
- recomposer des visages “probables” à partir de documents d’archives ;
- diffuser ces images sur internet ou sur les réseaux sociaux.
Même si la personne est décédée, la diffusion peut heurter la sensibilité des proches ou donner lieu à des réutilisations indésirables. Lorsqu’il s’agit de personnes vivantes, la vigilance doit être maximale.
2.5. Qui est responsable en cas de problème ?
L’IA est un outil : elle n’a pas de personnalité juridique. En cas de diffusion d’informations fausses, diffamatoires, ou en cas d’atteinte au respect de la vie privée, la responsabilité incombe à :
- la personne qui a publié le contenu (généalogiste, association, éditeur) ;
- éventuellement, la plateforme qui l’héberge, selon le cadre applicable.
S’appuyer sur une IA ne constitue ni une excuse, ni une exonération de responsabilité : c’est à l’utilisateur de vérifier les informations et de respecter le droit.
3. IA & généalogie : ce qu’il est possible de faire (et ce qui est déconseillé)
3.1. Des usages pertinents et raisonnables
Bien utilisée, l’IA peut être une aide précieuse pour la recherche généalogique :
- Assistance à la lecture : proposer des hypothèses de déchiffrement, que le généalogiste confirme ou corrige ;
- Transcription : gagner du temps sur des textes longs, avant une relecture humaine attentive ;
- Traduction : comprendre rapidement un acte en latin, en allemand, en italien, etc. ;
- Contextualisation : obtenir des explications générales sur les institutions, les pratiques juridiques ou sociales d’une époque.
Dans tous ces cas, l’IA ne remplace pas la consultation directe du document original, mais fournit un appui qui peut accélérer la compréhension.
3.2. Ce qu’il vaut mieux éviter
En revanche, certains usages présentent un risque élevé d’erreur ou de non-conformité juridique :
- Reconstitution automatique d’arbres à partir de données partielles : l’IA peut créer des liens de parenté non attestés par les actes ;
- Génération de biographies détaillées de personnes identifiables, surtout si elles sont encore en vie ou récemment décédées ;
- Attribution de professions, d’événements ou de lieux qui ne figurent pas dans les sources, simplement parce qu’ils “collent bien” au contexte ;
- Analyse de bases contemporaines contenant des personnes vivantes, sans cadrage juridique clair (RGPD, consentement, finalité) ;
- Production et diffusion de portraits recomposés à partir d’archives, sans accord des intéressés ou des ayants droit.
Ces usages cumulent des risques de sur-interprétation et d’atteinte aux droits.
3.3. Bonnes pratiques recommandées
Pour utiliser l’IA de manière responsable en généalogie, plusieurs principes simples peuvent être retenus :
- Toujours revenir à la source primaire
- L’IA peut proposer une lecture ou un résumé, mais seule l’archive originale fait foi.
- En cas de doute, privilégier la relecture manuelle, voire l’avis d’un paléographe ou d’un archiviste.
- Ne jamais publier une information non confirmée
- Ne pas intégrer à un arbre en ligne ou à un article une donnée qui ne repose que sur une interprétation d’IA.
- Indiquer clairement les hypothèses, les incertitudes, les zones encore à vérifier.
- Limiter l’IA pour les personnes vivantes
- Éviter de soumettre à un service externe des fichiers contenant des données sur des personnes vivantes.
- Se rappeler que la généalogie n’autorise pas tout en matière de vie privée.
- Respecter les CGU des services d’archives
- Lire (au moins en partie) les conditions d’utilisation des sites d’archives et des bibliothèques numériques.
- Ne pas automatiser de manière massive le téléchargement ou la réutilisation d’images.
- Informer sur l’usage de l’IA
- Lorsque des outils d’IA ont été utilisés pour un travail publié (article, dossier, arbre en ligne), le signaler.
- Promouvoir une culture de transparence et de prudence.
La Fédération Française de Généalogie peut jouer un rôle clé en rappelant ces bonnes pratiques et en accompagnant progressivement les associations et les particuliers dans ces nouveaux usages.
4. Quel futur pour l’IA dans les archives ?
4.1. Des expérimentations encadrées
De nombreux services d’archives et institutions culturelles travaillent déjà, ou expérimentent, des solutions d’IA pour :
- reconnaître automatiquement les écritures manuscrites (technologies HTR – Handwritten Text Recognition) ;
- indexer plus rapidement des registres ;
- améliorer la recherche plein texte dans des corpus numérisés ;
- aider à la préservation numérique (détection d’erreurs, contrôle qualité).
Ces projets sont en général développés dans un cadre institutionnel, avec :
- un souci de fiabilité scientifique ;
- une attention portée à la protection des données ;
- une réflexion sur l’éthique de l’usage de l’IA.
4.2. Trouver l’équilibre : progrès technique et rigueur généalogique
L’IA va probablement s’intégrer de plus en plus dans les outils de consultation, d’indexation et de recherche documentaire. Pour les généalogistes, le défi n’est pas d’accepter ou de refuser globalement l’IA, mais de :
- comprendre ses forces (vitesse, assistance, synthèse) ;
- connaître ses limites (erreurs, hallucinations, manque de contexte) ;
- intégrer le droit et l’éthique dans les usages ;
- conserver la méthode généalogique : croisement des sources, prudence dans les conclusions, respect des personnes.
La Fédération a un rôle essentiel à jouer pour accompagner ce mouvement, en rappelant que la rigueur, la vérification et le respect des textes restent au cœur de la pratique.
Conclusion
L’IA n’est ni un ennemi de la généalogie, ni une baguette magique. C’est un outil puissant, capable d’accélérer certains travaux, mais aussi de produire des erreurs très convaincantes et de conduire à des usages juridiquement risqués.
Pour les généalogistes, la question n’est pas seulement : “Que peut faire l’IA ?” mais :
- “Que puis-je raisonnablement lui confier sans mettre en danger la qualité de mon travail ?”
- “Dans quel cadre légal suis-je autorisé à utiliser ces outils ?”
En combinant vigilance méthodologique, respect du Code du patrimoine, du RGPD, du droit d’auteur et du droit à l’image, il est possible de tirer parti des apports de l’IA tout en préservant ce qui fait la force de la généalogie : la fiabilité des sources et le respect des personnes.







