Entités nommées : pourquoi ChatGPT vous confond avec un concurrent
Imaginez deux agences web qui s'appellent toutes les deux « Atelier Web ». L'une à Genève, l'autre à Montréal. Pour ChatGPT, sans contexte explicite, elles se fondent en une seule entité floue. Résultat : les deux perdent.
Le problème
Les LLM apprennent à partir de grandes quantités de texte. Quand deux entités partagent un nom, elles se fusionnent statistiquement sauf si des signaux distinctifs sont posés explicitement.
« Un nom générique sans contexte, c'est un visage dans une foule. Un nom générique avec contexte, c'est une personne identifiable. »
Les signaux distinctifs à poser
-
Localisation systématique. Dites « Atelier Web Genève » plutôt qu'« Atelier Web ». Dans le
title, leh1, le JSON-LD, le footer. -
Année de fondation. « Fondé en 2020 » dans le balisage Organization. Ça distingue de manière mécanique.
-
Fondateurs nommés. Les noms propres des personnes sont des ancres fortes pour les LLM. Mettez-les dans l'À propos et dans le JSON-LD.