À l'ère d'Internet, l'abondance d'informations rend les graphes de connaissances (KG) essentiels pour comprendre et organiser le monde. Mais voici le défi : comment différents graphes de connaissances identifient-ils et alignent-ils leurs entités respectives ? C'est comme organiser une grande fête et faire en sorte que des invités de milieux différents se rencontrent et deviennent amis.

Une étude récente intitulée « AutoAlign : Fully Automatic and Effective Knowledge Graph Alignment enabled by Large Language Models » propose une solution ingénieuse : AutoAlign. Ce n'est pas seulement une avancée technologique, mais aussi une véritable « fête » dans le monde de l'IA.

image.png

Imaginez-vous comme organisateur d'une fête, veillant à ce que chaque invité trouve ses amis. Dans le monde des graphes de connaissances, ces « invités » sont les entités, et AutoAlign est l'organisateur magique.

AutoAlign est une nouvelle méthode d'alignement de graphes de connaissances, entièrement automatique et efficace. Elle ne nécessite aucun alignement initial manuel (seed alignments), ce qui signifie que vous n'avez pas besoin de lui indiquer à l'avance quelles entités sont liées. C'est comme si, lors d'une fête, vous n'aviez pas besoin de présenter chaque personne individuellement ; AutoAlign les identifie et les présente automatiquement.

Le secret d'AutoAlign réside dans l'utilisation de grands modèles de langage (comme ChatGPT et Claude) pour construire un graphe de proximité des prédicats (predicate-proximity-graph). Ce graphe aide AutoAlign à identifier automatiquement les prédicats similaires dans différents graphes de connaissances. C'est comme si l'organisateur de la fête observait le comportement et les conversations des invités pour identifier leurs points communs.

Des expériences menées sur des graphes de connaissances réels ont montré qu'AutoAlign surpasse de manière significative les méthodes existantes pour la tâche d'alignement d'entités. C'est comme si, après la fête, tous les invités avaient trouvé leurs amis, et l'organisateur était félicité pour son travail.

Alignement des prédicats (Predicate Alignment) : AutoAlign utilise le graphe de proximité des prédicats pour apprendre la similarité entre les prédicats représentant les mêmes relations dans différents graphes de connaissances. C'est comme si l'organisateur utilisait les centres d'intérêt communs des invités pour les présenter.

Alignement des entités (Entity Alignment) : AutoAlign calcule d'abord indépendamment les plongements des entités de chaque graphe de connaissances, puis, en calculant la similarité des entités basée sur les attributs, il convertit les plongements des entités des deux graphes dans le même espace vectoriel. C'est comme si l'organisateur identifiait les amis en observant l'apparence et le comportement des invités.

Apprentissage conjoint (Joint Learning) : AutoAlign apprend conjointement les plongements des prédicats, des entités et des attributs, ce qui rend l'alignement des entités plus précis. C'est comme si l'organisateur ajustait continuellement sa stratégie de présentation pendant la fête pour s'assurer que chacun trouve ses amis.

AutoAlign démontre non seulement ses capacités dans la tâche d'alignement de graphes de connaissances, mais aussi son potentiel dans des applications plus larges, telles que le complétion de graphes de connaissances. Les chercheurs pensent qu'à l'avenir, AutoAlign pourrait dépasser le cadre des graphes de connaissances pour s'étendre à des domaines plus vastes, comme la recherche sur les graphes ou les hypergraphes.

Adresse de l'article : https://arxiv.org/abs/2307.11772