L’identification des composants de métaphore (MCI) est cruciale pour le traitement du langage naturel (NLP). Elle consiste à détecter et comprendre des éléments comme le ténor, le véhicule et le terrain, essentiels dans la communication quotidienne et les textes scientifiques. La complexité des métaphores pose un défi aux méthodes traditionnelles reposant sur des règles manuelles, souvent inadéquates face aux nuances contextuelles.

Récemment, des modèles de deep learning, comme les réseaux de neurones, ont amélioré cette identification, mais rencontrent toujours des difficultés contextuelles. Les chercheurs de l’Université de Zhengzhou ont créé le cadre LaiDA, intégrant l’apprentissage en contexte avec l’augmentation de données, utilisant des modèles de langage comme ChatGPT pour améliorer la précision du MCI.

Ce cadre se distingue par son réseau d’attention graphique (GAT) encoder, qui enrichit les représentations linguistiques, et sa capacité à intégrérer des exemples similaires pendant l’affinement. LaiDA a atteint une précision remarquable de 93,21 % lors de la tâche partagée NLPCC2024, confirmant son efficacité.

En fusionnant l’apprentissage linguistique avec des techniques de data augmentation, LaiDA élève les standards pour l’identification et l’interprétation des métaphores en NLP.