Inproceedings,

Une approche par acceptions pour les bases lexicales multilingues

, and .
TA-TAO: Recherche de pointe et applications immédiates, page 65-84. Montréal, Canada, Actualité scientifique, AUPELF-UREF, (1993)

Abstract

De nombreux projets sont menés pour développer des bases lexicales multilingues. Certains utilisent une approche interlingue (KBMT-89, EDR, ...), alors que d'autres ont choisi une approche bilingue (Multilex, ...). Le GETA utilise une approche interlingue basée sur les acceptions (sens de mots) pour développer son système de gestion de bases de données lexicales: NADIA. Selon cette approche, le lexique interlingue est l'union des acceptions des langues qui apparaissent dans la base. L'ensemble des relations et attributs interlingue est défini librement par le linguiste, à part la relation prédéfinie "isa" (relation de sous-acception à sur-acception), qui est nécessaire dans tous les cas, car les acceptions des termes d'une langue n'ont pas toujours d'équivalent lexical dans une autre langue. Cette architecture lexicale n'a pas d'influence sur le contenu linguistique des dictionnaires monolingues, pas plus que sur le format adopté par le linguiste pour coder l'information. Le système NADIA est concu pour être multilingue (le système gère des bases multilingues), indépendant des applications (les bases peuvent être utilisées dans diffèrent buts), générique (les structures linguistiques sont définie par un linguiste) et indépendant de la théorie (de nombreux formalismes informatiques peuvent être utilisés pour coder les structures linguistiques). Le système propose de nombreux outils (navigateur, éditeur, défauteur, vérificateur de cohérence, ...) pour simplifier la gestion d'une base multilingue. De plus, il prend en charge, autant que possible, la gestion du dictionnaire interlingue. Les projets EDR et KBMT-89 (qui utilisent une approche basée sur la connaissance) sont confrontés à des problèmes théoriques et méthodologiques (raffinement des concepts, représentation de la connaissance, classification des concepts, ...). L'approche basée sur les acceptions est un bon choix pour éviter la complexité introduite par la représentation des connaissances, tout en gardant l'avantage d'une approche interlingue. Multilex donne un moyen au linguiste de définir différentes structures linguistiques, mais celui-ci ne peut utiliser que les structures de traits typées pour coder sa théorie linguistique. Au GETA, nous avons choisi de proposer au linguistes de nombreux formalismes (arbres, structures de traits typées, graphes, ensembles, ...).

Tags

Users

  • @gilles.serasset

Comments and Reviews