Présentation
Créé en 2005 par le CNRS, le CNRTL fédère au sein d’un portail unique, un ensemble de ressources linguistiques informatisées et d’outils de traitement de la langue.
Le CNRTL intègre le recensement, la documentation (métadonnées), la normalisation, l’archivage, l’enrichissement et la diffusion des ressources.
La pérennité du service et des données est garantie par l’adossement à l’UMR ATILF (CNRS – Nancy Université), le soutien du CNRS ainsi que son intégration dans le projet d’équipement d'excellence ORTOLANG.
Nouveautés
Corpus journalistique de l'Est Républicain (CNRTL - Est Républicain).
Prolex : Lexique relationnel multilingue de noms propres (Laboratoire d'informatique - Université François Rabelais - Tours).
Pompamo : Outil de détection de candidats à la néologie (ATILF/ CNRS - Nancy Université).
Portail lexical : un ensemble de ressources et de données
Les lexiques et dictionnaires sont intégrés au sein d’un portail lexical unique qui permet leur consultation croisée ainsi qu’un export dans un format normalisé (LMF, ISO-24613). Projet évolutif, le portail lexical a pour vocation de fédérer, de valoriser et de partager, en priorité avec la communauté scientifique, un ensemble de données issues des travaux de recherche sur les lexiques.
Ressources
Le CNRTL propose et documente des corpus librement accessibles dont les corpus Frantext libre de droits et DEDE (DEscriptions DEfinies). Progressivement, les données sont converties en TEI et enrichies par des annotations linguistiques. Le CNRTL offre également la possibilité de téléchargement du lexique MORPHALOU (Lexique Morphologique Ouvert du Français) ainsi que l'accès à un ensemble de dictionnaires anciens et modernes.
Outils
Le CNRTL réunit et documente des outils logiciels libres d’accès pour le traitement automatique des langues. A terme, ces outils seront rendus compatibles entre eux et avec les lexiques par le développement d’interfaces standardisées.