Langages Nº 225 (1/2022)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
Il s’agit dans cet article de partir d’un corpus lexicographique, en l’occurrence Le Trésor de la langue française informatisé, pour y récupérer automatiquement des phraséologismes transparents comportant des indicateurs d’origines variables, afin d’en extraire des moules phraséologiques. Puis les données dictionnairiques sont utilisées à nouveau pour générer automatiquement des candidats de phraséologismes selon des critères sémantiques. Les phraséologismes générés seront projetés dans un grand corpus pour être validés. L’objectif de notre expérience est de développer une méthode et un outil pour, d’une part, simuler le processus de mise en relation des données dictionnairiques par l’humain et, d’autre part, modéliser les différents types de contenus du dictionnaire en reconnaissance et en génération automatiques à partir de phraséologismes. Cela permettrait de mettre en évidence le rôle que jouent les phraséologismes dans la création des liens sémantiques entres les unités lexicales.
Starting from the computerized dictionary Le Trésor de la langue française informatisé as lexicographic corpus, we shall automatically retrieve transparent phraseologisms which have indicators of varying origins, and to extract phraseological molds from them. Then, the dictionary data will be used again to automatically generate phraseologism candidates according to semantic criteria. Finally, the generated phraseologisms will be projected into a large corpus for validation. The objective of our experience is to develop a method and a tool to, on the one hand, simulate the human process in linking dictionary data, and on the other hand, to model the different types of dictionary content in automatic recognition and generation of phraseologisms. This would highlight the role that phraseologisms play in linking semantically lexical units.