Langages Nº 225 (1/2022)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
À l’heure des algorithmes et de l’intelligence artificielle, de nouvelles techniques fondées sur les corpus permettent aujourd’hui de vérifier les hypothèses théoriques de la linguistique et d’extraire une multitude d’exemples pertinents. La méthodologie proposée dans cette contribution recourt à un score d’association statistique et à de vastes corpus indexés. Elle permet à la fois d’extraire des unités phraséologiques et des constructions telles que définies par la grammaire de construction. Les expériences proposées mettent en lumière l’existence d’associations statistiques dans le système linguistique, à divers niveaux d’abstraction : constructions morphologiques, syntaxiques ou idiomatiques.
In the age of algorithms and artificial intelligence, new techniques based on corpora now make it possible to verify the theoretical hypotheses of linguistics and to extract a multitude of relevant examples. The methodology proposed in this contribution uses a statistical association score and large indexed corpora. It allows both the extraction of phraseological units and constructions as defined by construction grammar. The proposed experiments highlight the existence of statistical associations in the linguistic system, at various levels of abstraction: morphological, syntactic or idiomatic constructions.