Langages n° 206 (2/2017)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
Du point de vue des corpus étiquetés du français, la période des XVIe-XVIIIe siècles fait figure de chaînon manquant. Les travaux que nous présentons ici s’attachent à combler ce manque. Cet article présente les difficultés de traitement que présentent les écrits français de cette période, le corpus diachronique que nous avons constitué, les choix techniques mis en oeuvre pour son annotation, et enfin propose quelques méthodes statistiques pour son exploitation.
From the perspective of French tagged corpora, the period from the sixteenth to the eighteenth centuries may be seen as a missing link. The work we presents here aim to fill this gap. This article presents the difficulties involved by the processing of the French writings of this period, the diachronic corpus we have built, the technical choices related to its annotation, and finally offers some statistical methods for its use.