
Langages n° 197 (1/2015)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
Nous montrons comment la fréquence variable de traits prosodiques, syntaxiques et intonosyntaxiques constitue un indice pour caractériser des types de textes à l’oral et les genres qui les engendrent. Parmi l’ensemble des traits formels explorés, on s’interroge sur la manière dont ils se répartissent en termes de redondance de l’information, de complémentarité ou de pertinence pour l’étude des variables situationnelles considérées. Lors de notre étude quantitative, nous confrontons deux méthodes de classification supervisée : arbres de décision et machine à vecteurs supports, et nous abordons le problème de la représentation graphique des traits grâce à l’analyse en composantes principales. L’ensemble donne un retour précis et inédit sur le rôle de l’interface intonosyntaxique dans l’identification des genres en français parlé.
We highlight how the variable frequency of prosodic, syntactic and intonosyntactic features is a strong predictor for discourse genre classification in speech. We quantify this claim by studying the mutual information these features share with the situational variables considered, allowing us to identify possibly redundant information and to adequately predict genres from intonosyntactic annotations. In our quantitative study, we compare two methods for supervised classification : decision trees and support vector machines. Furthermore, we address the issue of graphical representations of features through a principal component analysis. All these points provide valuable feedback on the role played by the intonosyntactic interface in the identification of discourse genres in spoken French.