Aller au contenu principal
Connexion
Mot de passe oublié
Vous n'avez pas encore de compte ?
Créer votre compte
  • Enseignants
  • Livres
Armand Colin | Revues

Formulaire de recherche

  • Histoire
    • Annales de démographie historique
    • Annales historiques de la Révolution française
    • Histoire, économie & société
    • Revue de l'histoire des religions
    • Revue d'histoire des sciences
  • Géographie
    • Annales de Géographie
    • L'information géographique
  • Éco & Sc. Politique
    • Politique étrangère
    • Revue d'économie régionale et urbaine
  • Lettres & Langues
    • Langue française
    • Langages
    • Le Français Aujourd'hui
    • Littérature
    • Romantisme
  • Éduc. & santé
    • Carrefours de l'éducation
    • La Revue de l'hypnose et de la santé

Vous êtes ici

Accueil » Lettres & Langues » Langages » Langages n° 187 (3/2012) » Hétérogénéité des corpus et textométrie

Langages n° 187 (3/2012)

L'analyse du corpus face à l'hétérogénéité des données
Parution 
octobre 2012
EAN 
9782200927769
Prix au numéro 
18 €
Marque 
Armand Colin
Pagination 
136 pages
Voir le sommaire

Pour acheter ce numéro, contactez-nous

S'abonner

Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.

Articlesprecedent suivant
Auteur(s) 
Bénédicte Pincemin
Hétérogénéité des corpus et textométrie
Résumé 

L’homogénéité fait partie des critères habituellement requis en linguistique de corpus. Ce critère est à discuter en regard d’autres critères concernant également la textualité, comme la représentativité et l’interprétabilité ; et sa mise en oeuvre suppose une définition pragmatique des genres textuels. Au stade de l’analyse, la méthode textométrique, statistique et endogène, modélisant le corpus à partir des distributions de ses unités lexicales, est directement sensible aux hétérogénéités. Mais la tradition textométrique est aussi particulièrement attentive à la forme originale des données. Aussi la textométrie a-t-elle développé des pratiques méthodologiques et mis au point des fonctionnalités pour gérer l’hétérogénéité des corpus, évitant des opérations de réduction a priori.

Mots clés 
analyse statistique de données textuelles
Linguistique de corpus
linguistique différentielle
interprétation
codage des textes
genres textuels
corpus diachroniques
corpus multilingues
corpus parallèles
Corpus heterogeneity and textometry
Abstract 

Corpus linguistics usually requires homogeneous corpora. The need for homogeneity will be discussed with reference to other factors linked to textuality, such as representativity and interpretability, and a pragmatic definition of textual genres is necessary for its application. The textometry approach, both statistical and corpus-based, presents an analysis of the corpus based on the distribution of its lexical units, and is thus directly sensitive to heterogeneity. However, textometry is careful to respect the original data. For this reason, the approach has developed a methodology and statistical tools in order to study heterogeneous corpora, thus avoiding potential loss of relevant detail.

Keywords 
statistical analysis of textual data
corpus linguistics
interpretation
text encoding
textual genres
diachronic corpora
multilingual corpora
parallel corpora
Citation 
Bénédicte Pincemin, « Hétérogénéité des corpus et textométrie », Langages n° 187 (3/2012), pp. 13-26, Armand Colin. Disponible sur : http://www.revues.armand-colin.com/lettres-langue/langages/langages-ndeg-187-32012-lanalyse-du-corpus-face-lheterogeneite-donnees/heterogeneite-corpus-textometrie
Consulter l'article
Citer l'article
DANS LA MÊME thématique
Le statut linguistique de l’exemple dans les dictionnaires de langue française sous l’Ancien Régime
Auteur(s)
Isabelle Turcan
LANGUE FRANÇAISE Nº222 (2/2024)
L’exemplification en français : perspectives linguistiques
Parution:
juin 2024
L’interprétation argumentative
Auteur(s)
Marion Carel
Langue française Nº217 (1/2023)
Varia
Parution:
mars 2023
Logo footer Armand colin
  • Qui sommes-nous ?
  • Contact
  • Livres
  • Espace Enseignants du Supérieur
  • Dunod Éditeur

Inscrivez-vous à la newsletter

  • Mentions légales
  • Archives ouvertes
  • C.G.V
  • C.G.A
  • Données personnelles
  • Cookies
  • Plan du site

© Armand Colin, Tous droits réservés.

Back to top