Aller au contenu principal
Connexion
Mot de passe oublié
Vous n'avez pas encore de compte ?
Créer votre compte
  • Enseignants
  • Livres
Armand Colin | Revues

Formulaire de recherche

  • Histoire
    • Annales de démographie historique
    • Annales historiques de la Révolution française
    • Histoire, économie & société
    • Revue de l'histoire des religions
    • Revue d'histoire des sciences
  • Géographie
    • Annales de Géographie
    • L'information géographique
  • Éco & Sc. Politique
    • Politique étrangère
    • Revue d'économie régionale et urbaine
  • Lettres & Langues
    • Langue française
    • Langages
    • Le Français Aujourd'hui
    • Littérature
    • Romantisme
  • Éduc. & santé
    • Carrefours de l'éducation
    • La Revue de l'hypnose et de la santé

Vous êtes ici

Accueil » Lettres & Langues » Langages » Langages n° 187 (3/2012) » Hétérogénéité et extraction d’information factuelle dans un corpus de récits de voyage

Langages n° 187 (3/2012)

L'analyse du corpus face à l'hétérogénéité des données
Parution 
octobre 2012
EAN 
9782200927769
Prix au numéro 
18 €
Marque 
Armand Colin
Pagination 
136 pages
Voir le sommaire

Pour acheter ce numéro, contactez-nous

S'abonner

Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.

Articlesprecedent suivant
Auteur(s) 
Anaïs Lefeuvre
Natalia Vinogradova
Hétérogénéité et extraction d’information factuelle dans un corpus de récits de voyage
Résumé 

L’extraction d’information nécessite une connaissance des objets à extraire. Nous cherchons dans ce travail à décrire le comportement des séquences textuelles présentant l’itinéraire au sein du récit de voyage. Le récit de voyage est reconnu comme genre hétérogène, nous analysons donc cette hétérogénéité afin de pouvoir reconnaître les séquences homogènes, dont la description d’itinéraire fait partie. Nous menons notre analyse à plusieurs niveaux discursifs, ce qui nous permet d’avoir une vision globale du comportement de notre objet d’étude, l’itinéraire et du contexte dans lequel il apparaît. Dans la perspective de l’extraction automatique d’itinéraire, nous utilisons de nombreux outils, chacun adapté au mieux au niveau d’analyse traité. En nous appuyant sur le cadre théorique de la SRDT (Segmented Discourse Representation Theory), dont nous montrons l’adéquation à l’étude, nous approchons le fonctionnement des descriptions des itinéraires, nous poussant à enrichir la méthode d’extraction afin de gérer l’hétérogénéité des unités discursives dans lesquels l’itinéraire est énoncé.

Mots clés 
hétérogénéité
récit de voyage
itinéraires
séquences textuelles
segments de discours
extraction d'information
SDRT
types fonctionnels
Heterogeneity and factual information extraction in a corpus of travel writing
Abstract 

The information extraction task requires a good knowledge of the object to be extracted. In this work we explore the behavior of textual sequences describing the itinerary within the travel writing. Travel novel is a specific genre that is recognized to be heterogeneous, so we analyze its heterogeneity in order to discriminate homogeneous sequences, one of which being the itinerary description. Our analysis holds on different discourse levels, it allows us to get an overview of itinerary behavior through the narration. In order to automatize the extraction of itineraries, we use different tools, each one being perfectly adapted to the discourse level in question. Our theoretical framework at the semantic representation level, the SDRT (Segmented Discourse Representation Theory), complies with such kind of analysis, as we see in the course of this work. This study makes us understand the itinerary sequences behavior, leading us to enrich our extraction method to cope with heterogeneity of the discourse units dedicated to the itinerary.

Keywords 
heterogeneity
travel writing
itineraries
textual sequences
discourse segments
information extraction
SDRT
functional types
Citation 
Anaïs Lefeuvre, Natalia Vinogradova, « Hétérogénéité et extraction d’information factuelle dans un corpus de récits de voyage », Langages n° 187 (3/2012), pp. 127-144, Armand Colin. Disponible sur : http://www.revues.armand-colin.com/lettres-langue/langages/langages-ndeg-187-32012-lanalyse-du-corpus-face-lheterogeneite-donnees/heterogeneite-extraction-dinformation-factuelle-corpus
Consulter l'article
Citer l'article
Logo footer Armand colin
  • Qui sommes-nous ?
  • Contact
  • Livres
  • Espace Enseignants du Supérieur
  • Dunod Éditeur

Inscrivez-vous à la newsletter

  • Mentions légales
  • Archives ouvertes
  • C.G.V
  • C.G.A
  • Données personnelles
  • Cookies
  • Plan du site

© Armand Colin, Tous droits réservés.

Back to top