Recherche d'information en langage naturel dans les documents XML: Extraction et recherche d'information en langage naturel dans les documents semi-structurés (Omn.Univ.Europ.) par Xavier Tannier

Recherche d'information en langage naturel dans les documents XML: Extraction et recherche d'information en langage naturel dans les documents semi-structurés (Omn.Univ.Europ.) par Xavier Tannier

Titre de livre: Recherche d'information en langage naturel dans les documents XML: Extraction et recherche d'information en langage naturel dans les documents semi-structurés (Omn.Univ.Europ.)

Auteur: Xavier Tannier

ISBN: 6131526273

Recherche d'information en langage naturel dans les documents XML: Extraction et recherche d'information en langage naturel dans les documents semi-structurés (Omn.Univ.Europ.) par Xavier Tannier est disponible au téléchargement en format PDF et EPUB. Ici, vous pouvez accéder à des millions de livres. Tous les livres disponibles pour lire en ligne et télécharger sans avoir à payer plus.

Xavier Tannier avec Recherche d'information en langage naturel dans les documents XML: Extraction et recherche d'information en langage naturel dans les documents semi-structurés (Omn.Univ.Europ.)

La recherche d'information (RI) dans des documents semi-structurés (écrits en XML en pratique) combine des aspects de la RI traditionnelle et ceux de l'interrogation de bases de données. La structure a une importance primordiale, mais le besoin d'information reste vague. L'unité de recherche est variable (un paragraphe, une figure, un article complet...). Par ailleurs, la flexibilité du langage XML autorise des manipulations du contenu qui provoquent parfois des ruptures arbitraires dans le flot naturel du texte. Les problèmes posés par ces caractéristiques sont nombreux, que ce soit au niveau du pré-traitement des documents ou de leur interrogation. Face à ces problèmes, nous avons étudié les solutions spécifiques que pouvait apporter le traitement automatique de la langue (TAL). Nous avons ainsi proposé un cadre théorique et une approche pratique pour permettre l'utilisation des techniques d'analyse textuelle en faisant abstraction de la structure. Nous avons également conçu une interface d'interrogation en langage naturel pour la RI dans les documents XML, et proposé des méthodes tirant profit de la structure pour améliorer la recherche des éléments pertinents.


Diplômé de l'INSA de Toulouse et de l'École des Mines deSaint-Étienne, Xavier Tannier est maître de conférence àl'université Paris-Sud 11. Il effectue sa recherche en traitementautomatique des langues au LIMSI-CNRS.