Catégorisation automatique de propositions textuelles en types de discours

Details

Ressource 1Download: BIB_EAE5999425AF.P001.pdf (1596.90 [Ko])
State: Public
Version: author
Serval ID
serval:BIB_EAE5999425AF
Type
Inproceedings: an article in a conference proceedings.
Collection
Publications
Institution
Title
Catégorisation automatique de propositions textuelles en types de discours
Title of the conference
Lire demain : des manuscrits antiques à l'ère digitale = Reading tomorrow : from ancient manuscripts to the digital era
Author(s)
Cocco C.
Publisher
Presses polytechniques et universitaires romandes
Address
Lausanne
ISBN
9782880749583
Publication state
Published
Issued date
2012
Editor
Clivaz C., Meizoz J., Vallotton F., Verheyden J.
Pages
689-707
Language
french
Notes
Livre papier, eBook
Abstract
De nombreuses méthodes de classification automatique de textes (supervisée ou non) existent. Elles se sont particulièrement développées depuis la création du web en vue d'améliorer les moteurs de recherche. Au delà de ce champs d'application, elles peuvent aussi être utiles pour « découvrir » ou « redécou­vrir » ce qui caractérise une classe de textes aussi simplement que possible. Dans l'approche statistique développée ici, il s'agira de partitionner des parties de textes en types de discours tels que narratif, explicatif, argumentatif etc. en utilisant un minimum d'information, à savoir les catégories morphosyn­taxiques (CMS). Les premiers résultats obtenus mettent en évidence des liens significatifs entre les CMS, les types de discours et des textes annotés par un expert humain ; ces relations sont toutefois encore incomplètes et difficiles à interpréter d'un point de vue linguistique.
Create date
22/08/2012 14:35
Last modification date
20/08/2019 17:13
Usage data