Simplification automatique de textes techniques et spécialisés

Simplification automatique de textes techniques et spécialisés
Author: Rémi Cardon
Publisher:
Total Pages: 0
Release: 2021
Genre:
ISBN:


Download Simplification automatique de textes techniques et spécialisés Book in PDF, Epub and Kindle

La simplification automatique de textes est un domaine du traitement automatique des langues (TAL) qui vise à traiter des textes difficiles à lire pour un public donné de façon à les rendre plus accessibles. Notre objectif consiste à simplifier automatiquement les textes médicaux et de santé. Nous présentons l'ensemble de notre travail sur cette question, qui va de la collecte et analyse de corpus jusqu'aux expériences en simplification automatique.Nous commençons par la collecte d'un corpus comparable de textes médicaux. Ce corpus est constitué de couples de documents qui traitent du même sujet : l'un s'adressant à un public spécialiste et l'autre à un public néophyte. Le corpus contient trois types de textes : des informations sur les médicaments, des bilans de revues systématiques de littérature médicale et des articles encyclopédiques. Une fois les documents collectés, nous annotons un sous-ensemble de ces documents et analysons les transformations linguistiques qui y sont mises en œuvre lors de la simplification.À partir du corpus comparable, nous mettons en place une méthode pour en extraire un corpus parallèle, c'est-à-dire un corpus comprenant des couples de phrases qui ont le même sens mais diffèrent par leur degré de difficulté. Ce type de corpus représente le matériau principal pour les méthodes de simplification automatique. Notre méthode d'extraction de phrases parallèles comporte deux étapes : (1) le préfiltrage de paires de phrases candidates à l'alignement selon des heuristiques syntaxiques et (2) la classification binaire permettant de distinguer les phrases en relation de simplification. Nous évaluons différents classifieurs ainsi que l'influence du déséquilibre des données sur les performances. Afin de valoriser ce corpus parallèle, nous créons également un corpus de paires de phrases annotées selon leur similarité sémantique, avec des scores allant de 0 (sémantique indépendante) à 5 (même sémantique). Les deux corpus sont disponibles pour la recherche.Enfin, nous présentons une série d'expériences en simplification automatique de textes médicaux en français. Ainsi, nous mettons à l'œuvre une méthode neuronale issue de la traduction automatique. Nous utilisons plusieurs ressources : le corpus parallèle médical construit par nous, le corpus parallèle de langue générale automatiquement traduit par nous de l'anglais vers le français ainsi qu'un lexique qui apparie des termes médicaux avec des termes ou paraphrases accessibles au grand public. Nous décrivons le protocole expérimental et menons une évaluation en deux volets, quantitatif et qualitatif. Les résultats sont comparables à l'état de l'art de la simplification en langue générale et montrent que les simplifications produites peuvent être exploitées dans le cadre d'une tâche de simplification assistée par ordinateur.


Simplification automatique de textes techniques et spécialisés
Language: fr
Pages: 0
Authors: Rémi Cardon
Categories:
Type: BOOK - Published: 2021 - Publisher:

GET EBOOK

La simplification automatique de textes est un domaine du traitement automatique des langues (TAL) qui vise à traiter des textes difficiles à lire pour un pub
Traitement Automatique de Textes: Techniques Linguistiques
Language: fr
Pages: 18
Authors:
Categories:
Type: BOOK - Published: - Publisher: Ed. Techniques Ingénieur

GET EBOOK

Automatic Typographic-quality Typesetting Techniques
Language: en
Pages: 116
Authors: Mary Elizabeth Stevens
Categories: Computerized typesetting
Type: BOOK - Published: 1967 - Publisher:

GET EBOOK

The report describes the current state-of-the-art in automation of graphic arts composition, starting from either of two sources: keyboard entry of manuscript m
Hierarchy in Natural and Social Sciences
Language: en
Pages: 248
Authors: Denise Pumain
Categories: Business & Economics
Type: BOOK - Published: 2006-02-09 - Publisher: Springer Science & Business Media

GET EBOOK

Hierarchy is a form of organisation of complex systems that rely on or produce a strong differentiation in capacity (power and size) between the parts of the sy
Documents
Language: en
Pages: 273
Authors: Diana Ombelli
Categories: Authentication
Type: BOOK - Published: 2008 - Publisher:

GET EBOOK