Journal des technologies de l'information et du génie logiciel

Journal des technologies de l'information et du génie logiciel
Libre accès

ISSN: 2165- 7866

Abstrait

CONDENZA : Un système d'extraction de résumé à partir d'un document source donné

Mgbeafulike IJ et Christopher Ejiofor

Malgré la disponibilité croissante de documents sous forme électronique et la disponibilité de logiciels de publication assistée par ordinateur, les résumés continuent d'être produits manuellement. L'objectif de CONDENZA est de développer un système d'extraction de résumés à partir d'un document source donné. CONDENZA décrit un système de méthodes automatiques d'obtention de résumés. La raison d'être des résumés est de faciliter l'identification rapide et précise du sujet des articles publiés. L'idée est de faire gagner du temps et des efforts au lecteur potentiel pour trouver des informations utiles dans un article ou un rapport donné. Le système génère une version plus courte d'une phrase donnée tout en essayant de préserver son sens. Cette tâche est réalisée à l'aide de techniques de résumé. CONDENZA met en œuvre une méthode qui combine un algorithme a priori pour la détection de la fréquence des mots-clés avec une approche basée sur le clustering pour regrouper des phrases similaires. Le résultat du système montre que notre approche permet de résumer efficacement les documents textuels en évitant la redondance entre les mots du document et en garantissant la plus grande pertinence par rapport au texte d'entrée. Les facteurs directeurs de nos résultats sont le rapport entre les phrases d'entrée et de sortie après résumé.

Clause de non-responsabilité: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été révisé ou vérifié.
Top