ISSN: 2165- 7866
Abaynew Guadie*, Debela Tesfaye, Teferi Kebebew
Cet article présente le résumé de texte amharique pour les articles d'actualité publiés sur les médias sociaux, pour résumer les articles d'actualité publiés dans des textes amhariques à la fois dans des documents publiés sur les médias sociaux sur Twitter et Facebook ; Les principaux problèmes des textes publiés sur les médias sociaux sont que la plupart des gens liraient probablement qu'ils sont publiés dans des textes amhariques avec des documents publiés en double. Cependant, pour trouver les informations que l'utilisateur recherche, il doit trouver des textes résumés publiés et lire des parties importantes des publications sous forme de documents amhariques pour extraire les informations souhaitées sur les médias sociaux. Le résumé consiste à gérer la surcharge d'informations en présentant et en publiant avec un document texte pour la représentation temporelle actuelle des documents publiés à résumer. Notre approche proposée comporte trois composants principaux : Premièrement, calculer la similarité entre chaque document publié dans les deux paires de phrases. Deuxièmement, regrouper en fonction des résultats de similarité des documents pour les regrouper en utilisant l'algorithme Kmeans. Troisièmement, résumer individuellement le document publié groupé à l'aide d'algorithmes TF-IDF qui impliquent la recherche de moyens statistiques pour les termes fréquents afin de classer les documents. Français Nous avons appliqué la technique de résumé, une approche de résumé extractif qui consiste à extraire les phrases les mieux classées dans les documents publiés pour former les résumés et la taille du résumé peut être identifiée par l'utilisateur. Dans la première expérience, le score de mesure F le plus élevé est de 87,07 % pour un taux d'extraction à 30 %, dans le groupe groupé de messages de protestation. Dans la deuxième expérience, le score de mesure F le plus élevé est de 84 % pour un taux d'extraction à 30 %, dans les groupes de messages sur les sécheresses. Dans la troisième expérience, le score de mesure F le plus élevé est de 91,37 % pour un taux d'extraction à 30 %, dans les groupes de messages sur les sports et également dans la quatrième expérience, le score de mesure F le plus élevé est de 93,52 % pour un taux d'extraction à 30 % pour générer les textes des messages de résumé. Si le système pour générer la taille du résumé est augmenté, le taux d'extraction augmente également dans les textes publiés. Pour cela, le système d'évaluation a montré de très bons résultats pour résumer les textes publiés sur les médias sociaux.