Journal des technologies de l'information et du génie logiciel

Journal des technologies de l'information et du génie logiciel
Libre accès

ISSN: 2165- 7866

Abstrait

Afan Oromo Sense Clustering dans les techniques hiérarchiques et partitionnelles

Workineh Tesema

Cet article présente le regroupement de sens de mots à sens multiples en Afan Oromo. L'idée principale de ce travail est de regrouper les contextes, ce qui fournit un moyen utile de découvrir des sens sémantiquement liés. Les contextes similaires d'un sens donné du mot cible sont regroupés en utilisant trois regroupements hiérarchiques et deux regroupements partitionnels. Tous les contextes de sens liés sont inclus dans le regroupement et donc effectués sur tous les contextes du corpus. L'hypothèse sous-jacente est que le regroupement capture l'unité reflétée parmi les contextes et que chaque cluster révèle les relations possibles existant entre les contextes. Comme le montre l'expérience, sur les cinq clusters au total, les clusters EM et K-Means qui donnent une précision significativement plus élevée que le résultat hiérarchique (clustering unique, clustering complet et clustering moyen). Pour l'Afan Oromo, EM et K-means améliorent la précision du regroupement de sens que les algorithmes de regroupement hiérarchique. Chaque cluster représente un sens unique. Certains mots ont deux sens sur cinq. Comme le montre le résultat, la précision moyenne de l'ensemble de tests était de 85,5 %, ce qui est encourageant compte tenu du travail d'apprentissage automatique non supervisé. En utilisant cette approche, trouver le bon nombre de clusters équivaut à trouver le nombre de sens. Le résultat obtenu est encourageant, malgré le fait qu'il nécessite moins de ressources.

Clause de non-responsabilité: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été révisé ou vérifié.
Top