ISSN: 2165- 7866
Workineh Tesema
Cet article présente le regroupement de sens de mots à sens multiples en Afan Oromo. L'idée principale de ce travail est de regrouper les contextes, ce qui fournit un moyen utile de découvrir des sens sémantiquement liés. Les contextes similaires d'un sens donné du mot cible sont regroupés en utilisant trois regroupements hiérarchiques et deux regroupements partitionnels. Tous les contextes de sens liés sont inclus dans le regroupement et donc effectués sur tous les contextes du corpus. L'hypothèse sous-jacente est que le regroupement capture l'unité reflétée parmi les contextes et que chaque cluster révèle les relations possibles existant entre les contextes. Comme le montre l'expérience, sur les cinq clusters au total, les clusters EM et K-Means qui donnent une précision significativement plus élevée que le résultat hiérarchique (clustering unique, clustering complet et clustering moyen). Pour l'Afan Oromo, EM et K-means améliorent la précision du regroupement de sens que les algorithmes de regroupement hiérarchique. Chaque cluster représente un sens unique. Certains mots ont deux sens sur cinq. Comme le montre le résultat, la précision moyenne de l'ensemble de tests était de 85,5 %, ce qui est encourageant compte tenu du travail d'apprentissage automatique non supervisé. En utilisant cette approche, trouver le bon nombre de clusters équivaut à trouver le nombre de sens. Le résultat obtenu est encourageant, malgré le fait qu'il nécessite moins de ressources.