ISSN: 2165- 7866
Ruba Ali Alsuhaymi
À l'heure actuelle, avec la large diffusion actuelle des informations sur les médias sociaux, le destinataire ou le chercheur a besoin de plus de détails sur les informations reçues ou diffusées, y compris la provenance. Avec l'explosion actuelle des sites d'actualités, la crédibilité des articles d'actualité sur Internet se pose. Il est important de savoir si les informations sont correctes ou non. Cet article se concentre sur l'identification de la provenance des articles d'actualité. En outre, la provenance des articles d'actualité est souvent retracée pour voir où la première publication de ces informations est apparue. La publication de l'actualité est-elle vraie (la crédibilité de l'actualité), ou l'actualité cite-t-elle la provenance de l'actualité sur le site d'actualités ou s'agit-il d'un plagiat et d'une redistribution sur les sites d'actualités sur Internet ? Dans cet article, nous répondrons à ces questions grâce à la conception et à la mise en œuvre de deux techniques Google Search API et Google Custom Search qui définiront la provenance des articles d'actualité grâce à la technique Topic Detection and Tracking (TDT). Par conséquent, nous vérifions la qualité technique proposée en termes de mesures de performance à travers plusieurs expériences différentes. Sur la base de ces expériences et tests, il a été découvert que la technique Google Search API est plus performante que Google Custom Search pour détecter la provenance des articles de presse. Google Search API est la meilleure technique, en fonction de la satisfaction de l'utilisateur, du temps nécessaire pour afficher les résultats et de la précision et de la validité. Ainsi, le résultat de Google Search API est de 90 % tandis que Google Custom Search est de 70 %.