ISBN-13: 9786209137112 / Francuski / Miękka / 2025 / 60 str.
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.