This work aimed to investigate the use of a parallel K-Means clustering algorithm, based on the MapReduce programming model, to improve the response time of data mining. The algorithm's performance was evaluated in terms of SpeedUp and ScaleUp. To this end, experiments were performed on a Hadoop cluster consisting of six computers with standard hardware. The clustered data are measurements from flow towers in agricultural regions and belong to Ameriflux. The experiments were performed using 3, 4, and 6 machines, respectively. The results showed that with the increase in the number of...
This work aimed to investigate the use of a parallel K-Means clustering algorithm, based on the MapReduce programming model, to improve the response t...
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été...
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapR...
Ziel dieser Arbeit war es, die Verwendung eines parallelen K-Means-Clustering-Algorithmus auf Basis des MapReduce-Programmiermodells zu untersuchen, um die Reaktionszeit beim Data Mining zu verbessern. Die Leistung des Algorithmus wurde hinsichtlich SpeedUp und ScaleUp bewertet. Zu diesem Zweck wurden Experimente in einem Hadoop-Cluster durchgeführt, der aus sechs Computern mit handelsüblicher Hardware bestand. Die gruppierten Daten sind Messungen von Strömungstürmen in landwirtschaftlichen Regionen und stammen von Ameriflux. Die Experimente wurden mit 3, 4 bzw. 6 Maschinen durchgeführt....
Ziel dieser Arbeit war es, die Verwendung eines parallelen K-Means-Clustering-Algorithmus auf Basis des MapReduce-Programmiermodells zu untersuchen, u...