ISBN-13: 9786204854168 / Francuski / Miękka / 120 str.
En raison des progrès du numérique, de grands volumes de données sont générés par les applications modernes. Les algorithmes de clustering sont utilisés pour catégoriser avec précision les données dans ces grands ensembles de données. Ce livre présente une revue de la littérature des différents algorithmes traditionnels de clustering et leurs comparaisons d'un point de vue théorique. Le livre fournit également un aperçu des applications des techniques de clustering sur I) les données des journaux Web, II) les données d'image et III) les données biologiques. L'un des principaux inconvénients des algorithmes de clustering traditionnels est qu'ils sont coûteux en termes de calcul lorsque la taille des données d'entrée est trop importante. Pour surmonter ce problème, nous fournissons également une étude complète des récents algorithmes de clustering basés sur MapReduce qui étendent la contrepartie traditionnelle avec le paradigme de programmation Map-Reduce. Ce livre s'adresse principalement aux chercheurs qui s'intéressent au domaine de la découverte de motifs à partir de grands ensembles de données en utilisant le clustering MapReduce. Il les aidera à effectuer le regroupement de données dans un environnement distribué. Plus important encore, les questions et les domaines ouverts discutés dans ce livre aideront les chercheurs à identifier leur orientation future.