ISBN-13: 9786206345435 / Francuski / Miękka / 68 str.
Une énorme quantité de données est collectée et stockée dans des bases de données partout dans le monde. Ces données sont regroupées et continuent d'augmenter chaque année. L'extraction des informations cachées dans ces bases de données et la classification des informations extraites sont les tâches les plus importantes de l'exploration de données. Si ces ensembles de données sont déséquilibrés, il devient difficile de les traiter. La prédiction de l'avenir est l'une des tâches fondamentales de l'exploration de données. Travailler avec des ensembles de données déséquilibrés pour prédire les résultats possibles est une tâche très fastidieuse. Un ensemble de données est déséquilibré lorsqu'il n'est pas classé correctement, c'est-à-dire lorsqu'une classe contient plus d'instances que l'autre. Ces classes sont souvent représentées par une classe positive (minoritaire) et une classe négative (majoritaire). La classe qui a le moins d'échantillons est appelée classe minoritaire, et celle qui en a le plus est appelée classe majoritaire. Le déséquilibre d'un ensemble de données est à l'origine de nombreux problèmes graves dans le domaine de l'exploration de données. En général, l'algorithme de classification standard considère l'ensemble de données comme équilibré, ce qui se traduit par un penchant pour la classe majoritaire. L'équilibrage des ensembles de données est donc essentiel pour de nombreuses applications en temps réel.