ISBN-13: 9786206378457 / Francuski / Miękka / 72 str.
Le déséquilibre des classes est l'un des problèmes les plus difficiles à résoudre pour les techniques d'exploration de données et d'apprentissage automatique. Dans les applications du monde réel, les données présentent souvent une répartition déséquilibrée des classes. Cela se produit lorsque la plupart des exemples appartiennent à une classe majoritaire et que peu d'exemples appartiennent à une classe minoritaire. Dans ce cas, les classificateurs standard ont tendance à classer tous les exemples dans la classe majoritaire et à ignorer complètement la classe minoritaire. Pour ce problème, les chercheurs ont proposé de nombreuses solutions au niveau des données et des algorithmes. La plupart des efforts se concentrent sur les problèmes de classes binaires. Cependant, la classe binaire n'est pas le seul scénario où le problème du déséquilibre des classes se pose. Dans le cas d'ensembles de données multi-classes, il est beaucoup plus difficile de définir les classes majoritaires et minoritaires. C'est pourquoi la classification multi-classes dans des ensembles de données déséquilibrés reste un sujet de recherche important. Dans notre livre, nous avons proposé une nouvelle approche basée sur SOMTE (Synthetic Minority Over-sampling TEchnique) et le clustering qui est capable de traiter le problème des données déséquilibrées impliquant des classes multiples. Nous avons mis en oeuvre notre approche en utilisant des outils d'apprentissage automatique open source : Weka et RapidMiner.