ISBN-13: 9783639747072 / Portugalski / Miękka / 2015 / 112 str.
O aprendizado de maquina em conjuntos de dados que possuam classes desbalanceadas tem recebido consideravel atencao na comunidade cientifica, pois os algoritmos de classificacao tradicionais nao fornecem um desempenho satisfatorio. Varias melhorias nos algoritmos tradicionais de classificacao tem sido propostas na literatura, onde foram feitas consideracoes a nivel de dados e a nivel de algoritmos. O primeiro utiliza diversas formas de reamostragem, tal como super-amostragem de exemplos da classe minoritaria, sub-amostragem de exemplos da classe majoritaria ou a combinacao de ambos. Os ultimos tentam adaptar (inserindo custos diferenciados em exemplos da classe minoritaria e majoritaria ou alterando kernels) os algoritmos de classificacao ja existentes para melhorar o desempenho. Varios algoritmos na forma de um comite de maquinas tambem sao reportados como meta-tecnicas para trabalhar com classes desbalanceadas. Esta tese estudou estes principais algoritmos. Depois foi feito um estudo se poderia obter algo mais das caracteristicas de cada um. Obteve-se um algoritmo composto que possui uma taxa de acerto na classificacao de dados melhor que os algoritmos nos quais se baseou."
O aprendizado de máquina em conjuntos de dados que possuam classes desbalanceadas tem recebido considerável atenção na comunidade científica, pois os algoritmos de classificação tradicionais não fornecem um desempenho satisfatório. Várias melhorias nos algoritmos tradicionais de classificação têm sido propostas na literatura, onde foram feitas considerações a nível de dados e a nível de algoritmos. O primeiro utiliza diversas formas de reamostragem, tal como super-amostragem de exemplos da classe minoritária, sub-amostragem de exemplos da classe majoritária ou a combinação de ambos. Os últimos tentam adaptar (inserindo custos diferenciados em exemplos da classe minoritária e majoritária ou alterando kernels) os algoritmos de classificação já existentes para melhorar o desempenho. Vários algoritmos na forma de um comitê de máquinas também são reportados como meta-técnicas para trabalhar com classes desbalanceadas. Esta tese estudou estes principais algoritmos. Depois foi feito um estudo se poderia obter algo mais das características de cada um. Obteve-se um algoritmo composto que possui uma taxa de acerto na classificação de dados melhor que os algoritmos nos quais se baseou.