ISBN-13: 9783659004681 / Hiszpański / Miękka / 2012 / 88 str.
Los arboles de decision son clasificadores supervisados muy populares en la solucion de problemas de Reconocimiento de Patrones. En la construccion de un arbol de decision, una funcion de evaluacion es aquella encargada de seleccionar la mejor division candidata. Cada funcion de evaluacion, tiene como objetivo obtener arboles que sean balanceados, de pocos niveles y que al mismo tiempo obtenga nodos lo mas puros posibles. En esta obra cientifica se determinaron los antecedentes historicos del desarrollo de los metodos de induccion de arboles de decision y su aplicacion en conjuntos de entrenamiento con datos mezclados e incompletos. Ademas se propone un nuevo metodo de inducir arboles de decision basado en indices de validacion de cluster, con el objetivo de evaluar cada nodo como si fuera un cluster. Se adicionan criterios de parada en la construccion del arbol, para obtener mejores resultados en cuanto a calidad y eficacia del clasificador. El metodo propuesto fue comparado con el C4.5 y los resultados obtenidos al clasificar en 30 bases de datos del repositorio de la Universidad de California en Irvine (UCI) muestran que la eficacia del nuevo metodo propuesto es superior.
Los árboles de decisión son clasificadores supervisados muy populares en la solución de problemas de Reconocimiento de Patrones. En la construcción de un árbol de decisión, una función de evaluación es aquella encargada de seleccionar la mejor división candidata. Cada función de evaluación, tiene como objetivo obtener árboles que sean balanceados, de pocos niveles y que al mismo tiempo obtenga nodos lo más puros posibles. En esta obra científica se determinaron los antecedentes históricos del desarrollo de los métodos de inducción de árboles de decisión y su aplicación en conjuntos de entrenamiento con datos mezclados e incompletos. Además se propone un nuevo método de inducir árboles de decisión basado en índices de validación de clúster, con el objetivo de evaluar cada nodo como si fuera un clúster. Se adicionan criterios de parada en la construcción del árbol, para obtener mejores resultados en cuanto a calidad y eficacia del clasificador. El método propuesto fue comparado con el C4.5 y los resultados obtenidos al clasificar en 30 bases de datos del repositorio de la Universidad de California en Irvine (UCI) muestran que la eficacia del nuevo método propuesto es superior.