M. Agulló Antolín

La presencia de outliers afecta gravemente a los métodos usuales de obtención de reglas de clasificación, llevando a la obtención de reglas innecesariamente complejas. Podemos encontrar reglas de clasificación más sencillas permitiendo clasificar solo una fracción de la muestra. Además, podemos encontrar variables que no aportan información al modelo (correlacionadas con otras, que no diferencian unos individuos de otros,...). Incluir este tipo de variables conlleva un aumento de la dimensión del problema y una disminución en la eficiencia de los algoritmos de clasificación.
Proponemos un algoritmo basado en técnicas de recorte imparcial y de selección de modelos para que, mediante una penalización adecuada, seleccione un hiperplano que separe ambas muestras con el mínimo error. Este algoritmo calcula de manera independiente el error penalizado para cada nivel de recorte y dimensión. De modo que el tiempo de computación se reduce notablemente mediante la paralelización del algoritmo.

Keywords: Clasificación, paralelizar, machine learning

Scheduled

SI-R-1 Invited Session. R (Hispano): Quiénes somos, de dónde venimos, adónde vamos
September 5, 2019  4:05 PM
I3L10. Georgina Blanes building


Other papers in the same session


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.