R en la computación de altas prestaciones: paralelizando un algoritmo de clasificación.

M. Agulló Antolín

La presencia de outliers afecta gravemente a los métodos usuales de obtención de reglas de clasificación, llevando a la obtención de reglas innecesariamente complejas. Podemos encontrar reglas de clasificación más sencillas permitiendo clasificar solo una fracción de la muestra. Además, podemos encontrar variables que no aportan información al modelo (correlacionadas con otras, que no diferencian unos individuos de otros,...). Incluir este tipo de variables conlleva un aumento de la dimensión del problema y una disminución en la eficiencia de los algoritmos de clasificación.
Proponemos un algoritmo basado en técnicas de recorte imparcial y de selección de modelos para que, mediante una penalización adecuada, seleccione un hiperplano que separe ambas muestras con el mínimo error. Este algoritmo calcula de manera independiente el error penalizado para cada nivel de recorte y dimensión. De modo que el tiempo de computación se reduce notablemente mediante la paralelización del algoritmo.

Keywords: Clasificación paralelizar machine learning

Scheduled

SI-R-1 Invited Session. R (Hispano): Quiénes somos, de dónde venimos, adónde vamos

September 5, 2019 4:05 PM

I3L10. Georgina Blanes building

Other papers in the same session

Influencia de la Escuela Gallega de Estadística en Ecuador a través del R Users Group – Ecuador

M. Flores, R. Fernandez-Casal, J. Tarrío-Saavedra, S. Naya Fernández

La Comunidad R-Hispano en perspectiva: hitos conseguidos y retos futuros

E. López Cano

R en cooperación: modelos h2o entrenados con R

J. L. Cañadas Reche

Visualizaciones con R-Shiny. Un gestor de modelos realizados en open source

F. J. Rodríguez Aragón

R en la computación de altas prestaciones: paralelizando un algoritmo de clasificación.

Other papers in the same session

Latest news

Organizers

Partners

Sponsors

R en la computación de altas prestaciones: paralelizando un algoritmo de clasificación.

Other papers in the same session

Latest news

Organizers

Partners

Sponsors

Cookie policy