Logical analysis ofmulticlass data with relaxed patterns
Fecha
2020
Autores
Bain, Travaughn C.
Ávila-Herrera, Juan F.
Subasi, Ersoy
Subasi, Munevver Mine
Título de la revista
ISSN de la revista
Título del volumen
Editor
Springer (Alemania)
Resumen
Abstract. An efficient and robust algorithm based on mixed integer linear programming is proposed to extend the Logical Analysis of Data (LAD) methodology to solve multiclass classification problems, where One-vs-Rest learning models are constructed to classify observations in predefined classes. The proposed algorithm uses two control parameters, homogeneity and prevalence, for identifying relaxed (fuzzy) patterns in multiclass datasets. The utility of the proposed method is demonstrated through experiments on multiclass benchmark datasets. Numerical experiments show that the efficiency and performance of the proposed multiclass LAD method with relaxed patterns is comparable to, if not better than, those of the previously developed LAD based multiclass classification as well as other well-known supervised learning methods.
Resumen. Se propone un algoritmo eficiente y robusto basado en programación lineal entera mixta para extender la metodología de Análisis Lógico de Datos (LAD) para resolver problemas de clasificación multiclase, donde se construyen modelos de aprendizaje Uno versus Resto para clasificar observaciones en clases predefinidas. El algoritmo propuesto utiliza dos parámetros de control, homogeneidad y prevalencia, para identificar patrones relajados (difusos) en conjuntos de datos multiclase. La utilidad del método propuesto se demuestra a través de experimentos con conjuntos de datos de referencia multiclase. Los experimentos numéricos muestran que la eficiencia y el rendimiento del método LAD multiclase propuesto con patrones relajados es comparable, si no mejor, a los de la clasificación multiclase basada en LAD desarrollada previamente, así como a otros métodos de aprendizaje supervisado bien conocidos.
Resumen. Se propone un algoritmo eficiente y robusto basado en programación lineal entera mixta para extender la metodología de Análisis Lógico de Datos (LAD) para resolver problemas de clasificación multiclase, donde se construyen modelos de aprendizaje Uno versus Resto para clasificar observaciones en clases predefinidas. El algoritmo propuesto utiliza dos parámetros de control, homogeneidad y prevalencia, para identificar patrones relajados (difusos) en conjuntos de datos multiclase. La utilidad del método propuesto se demuestra a través de experimentos con conjuntos de datos de referencia multiclase. Los experimentos numéricos muestran que la eficiencia y el rendimiento del método LAD multiclase propuesto con patrones relajados es comparable, si no mejor, a los de la clasificación multiclase basada en LAD desarrollada previamente, así como a otros métodos de aprendizaje supervisado bien conocidos.
Descripción
Palabras clave
APRENDIZAJE, CLASIFICACIÓN, ANÁLISIS DE DATOS, PROGRAMACIÓN LINEAL, LEARNING, CLASSIFICATION, DATA ANALYSIS, LINEAR PROGRAMMING
