Un estudio comparativo de técnicas de minería de datos y aprendizaje máquina para la estimación del esfuerzo utilizando puntos de función

Quesada López, Christian; Murillo-Morera, Juan; Jenkins, Marcelo

Un estudio comparativo de técnicas de minería de datos y aprendizaje máquina para la estimación del esfuerzo utilizando puntos de función

dc.contributor.author	Quesada López, Christian
dc.contributor.author	Murillo-Morera, Juan
dc.contributor.author	Jenkins, Marcelo
dc.date.accessioned	2025-07-04T19:45:50Z
dc.date.available	2025-07-04T19:45:50Z
dc.date.issued	2019
dc.description.abstract	Resumen. En los últimos años, una gran cantidad de técnicas de minería de datos y de aprendizaje máquina han sido utilizadas para la construcción de modelos de estimación del esfuerzo de desarrollo del software. La literatura ha reportado resultados inconsistentes acerca de la efectividad de los modelos dependiendo de los conjuntos de datos. En este estudio utilizamos un procedimiento automatizado para la comparación exhaustiva de modelos de estimación de esfuerzo y presentamos los resultados del análisis comparativo a partir de la combinación de un conjunto de técnicas de pre-procesamiento de datos, selección de atributos y algoritmos de aprendizaje aplicado a distintos sub conjuntos de datos del repositorio ISBSG. Los resultados indican que las técnicas con mejores resultados para los modelos basados en los puntos de función IFPUG-FPA fueron LeastMedSq, SMOreg y GaussianProcesses y para COSMIC-FFP fueron SMOreg, MP5 y AdditiveRegression. Las técnicas que incorporan estrategias de regresión son las que mejores resultados obtienen. Asimismo, la combinación de técnicas de pre procesamiento y selección de atributos mejoran los resultados de exactitud. Los modelos de estimación evaluados alcanzaron valores en la exactitud estandarizada entre el 49.94% y 64.05% para IFPUG-FPA y entre el 80.30% y el 67.31% para COSMIC-FFP. Con nuestro procedimiento de evaluación es posible analizar la exactitud de distintos modelos de estimación, cuáles técnicas obtienen los mejores resultados de exactitud a partir de cada conjunto de datos y la combinación de técnicas que puede mejorar el desempeño de los modelos.
dc.description.abstract	Abstract. In recent years, a large number of data mining and machine learning techniques have been used for the construction of software development effort estimation models. The literature has reported inconsistent results about the effectiveness of the models because of their dependence on the data sets. In this study, we use an automated procedure for the exhaustive comparison of effort estimation models, and present the results of a comparative analysis derived from the combination of a set of data pre-processing, attribute selection techniques and learning algorithms applied to different sub sets of data from the ISBSG repository. The results indicate that the techniques with the best results for models based on IFPUG-FPA function points were LeastMedSq, SMOreg, and GaussianProcesses, but for COSMIC-FFP were SMOreg, MP5, and AdditiveRegression. The techniques that incorporate regression strategies yield the best results obtained for these data sets. In addition, the combination of pre-processing techniques and attributes selection improve the accuracy results. The estimation models reached a standardized accuracy between 49.94% and 64.05% for IFPUG FPA and between 80.30% and 67.31% for COSMIC FFP. With our evaluation procedure, it is possible to analyze the accuracy of different estimation models, which techniques obtain the best accuracy results from each data set, as well as the combination of techniques that can improve the performance of the models.
dc.description.procedence	Escuela de Informática
dc.description.sponsorship	Universidad Nacional, Costa Rica
dc.description.sponsorship	Associação Ibérica de Sistemas e Tecnologias de Informação (AISTI), Portugal
dc.identifier.issn	1646-9895
dc.identifier.uri	https://hdl.handle.net/11056/32037
dc.language.iso	spa
dc.publisher	Associação Ibérica de Sistemas e Tecnologias de Informação (AISTI) (Portugal)
dc.rights	Acceso abierto
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.source	Revista Ibérica de Sistemas e Tecnologias de Informação, (E17), 595-609 2019
dc.subject	DESARROLLO DE SOFTWARE
dc.subject	MINERÍA DE DATOS
dc.subject	APRENDIZAJE
dc.subject	METODO EMPÍRICO
dc.subject	SOFTWARE DEVELOPMENT
dc.subject	DATA MINING
dc.subject	LEARNING
dc.subject	EMPIRICAL METHOD
dc.title	Un estudio comparativo de técnicas de minería de datos y aprendizaje máquina para la estimación del esfuerzo utilizando puntos de función
dc.title.alternative	A comparative study of data mining and machine learning techniques for software effort estimation using function points
dc.type	http://purl.org/coar/resource_type/c_6501

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: No. E17 2019. 4.pdf
Tamaño:: 3.05 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 919 B
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Artículos científicos