Un estudio comparativo de técnicas de minería de datos y aprendizaje máquina para la estimación del esfuerzo utilizando puntos de función
dc.contributor.author | Quesada López, Christian | |
dc.contributor.author | Murillo-Morera, Juan | |
dc.contributor.author | Jenkins, Marcelo | |
dc.date.accessioned | 2025-07-04T19:45:50Z | |
dc.date.available | 2025-07-04T19:45:50Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Resumen. En los últimos años, una gran cantidad de técnicas de minería de datos y de aprendizaje máquina han sido utilizadas para la construcción de modelos de estimación del esfuerzo de desarrollo del software. La literatura ha reportado resultados inconsistentes acerca de la efectividad de los modelos dependiendo de los conjuntos de datos. En este estudio utilizamos un procedimiento automatizado para la comparación exhaustiva de modelos de estimación de esfuerzo y presentamos los resultados del análisis comparativo a partir de la combinación de un conjunto de técnicas de pre-procesamiento de datos, selección de atributos y algoritmos de aprendizaje aplicado a distintos sub conjuntos de datos del repositorio ISBSG. Los resultados indican que las técnicas con mejores resultados para los modelos basados en los puntos de función IFPUG-FPA fueron LeastMedSq, SMOreg y GaussianProcesses y para COSMIC-FFP fueron SMOreg, MP5 y AdditiveRegression. Las técnicas que incorporan estrategias de regresión son las que mejores resultados obtienen. Asimismo, la combinación de técnicas de pre procesamiento y selección de atributos mejoran los resultados de exactitud. Los modelos de estimación evaluados alcanzaron valores en la exactitud estandarizada entre el 49.94% y 64.05% para IFPUG-FPA y entre el 80.30% y el 67.31% para COSMIC-FFP. Con nuestro procedimiento de evaluación es posible analizar la exactitud de distintos modelos de estimación, cuáles técnicas obtienen los mejores resultados de exactitud a partir de cada conjunto de datos y la combinación de técnicas que puede mejorar el desempeño de los modelos. | |
dc.description.abstract | Abstract. In recent years, a large number of data mining and machine learning techniques have been used for the construction of software development effort estimation models. The literature has reported inconsistent results about the effectiveness of the models because of their dependence on the data sets. In this study, we use an automated procedure for the exhaustive comparison of effort estimation models, and present the results of a comparative analysis derived from the combination of a set of data pre-processing, attribute selection techniques and learning algorithms applied to different sub sets of data from the ISBSG repository. The results indicate that the techniques with the best results for models based on IFPUG-FPA function points were LeastMedSq, SMOreg, and GaussianProcesses, but for COSMIC-FFP were SMOreg, MP5, and AdditiveRegression. The techniques that incorporate regression strategies yield the best results obtained for these data sets. In addition, the combination of pre-processing techniques and attributes selection improve the accuracy results. The estimation models reached a standardized accuracy between 49.94% and 64.05% for IFPUG FPA and between 80.30% and 67.31% for COSMIC FFP. With our evaluation procedure, it is possible to analyze the accuracy of different estimation models, which techniques obtain the best accuracy results from each data set, as well as the combination of techniques that can improve the performance of the models. | |
dc.description.procedence | Escuela de Informática | |
dc.description.sponsorship | Universidad Nacional, Costa Rica | |
dc.description.sponsorship | Associação Ibérica de Sistemas e Tecnologias de Informação (AISTI), Portugal | |
dc.identifier.issn | 1646-9895 | |
dc.identifier.uri | https://hdl.handle.net/11056/32037 | |
dc.language.iso | spa | |
dc.publisher | Associação Ibérica de Sistemas e Tecnologias de Informação (AISTI) (Portugal) | |
dc.rights | Acceso abierto | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.source | Revista Ibérica de Sistemas e Tecnologias de Informação, (E17), 595-609 2019 | |
dc.subject | DESARROLLO DE SOFTWARE | |
dc.subject | MINERÍA DE DATOS | |
dc.subject | APRENDIZAJE | |
dc.subject | METODO EMPÍRICO | |
dc.subject | SOFTWARE DEVELOPMENT | |
dc.subject | DATA MINING | |
dc.subject | LEARNING | |
dc.subject | EMPIRICAL METHOD | |
dc.title | Un estudio comparativo de técnicas de minería de datos y aprendizaje máquina para la estimación del esfuerzo utilizando puntos de función | |
dc.title.alternative | A comparative study of data mining and machine learning techniques for software effort estimation using function points | |
dc.type | http://purl.org/coar/resource_type/c_6501 |
Archivos
Bloque original
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- No. E17 2019. 4.pdf
- Tamaño:
- 3.05 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 919 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción: