Logotipo del repositorio
 

Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google

dc.contributor.authorOvares Barquero, Felipe
dc.contributor.authorRubí Barquero, José Alberto
dc.date.accessioned2023-05-15T19:24:44Z
dc.date.available2023-05-15T19:24:44Z
dc.date.issued2010
dc.description.abstractEn lingüística, principalmente en el idioma inglés, se usa el Índice de Niebla de Gunning para determinar la legibilidad de un texto. El índice estima los años de educación formal necesarios para compren-der el texto en una primera lectura. Un Índice de 11 años apunta a una persona con el colegio finalizado, (Gunning, 1973). Analizamos en esta investigación la variación del Índice al cambiar la forma de obtener uno de los parámetros. En la fórmula original se consideran “palabras complejas” las que tienen tres o más sílabas. En su lugar utilizamos “palabras desconocidas” que son aquellas cuyo uso es poco familiar, según un corpus construido durante la investigación, partiendo de millones de libros digitalizados por Google y la Universidad de Harvard. Aunque la variación de los resultados dependerá del valor asignado para determinar si una palabra es desconocida la investigación es pionera en el uso de un corpus para calcular el Índice de Niebla.es_ES
dc.description.abstractIn linguistics, especially in the English language, the Gunning Fog Index is used to determine the reada-bility of text. The said Index estimates the number of years of formal education needed to comprehend text on the first reading. Therefore, the resulting index of 11 years describes a high school graduate, (Gunning, 1973). In our study we analyzed the variation of the Index by changing the way one of the parameters is obtained. In the original formula “complex words”, those which contain three or more syllables are considered. Instead, we used “unknown words”, those which use is not very familiar, according to a corpus built during the study, constituting of millions of books digitized by Google and Harvard University. Although the variation of the results will depend on the assigned value to determine if a word is unknown, the study is pioneer in the use of a corpus to calculate the Fog Index.es_ES
dc.description.procedenceEscuela de Informáticaes_ES
dc.description.sponsorshipUniversidad Nacional, Costa Ricaes_ES
dc.identifier.urihttp://hdl.handle.net/11056/25458
dc.language.isospaes_ES
dc.publisherUniversidad Nacional (Costa Rica)es_ES
dc.rightsAcceso abiertoes_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.sourceUniciencia Vol.24 No.1 133-141 2010es_ES
dc.subjectÍNDICE DE NIEBLA GUNNINGes_ES
dc.subjectANÁLISIS DE TEXTOSes_ES
dc.subjectCORPUSes_ES
dc.subjectFACILIDAD DE LECTURAes_ES
dc.subjectSÍLABASes_ES
dc.subjectLINGÜÍSTICA COMPUTACIONALes_ES
dc.subjectDIGITALIZACIÓN DE LIBROSes_ES
dc.subjectMINERÍA DE DATOSes_ES
dc.subjectGUNNING FOG INDEXes_ES
dc.subjectTEXT ANALYZERes_ES
dc.subjectDATA MININGes_ES
dc.subjectALGORITMOSes_ES
dc.titleVariación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por googlees_ES
dc.typehttp://purl.org/coar/resource_type/c_6501es_ES

Archivos

Bloque original

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
Vol 24 No 1 2010. 14.pdf
Tamaño:
1.2 MB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
919 B
Formato:
Item-specific license agreed upon to submission
Descripción: