Logotipo del repositorio
 

Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google

Fecha

2010

Autores

Ovares Barquero, Felipe
Rubí Barquero, José Alberto

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Nacional (Costa Rica)

Resumen

En lingüística, principalmente en el idioma inglés, se usa el Índice de Niebla de Gunning para determinar la legibilidad de un texto. El índice estima los años de educación formal necesarios para compren-der el texto en una primera lectura. Un Índice de 11 años apunta a una persona con el colegio finalizado, (Gunning, 1973). Analizamos en esta investigación la variación del Índice al cambiar la forma de obtener uno de los parámetros. En la fórmula original se consideran “palabras complejas” las que tienen tres o más sílabas. En su lugar utilizamos “palabras desconocidas” que son aquellas cuyo uso es poco familiar, según un corpus construido durante la investigación, partiendo de millones de libros digitalizados por Google y la Universidad de Harvard. Aunque la variación de los resultados dependerá del valor asignado para determinar si una palabra es desconocida la investigación es pionera en el uso de un corpus para calcular el Índice de Niebla.
In linguistics, especially in the English language, the Gunning Fog Index is used to determine the reada-bility of text. The said Index estimates the number of years of formal education needed to comprehend text on the first reading. Therefore, the resulting index of 11 years describes a high school graduate, (Gunning, 1973). In our study we analyzed the variation of the Index by changing the way one of the parameters is obtained. In the original formula “complex words”, those which contain three or more syllables are considered. Instead, we used “unknown words”, those which use is not very familiar, according to a corpus built during the study, constituting of millions of books digitized by Google and Harvard University. Although the variation of the results will depend on the assigned value to determine if a word is unknown, the study is pioneer in the use of a corpus to calculate the Fog Index.

Descripción

Palabras clave

ÍNDICE DE NIEBLA GUNNING, ANÁLISIS DE TEXTOS, CORPUS, FACILIDAD DE LECTURA, SÍLABAS, LINGÜÍSTICA COMPUTACIONAL, DIGITALIZACIÓN DE LIBROS, MINERÍA DE DATOS, GUNNING FOG INDEX, TEXT ANALYZER, DATA MINING, ALGORITMOS

Citación