Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google

Ovares Barquero, Felipe; Rubí Barquero, José Alberto

Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google

dc.contributor.author	Ovares Barquero, Felipe
dc.contributor.author	Rubí Barquero, José Alberto
dc.date.accessioned	2023-05-15T19:24:44Z
dc.date.available	2023-05-15T19:24:44Z
dc.date.issued	2010
dc.description.abstract	En lingüística, principalmente en el idioma inglés, se usa el Índice de Niebla de Gunning para determinar la legibilidad de un texto. El índice estima los años de educación formal necesarios para compren-der el texto en una primera lectura. Un Índice de 11 años apunta a una persona con el colegio finalizado, (Gunning, 1973). Analizamos en esta investigación la variación del Índice al cambiar la forma de obtener uno de los parámetros. En la fórmula original se consideran “palabras complejas” las que tienen tres o más sílabas. En su lugar utilizamos “palabras desconocidas” que son aquellas cuyo uso es poco familiar, según un corpus construido durante la investigación, partiendo de millones de libros digitalizados por Google y la Universidad de Harvard. Aunque la variación de los resultados dependerá del valor asignado para determinar si una palabra es desconocida la investigación es pionera en el uso de un corpus para calcular el Índice de Niebla.	es_ES
dc.description.abstract	In linguistics, especially in the English language, the Gunning Fog Index is used to determine the reada-bility of text. The said Index estimates the number of years of formal education needed to comprehend text on the first reading. Therefore, the resulting index of 11 years describes a high school graduate, (Gunning, 1973). In our study we analyzed the variation of the Index by changing the way one of the parameters is obtained. In the original formula “complex words”, those which contain three or more syllables are considered. Instead, we used “unknown words”, those which use is not very familiar, according to a corpus built during the study, constituting of millions of books digitized by Google and Harvard University. Although the variation of the results will depend on the assigned value to determine if a word is unknown, the study is pioneer in the use of a corpus to calculate the Fog Index.	es_ES
dc.description.procedence	Escuela de Informática	es_ES
dc.description.sponsorship	Universidad Nacional, Costa Rica	es_ES
dc.identifier.uri	http://hdl.handle.net/11056/25458
dc.language.iso	spa	es_ES
dc.publisher	Universidad Nacional (Costa Rica)	es_ES
dc.rights	Acceso abierto	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.source	Uniciencia Vol.24 No.1 133-141 2010	es_ES
dc.subject	ÍNDICE DE NIEBLA GUNNING	es_ES
dc.subject	ANÁLISIS DE TEXTOS	es_ES
dc.subject	CORPUS	es_ES
dc.subject	FACILIDAD DE LECTURA	es_ES
dc.subject	SÍLABAS	es_ES
dc.subject	LINGÜÍSTICA COMPUTACIONAL	es_ES
dc.subject	DIGITALIZACIÓN DE LIBROS	es_ES
dc.subject	MINERÍA DE DATOS	es_ES
dc.subject	GUNNING FOG INDEX	es_ES
dc.subject	TEXT ANALYZER	es_ES
dc.subject	DATA MINING	es_ES
dc.subject	ALGORITMOS	es_ES
dc.title	Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google	es_ES
dc.type	http://purl.org/coar/resource_type/c_6501	es_ES

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: Vol 24 No 1 2010. 14.pdf
Tamaño:: 1.2 MB
Formato:: Adobe Portable Document Format
Descripción:

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 919 B
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Artículos científicos