Categorías léxicas en medios digitales de Honduras de 2009 - 2016

##plugins.themes.bootstrap3.article.main##

Jairo Jonathán Martínez
Eva Leticia Martínez
Enviado: Aug 22, 2018
Publicado: Sep 12, 2018

Resumen

Un recurso valioso para las empresas y personas es la información. Aunque se pueden encontrar muchos datos estructurados, gran parte del conocimiento se encuentra en formatos no estructurados, en forma de lenguaje natural. En los últimos años las tecnologías han favorecido un crecimiento constante de la producción de volúmenes de texto que están disponibles, pero que son difíciles de procesar. Estos constituyen una gran fuente de información importante para las empresas, la política y las personas que quiere aplicar tecnicas de minería de texto para encontrar información que les sea de utilidad. Sin embargo, el procesamiento del lenguaje natural es un campo de investigación en pleno desarrollo, y una tarea pendiente para los científicos lingüístico-computacionales. En Honduras también ha crecido la producción de texto digital. Como parte del procesamiento computacional de texto se realiza el etiquetamiento de la categoría léxica a la que pertenece cada palabra. Para este artículo se realizó el etiquetamiento de una colección compuesta por más de 173 mil noticias publicades entre los años 2009 y 2016 en periódicos digitales del país. Además, se realiza un análisis de la frecuencia de las palabras y de las categorías léxicas en las que fueron clasificadas.

Palabras clave

categorías léxicas, Honduras, lingüística computacional, periódicos digitales

Descargas

La descarga de datos todavía no está disponible.

##plugins.themes.bootstrap3.article.details##

Cómo citar
Martínez, J., & Martínez, E. (2018). Categorías léxicas en medios digitales de Honduras de 2009 - 2016. Memorias De Congresos UTP, 1(1), 113-120. Recuperado a partir de http://revistas.utp.ac.pa/index.php/memoutp/article/view/1841