Acessibilidade / Reportar erro

PuertoTex: un software de minería textual para la creación de resúmenes automáticos en el dominio de ingeniería de puertos y costas basado en ontologías

PuertoTex: a data mining software based on ontologies for automatic summarization on port and coastal engineering domain

El objeto de este trabajo es elaborar y evaluar los resultados de la implementación de un software basado en ontologías, capaz de generar resúmenes automáticos en el campo de la Ingeniería de Puertos y Costas. Para el desarrollo de la herramienta se emplean diversas técnicas emanadas del análisis de discurso así como técnicas cognitivas, que permiten generar reglas para el tratamiento de los textos. También se apela a la construcción de una ontología que facilite los procesos de etiquetado a partir de las potencialidades de Resource Description Framework y Extensible Makup Language. Se construye un conjunto de agentes que actúa sobre la ontología, de la cual se declaran sus principales elementos. Como producto generado se presenta Puertotex, un software para la construcción de resúmenes automáticos basado en ontologías. La evaluación de los resúmenes generados refleja la calidad del sistema, que tiene como única limitación su capacidad para trabajar con el dominio objeto de investigación.

Autómatas; Desambiguación de textos científicos; Minería de texto; Ontologías; Resumen automático


Pontifícia Universidade Católica de Campinas Núcleo de Editoração SBI - Campus II - Av. John Boyd Dunlop, s/n. - Prédio de Odontologia, Jd. Ipaussurama - 13059-900 - Campinas - SP, Tel.: +55 19 3343-6875 - Campinas - SP - Brazil
E-mail: transinfo@puc-campinas.edu.br