Acessibilidade / Reportar erro

Técnicas de recuperación de información aplicadas a la construcción de tesauros

Information retrieval techniques applied to the development of a thesaurus

El artículo propone la aplicación de un conjunto de técnicas propias del ámbito de la Recuperación de Información a la elaboración de Tesauros. Las propuestas que se presentan se aplicaron en la selección de la terminología, en la categorización de términos mediante clusters, y en el establecimiento de relaciones semánticas entre los términos, por procedimientos de similitud, que dieron como resultado un Tesauro de Comercio Exterior, de 7.790 términos. De tales resultados se puede concluir que las técnicas utilizadas simplifican de forma considerable las tareas para la recopilación de la terminología, y pueden suponer una mejora de la calidad del Tesauro resultante, en tanto que permiten el análisis de las condiciones de la colección para la que se utilizará el Tesauro, así como aportar información extra a los expertos que es difícilmente obtenible de forma manual.

Construcción de tesauros; Clustering; Modelo de espacio vectorial; Modelo generalizado de espacio vectorial; Semántica latente


Pontifícia Universidade Católica de Campinas Núcleo de Editoração SBI - Campus II - Av. John Boyd Dunlop, s/n. - Prédio de Odontologia, Jd. Ipaussurama - 13059-900 - Campinas - SP, Tel.: +55 19 3343-6875 - Campinas - SP - Brazil
E-mail: transinfo@puc-campinas.edu.br