Índice General

Pautas de lectura


Sección Anterior: 3.
La recuperación de información

Sección Siguiente: 5. Hipertexto e Hipermedia

 

Estructura sección 4:
4.1. La gestión informática de documentos
4.2. Tipos de sistemas de tratamiento y recuperación de información documental
4.3. Especificidad de los STRID
4.4. Tratamiento del texto
4.5. Las funciones técnicas de un STRID
4.6. Consultas al STRID: las ecuaciones de búsqueda


4.5. Las funciones técnicas de un STRID

Los Sistemas de Tratamiento y Recuperación de Información Documentales deben ofrecer a sus usuarios, como especializaciones de los SGBD que son, las mismas funciones técnicas de creación, mantenimiento y recuperación de la información que éstos (TRAMULLAS y CUBILLO, 1995; WEITZMAN y MATTHEW, 1995). Esto supone tanto la disponibilidad de funciones para el usuario final, de forma que tenga a su alcance todos los mecanismos necesarios para acceder a los documentos, como la existencia de herramientas y utilidades que aseguren la adecuada administración y mantenimiento del sistema, en sus diferentes niveles, por parte del DBA. Ambos deben ser complementados por nuevas capacidades, más adecuadas a un tratamiento documental e informativo de la base de datos (CONLON y CONLON, 1996). En esta situación, un STRID debe ser capaz de ofrecer las siguientes funciones:

1.- Creación de bases de datos documentales, con una estructura de campos (también llamados parágrafos o párrafos) fija. Los diferentes campos, para lograr un correcto tratamiento de los datos, deben ser de longitud variable y, a ser posible, permitir la creación de subcampos o subparágrafos. Todos los sistemas deben respetar la arquitectura de bases de datos explicada en el capítulo correspondiente.
2.- Introducción de datos, tanto de manera interactiva, como de ficheros preexistentes, con posibilidad de conversión de formatos de bases de datos externas. Las funciones de introducción de datos deben permitir controles de entrada, validación, etc, de cara a asegurar, en lo posible, la calidad de los datos introducidos.
3.- Recuperación de la información contenida en los documentos de la base de datos a través de cualquier término existente en ella, mediante la formulación de ecuaciones de búsqueda que permitan combinar los términos según diferentes criterios. Los sistemas ofrecen la posibilidad de ejecutar las consultas sobre una o varias bases de datos simultáneamente. Los documentos resultantes se agrupan en sets o conjuntos, susceptibles de combinación posterior.
4.- Salida de la información, mediante edición en pantalla, impresión y redirección a ficheros de los documentos de interés para el usuario. Las órdenes de salida de información deben ofrecer la posibilidad de enviar ésta a diferentes destinos, así como los formatos de presentación de los datos a utilizar (tamaño, campos...). Deben incluirse aquí las capacidades para ordenar, según diferentes criterios, los documentos resultantes. Otra función a considerar es la posibilidad de crear nuevas bases de datos, tomando como base los documentos recuperados en una búsqueda previa.
5.- Análisis de la respuesta, utilizando herramientas de análisis de frecuencias de los términos o de coocurrencias.
6.- Creación de ficheros que definan el perfil de búsqueda de los usuarios, así como de las ecuaciones que ejecuten. A los ficheros que contienen ecuaciones de búsqueda previamente grabadas, y que pueden ejecutarse en cualquier momento, se les llama normalmente "macros". Estas macros son ficheros susceptibles de edición y modificación, lo que facilita la recuperación de información con un mínimo esfuerzo de tiempo y coste.
7.- Gestión de mecanismos de control terminológico, tanto para la entrada de datos como para su recuperación. Puede tratarse de un tesauro, de un glosario o de un diccionario terminológico.
8.- Ayuda al usuario en todo momento, a través de mensajes y líneas de estado, especialmente durante el proceso de interrogación (interrogación asistida). En sistemas de recuperación en línea (teledocumentación), el sistema informa al usuario del tiempo de conexión, tareas ejecutadas, coste de la sesión, etc. Los mecanismos de ayuda al usuario, especialmente aquellos referidos a la evaluación y refinamiento de las búsquedas, son una de las principales áreas de investigación.
9.- Dependiendo de la configuración del sistema, éste puede ofrecer opciones de acceso multiusuario, niveles de seguridad, reorganización y recuperación de ficheros, etc.

Fig.4.3. Esquema de un IRS (Information Retrieval System)

En general, las funciones anteriores se engloban en alguno de los seis subsistemas genéricos que debe ofrecer un STRID (LANCASTER y WARNER, 1993: 15-16):

1.- Subsistema de selección de documentos.
2.- Subsistema de indización.
3.- Subsistema de vocabulario.
4.- Subsistema de búsqueda.
5.- Subsistema de interacción hombre-máquina.
6.- Subsistema de comparación.

 

 

Jesús Tramullas y Kronos © 1997, 2000.