 |
 |
Estructura
sección 4:
4.1.
La gestión informática de documentos
4.2. Tipos de sistemas de tratamiento y recuperación
de información documental
4.3. Especificidad de los STRID
4.4. Tratamiento del texto
4.5. Las funciones técnicas de un STRID
4.6. Consultas al STRID: las ecuaciones de búsqueda
|
 |
4.5. Las
funciones técnicas de un STRID
Los Sistemas de Tratamiento
y Recuperación de Información Documentales deben ofrecer a sus usuarios,
como especializaciones de los SGBD que son, las mismas funciones técnicas
de creación, mantenimiento y recuperación de la información que éstos
(TRAMULLAS y CUBILLO, 1995; WEITZMAN y MATTHEW, 1995). Esto supone tanto
la disponibilidad de funciones para el usuario final, de forma que tenga
a su alcance todos los mecanismos necesarios para acceder a los documentos,
como la existencia de herramientas y utilidades que aseguren la adecuada
administración y mantenimiento del sistema, en sus diferentes niveles,
por parte del DBA. Ambos deben ser complementados por nuevas capacidades,
más adecuadas a un tratamiento documental e informativo de la base de
datos (CONLON y CONLON, 1996). En esta situación, un STRID debe ser capaz
de ofrecer las siguientes funciones:
1.- Creación de
bases de datos documentales, con una estructura de campos (también llamados
parágrafos o párrafos) fija. Los diferentes campos, para lograr un correcto
tratamiento de los datos, deben ser de longitud variable y, a ser posible,
permitir la creación de subcampos o subparágrafos. Todos los sistemas
deben respetar la arquitectura de bases de datos explicada en el capítulo
correspondiente.
2.- Introducción de datos, tanto de manera interactiva, como de ficheros
preexistentes, con posibilidad de conversión de formatos de bases de
datos externas. Las funciones de introducción de datos deben permitir
controles de entrada, validación, etc, de cara a asegurar, en lo posible,
la calidad de los datos introducidos.
3.- Recuperación de la información contenida en los documentos de la
base de datos a través de cualquier término existente en ella, mediante
la formulación de ecuaciones de búsqueda que permitan combinar los términos
según diferentes criterios. Los sistemas ofrecen la posibilidad de ejecutar
las consultas sobre una o varias bases de datos simultáneamente. Los
documentos resultantes se agrupan en sets o conjuntos, susceptibles
de combinación posterior.
4.- Salida de la información, mediante edición en pantalla, impresión
y redirección a ficheros de los documentos de interés para el usuario.
Las órdenes de salida de información deben ofrecer la posibilidad de
enviar ésta a diferentes destinos, así como los formatos de presentación
de los datos a utilizar (tamaño, campos...). Deben incluirse aquí las
capacidades para ordenar, según diferentes criterios, los documentos
resultantes. Otra función a considerar es la posibilidad de crear nuevas
bases de datos, tomando como base los documentos recuperados en una
búsqueda previa.
5.- Análisis de la respuesta, utilizando herramientas de análisis de
frecuencias de los términos o de coocurrencias.
6.- Creación de ficheros que definan el perfil de búsqueda de los usuarios,
así como de las ecuaciones que ejecuten. A los ficheros que contienen
ecuaciones de búsqueda previamente grabadas, y que pueden ejecutarse
en cualquier momento, se les llama normalmente "macros". Estas macros
son ficheros susceptibles de edición y modificación, lo que facilita
la recuperación de información con un mínimo esfuerzo de tiempo y coste.
7.- Gestión de mecanismos de control terminológico, tanto para la entrada
de datos como para su recuperación. Puede tratarse de un tesauro, de
un glosario o de un diccionario terminológico.
8.- Ayuda al usuario en todo momento, a través de mensajes y líneas
de estado, especialmente durante el proceso de interrogación (interrogación
asistida). En sistemas de recuperación en línea (teledocumentación),
el sistema informa al usuario del tiempo de conexión, tareas ejecutadas,
coste de la sesión, etc. Los mecanismos de ayuda al usuario, especialmente
aquellos referidos a la evaluación y refinamiento de las búsquedas,
son una de las principales áreas de investigación.
9.- Dependiendo de la configuración del sistema, éste puede ofrecer
opciones de acceso multiusuario, niveles de seguridad, reorganización
y recuperación de ficheros, etc.

Fig.4.3.
Esquema de un IRS (Information Retrieval System)
En general, las funciones
anteriores se engloban en alguno de los seis subsistemas genéricos que
debe ofrecer un STRID (LANCASTER y WARNER, 1993: 15-16):
1.- Subsistema de
selección de documentos.
2.- Subsistema de indización.
3.- Subsistema de vocabulario.
4.- Subsistema de búsqueda.
5.- Subsistema de interacción hombre-máquina.
6.- Subsistema
de comparación.
|
 |
 |
 |