Índice General

Pautas de lectura


Sección Anterior: 2.
Los sistemas de bases de datos y los SGBD

Sección Siguiente: 4. Sistemas de tratamiento y recuperación de información documental

 

Estructura sección 3:
3.1. Concepto de recuperación de información
3.2. El problema de los lenguajes
3.3. El proceso de recuperación
3.4. Lenguajes de interrogación y operadores
3.5. Estrategia de la interrogación
3.6. La exploración como mecanismo de recuperación
3.7. Revisión y análisis de resultados
3.8. Recuperación de información y sistemas expertos


3.2. El problema de los lenguajes

 Una de las cuestiones a considerar es el problema planteado por la traslación de los conceptos a diferentes tipos de lenguajes, cada uno de ellos con características propias (DESCHATELETS, 1986). En un primer momento, el usuario plantea sus necesidades utilizando el lenguaje humano, principalmente en sus variantes escrita y oral. El mensaje emitido es recibido, en numerosas ocasiones, por el documentalista, que debe asegurarse de reducir al mínimo las posibles diferencias entre lo expresado por el usuario y su propia comprensión, confrontando el significado real de los términos para el usuario final, y ofreciendo al mismo otras posibilidades: eliminación de polisemias, uso de sinonimias... Esta primera transmisión y depuración del mensaje coincide con la fase clásica de entrevista, en un proceso de búsqueda documental.

Una vez establecido claramente el contenido del primer mensaje, en un lenguaje al que podríamos llamar, con las debida precauciones "clásico", los conceptos delineados y las relaciones entre ellos deben traducirse a un lenguaje documental. Esta es la segunda transformación que se realiza sobre los conceptos, y consiste en adecuar lo expresado por el usuario, conceptos y relaciones, a los términos y relaciones propios del lenguaje documental pertinente para cada caso. Entra en juego un "segundo lenguaje". Se trata, en este momento, de traducir los términos y expresiones utilizados por el usuario, a términos y relaciones entre los términos que estén contemplados en el lenguaje documental, independientemente de su tipo, que haya sido utilizado en la creación y representación de los documentos en la base de datos que se vaya a consultar. Resulta necesario utilizar los mecanismos de control terminológico establecidos para cada recurso de información. Por supuesto, es posible utilizar directamente los términos y relaciones obtenidos del "primer lenguaje", pero puede imaginarse fácilmente que los resultados no serán los adecuados.

Sin embargo, no será ésta la última transformación "lingüística" a realizar. Una vez obtenidos y validados los términos que deban utilizarse, así como las relaciones entre ellos, las expresiones resultantes deben transformase a un "tercer lenguaje", el cual cumple la función de interrogar, de una forma consistente y comprensible para el sistema informático y sus aplicaciones, la base de datos, con la finalidad de extraer de ésta aquellos documentos que cumplan los requisitos establecidos. A este tercer lenguaje se le denomina lenguaje de interrogación de bases de datos, y es el marco dentro del cual se deben introducir las expresiones del "segundo lenguaje". En este "tercer lenguaje" los términos y conceptos expresados en los anteriores serán válidos, pero será preciso utilizar las características propias del mismo en el momento de expresar las relaciones entre los conceptos.

Los procesos de transferencia entre los tres lenguajes suponen uno de los principales problemas en la recuperación de información en bases de datos. Mientras los "terceros lenguajes" sólo ofrecen problemas de tipo técnico, superables mediante la práctica, los procesos que rodean los "primeros y segundos lenguajes" se encuentran con un mayor nivel de azar, lo que repercute en la recuperación de información.. Para superar estos problemas se investiga en el desarrollo de nuevas técnicas que permitan superar, en lo posible, las diferencias de lógica entre los esquemas mentales de los usuarios, y los esquemas existentes en los lenguajes documentales y los lenguajes informáticos, más limitados y rigurosos. Se trataría, en este caso, de desarrollar intermediarios que facilitasen las transformaciones, de forma transparente para el usuario.

 

Jesús Tramullas y Kronos © 1997, 2000.