Portada Teoría Ejercicios Herramientas Transparencias

Menú de la sección:

1. Problemas de los documentos digitales
2. Variabilidad de los documentos en el Web

3. Aproximaciones a la recuperación de información
4. El proceso de recuperación de información
5. Los directorios
6. Los motores de búsqueda
7. Los agentes personales
8. Internet invisible/web profundo
9. Tutoriales

1. Problemas de los documentos digitales


El objeto básico de recuperación en Internet, por el momento, son los documentos textuales. Sobre los mismos se aplican los principios de tratamiento y recuperación que utilizan los sistemas de gestión documental y de recuperación de información. Sin embargo, los documentos digitales que forman la World Wide Web difieren sobremanera de la percepción clásica de documento como unidad cerrada, ya que, pro contra, son cambiantes y dinámicos. Estas particularidades deben ser tomadas muy en cuenta al desarrollar los procesos de recuperación de información.

La información que es visualizada por el usuario en el web adopta la forma de páginas web. Se trata de documentos textuales, es decir, documentos cuyo componente fundamental es el texto. La norma que rige la construcción de páginas web es el HyperText Markup Language, más conocido como HTML, actualmente en su versión 4. La característica que le dota de un poder extraordinario frente a otros soportes o formatos para documentos electrónicos, es su capacidad hipertextual. Al considerar una página web como un documento, resulta evidente que las características técnicas del HTML permiten integrar todo tipo de informaciones, por lo que, aparentemente, la página web se configura como el soporte documental ideal para los nuevos documentos interactivos que se prevean para los próximos años. Y también puede deducir que una página web, tal y como se la muestra el navegador, tampoco existe realmente; lo que existen son las instrucciones y los elementos necesarios para componerla.

El hipertexto es un sistema de organización y acceso a la información basado en la asociación de documentos, que utiliza para ello un sistema informático, y que sigue la metáfora de la red de elementos. El principio de asociación permite que se pueda acceder directamente desde una idea a otras íntimamente relacionadas con la primera, en virtud de diferentes criterios. Los componentes fundamentales de los sistemas hipermedia, desde una perspectiva informativa y documental, son los nodos, los enlaces y los anclajes. El nodo es la unidad básica del hipertexto, la unidad de acción del usuario, que la explora y evalúa en el contexto en el que se encuentra. Los enlaces interconectan los nodos, y su ejecución permite conmutar o saltar entre los nodos. El usuario tiene la libertad de ejecutar o no los enlaces, según su interés. La ejecución de los enlaces es posible gracias a la presencia de los anclajes. Los anclajes son los puntos de activación y de destino del enlace, y suelen diferenciarse del resto de la información mediante atributos de presentación. Si estos componentes los trasladamos a una página web, queda claro que el nodo corresponde con la propia página web; que el anclaje es el texto o gráfico resaltado en la presentación, cuya pulsación nos llevará a otra página web, y que el enlace, en realidad, es una etiqueta de HTML que no vemos directamente.

Teoría....

© Un curso de Jesús Tramullas para el Instituto de Ciencias de la Educación de la Universidad de Zaragoza
Versión 1.4. 21 de Junio de 2002.