Portada Teoría Ejercicios Herramientas Transparencias

Menú de la sección:

1. Problemas de los documentos digitales
2. Variabilidad de los documentos en el Web
3. Aproximaciones a la recuperación de información
4. El proceso de recuperación de información
5. Los directorios
6. Los motores de búsqueda
7. Los agentes personales
8. Internet invisible/web profundo
9. Tutoriales

7. Los agentes personales


Los sistemas de agentes más conocidos de Internet son, los web robots, agentes que desarrollan todo tipo de tareas en el World Wide Web. Los más populares y útiles, para el usuario común, son los agentes de búsqueda de información, o searchbots. Los motores de búsqueda alimentan sus bases de datos mediante la utilización de robots o agentes básicos, los llamados spiders, wanderers o worms, a los que delegan las tareas de localización, acceso y copia de documentos, como se ha explicado en capítulos anteriores. Junto a éstos, cada vez en mayor medida está aumenta la utilización de los agentes personales para recuperación de información, que actúan como intermediario entre el usuario y los motores de búsqueda, tanto si éstos son de tipo general, como especializados.

Las funciones técnicas que ofrecen los searchbot están muy relacionadas con su funcionamiento directo. Las principales funciones disponibles son:

  1. Consulta autónoma a fuentes de información: el usuario establece que fuentes de información, principalmente motores de búsqueda, van a ser consultadas para solucionar la cuestión planteada.
  2. Consulta simultánea: para optimar la conexión y el tiempo disponible, los searchbots no lanzan las conexiones secuencialmente, sino que lo hacen de forma simultánea.
  3. Filtrado de respuestas: tras la recepción de las respuestas es necesario someterlas a un filtrado que elimine referencias duplicadas, inexistentes, o subsecciones de documentos principales, por ejemplo.
  4. Criterios de ordenación y ponderación de respuestas: incorporan algoritmos capaces de analizar el contenido del documento, y dotarlo con una escala de valoración de sus contenidos, ordenando el conjunto resultante según la misma.
  5. Obtención del documento original o primario y creación de recursos de información: Las prestaciones anterior y siguiente se apoyan en la capacidad de ir a la localización del documento, y obtener una copia del mismo que es recibida y almacenada en el ordenador del usuario. Así permiten crear recursos de información en su propio ordenador, que pueden adoptar la forma de bases de datos textuales, directorios e índices en forma de páginas web, etc.
  6. Definición de perfiles de usuario: creación de un archivo permanente en el que almacenar esas ecuaciones, para su ejecución cuando sea menester.
  7. Temporalización de actividades: el searchbot debe ofrecer la posibilidad de establecer la ejecución de perfiles de usuario a intervalos temporales.

6. Los motores...

© Un curso de Jesús Tramullas para el Instituto de Ciencias de la Educación de la Universidad de Zaragoza
Versión 1.4. 21 de Junio de 2002.