¿Reimaginando la búsqueda de información?

En el número de junio de Communications of the ACM se incluye un breve pero interesante texto de Alex Wright, titulado «Reimagining Search» (, DOI ). En él el autor reflexiona sobre los orígenes de los sistemas de búsqueda, y lo que hoy en día los usuarios le piden a los motores de búsqueda en internet.

Recuerda el autor el primer sistema SMART, desarrollado por G. Salton, y cómo definió el estándar de los sistemas de recuperación: define una expresión de búsqueda, compárala con un conjunto de documentos, calcula un subconjunto de documentos relevantes, y ordénalos y muéstralos en una lista. Lo que han hecho todos los sistemas de recuperación hasta la fecha. Y a continuación, el autor introduce una cuestión de especial relevancia en la actualidad: « Today, many of us have less interest in sifting through a collection of documents than in getting something done: booking a flight, finding a job, buying a house, making an investment, or any number of other highly focused tasks.»

Se ha producido un cambio de paradigma: los sistemas de recuperación se usan para buscar cómo hacer algo, antes que para encontrar una información documentada. Quizá algunos dirían que es un cambio del saber al hacer, pero lo dejo para los teóricos. Este cambio en los propósitos y motivaciones de los usuarios se refleja en el primer elemento del modelo: la expresión de búsqueda. Las líneas de investigación emergentes se centran en identificar cuál es el propósito del usuario, y para ello analizan los patrones de redacción de preguntas, el contexto de la pregunta, y las acciones previas de los usuarios (si están disponibles, claro está). El análisis de patrones lingüísticos (orden de elementos, sinónimos…) es una de las armas que usa Google, por ejemplo, para identificar qué quieren expresar los usuarios al escribir una frase.

El estudio de los usuarios resulta clave. Wright cita un trabajo de Microsoft Research de 2012, en el cual se identifican cinco modos discretos de comportamiento de los usuarios que buscan información, cada uno de los cuales muestra diferentes pautas de interacción:

  • Respite: taking a break in the day’s routine with brief, frequent visits to a familiar set of Web sites;
  • Orienting: frequent monitoring of heavily-used sites like email providers and financial services;
  • Opportunistic use: leisurely visits to less-frequented sites for topics like recipes, odd jobs, and hobbies;
  • Purposeful use: non-routine usage scenarios, usually involving time-limited problems like selling a piece of furniture, or finding a babysitter, and
  • Lean-back: consuming passive entertainment like music or videos.

El objetivo de los proveedores de información pasará a la predicción: analizando lo que se busca y cómo se busca, intentarán ser capaces de ofrecer la información usando modelos de los usuarios, antes de que el usuario la demande. Con todo lo bueno (y lo malo), que esto puede suponer…