Preservar información digital

Una cuestión clave en gestión de información es la preservación. En el entorno digital, hablamos entonces de preservación digital. De la misma forma que estamos acostumbrados a oir hablar de programas de preservación de documentos, digitalización, expurgo, conservación, etc., cuando hacemos referencia a documentos en soportes físicos como el papel, fotografía, etc, debemos acostumbrarnos a oír hablar, y a trabajar, con procesos y técnicas de preservación digital.

En preservación de documentos tradicionales, el soporte es parte inherente e inseparable del documento original. La actuación sobre el soporte es fundamental, y existe todo un conjunto de normas y procedimientos para ello.  Pero, ¿qué sucede cuando debemos enfrentarnos a documentos, no digitales, sino más bien «legibles por máquina»? Cada vez en mayor medida nos enfrentamos a documentos que necesitan de una máquina, de un intermediario, para poder acceder a la información contenida en ellos. Las aproximaciones que se han ido adoptando para hacer frente a este problema han tomado tres orientaciones diferentes:

  1. La conservación y mantenimiento de las máquinas que hacen posible el acceso a la información contenida en el documento, opción cara y compleja, y siempre fuente de riesgo.
  2. La migración a otros formatos, generalmente digitales, poniendo el énfasis en guardar el contenido informativo, pero con el riesgo de perder por el camino efectos estéticos, visuales o sonoros que formaban parte integrante del documento original; y
  3. La emulación, mediante una plataforma común (generalmente mezcla de máquina y software) de las herramientas necesarias para acceder a diferentes tipos de documentos.

Una combinación de las aproximaciones 2 y 3 es la que pretende el proyecto Keeping emulation environments portable (KEEP), financiado por el 7º Programa Marco de la Unión Europea. Pretende desarrollar una plataforma que haga posible la creación de dispositivos virtuales capaces de acceder a cualquier tipo de formato previo. Por el momento, parece prometedor, pero aquí la cuestión clave es el formato de los documentos. En particular, las especificaciones que establecen las partes, estructura y organización del formato digital que sirve de contenedor de la información que se trate.  De ello se deduce la importancia nuclear de que las especificaciones de formatos sean abiertas, es decir, que su implementación esté al alcance de todos los interesados. Esta es la razón de la lucha de los últimos años entre el formato OpenDocument (ODF), abierto y libre, estándar ISO, soportado por OASIS, y OOXML, formato difícilmente sostenible e implementable, sujeto a patentes y derechos propietarios,  que, entre diferentes escándalos y denuncias, Microsoft ha conseguido hacer pasar como estándar ISO.

En cualquier caso, y siendo reiterativo, los usuarios parecen haber resuelto esto por la via expeditiva en los últimos años: ¿música? de wav a mp3 y lo que sea necesario; ¿vídeo?  de dvd a avi, mp4, flv y lo que sea menester… para ellos lo importante no es el formato ni el productor; lo importante es seguir teniendo acceso a sus contenidos independientemente del dispositivo… ¿cuánto aguantará el Kindle de Amazon siendo propietario?…. para terminar me planteo qué preservamos en realidad, información digital o documento digital…