Entre las discusiones sobre la propiedad de las cosas intelectuales no está recibiendo la importancia que merece la revisión del papel de los datos bibliográficos. Los usuarios crean bibliografías que recogen en esquemas de datos que suelen responder a estándares de facto, como bibtext, o de iure, como MARC o Dublin Core. Las bibliotecas usan MARC, o alguna de sus variantes, como esquema de estandarización de datos. Los archivos también tienen varios esquemas. Esta estandarización facilita el intercambio de información entre organizaciones, una de las funciones básicas de los estándares, y hacen posible la preservación de datos y la reutilización. Numerosos servicios del web 2.0 se basan en el uso de estándares, como RSS o FOAF para relacionar y reutilizar información. Gran parte del web semántico es posible gracias al uso del estándar RDF. Todo esto está muy bien, pero acaba llevando a la pregunta del millón ¿de quién son los datos?
Porque me temo que las instituciones van a empezar a predicar que los datos son suyos, aunque sean meramente descriptivos, y que sólo ellos dan permisos y prebendas de uso. Todos en la línea de posesión febril que está generando la destalentada legislación sobre propiedad pseudo-intelectual. No me queda claro, por ejemplo, que diría una biblioteca si le montas un OPAC 2.0 independiente. Porque, de ¿quién son unos datos meramente descriptivos de uso abierto? ¿hasta dónde llega la política de fair use de los datos públicos? En realidad, ya hemos visto como multinacionales del sector de la información han intentado arrogarse las bibliografías que hacían los usuarios con sus herramientas, como en el reciente ataque contra Zotero. Es lo que tiene el soft propietario y las licencias privativas: abuso, exceso, amenaza y monopolio. Y me temo que algunos quieren iniciar un camino hacia los «datos privativos».
Esta reflexión viene al hilo de que «serendipeando» por la red he encontrado la propuesta del Working Group on Open Bibliographic Data, cuyo objetivo es promover buenas prácticas legales y técnicas que hagan posible mantener los datos bibliográficos y referenciales abiertos. Nada que objetar, en cuanto pretenden trabajar sobre estándares de acceso e intercambio. Estamos trabajando con Zotero, Mendeley y CiteULike, y una de las cosas que me gustan de ellos es la posibilidad de intercambiar datos y referencias con unos mínimos problemas. Sin embargo, hay que tener en cuenta que los esquemas de descripción de elementos bibliográficos están fundados en la singularidad de las entidades, no en la relación que pueden tener entre sí ellas o sus datos componentes. Los estándares actuales muestran el mismo problema, que se irá haciendo más notorio conforme se desarrollen más las tecnologías semánticas de relación y asociación de información. Por esta razón es de sumo interés el esfuerzo que lleva a cabo la Bibliographic Knowledge Network por desarrollar un nuevo estándar, el llamado BibJSON, cuyo objetivo es disponer de un estándar que integre los datos bibliográficos clásicos, con los de autoría, organizaciones, descripción, etc, de forma que se pueden establecer automáticamente asociaciones con otros datos.
A un nivel más personal, los datos son míos, son miiii tesooooooroooo… de lo que es muy consciente Google. Fruto de ello es que la propia empresa ha organizado un equipo de trabajo cuya finalidad es favorecer que los usuarios de sus servicios puedan mover fácilmente sus datos desde y hacia Google. The Data Liberation Front ofrece buenas guías para ello, aunque sigue siendo un trabajo en desarrollo. Se critica mucho últimamente, y con buenas razones, a Google, pero aún no he visto que Facebook haga lo mismo, ni Twitter, ni Tuenti, ni otras empresas. Porque, volviendo a la pregunta inicial ¿de quién son mis datos? ¿y los datos públicos de libre uso?