Wikipedia: de enciclopedia a objeto de investigación (ThinkEPI)

“La lógica es maravillosa, pero a veces obtienes mejores resultados pensando.”

Terry Pratchett (El país del fin del mundo, 1989).

Actualización (23/3/15): la versión pendiente de publicación añade algunas notas y referencias más…

1. Wikipedia como disrupción.

Cuando se lanzó Wikipedia en 2001, la iniciativa para desarrollar y compilar una enciclopedia universal en línea, en acceso abierto, redactada y corregida por voluntarios, pareció a muchos un disparate y un proyecto que iba a tener un escaso recorrido. Catorce años después, oscila entre el sexto y el séptimo lugar en el listado de sitios más visitados de internet, ofrece un elevado número de versiones en diferentes idiomas (hasta los 237), y el número de páginas consultadas y de visitantes se cuenta en millones… por hora. A su estela han ido surgiendo proyectos más especializados, como Commons, Wikidata, Wiktionary… que se han ido desarrollando con más o menos éxito, animados por el mismo planteamiento de creación y acceso libre al conocimiento humano.Como era de esperar, la disrupción del modelo enciclopédico tradicional que supuso Wikipedia generó controversias, en especial sobre la calidad del contenido informativo que ofrece a los usuarios (Saorín, 2012). La impresión generalizada en este aspecto, que todavía encuentra eco en la prensa generalista, era que Wikipedia carecía de fiabilidad y de calidad en sus contenidos. Esta errónea generalización fué refutada en el trabajo de Giles (2005) publicado en Nature, una revista poco sospechosa de sesgo, que comparaba artículos similares de Wikipedia y de la Enciclopaedia Britannica. Sin embargo, cada cierto tiempo los medios se hacen eco de trabajos que demuestran una pretendida falta de fiabilidad de Wikipedia.

Realmente, si se aborda Wikipedia desde una perspectiva crítica cuyos fundamentos culturales y académicos se encuentran en el modelo de enciclopedia vigente en los siglos XIX y XX, pueden identificarse debilidades. La utilización de este enfoque no parece ser la más adecuada: no parece lo más recomendable valorar y analizar un producto de información del siglo XXI, un nodo, resultado de la sociedad-red, tal y como la delineó Manuel Castells, siguiendo criterios de la estructura socio-cultural de los siglos anteriores. Para poder estudiar Wikipedia es necesario establecer un marco teórico y metodológico adecuado al contexto científico, social y cultural de Wikipedia, y de otros productos de la sociedad-red.

2. Wikipedia en la literatura científica.

En primer lugar cabe plantear si Wikipedia es un fenónemo social, tecnológico y cultural que puede ser sometido al análisis y escrutinio que supone la aplicación al mismo de los métodos científicos provenientes de diferentes disciplinas. La revisión de la publicación científica desde 2001 dice que indudablemente lo es. La base de datos de Scopus recoge que desde 2006 hasta febrero de 2015 se han publicado 4932 trabajos sobre la cuestión (atendiendo a contenidos de título, palabras clave y resumen). Web of Science los reduce a 2275, entre 2002 y 2014. Google Scholar, con una cobertura bastante más amplia, ofrece 8440 resultados que incluyen el término “Wikipedia” en el título del propio trabajo. Scirus, antes de su desaparición, ofrecía 7032 resultados. Bar-Ilan y Aharony (2014) han revisado la producción anual presente en Scopus, dividendo la misma entre enfoques tecnológico y social, y señalando que parece descender lentamente desde 2012. Además de la cobertura en las bases de datos, han emergido congresos y conferencias especializados sobre Wikipedia, que se celebran con regularidad. The International Symposium on Open Collaboration (OpenSym, previamente denominado WikiSym) es un congreso anual dedicado a la investigación sobre temas de colaboración abierta, apoyado por ACM, y que da una amplia cobertura a trabajos sobre diferentes aspectos de Wikipedia; también Wikipedia suele gozar de sesiones en las ACM Conference on Computer Supported Cooperative Work; Wikimania, patrocinado por la Wikimedia Foundation desde 2005, es la conferencia anual oficial de la misma, donde se presentan proyectos, estudios y desarrollos; GLAM-Wiki Conference es el evento bianual dedicado a proyectos GLAM en Wikipedia, que se ha celebrado en 2013 y 2015, con apoyo de Europeana y de la Wikimedia Foundation. A lo anterior habría que añadir los números especiales de revista, talleres o sesiones específicas en el marco de congresos más amplios, etc. Todo ello permite afirmar que Wikipedia es un objeto de estudio de interés para diferentes disciplinas y campos científicos.

3. Áreas de investigación sobre Wikipedia.

El volumen de trabajos de investigación publicados sobre diferentes aspectos de Wikipedia ha hecho posible que, a su vez, puede encontrarse en la bibliografía especializada trabajos que precisamente analizan el contenido y orientación de las publicaciones, con el objetivo de detectar y documentar sobre los frentes de investigación que pueden identificarse.

Okoli (2009), aplicando el modelo de análisis propuesto por Okoli y Schabram (2009), usando como fuente artículos publicados en revistas peer-review, identifica las siguientes áreas:

  • Funcionamiento de Wikipedia y sus causas, incluyendo en este apartado revisiones generales de Wikipedia, motivaciones para contribuir y procesos editoriales.
  • Confiabilidad o fiabilidad de Wikipedia, incluyendo estudios críticos y análisis epistemológicos.
  • Wikipedia como fuente de datos, atendiendo a citas de Wikipedia, Wikipedia como fuente de datos, y Wikipedia como fuente primaria.
  • Aplicaciones en educación y economía.

En 2012, el grupo de investigadores coordinado por Okoli presentó un desarrollo más extenso de sus primeros trabajos (Okoli et alii, 2012). Para ello revisó unos 450 trabajos recogidos de WikiLit. Los resultados obtenidos ofrecen una mejor y más detallada aproximación a los temas de investigación sobre Wikipedia:

  • Generalidades: conceptos de enciclopedia, epistemología, ética, Wikipedia como plataforma de investigación.
  • Contenido: calidad y tamaño.Wikipedia como corpus textual: recuperación de información, procesamiento de lenguaje natural, ontologías.
  • Infraestructura: legal y técnica.
  • Participación: actividades de participación, motivación, cultura de colaboración, resultados, herramientas software.
  • Lectura y lectores: herramientas de software, fuente de conocimiento, valoración y popularidad, credibilidad.

Martin (2010), en un trabajo introductorio sobre aplicación de técnicas estadísticas a Wikipedia, que no ofrece datos sobre el corpus revisado, señala las siguientes áreas de investigación:

  • Calidad, donde incluye vandalismo y evolución de artículos.
  • Confianza.
  • Aspectos semánticos.
  • Gobernancia y sociedad.

Nielsen (2012) revisa alrededor de un millar de trabajos, y propone cuatro grandes categorías, correspondientes a:

  • Investigaciones que analizan Wikipedia, incluyendo calidad, errores, cobertura, actualización, fuentes, accesibilidad, análisis de redes, género, vandalismo, edición, autoría, usuarios, factores geográficos, organización, popularidad y motivaciones de usuarios.
  • Investigaciones que usan información de Wikipedia, incluyendo utilización de categorías, construcción de tesauros, traducciones, tendencias y predicción, búsqueda y extracción de información para otros productos derivados.
  • Investigaciones que analizan extensiones técnicas a Wikipedia, incluyendo control de calidad, certificación y valoración, creación automática de contenido y enlaces, bases de datos, wikis semánticos, marcado, edición mediante formularios, digitalización de contenidos, geolocalización, extensiones gráficas y de video, edición en tiempo real y programación.
  • Investigaciones que usan Wikipedia como un recursos de comunicación, incluyendo actitudes hacia ella, usos de Wikipedia, citas de Wikipedia, wikis especializados, censura, uso como herramienta educativa, comunicación en cursos y libros de texto y manuales.

Jullien (2012) define Wikipedia como un sistema colectivo de producción de conocimiento. Realiza un revisión de los temas tratados en la bibliografía, y para ello considera necesario que previamente se conozca con detalle el funcionamiento de este tipo de comunidades. Su revisión cubre alrededor de 300 trabajos publicados en inglés, francés y español hasta 2011. Los principales temas cubiertos que identifica corresponden a:

  • Estudios sobre la motivación de la participación.
  • Procesos o patrones de interacción. Este amplio apartado incluye la actividad y roles de los usuarios, la estructura del proyecto, el estudio de artículos o conjuntos de ellos, la estructura e interacción de los procesos de edición y la estructura, organización y gobernancia del proyecto Wikipedia.
  • La evaluación de calidad, atendiendo a aspectos de calidad de procesos y eficiencia, experiencia de usuario (editor y lector), calidad del producto Wikipedia (aspectos de globalidad y calidad de artículos,

Taraborelli (2013) ha identificado siete grandes frentes de investigación sobre Wikipedia, que ha plasmado en un gráfico ilustrativo:

  • Wikipedia como entidad, aspectos generales.
  • Wikipedia como corpus textual.
  • Calidad de la información en Wikipedia.
  • Reputación.
  • Cuestiones de género.
  • Colaboración.
  • Educación.

Mesgari et alii (2015), también del grupo de Okoli y Nielsen, han publicado la más reciente revisión de bibliografía. Su objetivo ha sido analizar la investigación sobre el contenido de Wikipedia, restringiéndose a la Wikipedia en inglés. Han revisado 110 trabajos académicos, también seleccionados de WikiLit, y detectado dos corrientes principales:

  • Calidad del contenido de Wikipedia.
  • Tamaño de Wikipedia.

De este estudio es relevante una cuestión clave, que es mejor citar literalmente:

“Reliability or accuracy is the core to the Wikipedia content quality discussions. As we have reviewed, the studies have demonstrated mixed results, though the positive evaluations of Wikipedia are more numerous than the negative ones.”

La revisión de los trabajos anteriores demuestra que Wikipedia es un fenómeno tecnológico, social y cultural que no puede desdeñarse, ni tampoco abordarse desde enfoques simplistas o generalistas. La cuestión clave radica en el desarrollo de una discusión activa y constructiva sobre la integración de Wikipedia en las actividades formativas y en los procesos informacionales de los usuarios.

4. Bibliografía.

Bar-Ilan, J., & Aharony, N. (2014). Twelve years of Wikipedia research. En Proceedings of the 2014 ACM conference on Web science – WebSci ’14 (pp. 243–244). New York: ACM Press. doi:10.1145/2615569.2615643

Giles, J. (2005). Internet encyclopaedias go head to head. Nature, 438(7070), 900-901 doi:10.1038/438900a

Jullien, N. (2012). What We Know About Wikipedia: A Review of the Literature Analyzing the Project(s). SSRN Electronic Journal, 1–86. Recuperado de http://dx.doi.org/10.2139/ssrn.2053597

Martin, O. S. (2011). A Wikipedia Literature Review. ArXiV, abs/1110.5. Recuperado de http://arxiv.org/abs/1110.5863

Mesgari, M., Okoli, C., Mehdi, M., Nielsen, F. Å., & Lanamäki, A. (2015). “The sum of all human knowledge”: A systematic review of scholarly research on the content of Wikipedia. Journal of the Association for Information Science and Technology, 66(2), 219–245. doi:10.1002/asi.23172

Nielsen, F. Å. (2012). Wikipedia Research and Tools: Review and Comments. SSRN Electronic Journal. doi:10.2139/ssrn.2129874

Okoli, C. (2009). A Brief Review of Studies of Wikipedia in Peer-Reviewed Journals. Proceedings of the Third International Conference on Digital Society. Cancun, Mexico, 155-160. doi:10.1109/ICDS.2009.28

Okoli, C., & Schabram, K. (2009). Protocol for a Systematic Literature Review of Research on the Wikipedia. Sprouts: Working Papers on Information System, 9, 1–10. doi:10.1145/1643823.1643912

Okoli, C., Mehdi, M., Mesgari, M., Nielsen, F. Å., & Lanamäki, A. (2012). The People’s Encyclopedia Under the Gaze of the Sages: A Systematic Review of Scholarly Research on Wikipedia. SSRN Electronic Journal. doi:10.2139/ssrn.2021326

Saorín, T. (2012). Wikipedia de la A a la W. Barcelona. EPI/UOC.

Taraborelli, D. (2013). Descending Mount Everest: Steps towards applied Wikipedia research. En Proceedings of the 9th International Symposium on Open CollaborationWikiSym/OpenSym 2013, Keynote. Recuperado de https://commons.wikimedia.org/wiki/File:Wikipedia_research_keynote_WikiSym_2013.pdf