Introducción a Semantic MediaWiki

From semantic-mediawiki.org

Semantic MediaWiki (SMW) es una extensión de MediaWiki, el sistema Wiki que da forma a Wikipedia, gratuita y de fuente abierta, que ayuda a buscar, organizar, poner etiquetas, navegar, evaluar y compartir el contenido de un wiki. Mientras que los wikis tradicionales contienen textos que los ordenadores no pueden ni entender ni evaluar, SMW añade anotaciones semánticas que aportan el poder de la Web semántica al wiki.

Introducción a la herramienta: Semantic Mediawiki[edit]

Los wikis se han convertido en una gran herramienta para la recogida e intercambio de conocimiento dentro de comunidades. Este conocimiento está principalmente contenido en textos y archivos multimedia, y por lo tanto es de fácil acceso para los lectores humanos. Pero los wikis se hacen más y más grandes, y puede perderse mucho tiempo buscando una respuesta dentro de un wiki. Como simple ejemplo, considere que un usuario podría plantearse la siguiente pregunta :

«¿Cuáles son las 100 ciudades más grandes con una alcaldesa?»

Wikipedia debería ser capaz de proporcionar la respuesta: contiene todas las grandes ciudades, sus alcaldes, y artículos sobre los alcaldes que nos dicen de qué género son. Sin embargo, la pregunta es casi imposible de responder por un humano, ¡ya que uno tendría que leer todos los artículos sobre todas las grandes ciudades primero! Incluso si la respuesta se encuentra, tal vez no sea válida por mucho tiempo. Las computadoras pueden hacer frente a grandes conjuntos de datos mucho más fácilmente y, sin embargo, no son capaces de ayudarnos mucho al buscar respuestas en un wiki: Incluso los programas más sofisticados son incapaces aún de leer y «entender» los textos-humanos a menos que los temas y el lenguaje de los textos sean muy restringidos. La búsqueda por palabra en el wiki tampoco son de gran ayuda en el descubrimiento de relaciones complejas.


Semantic MediaWiki permite que el conocimiento de las comunidades del wiki sea procesable por el ordenador. Por ejemplo, la respuesta a la pregunta anterior. La difícultad para el ordenador está en descubrir lo que significan las palabras en una página wiki (por ejemplo, sobre las ciudades). Los artículos contienen muchos nombres, pero ¿cuál de ellos es él del alcalde? Los seres humanos pueden comprender fácilmente el problema mirando la edición de la Wikipedia en un idioma distinto y que no entienden (el coreano es un buen punto de partida a menos que lo hables con fluidez). Mientras que fichas solas (nombres, números,…) pueden ser legibles, es imposible comprender su relevancia en el artículo. Del mismo modo, los ordenadores necesitan algo de ayuda para darle sentido a los textos del wiki.

En Semantic MediaWiki, los editores deben por tanto, añadir «pistas» sobre la información en las páginas wiki. Por ejemplo, alguien puede marcar un nombre como el nombre del actual alcalde. Esto lo hacen los editores que modifican una página y ponen algún texto con marcas especiales el nombre del alcalde. Después de esto, los ordenadores pueden tener acceso a esta información (por supuesto que todavía no lo «entenderán», pero pueden buscarlo si se lo pedimos), y ayudar a los usuarios en muchas formas.

Más información se puede encontrar en el manual del usuario.

Dónde puede ser útil el SMW[edit]

La herramienta Semantic MediaWiki introduce algunas marcas adicionales al texto del wiki y esto permite a los usuarios añadir "anotaciones semánticas" al wiki. Mientras que en principio esto parece que complica las cosas, también puede simplificar de manera importante la estructura del wiki, ayudar a los usuarios a encontrar más información en menos tiempo e incrementar la calidad y consistencia general del wiki. Para ilustrar esto, proveemos algunos ejemplos de uso cotidiano en la Wikipedia:

  1. Listas generadas manualmente. La Wikipedia está llena de listas editadas manualmente: como esta. Estas listas están sujetas a error ya que tienen que actualizarse manualmente. Más allá, el número de listas potencialmente interesantes es enorme, y es imposible proveer a todas ellas con calidad aceptable. En el SMW, las listas son generadas automáticamente así. Siempre están actualizadas y pueden ser fácilmente personalizadas para obtener mayor información.
  2. Buscando información. Mucho del conocimento de la Wikipedia está enterrado irremediablemente dentro de millones de páginas de texto, y es casi imposible encontrarlo. Por ejemplo, en el momento que se escribe esto, no existe una lista de físicas mujeres female physicists en la Wikipedia. Cuando se trata de encontrar todas las mujeres de esta profesión que están mencionadas en Wikipedia, uno tiene que ir a textual search. Obviamente, este intento está condenado a fracasar miserablemente. Nótese que entre los primeros 20 resultados, sólo 5 son sobre personas, y Marie Curie no está contenida en ninguno de todos los resultados (ya que la palabra "mujer" no aparece en su página). De nuevo, hacerlo con el SMW resuelve facilmente este problema (en este caso incluso sin mayores anotaciones ya que existen las categorías suficientes para obtener los resultados).
  3. Uso inflacionario de las categorías. La necesidad de estructurar mejor se vuelve aparente por el enorme uso de categorías en la Wikipedia. Mientras que esto es generalmente útil, también ha dado lugar a una serie de categorías que serían resultados de una mera consulta simple en SMW. Para algunos ejemplos considerar las categorías Rios en Buckinghamshire, Asteroides nombrados como personas, y Muertes en 1620, todos los cuales podrían ser facilmente reemplazados por búsquedas simples utilizando un puñado de anotaciones. De hecho, en este ejemplo Categoría:Rios, Propiedad: localizados en, Categoría:Asteroides, Categoría:Personas, Propiedad:nombrados por, y PPropiedad:fecha de la muerte podría ser suficiente para crear miles de listas similares de manera muy rápida y eliminar cientos de categorías de la Wikipedia.
  4. Consistencia entre lenguajes. La mayoría d elos artículos en la Wikipedia están enlazados con páginas similares en diferentes lenguas, y esto también puede hacerse para la anotación semántica del SMW. con este conocimiento, puedes preguntar por la población de Bejing que se da en la Wikipedia China sin tener que leer una sola palabra de esta lengua. Por ejemplo, la población de Edimburgo al momento que se escribe esto es diferente en las Wikipedias en Inglés, Alemán y francesa.
  5. Reuso externo. Algunas herramientas del desktop utilizan el contenido de la Wikipedia, por ejemplo el media player Amarok despliega artículos sobre los artistas mientras toca su música. sin embargo, ese reuso se limita a buscar un artículo para leérse inmediatamente. El programa no puede explotar la información (por ejemplo encontrar canciones de artistas que hayan grabado con la misma disquera), pero sólo pueden mostrar el texto en algún otro contexto. SMW niveliza el conocimiento del wiki para ser usado fuera del contexto de su artículo textual. Dado que los datos semánticos pueden ser publicados bajo una licencia libre, podrían incluso ser transportados con un software para ahorrar ancho de banda y tiempo de descarga.

Contacto y ayuda al usuario (en inglés)[edit]

Para contactar con el proyecto Semantic MediaWiki, ver la página de contacto. Para comentarios y preguntas, hay una lista de correos bastante activa user mailing list a la que puedes suscribirte. Ver Como obtener soporte para mayor información de ayuda sobre SMW.

Bugs y peticiones para el SMW se pueden rellenar en MediaZilla, ver la documentación sobre reporting bugs.