Semantic MediaWiki (SMW) — это расширение MediaWiki (вики-движка, используемого Фондом Викимедиа для своих проектов, таких как Википедия), которое помогает искать, организовывать, маркировать, просматривать содержимое вики, а также производить вычисления над ним. В то время, как традиционные вики содержат только текст, который компьютер не может ни понять, ни обработать, SMW добавляет семантические аннотации, что позволяет вики функционировать, используя преимущества баз данных, превращая MediaWiki в полноценную семантическую вики. Semantic MediaWiki была анонсирована в 2005 году, и в настоящее время имеет более десяти разработчиков и используется на сотнях сайтов. Также на сегодняшний день реализовано большое количество семантических расширений, призванных расширить возможности по редактированию и представлению хранящиеся в SMW данных. Термин «Semantic MediaWiki» иногда используется для обозначения целого семейства расширений.
Разработка Semantic MediaWiki частично поддержана проектами Рамочных программ Европейского союза, SEKT и ACTIVE, а также проектом Extension "Halo".
Contents
Почему Semantic MediaWiki?[edit]
Технология вики стала отличным помощником в накоплении и совместном использовании знаний в сообществах. Эти сведения содержатся в текстах и мультимедийных файлах и доступны для читателей-людей. Вики-системы очень удобны для хранения и извлечения определенных фактов, но они менее полезны для хранения структурированной информации и организации доступа к ней посредством агрегирования данных и выполнения запросов. По мере роста вики, в ней появляются проблемы, связанные с слабо развитой автоматической обработкой данных на страницах:
- несогласованность данных на разных страницах,
- трудоемкость повторного использования данных,
- проблемы в запросе списков страниц, объединенных общими свойствами,
- отсутствие развитого поиска.
Для простого примера рассмотрим следующий вопрос:
- «Какие сто самых больших городов в мире, где мэр — женщина?»
В Википедии имеются все данные для предоставления ответа: в ней есть статьи обо всех больших городах, и их мэрах. В статьях о мэрах есть информация об их поле. Однако, на поставленный вопрос почти невозможно ответить до тех пор, пока не прочтешь все статьи о больших городах. И даже если ответ найден, он может быть верен совсем не долго. Компьютеры могут содержать большой набор данных, но пока они не готовы поддержать нас в процессе задавания вопросов к вики: даже сложные программы автоматического анализа текста до сих пор не могут прочитать и до конца «понять» тексты на естественных языках. Поиск по ключевым словам в вики также не поможет.
Semantic MediaWiki дает возможность добавлять в вики структурированные, пригодные для машинной обработки данные, что позволяет в том числе и отвечать на вопросы.
Где SMW может помочь?[edit]
Semantic MediaWiki содержит некоторые дополнительные элементы разметки вики-текста, которые позволяют пользователям добавить на вики-страницы т.н. «семантические аннотации». Задуманные как средство организации данных, семантические аннотации позволяют упростить структуру вики-сайта, помогают пользователям найти больше информации за меньшее время, а также повысить качество вики-материалов и их непротиворечивость. Приведем некоторые достоинства использования SMW:
- Автоматически генерируемые списки. Вики-сайты имеет тенденцию содержать в себе много списков, где собраны ссылки на различные вики-страницы. Википедия содержит тысячи списков, таких как «Список умерших в 1995 году». Такой список предрасположен к ошибкам, пока не будет упорядочен вручную. Более того, число потенциально интересных списков очень велико, и невозможно обеспечить всем им допустимое качество. В SMW списки обрабатываются автоматически, как, например, этот. Они всегда содержат самую актуальную информацию и легко могут изменяться в зависимости от требований к параметрам представления или состава данных в списке.
- Визуальное отображение информации. Разнообразие вариантов вывода информации осуществляется дополнительными расширениями, такими как Semantic Result Formats и Semantic Maps. Эти расширения делают возможным отображать информацию в календарях, сроках доставки, графиках и картах, среди других, обеспечивающих намного более наглядное и интуитивное представление, чем простые списки.
- Улучшенная структура данных. Категории в MediaWiki используются как основной инструмент структурирования; зачастую, однако, можно наблюдать злоупотребление категориями. Наряду с правильным использованием категорий (см. например, статью C++, которая включена в категорию "Языки программирования"), встречаются случаи, когда вместо категоризации хочется просто разметить статью каким-либо значением. Взглянем, например, на категорию в Википедии, названную «Умершие в 1620-е годы» — разве не лучше привязывать к статьям о людях атрибут "Время смерти" и формировать категории динамически? Работа с использованием SMW строится ровно по такому принципу — страницы снабжаются аннотациями, обозначающими даты, числовые и строковые атрибуты, а нужные списки формируются автоматически.
- Удобство ввода структурированной информации. Семантические аннотации требуют изучения новых элементов разметки, однако и этого можно избежать, если использовать шаблоны, давно известные вики-пользователям (в Википедии шаблоны используются, например, для создания информационных таблиц, таких как таблица информации о птице в статье Дронты). Процесс разметки страниц может быть даже проще, чем процесс использования шаблонов в MediaWiki! Расширение Semantic Forms позволяет администраторам создавать формы для добавления и редактирования данных, что существенно снижает порог вхождения для пользователей.
- Поиск информации. Пользователи могут искать определенную информацию, создавая свои собственные запросы, используя дополнения типа Halo и Semantic Drilldown.
- Согласованность данных на разных языках. Большинство статей в Википедии связаны с аналогичными статьями на других языках, то же самое может быть сделано и для семантических аннотаций SMW. Эта функциональность может быть использована для того, чтобы обнаруживать возможные несоответствия, которые могут быть устранены редакторами. Например, население Эдинбурга на момент написания этих строк отличается в английской, немецкой, и французской Википедиях. Если же данные сохранены в виде, пригодном для машинной обработки (семантически), вы можете, например, запросить население Пекина из китайской Википедии не зная ни единого слова по-китайски.
- Внешнее повторное использование. Данные, однажды созданные в SMW, могут легко передаваться в форматах CSV, JSON и RDF наружу. Это дает возможность для вики быть источником данных для внешних приложений — роль, которую обычно исполняют реляционные базы данных. А с использованием дополнений External Data и Semantic Result Formats, несколько семантических вики могут использовать данные друг друга, устраняя необходимость в дублировании и ручной синхронизации. Сегодня некоторые настольные приложения используют информацию из Википедии. Например, аудиоплеер Amarok отображает статьи об исполнителе во время воспроизведения музыкальной композиции. Однако такое использование носит ограниченный характер. Программа способна только показать текст статьи Википедии в некотором контексте, но не может проделать дополнительных шагов (например, найти все альбомы исполнителя). SWM позволяет в полной мере воспользоваться информацией хранящейся в Википедии. А в силу того, что семантические данные могут быть опубликованы под бесплатной лицензией, то они могут даже поставляться вместе с приложениями, что позволит сэкономить пропускную способность и время загрузки данных.
- Применение в семантическом вебе. Расширение Triple Store Connector позволяет вам соединить вашу вики с RDF-хранилищем и использовать SPARQL для запросов.
- Интеграция данных. Данные, содержащиеся в вашей SMW-вики, не обязаны быть изолированными. Дополнения Data Import, Data Transfer и External Data дают вам возможность использовать данные извне — веб-сервисов, ресурсов Linked Data, старых систем. Таким образом, система, построенная на SMW, может исполнять роль информационного хаба, собирающего и синхронизирующего данные отовсюду.
Кто использует Semantic MediaWiki?[edit]
Начавшаяся как академический исследовательский проект, Semantic MediaWiki прошла долгий путь. Сейчас она активно используется в сотнях городах, по всему миру, установлена во многих организациях, включая компании Fortune 500, используется в биомедицинских проектах, правительственных агентствах. Вы можете посмотреть на список сайтов, которые используют SMW здесь и здесь. Следует отметить, что оба списка содержат только открытые для всеобщего обозрения сайты, несмотря на то, что возможно половина или более сайтов, которые использует Semantic MediaWiki, являются частными и предназначены для внутреннего использования организациями.
Существует большое количество консалтинговых компаний, которые используют SMW как часть их решений, включая FZI, gesinn.it, Sémantiki.fr, ontoprise и WikiWorks.
По крайней мере, два веб-сайта в настоящее время предлагают хостинг SMW и некоторых расширений: Wikia и Referata.
Вы можете прочитать о положительном опыте использования SMW среди организаций и отдельных людей на странице рекомендаций.
Дополнительная информация[edit]
На этом сайте есть огромное количество информации по настройке и работе с Semantic MediaWiki. Руководство администратора содержит информацию о загрузке, установке, а также поиске и устранении неисправностей SMW; а также информацию о различных дополнениях, которые могут быть установлены совместно с SMW. В Руководстве пользователя вы найдете информацию о том, как назначать страница семантические свойства, как выполнять запросы, просматривать данные и т.п. А на странице часто задаваемых вопросов можно найти найти ответы на популярные вопросы как технического, так и иного характера.
Контактная информация и поддержка пользователей[edit]
Для того, чтобы связаться с Проектом SMW, смотрите Страницу контактов. Для комментариев и вопросов есть пользовательский список рассылки, на который вы можете подписаться, а также IRC-канал #semanticmediawiki. Смотрите страницу поддержки для получения дополнительной дальнейшей информации о поддержке для SMW.
Ошибки и предложения нового функционала для SMW можно отсылать на MediaZilla, смотрите документацию на странице reporting bugs.