语义MediaWiki简介

From semantic-mediawiki.org

语义MediaWiki(Semantic MediaWiki,缩写SMW)是MediaWiki——以驱动维基百科而闻名的wiki应用程序——的一款扩展,有助于搜索、组织、标记、浏览、评价和共享wiki的内容。传统维基之中仅仅包含的是计算机既无法理解也无法评价的文本,而SMW则向其中新增了语义标注(semantic annotations),从而使维基可以作为一种协作式数据库来发挥作用。Semantic MediaWiki最初发布于2005年,目前拥有十多位开发人员,并且正在用于数百个站点。此外,目前人们还创建了大量的相关扩展,从而扩展了对SMW所存储数据的编辑、显示和浏览能力: "Semantic MediaWiki"这条术语有时用来指所有这些扩展所构成的整个家族。


为何需要Semantic Mediawiki?[edit]

维基已经成为用于在社区当中收集和分享知识的强大手段。这些知识大多数包含在文本和多媒体文件里面,因而便于人类读者理解和使用。尽管维基非常善于存储和检索具体的事实,但在信息的查询或整合方面却用处较小。举个简单的例子,比如下面这个问题:

“2012年启动的活跃项目有哪些?”

这个问题回答起来应当并不困难,但实际上情况并非如此——每当您想要回答这个问题的时候,您都不得不遍历关于种种项目的所有页面。文本搜索并不一定就能帮上什么忙。分类(类别)对此可能有一定的好处,尽管分类并不是一种理想的手段,而且它们的维护工作可能变得繁琐复杂(参见下文)。同时,目前也还没有可以有助于完成这种任务的人工智能工具。

Semantic MediaWiki则可以使维基之中的知识变得适合于计算机处理,从而让您能够找到并显示比如上述问题以及更多问题的答案。

SMW在何处有用[edit]

Semantic MediaWiki在维基文本之中额外引入了某些标记,从而让用户能够为维基添加"语义标注"。乍看上去这把事情变得更为复杂了,但其却大大地简化了维基的结构,有助于用户更快地找到更多的信息,并且改善了维基的总体质量和一致性。如下是应用SMW的一些好处:

自动化生成的列表[edit]

列表和表格是一种可以让信息变得一目了然的自然方式。在某些情况下,非语义型维基之中会包含人工编制的列表;Wikipedia本身就拥有成千上万张这样的列表,如"按人口排列的西班牙都市圈列表"。此类列表容易出错,因为必须加以手工维护。此外,潜在地令人感兴趣的列表也数目庞大,不可能都以令人接受的质量来提供所有这些列表。在SMW之中,列表则是采取像这样的方式自动生成的。这种列表始终保持最新,而且可以轻松地加以定制,从而获取进一步的信息。

信息的可视化呈现[edit]

语义结果格式(Semantic Result Formats)语义地图(Semantic Maps)之类的额外扩展所定义的各种各样的显示格式,允许在比如日历、时间线、图形和地图等等当中呈现信息,与简单的列表和表格相比,提供了更为丰富的数据视图。

经过改进的数据结构[edit]

MediaWiki维基站点往往倾向于大量采用类别来实现数据的结构化。一般来说,这些类别的确有用,如Wikipedia类别"1620年代的出生者";然而,假如采用SMW来存储这些页面的信息的话,就可以采用简单的语义取值来取代这些类别,减少了采用复杂分类体系的必要性。而且,如果把维基之中的语义标记保存在模板,又称为语义模板(semantic templates)之中的话,维基站点即可轻松地获得一种稳固的数据结构。语义表单(Semantic Forms)扩展可让管理员能够创建表单,用于在语义模板之中添加和编辑数据,从而,与传统的维基文本相比,使语义信息的添加变得甚至更加容易,更加简便直观。

信息搜索[edit]

Halo语义钻取语义表单之类扩展的支持下,具体的用户可以通过创建自己的查询,来搜索特定的信息。

外部的重复利用[edit]

一旦在SMW维基中创建之后,数据并不是就非得放在其维基站点当中;可轻松地将其导出成CSV和JSON之类的格式。这使得SMW维基站点可作为其他应用程序的数据源,或者在企业应用的情况下,可以取代关系型数据库通常所扮演的角色。借助于外部数据扩展、SPARQL及其他工具,基于SMW的维基站点甚至还可以利用另一个SMW维基站点的数据,消除维基站点之间冗余的必要。利用任何现场可用的RDF triplestore三元组存储(RDF triplestore)扩展,您还可以查询本维基之外的SMW数据。

数据的集成与混合[edit]

一个SMW安装包之中所包含的数据并非必须作为孤立的信息存储地。数据传输外部数据之类的扩展,可使您能够集成外部数据(来自比如遗留系统、Web服务或者在链数据源<linked data sources>),并将其与该维基站点之中现有的语义数据相互联系起来。因此,在信息技术世界当中,SMW所支撑驱动的维基站点可以成为一种重要的中心信息枢纽。

究竟谁在使用Semantic MediaWiki?[edit]

自从发端于学术研究项目,Semantic MediaWiki已经走过了不短的旅程。当前,在全球范围内,SMW正在活跃地应用于许多种语言的数百家网站,包括《财富》五百强企业、生物医学项目、政府机构以及消费者目录。 Wikipedia上关于Semantic MediaWiki的文章之中包括有一个列出了SMW知名用户的小节。另外,您还可以查看一张更为全面的站点列表,了解那些采用SMW的网站。应当注意的是,这两张列表着重于公共站点,尽管或许半数以上使用Semantic MediaWiki的站点属于私有,仅供公司和组织机构内部使用。

如今,有越来越多的咨询公司把SMW作为自己解决方案的组成部分来加以实施;其中,有些是明确声明其采用了MediaWiki和SMW,而其他则将其作为隐含的实施细节来处理。(在"专业支持"页面上,您可以找到一张可以受雇开展基于SMW的工作的人员和公司列表。)

当前,至少有两家网站为Semantic MediaWiki及其一些扩展提供着服务器:Referata and WikiHoster.net

关于不同公司、组织机构和个人使用SMW的正面经验,可参阅用户褒奖页面。

更多详情[edit]

这个站点上还备有多得多的关于设置和运行Semantic MediaWiki安装包的信息。

  • 管理员手册提供的是关于SMW的下载、安装和故障处理方面的信息,以及关于可以安装起来与SMW协调工作的各种扩展的信息。
  • 用户手册则提供的是关于定义属性、运行查询以及浏览数据等等方面的信息。
  • 常见问题解答则提供的是关于技术事项和非技术事项方面常见问题的解答。

联系方式与用户支持[edit]

要联系SMW项目,请参见联系方式页面。若要发表评价意见和提问,请参见您可以加入的活跃用户邮件列表以及IRC频道#semantic-mediawiki)。有关SMW支持的更多详情,请参见获得帮助

GitHub上可提交关于SMW的错误和功能请求;有关情况请参见错误报告文档。


本文档页面适用于SMW从0.1版到最新版本的所有版本。
      其他语言: deenenfrjanlruuk