Introductie tot Semantic MediaWiki
SMW handleiding |
---|
Introductie |
Bladeren en zoeken |
Semantisch zoeken |
Pagina's selecteren |
Bewerken |
Eigenschappen en types |
Semantic Web |
OWL/RDF export |
SMW admin manual |
Semantic MediaWiki (SMW) is een kosteloze uitbreiding van MediaWiki – het wiki-systeem dat de drijvende kracht is achter Wikipedia – die helpt om in de wiki-inhoud te zoeken, organiseren, taggen, bladeren, evalueren en te delen. Waar traditionele wiki's alleen maar teksten bevatten die computers niet kunnen begrijpen of evalueren, voegt SMW semantjsche annotaties toe die de kracht van het Semantic Web naar de wiki brengen.
Contents
Introductie tot Semantic Mediawiki[edit]
Wiki's zijn een geweldig hulpmiddel geworden voor het verzamelen en delen van kennis in gemeenschappen. Deze kennis is meestal vervat in teksten en multimediabestanden en is daarom gemakkelijk toegankelijk voor menselijke lezers. Maar wiki's worden groter en groter, en het kan erg veel tijd kosten om te zoeken naar een antwoord in een wiki. Stelt u zich bijvoorbeeld de volgende vraag eens voor die een gebruiker zou kunnen hebben:
- «Wat zijn de honderd grootste steden in de wereld met een vrouwelijke burgemeester?»
Wikipedia zou het antwoord moeten kunnen geven: het bevat alle grote steden, hun burgemeesters en artikelen over de burgemeester die ons vertellen over zijn of haar geslacht. Toch is deze vraag haast onmogelijk te beantwoorden voor een mens, omdat men alle artikelen over alle grote steden eerst zou moeten lezen! Zelfs als het antwoord gevonden wordt, kan het binnen korte tijd achterhaald zijn. Computers kunnen veel makkelijker omgaan met grote hoeveelheden gegevens, maar kunnen ons desondanks niet erg ondersteunen bij het zoeken naar antwoorden in een wiki: zelfs ingenieuze programma's kunnen teksten in natuurlijke taal nog niet lezen en "begrijpen" tenzij het onderwerp en de taal van te tekst erg beperkt is. De trefwoordenzoekfunctie van de wiki helpt ook niet bij het ontdekken van complexe onderlinge verbanden.
Semantic MediaWiki stelt wiki-gemeenschappen in staat om gedeeltes van hun kennis verwerkbaar te maken voor computers, dat wil zeggen om de bovenstaande vraag te kunnen beantwoorden. Het lastige probleem voor de computer is om erachter te komen wat de woorden in een wiki-pagina (bijvoorbeeld over steden) betekenen. Artikelen bevatten vele namen, maar wie is de huidige burgemeester? Mensen kunnen het probleem makkelijk begrijpen door een taaleditie van Wikipedia te bekijken die ze niet begrijpen (Koreaans is een goed begin tenzij u die taal vloeiend beheerst). Hoewel losse begrippen (namen, getallen, …) weliswaar leesbaar zijn, is het onmogelijk om hun relevantie in het artikel te begrijpen. Op dezelfde manier hebben computers wat hulp nodig om te begrijpen waar wikiteksten over gaan.
In Semantic MediaWiki voegen redacteuren daarom "hints" toe aan de informatie in wiki-pagina's. Iemand kan bijvoorbeeld een naam markeren als naam van de huidige burgemeester. Dit wordt gedaan door redacteuren die een pagina bewerken en speciale tekstcodes rondom de naam van de burgemeester plaatsen. Hierna kunnen computers deze informatie benaderen (natuurlijk "begrijpen" ze het nog steeds niet, maar ze kunnen ernaar zoeken als we hen erom vragen), en gebruikers ondersteunen op vele verschillende manieren.
Meer informatie is te vinden in de handleiding voor gebruikers.
Waar SMW behulpzaam kan zijn[edit]
Semantic MediaWiki introduceert wat extra opmaakcodes in de wiki-tekst die gebruikers de mogelijkheid geeft om "semantische annotaties" toe te voegen aan de wiki. Hoewel dit op het eerste gezicht dingen ingewikkelder lijkt te maken, kan het ook de structuur van de wiki in grote mate vereenvoudigen, gebruikers helpen om meer informatie te vinden in minder tijd, en de algehele kwaliteit en consistentie van de wiki te verbeteren. Ter illustratie geven we enkele voorbeelden van de dagelijkse gang van zaken op Wikipedia:
- Handmatig gegenereerde lijsten. Wikipedia staat vol met handmatig bewerkte lijstjes zoals deze. In deze lijstjes sluipen gemakkelijk fouten, omadt ze handmatig bijgewerkt moeten worden. Daarnaast is het aantal mogelijk interessante lijstjes enorm en het is onmogelijk om ze allemaal aan te bieden in een acceptabele kwaliteit. In SMW worden lijstjes automatisch gegenereerd zoals deze. Ze zijn altijd actueel en kunnen makkelijk worden aangepast om verdere informatie te verkrijgen.
- Informatie opzoeken. Veel van de kennis van Wikipedia is begraven tussen miljoenen tekstpagina's en kan nauwelijks teruggevonden worden. Er is, bijvoorbeeld, op het moment van dit schrijven, geen lijst van vrouwelijke natuurkundigen in Wikipedia. Wie probeert om alle vrouwen met dit beroep te vinden die in Wikipedia zijn opgenomen, is aangewezen op [1]. Deze poging is natuurlijk gedoemd om jammerlijk te mislukken. Merk op dat van de 20 eerste resultaten, er slechts vijf over personen gaan en dat Marie Curie in het geheel niet voorkomt in de resultaten (omdat "vrouwelijk" niet voorkomt op haar pagina). Wederom lost een vraag stellen in SMW dit probleem met gemak op (in dit geval zelfs zonder verdere annotatie, omdat bestaande categorieën voldoende zijn om de resulaten te vinden).
- Categorie-inflatie. De noodzaak van het beter structureren wordt duidelijk door het uit de hand gelopen gebruik van categorieën in Wikipedia. Hoewel dit over het algemeen behulpzaam is, heeft het oko geleid tot een aantal categorieën die in SMW slechts zoekresultaten zouden zijn. Voor enkele voorbeelden kunt u denken aan de categorieën Rivieren in Buckinghamshire, Asteroïden genoemd naar personen en overledenen in 1620, welke allemaal makkelijk vervangen kunnen worden door simpele vragen die een handvol annotaties gebruiken. In dit voorbeeld zouden Category:Rivers, Property:located in, Category:Asteroids, Category:People, Property:named after en Property:date of death voldoende zijn om duizenden van dergelijke lijstjes dynamisch aan te maken en honderden Wikipedia-categorieën te verwijderen.
- Consistentie tussen talen. De meeste artikelen in Wikipedia zijn gekoppeld aan overeenkomstige pagina's in andere talen en dit kan ook gedaan worden voor SMW's semantische annotatie. Met deze kennis kunt u vragen naar het inwoneraantal van Beijing dat gegeven wordt in de Chinese Wikipedia zonder een woord van deze taal te lezen. Dit kan worden uitgebuit om mogelijke inconsistenties te vinden die vervolgens door redacteuren kunnen worden opgelost. Het aantal inwoners van Edinburgh op het moment van dit schrijven is bijvoorbeeld verschillend in de Engelse, Duitse en Franse Wikipedia.
- Extern hergebruik. Sommige bureaublad-programma's maken tegenwoordig gebruik van de inhoud van Wikipedia, de mediaspeler Amarok bijvoorbeeld toont artikelen over artiesten tijdens het afspelen. Een dergelijk hergebruik is echter beperkt tot het ophalen van een artikel met als doel het onmiddelijk te lezen. Het programma kan de informatie niet inzetten (om bijvoorbeeld songs te vinden van artiesten die voor hetzelfde label hebben gewerkt), maar kan alleen de tekst tonen in een andere context. SMW maakt gebruik van de kennis in een wiki zodat het bruikbaar wordt buiten de context van zijn tekstartikel. Omdat semantische gegevens gepubliceerd kunnen worden onder een vrije licentie, kunnen ze zelfs geleverd worden met software om bandbreedtebeslag en downloadtijd te verminderen.
Contact en ondersteuning[edit]
Om contact op te nemen met het SMW-project, zie de contactpagina. Voor vragen en opmerkingen is er een actieve discussielijst waaraan u kunt deelnemen. Zie Help:Getting support voor meer informatie over ondersteuning voor SMW.
Probleemrapporten en verbeteringsverzoeken voor SMW kunnen tevens ingestuurd worden op MediaZilla, zie de documentatie over het melden van bugs.