Semantic Web 05.12.2006, 08:43 Uhr

Schleichende Revolution im Internet

Mit den Methoden des Semantic Web lassen sich die Vorteile der Maschine, nämlich die Verarbeitung von grossen und für den Menschen unübersichtliche Datenmengen, gezielter nutzen
Ralf Schweiger und Simon Hölzer sind Partner bei Lumrix.net.
Viele Modeworte kennzeichnen die Welt der Kommunikationstechnologie. Je prägnanter, desto kurzlebiger - scheinbar. So steht der strapazierte Begriff des Web 2.0 für eine zweite Generation des Internet mit kollaborativ ausgerichteten Diensten. Der Begriff des Semantic Web wurde hingegen schon Ende der Neunziger Jahre von den Wegbereitern des World Wide Web geprägt. Mit seinen Methoden sollen Informationen in einer maschinenlesbaren Form abgelegt und damit das Wissensmanagement effizienter gestaltet werden. Das Semantic Web ist durch die heute verfügbaren technischen Standards greifbarer geworden. Doch was bedeutet Semantik und wie wird diese Form der Organisation von Wissen unseren zukünftigen Umgang mit dem Internet verändern?

Im Semantic Web werden Inhalte von Dokumenten und Verknüpfungen zwischen diesen Inhalten semantisch, das heisst sinngebend, ausgezeichnet. So können beispielsweise relevante Komponenten von Adressinformationen, wie in einer Datenbank, im Dokument selbst bezeichnet werden. Die tatsächliche Bedeutung der so ausgezeichneten Inhalte (Absätze, einzelne Worte bis zu multimedialen Daten) bleibt der Maschine verschlossen. Der Vorteil liegt in der automatischen Identifikation dieser Inhalte. Mit deren Identifikation sind gezielte Manipulationen möglich, wie das Ordnen nach Hausnummern oder das Anzeigen von Personen zu bestimmten Hausnummern. Die jeweiligen Internetdokumente werden bevorzugt im Format der so genannten Extensible Markup Language (XML) abgelegt, welches das heute vorherrschende HTML Format (Hypertext Markup Language) der Webseiten schrittweise ablöst.

Von Pfeilen zu Hinweisschildern

Jedes einzelne so identifizierbare Objekt kann wieder mit beliebig anderen in einer sinntragenden Beziehung stehen. Ein Hyperlink in HTML führt zu einer anderen Stelle im gleichen oder in einem anderen Dokument. Semantische Links beschreiben formal diese Verknüpfung. Bestehende Querverweise werden so um inhaltliche Angaben erweitert. Die einfachste Beziehung ist eine direkte Zuordnung (ist gleich) oder eine Hierarchie (ist Teil von). Semantische Links sind frei formulierbar: Bern «ist Hauptstadt der» Schweiz. Für eine spätere automatisierbare Nutzung wären eine einheitliche Definition und Anwendung dieser Beziehungstypen notwendig. Bei komplexeren Beziehungstypen spricht man von Ontologien, die dann verschiedene Wissensbereiche abbilden und zugleich Regeln für die richtige Anwendung definieren. Beziehungen und Beziehungstypen können im so genannten Resource Description Framework (RDF) formal beschrieben werden. Auf dieser Basis lassen sich komplexe Beziehungsnetze entwickeln. RDF wird hierdurch zum eigentlichen Herzstück des Semantic Web. Derartige, mittels RDF austauschbare Netze werden beispielsweise für die Inhalte der Wikipedia-Enzyklopädie entwickelt.

Verteiltes Wissensmanagement

Wie beim Aufbau und der redaktionellen Pflege der Wissensinhalte von Wikipedia müssen diese Beziehungen inklusive Beziehungstypen ebenfalls formuliert werden. Dabei vertraut man grundsätzlich auf einen verteilten Ansatz und eine ordnende Kraft der zahlreichen Redakteure, die Beziehungstypen einheitlich zu definieren und anzuwenden. Bei sachgerechter Anwendung und unter Einhaltung allgemeiner Regeln sind die Beziehungsnetze sprachübergreifend nutzbar. Weiterhin vorteilhaft ist die Verwendung von XML als Austauschformat des RDF, welches losgelöst von den Dokumenteninhalten standardisiert gepflegt werden kann. Information aus dem RDF stehen damit für unterschiedliche Anwendungen als Beziehungsnetze zur Verfügung.



Das könnte Sie auch interessieren