Dieser Artikel beschreibt die die Grundlagende Idee des Semantic Web als eine Weiterentwicklung des World Wide Web, welches den gezielten Zugriff auf relevante Informationen durch semantische Technologien unterstützt.
Die Bezeichnung “Semantic Web” geht auf einen Artikel zurück, der 2001 im Scientific American erschienen ist [Berners-Lee et al, 2001]. Diese Artikel hatte das Ziel, neue Wege der Nutzung des World Wide Web über die bloße Bereitstellung und den Abruf von Informationen hinaus aufzuzeigen. Zu diesem Zweck wurden eine Reihe neuartiger Anwendungen vorgeschlagen. Die gemeinsame Idee der vorgestellten Anwendungen war die Entwicklung intelligenter Software Agenten als Grundlage für Fortgeschrittene Dienste: statt selbst Informationen zu suchen informiert der Benutzer den Agenten über seine persönlichen Bedürfnisse, woraufhin dieser selbständig das Web nach entsprechenden Informationen oder Diensten durchsucht und unter umständen auch gleich die entsprechenden Transaktionen tätigt.
Die Bezeichnung “Semantic Web” rührt nun von der Tatsache her, dass die genannten Szenarien voraussetzen, dass die intelligenten Software-Agenten in der Lage sind, im Netz vorhandene Informationen zu verstehen – oder zumindest korrekt zu interpretieren. Dies soll dadurch erreicht werden, dass die intendierte Bedeutung von Informationen auf entsprechenden Webseiten mit Hilfe spezialisierter XML-basierter Auszeichnungssprachen in maschinenlesbarer Form zur Verfügung gestellt werden. Auf diese Weise kann zum Beispiel klar gemacht werden, welche Zahl auf einer Webseite den Preis für ein Zimmer darstellt und ob sich dieser Preis inklusive oder exklusive Frühstück versteht. Zusätzlich können Informationen über die Art des Zimmers (Einzel-, oder Doppelzimmer) mit der entsprechenden Information verknüpft werden. Das entsprechende Vokabular etwa zur Bezeichnung unterschiedlichen Zimmerarten wird hierbei durch ein allgemein zugängliches Model unterschiedlicher Zimmerarten zur Verfügung gestellt welches sowohl vom Anbieter als auch vom Agenten verwendet wird. Dieses Vokabular, auf das sich zwei Parteien, die Informationen austauschen wollen einigen müssen wird auch als Ontologie bezeichnet [Stuckenschmidt und van Harmelen, 2004].
Das Ziel des Semantic Web als Forschungsgebiet ist nun die Entwicklung von Methoden, die dabei helfen, einige der oben genannten Aufgaben wie die Interpretation, Aggregation, Bewertung und Vergleich von Informationen im Web zu automatisieren. Es wurde schnell klar, dass zur Bewältigung gewaltige Herausforderung Methoden aus unterschiedlichsten Bereichen der Informatik notwendig sind. Neben der Suchmaschinen-technologie des klassischen Information Retrieval, die noch immer eine wichtige Rolle spielt, sind eine Reihe von Methoden der automatischen Informationsverarbeitung in den Fokus des Interesses gerückt. Beispiele sind die Verarbeitung natürlichen Sprache und Bildverarbeitung zur automatischen Interpretation von Texten und Bildern. Techniken des Maschinellen Lernens zur Aggregation von Informationen und zur automatischen Identifizierung wichtiger Begriffe, Techniken aus dem Bereich der formalen Wissensrepräsentation und Verarbeitung zur Expliziten Darstellung von Informationsinhalten und Vokabularen sowie zur automatischen Ableitung impliziter Informationsinhalte. Im Bereich der Datenbankforschung werden Konzepte zur Speicherung und zum effizienten Zugriff auf große Mengen repräsentierten und abgeleiteten Wissens sowie zur Verknüpfung solcher Datenbestände entwickelt. Im Bereich der Computersicherheit beschäftigt man sich mit Konzepten der Vertrauenswürdigkeit modellierter und abgeleiteter Informationen.
Ein wesentlicher Teil der frühen Arbeiten im Bereich der Semantic Web Technologien war mit der Entwicklung standardisierter Auszeichnungssprachen befasst. Das Ergebnis ist eine Reihe von Sprachstandards, insbesondere RDF [Manola und Miller, 2004] und OWL [McGuiness und van Harmelen, 2004], die vom W3C, dem offiziellen Standardisierungsgremium des World Wide Web herausgegeben werden. Inzwischen wurden eine ganze Reihe von Programmen zur Erzeugung, Speicherung und Verarbeitung von RDF und OWL Modellen entwickelt. Diese Programme sind in der Regel frei verfügbar. Hierdurch und durch die Verwendung der Standardisierten Sprachen reduziert sich der Aufwand zur Entwicklung intelligenter Methoden zur Verarbeitung von Web Informationen zum Teil erheblich.
Literatur
Berners-Lee, Tim; Hendler, James; Lassila, Ora, The Semantic Web. Scientific American, May2001, Vol. 284 Issue 5, p34
Frank Manola, Eric Miller. RDF Primer. W3C Recommendation 10 February 2004. http://www.w3.org/TR/rdf-primer/
Deborah L. McGuinness, Frank van Harmelen. OWL Web Ontology Language Overview. W3C Recommendation 10 February 2004. http://www.w3.org/TR/owl-features/
Heiner Stuckenschmidt, Frank van Harmelen. Information Sharing on the Semantic Web. Springer, Berlin Heidelberg, 2004