Das Semantische Web
Das Semantic Web, ist eine Vision von Tim Berners-Lee, dem Erfinder des World Wide Web.
Was ist Semantic Web ?
Web 2.0 und Sozial Software verknüpften das soziale Netztwerk zwischen den Usern.
Semantic Web – des öfteren auch als Web 3.0 bezeichnet – soll die maschinelle Verarbeitung von Daten ermöglichen, um dadurch den Gebrauchswert der jetzigen, unstrukturierten sich im Netz befindlichen Informationen zu erhöhen. Was müssen wir uns darunter Vorstellen?
Die beste Erklärung, die ich dazu gelesen habe, erlaube ich mir hier zu zitieren.
‘Stell dir vor, du hast einen großen Schrank. Einen richtig großen Schrank.
In diesen Schrank schmeisst du halt regelmäßig alle möglichen Klamotten rein: Hemden, Pullover, Unterhosen, Socken, Jeans und so weiter. Einfach nur reinstecken und die Tür zu.
Wenn du das nächste Mal den Schrank aufmachst und nach einem Anzug greifst, passiert ein Wunder.
Obwohl du in den Schrank lediglich nach deinem Anzug gegriffen hast, “kommt” aus dem Schrank mit diesem Anzug gleich auch das passende Hemd dazu, die passende Krawatte, das passende Gürtel, der passende Aktenkoffer, sogar die passende Armbanduhr oder Regenschirm, wenn nötig.
Das ist Semantik.’
Was Martin Waiss ausserdem noch zum Thema Semantic Web geschrieben hat, ist zum besseren Verständnis über dieses Thema absolut lesenswert.
Gegenwärtige Lage
Das Wachstum des Internets ist unvorstellbar gross geworden. Die Blog-Suchmaschine Technorati hat nachgezählt, dass allein die Weblogs dieser Welt Tag für Tag knapp eine Million neue Beiträge produzieren. Bei YouTube werden in jeder Minute gut 13 Stunden Video auf den Server geladen. Darüber hinaus gelangen in die Datenspeicher von Firmen, Universitäten oder des privaten PC täglich neue Informationen, wodurch ein Informationsüberfluss entsteht. Diese Daten sind oftmals unstrukturiert abgelegt.
Hier den Überblick zu behalten ist zur Unmöglichkeit geworden.
Zwar gibt es Suchmaschinen, diese vergleichen aber nur die Eingabe des Nutzers mit einem Bestand an schon von der Suchmaschine indexierten Dokumenten. Ein Dokument wird dann als Treffer an den Nutzer zurückgeliefert, wenn exakt die (Teil-)Zeichenkette, die eingegeben wurde, im Text des Dokuments vorkommt. Daher muss der Suchende Prognosen darüber treffen, welche Worte in welcher Schreibweise denn wahrscheinlich in relevanten Dokumenten vorkommen. Dies führt sehr oft zu einer großen Anzahl irrelevanter Treffer und schlimmer noch, dass viele relevante Dokumente nicht gefunden werden, weil sie statt des Suchbegriffs eine Umschreibung, ein Synonym oder einen allgemeineren Begriff enthalten. Wir müssen uns die Informationen aktiv aus dem Internet holen (“googeln”), statt die Information zu uns kommt.
Grundlagen des Semantischen Web
Das Problem wurde von Forschern schon frühzeitig erkannt. Seit mehr als 10 Jahren wird daran geforscht, Wissen besser zu verwalten. Ein Konzept, dessen Umsetzung genau dieses zum Ziel hat, wird als das Semantische Web bezeichnet. Mit dessen Hilfe könnte sich ein weltweites strukturiertes Netz von Informationen schaffen lassen. Dabei werden XML-verwandte Technologien verwendet, welche die einzelnen Informationen mit standardisierten Attributen (Verschlagwortung oder Tagging) beschreiben und in einem Netzwerk von Verbindungen abzulegen. Durch die Spezifikation der einzelnen Attribute kann von diversen Programmen oder mit Hilfe von Plugins auf semantischer Ebene auf das Wissen zugegriffen werden.
Die Sprache XML (Extensible Markup Language) ist der Grundbaustein. Das W3C hat in den letzten Jahren Standarts verabschiedet. Hervorzuheben sind hier insbesondere RDF und OWL.
Resource Description Framework – liefert die Syntax, in Form des sogenannten “Triples” > Subjekt, Prädikat und Objekt
Web Ontology Language – liefert die Zusammenhänge, die durch die RDF-Syntax beschrieben wurden
Semantische Webanwendungen
Neben den Suchmaschinen gibt es Social-Tagging-Netzwerke wie delicious.com als weitere Informationsfilter. Diese kann man schon als semantische Webanwendung bezeichnen. Hier werden von delicious Tags vorgeschlagen, die auf der Verschlagwortung der anderen User basieren. Das System lernt also ständig dazu.
Ebenso die Webanwendung Plista, worüber ich in dem früheren Artikel
( ” Plista – personalisiere dein Weberlebnis! “ ) berichtete. Dieser webübergreifende Dienst vergleicht die eigenen Surfvorlieben mit denen anderer User und zeigt relevante Beiträge zuerst an. Vergleichbar mit der kundenindividuellen Buchempfehlung von Amazon (”Kunden, die diesen Artikel gekauft haben, kauften auch”).
Fazit
Durch das Semantische Web wäre es möglich, präzisere und für den Endbenutzer brauchbarere Suchresultate zu erzielen, als durch gegenwärtige Datenbankrecherchen. Der Mehraufwand zur Entwicklung eines semantischen Webs könnte sich also lohnen.
