Die Tagging-Hölle
Professionelle semantische Auszeichnung von Inhalten
Wie mit jeder schleichenden Entwicklung, so verhält es sich auch mit dem Web3.0. Während man noch sehnsüchtig darauf wartet, dass sich die Technik etabliert ist man schon mittendrin.
HTML-5 ist noch nicht in allen Backports verfügbar, doch der Wunsch, Inhalten semantische Verknüpfungen zu hinterlegen ist stark vertreten. Da liegt es nahe, Tags im CMS für die Daten zu verlinken und im Frontend Filter dafür bereitzustellen. Und schon sind wir beim Thema. Tags müssen umfassend gepflegt werden; ähnliche Ausdrücke zusammengefasst werden. Aus persönlicher Erfahrung habe ich erlebt, dass den Moderatoren diese Aufgabe schnell müßig erscheint, sie diese daher schnell einstellen und ihren Sinn verkennen. Ein echter semantischer Zusammenhang entsteht dadurch auch nicht. Und in Sachen Web3.0, also der automatischen Kommunikation zwischen Geräten ist damit auch nicht gedient.
Doch wie entkommt man dieser Tagging-Hölle? Und wie macht man die Meta-Daten Maschinentauglich? Dafür gibt es momentan zwei Ansätze:
Der Erste geht davon aus, dass auf einer Seite genau eine Informationseinheit vorhanden ist. Die Metadaten werden mittels RDF und OWL dem Dokument angehängt. Durch die Annahme, dass jede Seite eine Informationseinheit enthält, ergibt sich der semantische Kontext aus der Struktur der Daten selbst.
Der zweite Ansatz dient zum Auszeichnen von Informationseinheiten innerhalb einer Seite. Sie werden Mikroformate und Mikrodaten genannt. Mikroformate haben den Vorteil, dass sie HTML4-kompatibel sind, während Mikrodaten HTML5-Standard sind. Diese Auszeichnungen werden von Google analysiert und bei Suchen berücksichtigt. Zudem erscheinen sie direkt auf der Ergebnisseite.
Obwohl diese Techniken schon länger vorhanden sind, gibt es in der Praxis kaum Umsetzungen. Das mag zum einen daran liegen, dass Web3.0 nach wie vor in den "Kinderschuhen" steckt. Ein weiterer Aspekt ist, dass die Relevanz von maschinenlesbaren Daten erst noch weiter wachsen muss. Die Smartphoneentwicklung der letzten Jahre weist die Richtung. Und zu guter Letzt müssen Informationsanbieter einen Schritt dahingehend wagen, ihre Daten aus der Hand zu geben, denn wenn diese Programmunabhängig und nur noch semantisch gebunden vermittelt werden, wird es schwer eine CI zu wahren. Aber das Problem ist im Bereich Social-Marketing auch schon hinlänglich diskutiert worden.
http://www.w3.org/TR/rdf-mt/
http://www.w3.org/TR/owl2-overview/
http://microformats.org/
http://www.whatwg.org/specs/web-apps/current-work/multipage/microdata.html

0 Kommentare