SHOW


In dieser Seite präsentieren wir einige Projekte am DFKI, in denen das automatische Hyperlinking entwickelt wurde oder zur Anwendung kam (siehe die "Anwendungen"). Aktuell gilt unser besonderes Augenmerk, bei der Weiterentwicklung dieser Strategie, dem Informations- und Wissensmanagement, einem Beitrag zur Bildung des Semantischen Webs, sowie unterschiedlicher Visualierungsstrategien für komplexe Informationszusammenhänge.

Automatisches Hyperlinking wird durch Computerprogramme geleistet, die eigenständig Verweise in Hyper-Dokumente einfügen. Hyper-Dokumente sind Dokumente, die üblicherweise mit Hilfe eines Browsers gelesen und visualisiert werden, wobei das Navigieren in größeren Dokumenten (auch im Web) durch die in den Dokumenten enthaltenen Links unterstützt wird.

Ein Computerprogramm, das in der Lage ist, ein Dokument automatisch mit Links/Verweisen zu unterlegen, bringt dem manuellen Verlinken gegenüber so viel Zeitersparniss, dass man sich beim Hyperlinken ein wesentlich höheres Verarbeitungsvolumen (größere Datenmenge und/oder höhere Verweisdichte) und eine höhere technische Komplexität (ganze strukturierte Verweisbündel statt einfacher Verweise) leisten kann.
Es ist schon erkannt worden, dass der Einsatz von sprachtechnologischen Mitteln bei dieser Automatisierung des Hyperlinkings eine wesentliche Rolle spielen kann, um u.a. eine bessere Qualiltät und eine erhöhte Konsistenz beim Hyperlinken zu erreichen.
Dieser Ansatz wird besonders am DFKI erforscht und entwickelt: Sprachtechnologie kann mit Hilfe von erprobten statistischen und regelbasierten Verfahren wesentlich zur automatischen Erkennung der anwendungsrelevanten Bezeichner und Ausdrücke in den Dokumenten beitragen. Sprachtechnologie zeichnet sich durch die gewährleistete Toleranz gegenüber Variationen auf morphologischer und syntaktischer Ebene aus und sichert dadurch eine erhöhte Konsistenz beim Verweisen, da alle möglichen Varianten eines zu verlinkenden Terms erkannt und entsprechend mit einem Verweis unterlegt werden können. Sprachtechnologische Verfahren, die semantische Methode einbeziehen, können z.B. auch Synonyme gleichbehandeln, wobei dann in die Textanalyse Thesauri mit ihren begrifflichen Beziehungen einbezogen werden. Und schließlich kann Sprachtechnologie bestimmte syntaktische Funktionen (Subjekt, Objekt etc.) von Satzbestandteilen erkennen und für Linkquellen wie -ziele nach Bedarf bevorzugen.

Die Automatisierung betrifft nicht nur die Erkennung im Text von anwendungsrelevanten Ausdrücken, sondern auch das Hinzufügen der relevanten Programmcodes (HTML und JavaScript) in den Text, die für die Visualisierung der Linkstruktur verantwortlich sind. Dies trägt auch wesentlich zur Konsistenz der Verlinkung bei, da gewährleistet wird, dass alle gleichbedeutenden Audrücke eine einheitliche Verlinkungstruktur und -präsentation erhalten.