SHOW -
 Hypercode

Projekt-Rahmen

Das Projekt "Hypercode" wurde zwischen Ende 1999 und Mitte 2000 von der Sprachforschungsgruppe des DFKI im Auftrag der IT-Infrastruktur-Gruppe einer großen deutschen Bank durchgeführt.  Die von "Hypercode" eingesetzte Technologie automatischen Hyperverlinkens diente hier dazu, die Dokumentenwelt mehrerer zehntausend Cobol-Programm-Dokumente sowie der zugehörigen Dokumentations-Dokumente hyper-navigierbar zu machen. 

Nutzer dieses Dienstes sind die Programmierer und IT-Qualitätssicherungsfachleute des Auftraggebers.  Insbesondere erstere haben in ihrem Arbeitsalltag das Bedürfnis, die Stellen im Programmcode, an denen eine Variable oder Funktion deklariert und verwendet wird, und die entsprechenden Stellen in der Dokumentation, an denen sie beschrieben wird, leicht auffinden zu können. 

Organisation von Programm-"Wissen"

Besonders bei der Navigation durch eine dicht hyperverlinkte Dokumentenwelt, mit ihren vielen Möglichkeiten den "geraden" Lesepfad zu verlassen, ist der Benutzer darauf angewiesen, sich orientieren zu können.  D.h., er soll schon, bevor er seinen bisherigen Weg verläßt, indem er einem Hyperlink folgt, wissen, wohin dieser ihn führen wird.  Für den Benutzer müssen deshalb die Prinzipien, die der Verlinkung zugrunde liegen, bekannt und nachvollziehbar sein. 

Aus ontologischer Sicht war diese Aufgabe hier insofern einfach, als alle Cobol-Dinglichkeiten, z.B. Variablen, unabhängig nebeneinanderstanden, auch wenn der zugehörige Bezeichner an vielen Stellen in den Dokumenten auftrat.  Um die vielen Vorkommen eines durch Hyperlinks miteinander verbundenen Cobol-Bezeichners nicht in einer langen Kette, sondern über eine möglichst geringe Anzahl an Linkknoten hinweg erreichbar zu machen, wurde dem Benutzer an jedem Bezeichner-Vorkommen ein ganzes Link-Bündel zur Auswahl angeboten.  Solch ein Link-Bündel wurde jeweils wahlweise in Form eines lokalen Menüs bzw. einer kleinen HTML-Zwischenseite realisiert. 

Als Topologie des Verlinkungsnetzes wurde gewählt, Cobol-Bezeichner innerhalb eines Dokuments in beide Richtungen zyklisch zu verzeigern und außerdem, nach Dokument-Arten gruppiert, auf die jeweiligen ersten Vorkommen in jedem anderen Dokument.  Jeder Auswahlpunkt eines solchen Link-Bündels war so durch die Art des Zieldokuments getypt

Technische Realisierung

Im hiesigen Szenario war die zu verlinkende Dokumentenwelt geschlossen.  Damit ist gemeint, daß dem Betreiber des Hyperverlinkungs-Systems, in diesem Falle der Infrastruktur-Gruppe, zu jeder Zeit bekannt ist, welche Dokumente zum Bestand gehören.  Bei einer geschlossenen Dokumentenwelt kann man zur Steigerung der Laufzeit-Effizienz eine Architektur einsetzen, bei der schon bekannte Linkstellen und Links in einer Datenbank zwischengespeichert werden.  Diese Datenbank wird immer auf den neuesten Stand gebracht, sobald Dokumente sich ändern, den Bestand verlassen oder hinzukommen.  Die Dokumentations- und Cobol-Dokumente liegen in Originalform im Zugriffsbereich einer Servlet-Engine des Webservers, die dann zum Zeitpunkt der Anforderung durch einen Benutzer die angeforderten Dokumente wie ein Filter mit Hyperlinks anreichert. 

Ein Navigationsbeispiel

Der Benutzer hat zunächst, über die Eingabemaske links oben, eine Liste der für ihn relevanten Dokumente, deren Namen mit SGZ beginnen sollen, angefordert. Sie erscheint im linken unteren Frame.  Aus dieser Liste hat er sich für das Cobol-Modul SGZ100 entschieden, das wir im mittleren Frame des linken oberen Fensters sehen.  Nach Anklicken des mit einem Hyperlink unterlegten Bezeichners E268048 wird ihm in Form einer kleinen HTML-Seite [oben rechts] ein Link-Bündel zur Weiterreise angeboten.

Aus diesem Link-Bündel hat er den Hyperlink auf das Dokument Satzaufbau angeklickt, der, wie nun im Schnappschuß des rechten unteren Fensters zu sehen, im Hauptframe das Dokument mit dem entsprechenden Titel vom Typ "Satzbeschreibung" liefert.  Dabei wird er gleich an das erste Vorkommen des zu explorierenden Bezeichners E268048 plaziert, der im dortigen Kontext abgekürzt 8048 heißt.  Er klickt nun diesen Bezeichner an und erhält, wiederum zu seiner Rechten, ein Link-Bündel, aus hiesiger Sicht, von dem aus er den weiteren Vorkommen dieses Bezeichners folgen kann.  Selbstverständlich wäre ihm freigestanden, auch jedem anderen mit einem Hyperlink unterlegten Bezeicher zu folgen. 

Auf diese Weise lassen sich, mit nur ganz wenigen Hyperlink-Klicks, auch sehr viele Auftreten eines Bezeichners erreichen. 

Sprachtechnologie

Naturgemäß waren in diesem formalsprachlichen Umfeld die Anwendungsmöglichkeiten natürlichsprachlicher Methoden beschränkt.  In allgemeinen humansprachlichen Dokumenten ist die Vielfalt, in der von der Bedeutung her ein und dieselbe Sache in unterschiedlichen Situationen /*Kontexten*/ in Erscheinung tritt, ungleich größer.  Man denke allein an Flexionsformen, unterdrückte Präfixe /*z.B. "Karte" statt "Kreditkarte"*/, Synonyma oder Pronomina.  Bei Hypercode waren lediglich unterdrückte redundante Präfixe in bestimmten Dokumentenarten zu berücksichtigen. 

Verwandte Projekte, in denen das DFKI die Technologie automatischen Hyperverlinkens auf humansprachlichen Dokumenten eingesetzt hat, sind Show SOG und MUMIS.


Deutsches Forschungszentrum für Künstliche Intelligenz
Markus Pilzecker, <mp@dfki.de>
Abt. Sprachtechnologie
Stuhlsatzenhausweg 3
D-66123 Saarbrücken