SHOW - Sog

Projekt-Rahmen

Das Projekt "SHOW-SOG" wurde in den Jahren 2000-2001 von der Sprachforschungsgruppe des DFKI im Auftrag des saarländischen Wirtschaftsministeriums durchgeführt. Die eingesetzte Technologie automatischen Hyperverlinkens diente hier dazu, die Webdokumente der Saarland Online Gründer Initiative (www.sog.saarland.de) thematisch zu erschliessen. Der Schwerpunkt der Arbeit lag daran, einzelne Ausdrücken und Seiten automatisch auf den zugrundenliegende Thesaurus zu verweisen, wobei als Seiteneffekt, die einzelnen Seiten des SOG Webauftritts mit der Konzepthierarchie des Thesaurus annotiert werden, womit eine intelligente Suche durch die SOG-Seiten unterstützt wird.

Maschinelle linguistische Verfahren können zwei in diesem Kontext ganz entscheidende Dinge leisten:
  1. Erkennung unterschiedlicher sprachlicher Realisierungen eines festgelegten Begriffes in den zu verlinkenden Dokumenten
  2. Aufdeckung von Ambiguitäten, so daß in einigen Fällen dafür gesorgt werden kann, daß oberflächlich gleiche Erscheinungsformen mit bedeutungsverschiedenen Begriffen verlinkt werden

Nutzer dieses Dienstes sind der Informationsanbieter selber, der seine Webpräsenz flexibler uind effizienter gestalten kann, aber auch Leute, die mit dem Gedanken spielen, eine Firma zu gründen: mit Hilfe von SHOW erhalten sie ein wichtige Navgiationshilfe durch das erweiterte Informationsangebot.

Organisation von SOG-Wissen

Die Gründer-Domäne wurde manuell mit Hilfe eines Thesaurus modelliert. Dieser Thesaurus wird dann von den DFKI sprachtechnologischen Werkzeuge während der automatischen natürlich-sprachlichen Analyse der SOG-Seiten konsultiert.

Technische Realisierung

Im hiesigen Szenario war die zu verlinkende Dokumentenwelt geschlossen.  Damit ist gemeint, daß dem Betreiber des Informationsangebots jeder Zeit bekannt ist, welche Dokumente zum Bestand gehören.  Das SHOW System (eine Kombination von flachen linguistischen Analysewerkzeugen, des Thesaurus und eines Annotierungstools) analysiert die Webseiten, erkennt Ausdrücke, die einem Begriff zugeordnet werden können, und annotiert diese mit JavaScript Code. Darüber hinaus, wird pro Seite eine Liste hergestellt, die Auskunft darüber gibt, welche Begriffe in der Seite realisiert sind. JavaScrip code liefert diese Liste in Form eines klickbaren Menüs. Beim Klicken, sei es bei den einzelnen annotierten Audrücken im Text oder im Menü, wird der Leser auf die entsprechende Einträgen im Thesaurus verwiesen.

Ein Navigationsbeispiel

Im folgenden Beispiel, kann gesehen werden, wie die SOG-Seite auf den zugrundenliegenden Thesaurus verlinkt werden. Der Leser kann entweder direkt auf einzelnen verlinkten Ausdrücken im Text klicken (verlinkte Ausdrücke werden highlighted, wenn der Mauszeiger darauf positioniert wird). Oder aber im oberen Rahmen rechts, nachdem das SOG Agent vom Benutzer ebenfalls angeklickt wurde, das Dokumentsymbol anklicken, wobei dann die Liste der in der Seite erkannten Begriffen erscheint. Hier wird auch darüber hinaus der Zugriff auf den gesamten Thesaurus gegeben.

SHOW-Sog

Verwandte Projekte, in denen das DFKI die Technologie automatischen Hyperverlinkens auf natürlich-sprachlichen prachlichen Dokumenten eingesetzt hat, sind Hyperkode und MUMIS.


Deutsches Forschungszentrum für Künstliche Intelligenz
Thierry Declerck, <declerck@dfki.de>
Abt. Sprachtechnologie
Stuhlsatzenhausweg 3
D-66123 Saarbrücken