Informatisches Kolloquium Heyer: Texttechnologie
|
Informatisches Colloquium Montag, 22. November 1999, 17 Uhr c.t. Konrad-Zuse-Hörsaal |
Referent
|
Prof. Dr. Gerhard Heyer FB Informatik, Universität Leipzig |
Thema
|
Text als Wissensrohstoff - Perspektiven der Texttechnologie |
Zusammenfassung
|
Ein Merkmal der modernen Informationsgesellschaft ist die Verfügbarkeit sehr großer Mengen digitalisierter Textdaten, die mit der zunehmenden Digitalisierung von Geschäftsvorgängen entstehen. Im Vortrag wird untersucht, wie diese digitalen Texte als Wissensrohstoff genutzt werden können, um die zunehmende Informationsflut zu strukturieren und zu kontrollieren. Am Beispiel des Projekts Deutscher Wortschatz an der Universität Leipzig - der derzeit wohl umfangreichsten Vollformen-Datenbank des Deutschen mit gut 4,2 Millionen Worteinträgen und mehr als 12 Millionen Beispielsätzen - wird gezeigt, wie semantische Relationen berechnet und für die automatische Disambiguierung und Sachgebietsklassifikation von Wörtern verwendet werden können. Hieraus ergeben sich u.a. texttechnologische Anwendungen bei der Suche in großen Textdatenbanken, dem Finden ähnlicher Dokumente sowie der automatischen Klassifikation von Dokumenten. |
Kontakt
|
Prof. Dr. Walther von Hahn Telefon 040 - 42883 2433 |
Koordination
|
Prof. Dr. W. v. Hahn (vhahn"AT"informatik.uni-hamburg.de) |