Text Mining (BA-Seminar)
In diesem Seminar behandeln wir Methoden und Herangehensweisen an Text Mining. Text Mining ist das Gewinnen strukturierter Information aus unstruktrierten Texten. Im Gegensatz zum Data Mining, wo Daten beeits z.B. in tabellarischer Form vorliegen, müssen diese beim Text Mining zunächst aus Text gewonnenen werden.
Der größte Teil der Information im Internet und in firmeneigenen Dokumentationen liegt in textueller Form vor. Wie diese großen Mengen an Text aufbereitet, verarbeitet und genutzt werden können, ist Gegenstand dieses Seminars.
Studierende präsentieren ausgewählte Themen, um einen Gesamtüberblick über relevante Techniken im Bereich Text Mining zu erhalten. Dabei können je nach Thema auch praktische Erfahrungen mit Text Mining Tools gesammelt werden.
Lernziel
Studierende lernen im Rahmen des Seminars:
- Rezeption und Aufbereitung von Forschungsarbeiten
- Präsentationstechniken
- Konzepte, Algorithmen und Ergebnisse im Bereich Text Mining
- Aspekte des maschinellen Lernens
- Aspekte der Sprachtechnologie
Vorgehen
Nach einer generellen Einführung in die Ziele und den Aufbau des Seminars werden die Themen verteilt. Jede/r Teilnehmende/r hält einen Vortrag über ein Thema im Bereich Text Mining. Eine aktive Teilnahme an der anschließenden Diskussion wird erwartet. Zum Ende des Seminars wird eine kurze Ausarbeitung erwartet.
Literatur
Wird individuell pro Thema zugewiesen.
Rahmenwerk: Text Mining: Heyer, Quasthoff, Wulff, Wissensrohstoff Text: Konzepte, Algorithmen, Ergebnisse, W3L, 2006
Zusätzliche Hinweise
Für das erfolgreiche Bestehen des Seminars wird gefordert
- Seminarvortrag über ein Thema im Bereich Automatische Spracherkennung
- Ausarbeitung über das Thema
- aktive Teilnahme an der Diskussion