Lecture: Data Mining

Sommer Semester 2016

News/Aktuelles

For this course we use the MIN-CommSy - further information and material will be made available there. All participants will be affirmed after the first lecture.
First registration period/Erste Anmeldephase (STiNE): 15.02.16 09:00h - 03.03.16 13:00h

Information/Allgemeine Informationen
LV-Nummer:	64-233
Lecturer:	Prof. Dr. Stefan Wermter, Dr. Cornelius Weber
Period:	Wöchentlich 4 UE Mi 10:15-11:45, 12:00-13:30
Room:	D-125/D-129
Credit Hours	4 SWS
Language:	Englisch
Module:	InfB-DaMi, WPB7-DaMi

Contents/Inhalte

We are surrounded by a huge amount of data on a daily basis but only by extracting information from data it is possible to analyze, process and discover knowledge in the data. Therefore data mining for knowledge discovery has a tremendous implication for many interdisciplinary fields including human computer interaction, assistance systems, cognitive neuroscience and healthcare but also for condition monitoring, business computing and knowledge management. This lecture covers methods, concepts and algorithms of data mining for knowledge discovery. The main focus is on those methods from machine learning, statistics and neural networks which learn representations from text, speech, images, or other data. Topics include:

Example tasks for learning systems
Pre-processing and visualization methods
Knowledge management and associations rules
Decision trees, decision rules
Supervised classification and neural networks
Unsupervised clustering and self-organizing neural networks
Genetic algorithms and learning
Fuzzy reasoning and neuro-fuzzy architectures
Hybrid systems and ensemble learning
Bayes networks and hidden Markov models
Text mining, sensor mining and other applications

Große Datenmengen umgeben uns in unserem täglichen LebenLeben und erfordern es, Informationen systematisch zu akquirieren, zu analysieren und zu verarbeiten, um schließlich Wissen zu gewinnen und zu verstehen. Das Data Mining, d.h. das Gewinnen von Wissen aus diesen Daten, hat eine enorme Bedeutung für interdisziplinäre Gebiete, z.B. Mensch-Computer-Interaktion, Assistenzsysteme, Kognitive Neurowissenschaften und das Gesundheitswesen, ist aber auch relevant für Prozessüberwachung und Wissensmanagement in der Wirtschaft. In dieser Vorlesung werden Methoden, Konzepte und Algorithmen zur Wissensgewinnung behandelt. Der Kern sind dabei Methoden aus dem Maschinellen Lernen, der Statistik und den Neuronalen Netzen, die Repräsentationen aus Texten, Sprache, Bildern oder anderen Daten lernen. Themen sind u.a.:

Verarbeitungsaufgaben für lernende Systeme
Vorverarbeitung und Visualisierung
Wissensmanagement und Assoziationsregeln
Wissensbäume und Entscheidungsregeln
Überwachte Klassifikation und Neuronale Netze
Unüberwachtes Clustern und selbst-organisierte Neuronale Netze
Genetische Algorithmen und Lernen
Fuzzy Schließen und Neuro-Fuzzy Architekturen
Hybride Systeme und Ensemble Lernen
Bayes Netze und Hidden Markov Modelle
Text Mining, Sensor Mining und andere Anwendungen

Objective/Lernziel

The area of Data Mining includes concepts of information and knowledge. The students learn on the basis of algorithms how to deal with huge amounts of data in terms of processing and analysis as well as how to visualise and interpret data for knowledge discovery. The students learn how to model complex problems, apply various approaches practically, and work scientifically with systematic methods.

Das Gebiet Data Mining umfasst Konzepte von Information und Wissen. Die Studierenden lernen auf algorithmischer Basis, wie man mit großen Datenmengen umgeht, d.h. deren Aufbereitung und Analyse, sowie verschiedene Visualisierungsmöglichkeiten und schließlich die Interpretation von Daten zur Wissensakquisition. Die Studierenden erlernen komplexe Fragestellungen zu modellieren, vielseitige Lösungsansätze praktisch umzusetzen und mit systematischen Methoden wissenschaftlich zu arbeiten.

Procedure/Vorgehen

Complementary to the lectures is the practical tutorial Data Mining, in which the contents from the lectures will be tested and examples will be implemented.

Zu den Vorlesungen gibt es die praktische Übung Data Mining, in dem die Inhalte aus den Vorlesungen geübt und an Beispielen selbst umgesetzt werden.

Language/Sprache

We will offer the lecture in English to give you an easy opportunity for getting used to the standard language of science and engineering. We will offer the complementing practical courses in English as well as German to adapt to your preferences. Also we will support you, both for the topic and the language, as good as we can. German discussions are also welcome at any time.

Wir werden die Vorlesung in Englisch anbieten um den Teilnehmern eine gute Gelegenheit zu geben Erfahrungen mit der Standardsprache in der Wissenschaft und dem Engineering zu sammeln. Wir bieten dazu die Praktischen Übungen in Englisch oder Deutsch an um den Teilnehmern den besten Zugang zu bieten. Dazu werden wir die Teilnehmer sowohl mit der Sprache als auch mit dem Inhalt so gut unterstützen wie wir können. Deutschsprachige Diskussionen sind ebenfalls zu jeder Zeit willkommen.

Hints for the examination/Prüfungshinweise

There will be a written examination (Klausur). Dates for the exam will be offered in the beginning and in the end of the non-lecture period.

Die Prüfung findet in Form einer Klausur statt. Klausurtermine werden zu Beginn und zum Ende der vorlesungsfreien Zeit angeboten.

Literature/Literatur

Kantardzic, M. Data Mining. Wiley, 2011.
Han J. & Kamber, M. Data mining: Concepts and techniques. Elsevier/Morgan Kaufmann, Amsterdam, 2006.
Marsland, S. Machine Learning - An Algorithmic Perspective. CRC Press, 2009.

Material

Das Material für diese Veranstaltung ist innerhalb des CommSy Portals zu finden:
Informatik-CommSy: WTM: Data Mining SS2016