Lecture: Data Mining
Summer Semester 2018
News/Aktuelles
- For this course we use the STiNE - further information and material will be made available there. All participants will be affirmed after the first lecture.
- First registration period/Erste Anmeldephase (STiNE): 12.02.18 09:00h - 01.03.18 13:00h
Information/Allgemeine Informationen |
|
LV-Nummer: | 64-233 |
Lecturer: | Dr. Cornelius Weber, Prof. Dr. Stefan Wermter |
Period: | Wöchentlich 4 UE Mi 10:00-11:30, 12:15-13:45 |
Room: | D-125/D-129 |
Credit Hours | 4 SWS |
Language: | Englisch |
Module: | InfB-DaMi, WPB7-DaMi |
Contents/Inhalte
We are surrounded by a huge amount of data on a daily basis but only by extracting and analzying information from the data it is possible to discover knowledge. Therefore data mining for knowledge discovery has a tremendous implication for many interdisciplinary fields including human computer interaction, assistance systems, cognitive neuroscience and healthcare, and is becoming increasingly relevant for industry. This lecture covers methods, concepts and algorithms of data mining for knowledge discovery. The focus is on methods from machine learning, statistics and neural networks, by which a data scientist retrieves interpretable representations from text, speech, images or other data. Topics include:
- Pre-processing and visualization methods
- Knowledge management and associations rules
- Decision trees, decision rules
- Supervised classification and unsupervised clustering
- Neural networks, deep learning and self-organizing neural networks
- Genetic algorithms
- Fuzzy reasoning and neuro-fuzzy architectures
- Ensemble learning and hybrid systems
- Bayes networks and hidden Markov models
- Text mining, sensor mining and other applications
Große Datenmengen umgeben uns im täglichen Leben und erfordern es, Informationen systematisch zu akquirieren, zu analysieren und zu verarbeiten, um Wissen zu gewinnen und zu verstehen. Data Mining, d.h. das Gewinnen von Wissen aus diesen Daten, hat eine enorme Bedeutung für interdisziplinäre Gebiete, z.B. Mensch-Computer-Interaktion, Assistenzsysteme, Kognitive Neurowissenschaften, und ist zunehmend relevant für die Wirtschaft. In dieser Vorlesung werden Methoden, Konzepte und Algorithmen zur Wissensgewinnung behandelt. Im Kern werden Methoden aus dem Maschinellen Lernen, der Statistik und den Neuronalen Netzen behandelt, die dem Data Scientist verwertbare Repräsentationen aus Texten, Sprache, Bildern oder anderen Daten liefern. Themen sind u.a:
- Vorverarbeitung und Visualisierung von Daten
- Wissensmanagement und Assoziationsregeln
- Wissensbäume und Entscheidungsregeln
- Überwachtes Lernen: Neuronale Netze, Deep Learning
- Unüberwachtes Lernen: Selbst-organisierte Netze, Clusteralgorithmen
- Genetische Algorithmen
- Fuzzy Schließen und Neuro-Fuzzy Architekturen
- Ensemble Lernen und Hybride Systeme
- Bayes Netze und Hidden Markov Modelle
- Text Mining, Sensor Mining und andere Anwendungen
Objective/Lernziel
The area of Data Mining includes concepts of information and knowledge. The students learn on an algorithmic basis how to process and analyse huge amounts of data and how to visualise and interpret data for knowledge discovery. The students learn how to model complex problems, apply various approaches practically, and work scientifically with systematic methods.
Data Mining umfasst Konzepte von Information und Wissen. Die Studierenden lernen auf algorithmischer Basis, wie man mit großen Datenmengen umgeht, d.h. deren Aufbereitung und Analyse, sowie verschiedene Visualisierungsmöglichkeiten und schließlich die Interpretation von Daten zur Wissensakquisition. Die Studierenden erlernen komplexe Fragestellungen zu modellieren, vielseitige Lösungsansätze praktisch umzusetzen und mit systematischen Methoden wissenschaftlich zu arbeiten.
Procedure/Vorgehen
Complementary to the lectures is the practical tutorial Data Mining, in which the contents from the lectures will be tested and examples will be implemented.
Zu den Vorlesungen gibt es die praktische Übung Data Mining, in dem die Inhalte aus den Vorlesungen geübt und an Beispielen selbst umgesetzt werden.
Language/Sprache
We will offer the lecture in English to provide an opportunity to become acquainted with the standard language of science and engineering. We will offer the complementing practical courses in English as well as in German to adapt to your preferences. Also we will support you, both for the topic and the language, as good as we can. German discussions are also welcome at any time.
Die Vorlesung wird in Englisch angeboten, um den Teilnehmern eine gute Gelegenheit zu geben, Erfahrungen mit der Standardsprache in der Wissenschaft und dem Engineering zu sammeln. Wir bieten dazu die Praktischen Übungen in Englisch oder Deutsch an, um den Teilnehmern den besten Zugang zu bieten. Dazu werden wir die Teilnehmer sowohl mit der Sprache als auch mit dem Inhalt so gut unterstützen wie wir können. Deutschsprachige Diskussionen sind ebenfalls zu jeder Zeit willkommen./em>
Hints for the examination/Prüfungshinweise
There will be a written examination (Klausur). Dates for the exam will be offered in the beginning and in the end of the non-lecture period.
Die Prüfung findet in Form einer Klausur statt. Klausurtermine werden zu Beginn und zum Ende der vorlesungsfreien Zeit angeboten.
Literature/Literatur
- Kantardzic, M. Data Mining. Wiley, 2011.
- Han J. & Kamber, M. Data Mining: Concepts and Techniques. Elsevier/Morgan Kaufmann, Amsterdam, 2006.
- Marsland, S. Machine Learning - An Algorithmic Perspective. CRC Press, 2015.
Material
Das Material für diese Veranstaltung ist im STiNE zu finden.