Lecture: Data Mining
Summer Semester 2017
News/Aktuelles
- For this course we use the MIN-CommSy - further information and material will be made available there. All participants will be affirmed after the first lecture.
- First registration period/Erste Anmeldephase (STiNE): 13.02.17 09:00h - 03.03.16 13:00h
Information/Allgemeine Informationen |
|
LV-Nummer: | 64-233 |
Lecturer: | Dr. Cornelius Weber, Prof. Dr. Stefan Wermter |
Period: | Wöchentlich 4 UE Mi 10:15-11:45, 12:15-13:45 |
Room: | D-125/D-129 |
Credit Hours | 4 SWS |
Language: | Englisch |
Module: | InfB-DaMi, WPB7-DaMi |
Contents/Inhalte
We are surrounded by a huge amount of data on a daily basis but only by extracting information from data it is possible to analyze, process and discover knowledge in the data. Therefore data mining for knowledge discovery has a tremendous implication for many interdisciplinary fields including human computer interaction, assistance systems, cognitive neuroscience and healthcare, but is also becoming increasingly relevant for industry. This lecture covers methods, concepts and algorithms of data mining for knowledge discovery. The main focus is on those methods from machine learning, statistics and neural networks, by which a data scientist retrieves interpretable representations from text, speech, images, or other data. Topics include:
- Example tasks for learning systems
- Pre-processing and visualization methods
- Knowledge management and associations rules
- Decision trees, decision rules
- Supervised classification and neural networks
- Unsupervised clustering and self-organizing neural networks
- Genetic algorithms and learning
- Fuzzy reasoning and neuro-fuzzy architectures
- Hybrid systems and ensemble learning
- Bayes networks and hidden Markov models
- Text mining, sensor mining and other applications
Große Datenmengen umgeben uns im täglichen Leben und erfordern es, Informationen systematisch zu akquirieren, zu analysieren und zu verarbeiten, um Wissen zu gewinnen und zu verstehen. Data Mining, d.h. das Gewinnen von Wissen aus diesen Daten, hat eine enorme Bedeutung für interdisziplinäre Gebiete, z.B. Mensch-Computer-Interaktion, Assistenzsysteme, Kognitive Neurowissenschaften, und ist zunehmend relevant für die Wirtschaft. In dieser Vorlesung werden Methoden, Konzepte und Algorithmen zur Wissensgewinnung behandelt. Im Kern sind dabei Methoden aus dem Maschinellen Lernen, der Statistik und den Neuronalen Netzen, die dem Data Scientist verwertbare Repräsentationen aus Texten, Sprache, Bildern oder anderen Daten liefern. Themen sind u.a:
- Verarbeitungsaufgaben für lernende Systeme
- Vorverarbeitung und Visualisierung
- Wissensmanagement und Assoziationsregeln
- Wissensbäume und Entscheidungsregeln
- Überwachte Klassifikation und Neuronale Netze
- Unüberwachtes Clustern und selbst-organisierte Neuronale Netze
- Genetische Algorithmen und Lernen
- Fuzzy Schließen und Neuro-Fuzzy Architekturen
- Hybride Systeme und Ensemble Lernen
- Bayes Netze und Hidden Markov Modelle
- Text Mining, Sensor Mining und andere Anwendungen
Objective/Lernziel
The area of Data Mining includes concepts of information and knowledge. The students learn on the basis of algorithms how to deal with huge amounts of data in terms of processing and analysis as well as how to visualise and interpret data for knowledge discovery. The students learn how to model complex problems, apply various approaches practically, and work scientifically with systematic methods.
Data Mining umfasst Konzepte von Information und Wissen. Die Studierenden lernen auf algorithmischer Basis, wie man mit großen Datenmengen umgeht, d.h. deren Aufbereitung und Analyse, sowie verschiedene Visualisierungsmöglichkeiten und schließlich die Interpretation von Daten zur Wissensakquisition. Die Studierenden erlernen komplexe Fragestellungen zu modellieren, vielseitige Lösungsansätze praktisch umzusetzen und mit systematischen Methoden wissenschaftlich zu arbeiten.
Procedure/Vorgehen
Complementary to the lectures is the practical tutorial Data Mining, in which the contents from the lectures will be tested and examples will be implemented.
Zu den Vorlesungen gibt es die praktische Übung Data Mining, in dem die Inhalte aus den Vorlesungen geübt und an Beispielen selbst umgesetzt werden.
Language/Sprache
This semester we will offer the lecture in English to give you an easy opportunity for getting used to the standard language of science and engineering. We will offer the complementing practical courses in English as well as German to adapt to your preferences. Also we will support you, both for the topic and the language, as good as we can. German discussions are also welcome at any time.
Im kommenden Semester werden wir die Vorlesung in Englisch anbieten um den Teilnehmern eine gute Gelegenheit zu geben, Erfahrungen mit der Standardsprache in der Wissenschaft und dem Engineering zu sammeln. Wir bieten dazu die Praktischen Übungen in Englisch oder Deutsch an, um den Teilnehmern den besten Zugang zu bieten. Dazu werden wir die Teilnehmer sowohl mit der Sprache als auch mit dem Inhalt so gut unterstützen wie wir können. Deutschsprachige Diskussionen sind ebenfalls zu jeder Zeit willkommen.
Hints for the examination/Prüfungshinweise
There will be a written examination (Klausur). Dates for the exam will be offered in the beginning and in the end of the non-lecture period.
Die Prüfung findet in Form einer Klausur statt. Klausurtermine werden zu Beginn und zum Ende der vorlesungsfreien Zeit angeboten.
Literature/Literatur
- Kantardzic, M. Data Mining. Wiley, 2011.
- Han J. & Kamber, M. Data mining: Concepts and techniques. Elsevier/Morgan Kaufmann, Amsterdam, 2006.
- Marsland, S. Machine Learning - An Algorithmic Perspective. CRC Press, 2015.
Material
Das Material für diese Veranstaltung ist innerhalb des CommSy Portals zu finden:
Informatik-CommSy: WTM: Data Mining SS2017