Disputation von Fabian Panse am 17.12.2014, 14:00 Uhr, Raum F-534
17. Dezember 2014, von Reinhard Zierke
Foto: Fachschaft Informatik
Einladung zur hochschulöffentlichen Disputation
von Herrn Fabian Panse:“Duplikaterkennung in probabilistisch relationalen Datenbanken”
Einladung zur hochschulöffentlichen Disputation
von Herrn Fabian Panse
Mittwoch, 17. Dezember 2014 um 14:00 Uhr
im Informatikum, Vogt-Kölln-Str. 30, Raum F-534
“Duplikaterkennung in probabilistisch relationalen Datenbanken”
Abstract:
IDer Bedarf an probabilistischer Datenmodellierung steigt in vielen Anwendungsbereichen. Um mehrere prob. Datenbestände sinnvoll zu integrieren oder um einen einzelnen prob. Datenbestand zu bereinigen, bedarf es der Erkennung von Duplikaten. Traditionelle Duplikaterkennungsverfahren sind jedoch nicht für den Umgang prob. modellierter Unsicherheiten konzipiert. Daher beschreibt diese Arbeit einen generischen Ansatz zur effektiven und effizienten Erkennung von prob. Duplikaten in unterschiedlichen Anwendungsbereichen. Da eine prob. Datenmodellierung zudem die Integration von unsicheren Duplikatsentscheidungen in die Zieldatenbank gestattet, wird das Konzept der indeterministischen Duplikaterkennung eingeführt, bei der anstatt eines einzelnen mehrere mögliche Duplikat-Clusterings produziert werden. Hierfür werden Ansätze zur Berechnung, Modellierung, Anfragebearbeitung und Qualitätsbewertung präsentiert.
Prof. Dr. Matthias Rarey
(Vorsitzender des Fach-Promotionsausschusses Informatik)