Publications

Copyright Notice

This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each author's copyright. In most cases, these works may not be reposted without the explicit permission of the copyright holder.

The following notice applies to all IEEE publications: © IEEE. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works.

Book Publications and Dissertations

Navin Raj Prabhu, "Probabilistic and Generative Modeling for Emotion Recognition and Synthesis", Dissertation, Universität Hamburg, Feb. 2026
Julius Richter, "Generative Speech Enhancement in Multimodal Applications", Dissertation, Universität Hamburg, Sep. 2025
Huajian Fang, "Model-Based Deep Speech Enhancement for Improved Interpretability and Robustness", Dissertation, Universität Hamburg, Jun. 2025
Jean-Marie Lemercier, "Model-based Techniques and Diffusion Models for Speech Dereverberation", Dissertation, Universität Hamburg, Feb. 2025
Kristina Tesch, "Non-linear Spatial Filtering for Multi- channel Speech Enhancement and Separation", Dissertation Universität Hamburg, Feb. 2024. [video]
Robert Rehr, "Robust Speech Enhancement Using Statistical Signal Processing and Machine-Learning", Dissertation Universität Hamburg, Jan. 2019.
Timo Gerkmann and Emmanuel Vincent, "Spectral Masking and Filtering", In E. Vincent, T. Virtanen, S. Gannot (Eds.), Audio Source Separation and Speech Enhancement, Wiley 2018, ISBN 978-1-119-27989-1, Sep. 2018.
Martin Krawczyk-Becker, "Phase-Aware Single-Channel Speech Enhancement", Verlag Dr. Hut, ISBN 978-3-8439-2918-9, Dec. 2016.
Richard C. Hendriks, Timo Gerkmann, Jesper Jensen, "DFT-Domain Based Single-Microphone Noise Reduction for Speech Enhancement - A Survey of the State of the Art", Synthesis Lectures on Speech and Audio Processing, Morgan & Claypool Publishers, pp. 1-80, ISBN 978-1-62705-143-9, Jan. 2013. [doi]
Timo Gerkmann, "Statistical Analysis of Cepstral Coefficients and Applications in Speech Enhancement", Verlag Dr. Hut, ISBN 978-3-86853-696-6, Dec. 2010. [download]

Journals

2026

Simon Welker, Lorenz Kuger, Tim Roith, Berthy Feng, Martin Burger, Timo Gerkmann, Henry Chapman, "Position-Blind Ptychography: Viability of image reconstruction via data-driven variational inference", accepted for SIAM Journal on Imaging Sciences, 2026. [arxiv] [code]
Simon Welker, Bunlong Lay, Maris Hillemann, Tal Peer, Timo Gerkmann, "Real-Time Streamable Generative Speech Restoration with Flow Matching", IEEE Transactions on Audio, Speech, and Language Processsing, 2026. [doi] [arxiv] [audio] [code]
N. Raj Prabhu, M. Tsfasman, C. Oertel, T. Gerkmann, and N. Lehmann-Willenbrock, “Dynamics of collective group affect: Group-level annotations and the multimodal modeling of convergence and divergence,” IEEE Transactions on Affective Computing, Vol. 17, No. 1, pp. 1014 - 1029, Jan-Mar 2026. [doi], [arxiv]

2025
Nienke Cornelia Langerak, Hendrik Christiaan Stronks, Esther Francina van Marrewijk, Jeroen Johannes Briaire, Jean-Marie Lemercier, Timo Gerkmann, Johan Hubertus Maria Frijns, "A Novel Artificial-Intelligence-Based Reverberation-Reduction Algorithm for Cochlear Implants Enhances Speech Intelligibility and User Experience", AAS Ear and Hearing, Nov. 2025. [doi]
Jean-Marie Lemercier, Eloi Moliner, Simon Welker, Vesa Välimäki, Timo Gerkmann, "Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models", IEEE Trans. Audio, Speech, Language Proc., Vol. 33, pp. 2244-2258, 2025. [doi] [arxiv] [audio] [code]

2024
Jean-Marie Lemercier, Julius Richter, Simon Welker, Eloi Moliner, Vesa Välimäki, Timo Gerkmann, "Diffusion Models for Audio Restoration", IEEE Signal Processing Magazine, Nov 2024, Vol. 41, No. 6, pp. 72-84, Nov. 2024. [doi] [arxiv]
Kristina Tesch, Timo Gerkmann, "Multi-channel Speech Separation Using Spatially Selective Deep Non-linear Filters", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol 32, pp. 542-553, 2024. [doi] [arxiv] [audio]
Julius Richter, Simon Welker, Jean-Marie Lemercier, Bunlong Lay, Tal Peer, Timo Gerkmann, "Causal Diffusion Models for Generalized Speech Enhancement", IEEE Open Journal of Signal Processing, Vol 5, pp. 780-789, 2024. [doi] [audio]
Simon Welker, Henry N. Chapman, Timo Gerkmann, "DriftRec: Adapting diffusion models to blind JPEG restoration", IEEE Trans. Image Processing, Vol. 33, pp. 2795-2807, 2024. [doi] [arxiv]
Navin Raj Prabhu, Nale Lehmann-Willenbrock, Timo Gerkmann, "End-to-End Label Uncertainty Modeling in Speech Emotion Recognition using Bayesian Neural Networks and Label Distribution Learning", IEEE Transactions on Affective Computing, Vol. 15, No. 2, pp. 579-592, Apr.-Jun. 2024. [doi] [arxiv] [code]

2023
Jean-Marie Lemercier, Julius Richter, Simon Welker, Timo Gerkmann, "StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 31, pp. 2724 -2737 , 2023. [doi][arxiv] [code] [audio]
Julius Richter, Simon Welker, Jean-Marie Lemercier, Bunlong Lay, Timo Gerkmann, "Speech Enhancement and Dereverberation with Diffusion-based Generative Models", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 31, pp. 2351 - 2364, 2023. [doi] [arxiv] [code] [audio], ITG VDE award 2024
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann, "A Neural Network-supported Two-Stage Algorithm for Lightweight Dereverberation on Hearing Devices", EURASIP Journal on Audio, Speech, and Music Processing, Vol 18, 2023. [arxiv] [doi] [audio] [code]
Huajian Fang, Dennis Becker, Stefan Wermter, Timo Gerkmann, "Integrating Uncertainty into Neural Network-based Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 31, pp. 1587-1600, 2023. [doi]
Kristina Tesch, Timo Gerkmann, "Insights into Deep Non-linear Filters for Improved Multi-channel Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 31, pp. 563-575, 2023. [doi] [arxiv] [code] [audio]

2022
Tal Peer, Timo Gerkmann, "Phase-Aware Deep Speech Enhancement: It's All About The Frame Length", Journal of the Acoustical Society of America Express Letters, Vol. 2, No. 10, 2022. [doi]

2021
Kristina Tesch, Timo Gerkmann, "Nonlinear Spatial Filtering in Multichannel Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 29, pp. 1795-1805, 2021. [doi] [arxiv] [audio], ITG VDE award 2022
Tobias Knopp, Mirco Grosser, Matthias Gräser, Timo Gerkmann, Martin Möddel, "Efficient Joint Estimation of Tracer Distribution and Background Signals in Magnetic Particle Imaging using a Dictionary Approach", IEEE Transactions on Medical Imaging, 2021. [doi] [arxiv]
Robert Rehr, Timo Gerkmann, "SNR-Based Features and Diverse Training Data for Robust DNN-Based Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 29, pp. 1937-1949, 2021. [doi] [arxiv] [audio]

2020
Lux Li, Robert Rehr, Patrick Bruns, Timo Gerkmann, Brigitte Röder, "A survey on probabilistic models in human perception and machines", Frontiers in Robotics and AI, Vol. 7, No. 85, pp. 1-9, Jul. 2020. [doi]

2019
T. Knopp, N. Gdaniec, R. Rehr, M. Graeser, T. Gerkmann, "Correction of linear system drifts in magnetic particle imaging", Phys. Med. Biol., vol. 64, No. 12, Jun. 2019. [doi]

2018
Martin Krawczyk-Becker, Timo Gerkmann, "On Speech Enhancement Under PSD Uncertainty", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 26, No. 6, Jun. 2018. [doi] [download]
Steffen Kortlang, Zhangli Chen, Timo Gerkmann, Birger Kollmeier, Volker Hohmann, and Stephan D. Ewert, "Evaluation of combined dynamic compression and single channel noise reduction for hearing aid applications", Int. J. Audiology, Vol. 57, No. 3, pp. S43-S54, 2018. [doi]
Rainer Huber, Thomas Bisitz, Timo Gerkmann, Jürgen Kiessling, Hartmut Meister, Birger Kollmeier, "Comparison of single-microphone noise reduction schemes: can hearing impaired listeners tell the difference?", Int. J. Audiology, Vol. 57, No. 3, pp. S55-S61, 2018. [doi]
Robert Rehr, Timo Gerkmann, "On the Importance of Super-Gaussian Speech Priors for Machine-Learning Based Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 26, No. 2, Feb. 2018. [doi], [audio], [download]

2017
Jens-Alrik Adrian, Timo Gerkmann, Steven van de Par, Joerg Bitzer, "Synthesis of Perceptually Plausible Multichannel Noise Signals Controlled by Real World Statistical Noise Properties", Journal of the Audio Engineering Society, Vol. 65, No. 11, pp. 914-928, Nov. 2017. [doi], [Code and Audio]
Matthias Brandt, Simon Doclo, Timo Gerkmann, Joerg Bitzer, "Impulsive Disturbances in Audio Archives: Signal Classification for Automatic Restoration", Journal of the Audio Engineering Society, Vol. 65, No. 10, pp. 826-840, Oct. 2017. [doi]
Robert Rehr, Timo Gerkmann, "An Analysis of Adaptive Recursive Smoothing with Applications to Noise PSD Estimation", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 25, No. 2, pp. 397-408, Feb. 2017. [doi] [download]
Ante Jukic, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "A General Framework for Incorporating Time–Frequency Domain Sparsity in Multichannel Speech Dereverberation", J. Audio Eng. Soc., Vol. 65, No. 1/2, pp. 17-30, Jan. 2017. [doi]

2016
Martin Krawczyk-Becker, Timo Gerkmann, "On MMSE-Based Estimation of Amplitude and Complex Speech Spectral Coefficients Under Phase-Uncertainty", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 24, No. 12, pp. 2251-2262, Dec. 2016. [doi] [download]
Martin Krawczyk-Becker, Timo Gerkmann, "An evaluation of the perceptual quality of phase-aware single-channel speech enhancement", Journal of the Acoustical Society of America, 140, EL364-EL369, Oct. 2016. [audio] [doi] [download]
Martin Krawczyk-Becker, Timo Gerkmann, "Fundamental Frequency Informed Speech Enhancement in a Flexible Statistical Framework", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 24, No. 5, pp. 940-951, May 2016. [doi] [download]
2015
R.M. Baumgärtel, M. Krawczyk-Becker, D. Marquardt, C. Völker, H. Hu, T. Herzke, G. Coleman, K. Adiloglu, S.M.A Ernst, T. Gerkmann, S. Doclo, B. Kollmeier, V. Hohmann, M. Dietz, "Comparing Binaural Pre-Processing Strategies I: Instrumental Evaluation", Trends in Hearing, Vol. 19, 2015. [doi]
R.M. Baumgärtel, H. Hu, M. Krawczyk-Becker, D. Marquardt, T. Herzke, G. Coleman, K. Adiloglu, K. Bomke, K. Plotz, T. Gerkmann, S. Doclo, S., B. Kollmeier, V. Hohmann, M. Dietz, "Comparing Binaural Pre-Processing Strategies II: Speech Intelligibility of Bilateral Cochlear Implant Users", Trends in Hearing, Vol. 19, 2015. [doi]
Benjamin Cauchi, Ina Kodrasi, Robert Rehr, Stephan Gerlach, Ante Jukic, Timo Gerkmann, Simon Doclo, Stefan Goetze, "Combination of MVDR beamforming and single-channel spectral processing for enhancing noisy and reverberant speech", EURASIP Journal on Advances in Signal Processing, Dec. 2015. [doi]
Feifei Xiong, Bernd T. Meyer, Niko Moritz, Robert Rehr, Joern Anemueller, Timo Gerkmann, Simon Doclo, Stefan Goetze, "Front-End Technologies for Robust ASR in Reverberant Environments - Spectral Enhancement-based Dereverberation and Auditory Modulation Filterbank", EURASIP Journal on Advances in Signal Processing, Dec. 2015. [doi]
Ante Jukić, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "Multi-Channel Linear Prediction-Based Speech Dereverberation With Sparse Priors", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 23, No. 9, pp. 1509-1520, Sep. 2015. [doi] [download]
Lin Wang, Timo Gerkmann, Simon Doclo, "Noise Power Spectral Density Estimation Using MaxNSR Blocking Matrix", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 23, No. 9, pp. 1493-1508, Sep. 2015. [doi] [download]
Timo Gerkmann, Martin Krawczyk-Becker, Jonathan Le Roux, "Phase Processing for Single Channel Speech Enhancement: History and Recent Advances", IEEE Signal Processing Magazine, Vol. 32, No. 2, pp. 55-66, Mar. 2015. [more] [doi] [download]
Alexander Schasse, Timo Gerkmann, Rainer Martin, Wolfgang Sörgel, Thomas Pilgrim, Henning Puder, "Two-Stage Filter-Bank System for Improved Single-Channel Noise Reduction in Hearing Aids", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 23, No. 2, pp. 383-393, Feb. 2015. [doi] [download]
2014
Martin Krawczyk, Timo Gerkmann, "STFT Phase Reconstruction in Voiced Speech for an Improved Single-Channel Speech Enhancement", IEEE/ACM Trans. Audio, Speech, Language Proc., Vol. 22, No. 12, pp. 1931-1940, Dec. 2014. [Audio + Code] [doi] [download]
Timo Gerkmann, "Bayesian estimation of clean speech spectral coefficients given a priori knowledge of the phase", IEEE Trans. Signal Processing, Vol. 62, No. 16, pp. 4199-4208, 15 Aug. 2014. [Audio] [doi] [download]
2013
Timo Gerkmann, Martin Krawczyk, "MMSE-Optimal Spectral Amplitude Estimation Given the STFT-Phase", IEEE Signal Processing Letters, Vol. 20, No. 2, pp. 129-132, Feb. 2013. [Audio and Code] [doi] [download]
2012
Timo Gerkmann, Richard C. Hendriks, "Unbiased MMSE-based Noise Power Estimation with Low Complexity and Low Tracking Delay", IEEE Trans. Audio, Speech and Language Processing, Vol. 20, No. 4, pp. 1383 - 1393, May 2012. [Code and audio] [doi] [download]
Richard C. Hendriks, Timo Gerkmann, "Noise Correlation Matrix Estimation for Multi-Microphone Speech Enhancement", IEEE Trans. Audio, Speech and Language Processing, Vol. 20, No. 1, pp. 223-233. Jan. 2012. [doi] [download]
2011
Rainer Martin, Timo Gerkmann, "Besser Hören dank Algorithmen", Deutsche Zeitschrift für klinische Forschung, pp. 38-43, Sep. 2011.
Rainer Martin, Timo Gerkmann, "Besser Hören dank Algorithmen: Wie digitale Signalverarbeitung Hörgeräte verbessert und die Kommunikation erleichtert", rubin Wissenschaftsmagazin, Spring 2011.
2009
Timo Gerkmann, Rainer Martin, "On the Statistics of Spectral Amplitudes After Variance Reduction by Temporal Cepstrum Smoothing and Cepstral Nulling", IEEE Trans. Signal Processing, Vol. 57, No. 11, pp. 4165-4174, Nov. 2009. [doi] [download]
2008
Timo Gerkmann, Colin Breithaupt, Rainer Martin, "Improved A Posteriori Speech Presence Probability Estimation Based on a Likelihood Ratio with Fixed Priors", IEEE Trans. Audio, Speech and Language Processing, Vol. 16, No. 5, pp. 910-919, Jul. 2008. [doi] [download]
2007
Colin Breithaupt, Timo Gerkmann, Rainer Martin, "Cepstral Smoothing of Spectral Filter Gains for Speech Enhancement Without Musical Noise", IEEE Signal Processing Letters, Vol. 14, No. 12, pp. 1036-1039, Dec. 2007. [doi] [download]

Peer-reviewed Conferences

2026

Bunlong Lay, Timo Gerkmann, "A Fast Solver for Interpolating Stochastic Differential Equation Diffusion Models for Speech Restoration", ISCA Interspeech (Long Paper), Sydney, Australia, Sep. 2026. [arxiv]
Danilo de Oliveira, Tal Peer, Timo Gerkmann, "Too Good to Be True: A Study on Modern Automatic Speech Recognition for the Evaluation of Speech Enhancement", ISCA Interspeech, Sydney, Australia, Sep. 2026. [arxiv]
Sina Khanagha, Timo Gerkmann, "Your U-Net Dereverberation Model is Secretly an RIR Encoder", ISCA Interspeech, Sydney, Australia, Sep. 2026. [arxiv]
Renzheng Shi, Simon Welker, Timo Gerkmann, Tim Fingscheidt, "EffVOC: Low-Delay Efficient Speech Waveform Reconstruction from Spectral Representations Without Phase", ISCA Interspeech, Sydney, Australia, Sep. 2026.
Rostislav Makarov, Timo Gerkmann, "Repurposing a Speech Classifier for Guided Diffusion-Based Speech Generation", ISCA Interspeech, Sydney, Australia, Sep. 2026. [arxiv]
Rostislav Makarov, Lea Schönherr, Timo Gerkmann, "Are Modern Speech Enhancement Systems Vulnerable to Adversarial Attacks?", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [audio], [arxiv]
Danilo de Oliveira, Tal Peer, Jonas Rochdi, Timo Gerkmann, "Are These Even Words? Quantifying the Gibberishness of Generative Speech Models", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [audio], [arxiv]
Simon Welker, Tal Peer, Timo Gerkmann, "Real-Time Streaming Mel Vocoding with Generative Flow Matching", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [arxiv] [code]
Jakob Kienegger, Timo Gerkmann, "Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [audio], [arxiv]
Julius Richter, Danilo de Oliveira, Timo Gerkmann, "Do We Need EMA for Diffusion-Based Speech Enhancement? Toward a Magnitude-Preserving Network Architecture", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [arxiv]
Sina Khanagha, Bunlong Lay, Timo Gerkmann , "Bone-Conduction Guided Multimodal Speech Enhancement with Conditional Diffusion Models", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2026. [arxiv]

2025
Navin Raj Prabhu, Danilo de Oliveira, Nale Lehmann-Willenbrock, Timo Gerkmann, "Enhancing In-the-Wild Speech Emotion Conversion with Resynthesis-based Duration Modeling", IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), Honolulu, Hawaii, USA, Dec. 2025.
Jakob Kienegger, Alina Mannanova, Hujian Fang, Timo Gerkmann, "Self-Steering Deep Non-Linear Spatially Selective Filters for Efficient Extraction of Moving Speakers under Weak Guidance", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Tahoe City, USA, Oct. 2025. [arxiv], [video]
Danilo de Oliveira, Julius Richter, Jean-Marie Lemercier, Simon Welker, Timo Gerkmann, "Non-intrusive Speech Quality Assessment with Diffusion Models Trained on Clean Speech", Proc. of Interspeech, Rotterdam, The Netherlands, Aug. 2025. [doi], [arxiv], [code]
Jakob Kienegger, Timo Gerkmann, "Steering Deep Non-Linear Spatially Selective Filters for Weakly Guided Extraction of Moving Speakers in Dynamic Scenarios", Proc. of Interspeech, Rotterdam, The Netherlands, Aug. 2025. [doi], [arxiv], [video]
Bunlong Lay, Rostilav Makarov, Timo Gerkmann, "Diffusion Buffer: Online Diffusion-based Speech Enhancement with Sub-Second Latency", Proc. of Interspeech, Rotterdam, The Netherlands, Aug. 2025. [doi], [arxiv], [video]
Simon Welker, Matthew Le, Ricky T. Q. Chen, Wei-Ning Hsu, Timo Gerkmann, Alexander Richard, Yi-Chiao Wu, "FlowDec: A flow-based full-band general audio codec with high perceptual quality," International Conference on Learning Representations (ICLR), Singapore, Apr. 2025. [openreview] [code] [audio]
Julius Richter, Danilo de Oliveira, Timo Gerkmann, "Investigating Training Objectives for Generative Speech Enhancement," IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Hyderabad, India, Apr. 2025. [arxiv] [audio] [code]
Etienne Thuillier, Jean-Marie Lemercier, Eloi Moliner, Timo Gerkmann, Vesa Välimäki, "HRTF Estimation using a Score-based Prior", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Hyderabad, India, Apr. 2025. [arxiv]
Jakob Kienegger, Alina Mannanova and Timo Gerkmann, "Mask-Weighted Spatial Likelihood Coding for Speaker-Independent Joint Localization and Mask Estimation", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Hyderabad, India, Apr. 2025. [arxiv]

2024
Jean-Marie Lemercier, Simon Rouard, Jade Copet, Yossi Adi, Alexandre Defossez, “An Independence-promoting Loss for Music Generation with Language Models”, Proc. Int. Conf. Machine Learning (ICML), Vienna, Austria, Jul. 2024.
Alina Mannanova, Kristina Tesch, Jean-Marie Lemercier, Timo Gerkmann, "Meta-Learning for Variable Array Configurations in End-to-End Few-Shot Multichannel Speech Enhancement", Int. Workshop on Acoustic Enhancement (IWAENC), Aalborg, Denmark, Sep. 2024. [doi]
Eloi Moliner, Jean-Marie Lemercier, Simon Welker, Timo Gerkmann, Vesa Välimäki, "Buddy: Single-Channel Blind Unsupervised Dereverberation with Diffusion Models", Int. Workshop on Acoustic Enhancement (IWAENC), Aalborg, Denmark, Sep. 2024. Best student paper award. [doi], [arxiv]
Danilo de Oliveira, Eric Grinstein, Patrick Naylor, Timo Gerkmann, "Laser: Language-Queried Speech Enhancer", Int. Workshop on Acoustic Enhancement (IWAENC), Aalborg, Denmark, Sep. 2024. [doi]
Bunlong Lay, Sebastian Zaczek, Timo Gerkmann, "Robustness of Speech Separation Models for Similar-pitch Speakers", Int. Workshop on Acoustic Enhancement (IWAENC), Aalborg, Denmark, Sep. 2024. [doi]
Huajian Fang, Timo Gerkmann, "Uncertainty-Based Remixing for Unsupervised Domain Adaptation in Deep Speech Enhancement", Int. Workshop on Acoustic Enhancement (IWAENC), Aalborg, Denmark, Sep. 2024. [doi]
Julius Richter, Yi-Chiao Wu, Steven Krenn, Simon Welker, Bunlong Lay, Shinji Watanabe, Alexander Richard, Timo Gerkmann, "EARS: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation", Proc. of Interspeech, Kos, Greece, Sep. 2024. [doi], [arxiv], [audio], [code]
Bunlong Lay, Timo Gerkmann, "An Analysis of the Variance of Diffusion-based Speech Enhancement", Proc. of Interspeech, Kos, Greece, Sep. 2024. [doi], [arxiv], [audio]
Danilo de Oliveira, Simon Welker, Julius Richter, Timo Gerkmann, "The PESQetarian: On the Relevance of Goodhart's Law for Speech Enhancement", Proc. of Interspeech, Kos, Greece, Sep. 2024. [doi], [arxiv], [audio]
Bunlong Lay, Jean-Marie Lemercier, Julius Richter, Timo Gerkmann, "Single and Few-Step Diffusion for Generative Speech Enhancement", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Seoul, South Korea, Apr. 2024. [doi], [arxiv], [audio], [code]
Simon Welker, Tal Peer, Henry N. Chapman, Timo Gerkmann, "Live Iterative Ptychography with Projection-Based Algorithms", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Seoul, South Korea, Apr. 2024. [doi], [arxiv]
Tal Peer, Simon Welker, Johannes Kolhoff, Timo Gerkmann, "A Flexible Online Framework for Projection-Based Stft Phase Retrieval", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Seoul, South Korea, Apr. 2024. [doi], [arxiv]
Navin Raj Prabhu, Bunlong Lay, Simon Welker, Nale Lehmann-Willenbrock, Timo Gerkmann, "EMOCONV-Diff: Diffusion-Based Speech Emotion Conversion for Non-Parallel and in-the-Wild Data", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Seoul, South Korea, Apr. 2024. [doi], [arxiv]
Danilo de Oliveira, Timo Gerkmann, "Distilling Hubert with LSTMs via Decoupled Knowledge Distillation", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Seoul, South Korea, Apr. 2024. [doi], [arxiv]

2023
Jean-Marie Lemercier, Simon Welker, Timo Gerkmann, "Diffusion Posterior Sampling for Informed Single-Channel Dereverberation", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct, 2023. [arxiv]
Julius Richter, Simone Frintrop, Timo Gerkmann, "Audio-Visual Speech Enhancement with Score-Based Generative Models", ITG Speech Communication, Aachen, Germany, Sep. 2023. [doi][arxiv] [audio]
Danilo de Oliveira, Julius Richter, Jean-Marie Lemercier, Tal Peer, Timo Gerkmann, "On the Behavior of Intrusive and Non-Intrusive Speech Enhancement Metrics in Predictive and Generative Settings", ITG Speech Communication, Aachen, Germany, Sep. 2023. [doi][arxiv]
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann, "Wind Noise Reduction with a Diffusion-based Stochastic Regeneration Model", ITG Speech Communication, Aachen, Germany, Sep. 2023. [doi][arxiv][audio][code]
Huajian Fang, Simone Frintrop and Timo Gerkmann, "Uncertainty-Driven Hybrid Fusion for Audio-Visual Phoneme Recognition", ITG Speech Communication, Aachen, Germany, Sep. 2023. [doi]
Navin Raj Prabhu, Nale Lehmann-Willenbrock and Timo Gerkmann, "In-the-wild Speech Emotion Conversion Using Disentangled Self-Supervised Representations and Neural Vocoder-based Resynthesis", ITG Speech Communication, Aachen, Germany, Sep. 2023. [doi][arxiv]
Ehsan Yaghoubi, André Kelm, Timo Gerkmann, Simone Frintrop, "Acoustic and Visual Knowledge Distillation for Contrastive Audio-Visual Localization", ACM International Conference on Multimodal Interaction, Paris, France, Oct. 2023
Bunlong Lay, Simon Welker, Julius Richter, Timo Gerkmann, "Reducing the Prior Mismatch of Stochastic Differential Equations for Diffusion-based Speech Enhancement", Proc. of Interspeech, Dublin, Ireland, Aug. 2023. [arxiv][code][audio]
Danilo de Oliveira, Navin Raj Prabhu, Timo Gerkmann, "Leveraging Semantic Information for Efficient Self-Supervised Emotion Recognition with Audio-Textual Distilled Models", Proc. of Interspeech, Dublin, Ireland, Aug. 2023. [arxiv]
Hector Martel, Julius Richter, Kai Li, Xiaolin Hu, Timo Gerkmann, "Audio-Visual Speech Separation in Noisy Environments with a Lightweight Iterative Model", Proc. of Interspeech, Dublin, Ireland, Aug. 2023.
Jean-Marie Lemercier, Julian Tobergte, Timo Gerkmann, "Extending DNN-based Multiplicative Masking to Deep Subband Filtering for Improved Dereverberation", Proc. of Interspeech, Dublin, Ireland, Aug. 2023. [arxiv]
Julius Richter, Simon Welker, Jean-Marie Lemercier, Bunlong Lay, Tal Peer, Timo Gerkmann, "Speech Signal Improvement Using Causal Generative Diffusion Models", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi] [audio]
Kristina Tesch, Timo Gerkmann, "Spatially Selective Deep Non-linear Filters for Speaker Extraction", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi]
Tal Peer, Simon Welker, Timo Gerkmann, "DiffPhase: Generative Diffusion-based STFT Phase Retrieval", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi] [audio] [code]
Jean-Marie Lemercier, Julius Richter, Simon Welker, Timo Gerkmann, "Analysing Diffusion-based Generative Approaches versus Discriminative Approaches for Speech Restoration", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi] [code]
Huajian Fang, Niklas Wittmer, Johannes Twiefel, Stefan Wermter, Timo Gerkmann, "Partially Adaptive Multichannel Joint Reduction of Ego-noise and Environmental Noise", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi]
Huajian Fang, Timo Gerkmann, "Uncertainty Estimation in Deep Speech Enhancement Using Complex Gaussian Mixture Models", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Rhodes Island, Greece, Jun 2023. [arxiv] [doi]

2022
Simon Welker, Henry N. Chapman, Timo Gerkmann, "Blind Drifting: Diffusion models with a linear SDE drift term for blind image restoration tasks", NeurIPS Workshop DLDE (Spotlight), 2022. [download]
Navin Raj Prabhu, Nale Lehmann-Willenbrock, Timo Gerkmann, "Label Uncertainty Modeling and Prediction for Speech Emotion Recognition using t-Distributions", Affective Computing and Intelligent Interaction (ACII), Nara, Japan, Oct. 2022 [doi][arxiv]
Bunlong Lay, Timo Gerkmann, "Speech Enhancement Regularized by a Speaker Verification Model", Int. Workshop on Multimedia Signal Processing (MMSP), Shanghai, China, Sep. 2022. [doi]
Tal Peer, Simon Welker, Timo Gerkmann, "Beyond Griffin-Lim: Improved Iterative Phase Retrieval for Speech", Int. Workshop on Acoustic Signal Enhancement (IWAENC), Bamberg, Germany, Sep. 2022 [arxiv] [doi]
Kristina Tesch, Nils-Hendrik Mohrmann, Timo Gerkmann, "On the Role of Spatial, Spectral, and Temporal Processing for DNN-based Non-linear Multi-channel Speech Enhancement", ISCA Interspeech, Incheon, Korea, Sep. 2022 [arxiv] [audio] [doi]
Navin Raj Prabhu, Guillaume Carbajal, Nale Lehmann-Willenbrock, Timo Gerkmann, "End-To-End Label Uncertainty Modeling for Speech-based Arousal Recognition Using Bayesian Neural Networks", ISCA Interspeech, Incheon, Korea, Sep. 2022 [arxiv] [doi]
Simon Welker, Julius Richter, Timo Gerkmann, "Speech Enhancement with Score-Based Generative Models in the Complex STFT Domain", ISCA Interspeech, Incheon, Korea, Sep. 2022 [arxiv] [audio] [doi]
Danilo de Oliveira, Tal Peer, Timo Gerkmann, "Efficient Transformer-based Speech Enhancement Using Long Frames and STFT Magnitudes", ISCA Interspeech, Incheon, Korea, Sep. 2022 [arxiv] [audio] [doi]
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann, "Neural Network-augmented Kalman Filtering for Robust Online Speech Dereverberation in Noisy Reverberant Environments", ISCA Interspeech, Incheon, Korea, Sep. 2022 [arxiv][doi]
Julius Richter, Jeanine Liebold, Timo Gerkmann, "Continuous Phoneme Recognition based on Audio-Visual Modality Fusion", IEEE World Congress on Computational Intelligence, Padua, Italy, Jul. 2022. [doi]
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann, "Customizable End-To-End Optimization Of Online Neural Network-Supported Dereverberation For Hearing Devices", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Singapore, May 2022. [doi] [arxiv] [download][audio]
Simon Welker, Tal Peer, Henry Chapman, Timo Gerkmann, "Deep Iterative Phase Retrieval For Ptychography", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Singapore, May 2022. [doi] [arxiv] [download]
Huajian Fang, Tal Peer, Stefan Wermter, Timo Gerkmann, "Integrating Statistical Uncertainty Into Neural Network-Based Speech Enhancement", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Singapore, May 2022. [doi][arxiv]

2021
Xiaolin Hu, Kai Li, Weiyi Zhang, Yi Luo, Jean-Marie Lemercier, Timo Gerkmann, "Speech Separation Using an Asynchronous Fully Recurrent Convolutional Neural Network", NeurIPS, Dec. 2021. [download]
Guillaume Carbajal, Julius Richter, Timo Gerkmann,"Disentanglement Learning for Variational Autoencoders Applied to Audio-Visual Speech Enhancement", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2021. [arxiv][doi]
Danu Caus, Guillaume Carbajal, Timo Gerkmann, Simone Frintrop, "See the silence: improving visual-only voice activity detection by optical flow and RGB fusion", Int. Conference on Computer Vision Systems (ICVS), Sep. 2021. [download]
Tal Peer, Timo Gerkmann, "Intelligibility Prediction of Speech Reconstructed From Its Magnitude or Phase", ITG Conference on Speech Communication, Kiel, Germany, Sep. 2021.
Tal Peer, Klaus-Johan Ziegert, Timo Gerkmann, "Plosive Enhancement using Phase Linearization and Smoothing", ITG Conference on Speech Communication, Kiel, Germany, Sep. 2021.
Jean-Marie Lemercier, Leroy Bartel, David Ditter and Timo Gerkmann, "An Integrated Deep-Clustering Based System for Speaker Count Agnostic Speech Separation", ITG Conference on Speech Communication, Kiel, Germany, Sep. 2021.
Huajian Fang, Guillaume Carbajal, Stefan Wermter and Timo Gerkmann, "Joint Reduction of Ego-noise and Environmental Noise with a Partially-adaptive Dictionary", ITG Conference on Speech Communication, Kiel, Germany, Sep. 2021.
Guillaume Carbajal, Julius Richter, Timo Gerkmann,"Guided Variational Autoencoder for Speech Enhancement with a Supervised Classifier", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Toronto, Ontario, Canada, Jun. 2021. [doi][arxiv]
Huajian Fang, Guillaume Carbajal, Stefan Wermter, Timo Gerkmann, "Variational Autoencoder for Speech Enhancement With a Noise-Aware Encoder", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Toronto, Ontario, Canada, Jun. 2021. [doi][arxiv]
Tobias Knopp, Mirco Grosser, Matthias Graeser, Timo Gerkmann, Martin Möddel, "Dictionary-Based Background Signal Estimation for Magnetic Particle Imaging", IEEE International Symposium on Biomedical Imaging (ISBI), Apr. 2021. [doi]

2020
Julius Richter, Guillaume Carbajal, Timo Gerkmann, "Speech Enhancement with Stochastic Temporal Convolutional Networks", ISCA Interspeech, Shanghai, China, Oct. 2020. [doi] [download] [audio]
Pariente, M., Cornell, S., Cosentino, J., Sivasankaran, S., Tzinis, E., Heitkaemper, J., Olvera, M., Stöter, F., Hu, M., Martín-Doñas, J.M., Ditter, D., Frank, A., Deleforge, A., Vincent, E. "Asteroid: The PyTorch-Based Audio Source Separation Toolkit for Researchers", ISCA Interspeech, Shanghai, China, Oct. 2020. [doi] [download] [code]
Quan Nguyen, Julius Richter, Mikko Lauri, Timo Gerkmann, Simone Frintrop, "Improving mix-and-separate training in audio-visual sound source separation with an object prior", ICPR 2020. [doi] [download]
Hongzhuo Liang, Chuangchuang Zhou, Shuang Li, Xiaojian Ma, Norman Hendrich, Timo Gerkmann, Fuchun Sun, Marcus Stoffel, Jianwei Zhang, "Robust Robotic Pouring Using Audition and Haptics", IEEE/RSJ IROS 2020, Las Vegas, USA, Oct 2020. [doi] [arxiv]
Kristina Tesch, Timo Gerkmann, "Nonlinear Spatial Filtering for Multichannel Speech Enhancement in Inhomogeneous Noise Fields", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2020. [doi] [download]
David Ditter, Timo Gerkmann, "A Multi-Phase Gammatone Filterbank for Speech Separation via TasNet", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Barcelona, Spain, May 2020. [doi] [download] [code]

2019
Kristina Tesch, Robert Rehr, Timo Gerkmann, "On Nonlinear Spatial Filtering in Multichannel Speech Enhancement", ISCA Interspeech, Graz, Austria, Sep. 2019. [doi] [download]
David Ditter, Timo Gerkmann. "Influence of Speaker-Specific Parameters on Speech Separation Systems", ISCA Interspeech, Graz, Austria, Sep. 2019. [doi] [download]
Hongzhuo Liang, Shuang Li, Xiaojian Ma, Norman Hendrich, Timo Gerkmann, Jianwei Zhang, "Making Sense of Audio Vibration for Liquid Height Estimation in Robotic Pouring", IEEE/RSJ Int. Conf. Intelligent Robots and Systems (IROS), Macau, China, Nov. 2019. [doi], [arxiv], [video]
Robert Rehr, Timo Gerkmann, "An Analysis of Noise-aware Features in Combination with the Size and Diversity of Training Data for DNN-based Speech Enhancement", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Brighton, UK, May 2019. [doi] [download]

2018
Robert Rehr, Timo Gerkmann, "Robust DNN-Based Speech Enhancement with Limited Training Data", ITG Conference on Speech Communication, Oldenburg, Germany, Oct. 2018. [download]
Martin Krawczyk-Becker, Timo Gerkmann, "A Study on the Benefits of Phase-Aware Speech Enhancement in Challenging Noise Scenarios", Int. Conf. Latent Variable Analysis and Signal Separation (LVA ICA), Guildford, UK, Jul. 2018. [doi] [download]
Martin Krawczyk-Becker, Timo Gerkmann, "Nonlinear Speech Enhancement Under Speech PSD Uncertainty", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Calgary, Canada, Apr. 2018. [doi] [download]
Huy Phan, Martin Krawczyk-Becker, Timo Gerkmann, Alfred Mertins, "Weighted and Multi-Task Loss for Rare Audio Event Detection", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Calgary, Canada, Apr. 2018". [doi] [download]

2017
Robert Rehr, Timo Gerkmann, "MixMax Approximation as a Super-Gaussian Log-Spectral Amplitude Estimator for Speech Enhancement", ISCA Interspeech, Stockholm, Sweden, Aug. 2017. [doi] [download][audio]

2016
Robert Rehr, Timo Gerkmann, "A Combination of Pre-Trained Approaches and Generic Methods for an Improved Speech Enhancement", ITG Conference on Speech Communication, Paderborn, Germany, Oct. 2016. [download]
Dörte Fischer, Simon Doclo and Emanuel A. P. Habets, Timo Gerkmann, "Combined Single-Microphone Wiener and MVDR Filtering based on Speech Interframe Correlations and Speech Presence Probability", ITG Conference on Speech Communication, Paderborn, Germany, Oct. 2016. [download]
Ante Jukić, Zichao Wang, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "Constrained multi-channel linear prediction for adaptive speech dereverberation", Int. Workshop on Acoustic Signal Enhancement (IWAENC), Xi'an, China, Sept. 2016. [doi] [download]
Christoph Brauer, Timo Gerkmann, Dirk Lorenz, "Sparse Reconstruction of Quantized Speech Signals", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Shanghai, China, Mar. 2016. [doi] [download]
Robert Rehr, Timo Gerkmann, "Bias Correction Methods for Adaptive Recursive Smoothing With Applications in Noise PSD Estimation", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Shanghai, China, Mar. 2016. [doi] [download]
Benjamin Cauchi, Hamza Javed, Timo Gerkmann, Simon Doclo, Stefan Goetze, Patrick A. Naylor, "Perceptual and Instrumental Evaluation of the Perceived Level of Reverberation ", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Shanghai, China, Mar. 2016. [doi] [download]
Dörte Fischer, Timo Gerkmann, "Single-Microphone Speech Enhancement Using MVDR Filtering and Wiener Post-Filtering", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Shanghai, China, Mar. 2016. [doi] [download]
Benjamin Cauchi, Timo Gerkmann, Simon Doclo, Patrick A. Naylor, Stefan Goetze, "Spectrally and spatially informed noise suppression using beamforming and convolutive NMF", AES 60th Conference, Leuven, Belgium, Feb. 2016.
Naveen Kumar Desiraju, Simon Doclo, Markus Buck, Timo Gerkmann, Tobias Wolff, "On determining optimal reverberation parameters for late residual echo suppression", AES 60th Conference, Leuven, Belgium, Feb. 2016.
Ante Jukic, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "A general framework for multi-channel speech dereverberation exploiting sparsity", AES 60th Conference, Leuven, Belgium, Feb. 2016.
2015
Robert Rehr, Timo Gerkmann, "On the Bias of Adaptive First-Order Recursive Smoothing", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2015. [doi] [download]
Martin Krawczyk-Becker, Timo Gerkmann, "MMSE-Optimal Combination of Wiener Filtering and Harmonic Model Based Speech Enhancement in a General Framework", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2015. [doi] [download]
Ante Jukić, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "Group sparsity for MIMO speech dereverberation", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2015. [doi] [download]
Sidsel Marie Nørholm, Martin Krawczyk-Becker, Timo Gerkmann, Steven van de Par, Jesper Rindom Jensen, Mads Græsbøll Christensen, "Least Squares Estimate of the Initial Phases in STFT based Speech Enhancement", in ISCA Interspeech, Dresden, Germany, Sep. 2015. [doi] [download]
Benjamin Cauchi, Patrick Naylor, Timo Gerkmann, Simon Doclo, Stefan Goetze, "Late Reverberant Spectral Variance Estimation Using Acoustic Channel Equalization", in European Signal Processing Conference (EUSIPCO), Nice, France, Sep. 2015. [doi] [download]
Robert Rehr, Timo Gerkmann, "Cepstral Noise Subtraction for Robust Automatic Speech Recognition", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Brisbane, Australia, Apr. 2015. [doi] [download]
Martin Krawczyk-Becker, Dörte Fischer, Timo Gerkmann, "Utilizing Spectro-temporal Correlations for an Improved Speech Presence Probability Based Noise Power Estimation", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Brisbane, Australia, Apr. 2015. [doi] [download]
Ante Jukić, Nasser Mohammadiha, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "Multi-channel Linear Prediction-based Speech Dereverberation with Low-rank Power Spectrogram Approximation", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Brisbane, Australia, Apr. 2015. [doi] [download]
Adam Kuklasiński, Simon Doclo, Timo Gerkmann, Søren Holdt Jensen, Jesper Jensen, "Multi-channel PSD Estimators for Speech Dereverberation: A Theoretical and Experimental Comparison", in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Brisbane, Australia, Apr. 2015. [doi] [download]
2014
Tobias May, Timo Gerkmann, "Generalization of supervised learning for binary mask estimation", International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 155-159, Antibes, France, Sep. 2014. [doi] [download]
Balazs Fodor, Timo Gerkmann, ”A Posteriori Speech Presence Probability Estimation Based on Averaged Observations and a Super-Gaussian Speech Model”, International Workshop on Acoustic Signal Enhancement (IWAENC), Antibes, France, Sep. 2014. [doi] [download]
Stefan Goetze, Anna Warzybok, Ina Kodrasi, Jan Ole Jungmann, Benjamin Cauchi, Jan Rennies, Emanuel Habets, Alfred Mertins, Timo Gerkmann, Simon Doclo, Birger Kollmeier, "A Study on Speech Quality and Speech Intelligibility Measures for Quality Assessment of Single-Channel Dereverberation Algorithms", International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 234-238, Antibes, France, Sep. 2014. [doi] [download]
Anna Warzybok, Ina Kodrasi, Jan Ole Jungmann, Emanuel Habets, Timo Gerkmann, Alfred Mertins, Simon Doclo, Birger Kollmeier, Stefan Goetze, "Subjective Speech Quality and Speech Intelligibility Evaluation of Single-Channel Dereverberation Algorithms", International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 333-337, Antibes, France, Sep. 2014. [doi] [download]
Steffen Kortlang, Stephan Ewert, Timo Gerkmann, "Single Channel Noise Reduction based on an Auditory Filterbank", International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 284--288, Antibes, France, Sep. 2014. [doi] [download]
Ante Jukic, Toon van Waterschoot, Timo Gerkmann, Simon Doclo, "Speech dereverberation with convolutive transfer function approximation using MAP and variational deconvolution approaches", International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 51-55, Antibes, France, Sep. 2014. [doi] [download]
Balazs Fodor, Timo Gerkmann, "A Speech Presence Probability Estimator Based on Fixed Priors and a Heavy-Tailed Speech Model", European Signal Processing Conference (EUSIPCO), Lisbon Portugal, Sep. 2014. [download]
Naveen K. Desiraju, Simon Doclo , Timo Gerkmann, Tobias Wolff, "Efficient Multi-Channel Acoustic Echo Cancellation Using Constrained Sparse Filter Updates in the Subband Domain", ITG Fachtagung Sprachkommunikation, Sep. 2014. [download]
Timo Gerkmann, “MMSE-optimal enhancement of complex speech coefficients with uncertain prior knowledge of the clean speech phase,” in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Florence, Italy, May 2014. [Audio] [doi] [download]
Ina Kodrasi, Timo Gerkmann, and Simon Doclo, “Frequency-domain single-channel inverse filtering for speech dereverberation: Theory and practice,” in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Florence, Italy, May 2014. [doi] [download]
Robert Rehr, Martin Krawczyk, and Timo Gerkmann, “A posteriori voiced / unvoiced probability estimation based on a sinusoidal model,” in IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Florence, Italy, May 2014. [doi] [download]
Ante Jukic, Toon van Waterschoot, Timo Gerkmann, and Simon Doclo, “Speech dereverberation with multi-channel linear prediction and sparse priors for the desired signal,” in Hands-free Speech Communication and Microphone Arrays (HSCMA), Nancy, France, May 2014. [doi] [download]
Benjamin Cauchi, Ina Kodrasi, Robert Rehr, Stephan Gerlach, Ante Jukic, Timo Gerkmann, Simon Doclo, and Stefan Goetze, “Joint dereverberation and noise reduction using beamforming and a single-channel speech enhancement scheme,” in The REVERB challenge, Florence, Italy, May 2014. [download]
Feifei Xiong, Niko Moritz, Robert Rehr, Joern Anemueller, Bernd Meyer, Timo Gerkmann, Simon Doclo, and Stefan Goetze, “Robust ASR in reverberant environments using temporal cepstrum smoothing for speech enhancement and an amplitude modulation filterbank for feature extraction,” in The REVERB challenge, Florence, Italy, May 2014. [download]
2013
Martin Krawczyk, Robert Rehr, Timo Gerkmann, "Phase-Sensitive Real-Time Capable Speech Enhancement Under Voiced-Unvoiced Uncertainty", European Signal Processing Conference (EUSIPCO), Marrakech, Morocco, Sep 2013, invited paper. [download]
Richard Hendriks, Zeki Erkin, Timo Gerkmann, "Privacy Preserving Distributed Beamforming Based on Homomorphic Encryption", European Signal Processing Conference (EUSIPCO), Marrakech, Morocco, Sep 2013, invited paper. [download]
Niko Moritz, Marc R. Schädler, Kamil Adiloglu, Bernd T. Meyer, Tim Jürgens, Timo Gerkmann, Birger Kollmeier, Simon Doclo, Stefan Goetze, "Noise Robust Distant Automatic Speech Recognition Utilizing NMF Based Source Separation and Auditory Feature Extraction", 2nd Int. Workshop Machine Listening in Multisource Environments (CHIME), Vancouver, Canada, Jun. 2013. [doi] [download]
Ramón Astudillo, Timo Gerkmann, "On the Relation Between Speech Corruption Models in the Spectral and the Cepstral Domain", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Vancouver, Canada, May 2013. [doi] [download]
Richard Hendriks, Zekeriya Erkin, Timo Gerkmann, "Privacy-preserving Distributed Speech Enhancement for Wireless Sensor Networks by Processing in the Encrypted Domain", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Vancouver, Canada, May 2013. [doi] [download]
2012
Timo Gerkmann, Martin Krawczyk, Robert Rehr, "Phase estimation in speech enhancement - unimportant, important, or impossible?", IEEE Convention of Electrical and Electronics Engineers in Israel, Eilat, Israel, Nov. 2012. [doi] [download]
Martin Krawczyk, Timo Gerkmann, "STFT Phase Improvement for Single Channel Speech Enhancement", Int. Workshop Acoust. Signal Enhancement (IWAENC), Aachen, Germany, Sep. 2012. [download]
Timo Gerkmann, Richard C. Hendriks, "Improved MMSE-Based Noise PSD Tracking Using Temporal Cepstrum Smoothing", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Kyoto, Japan, Mar. 2012. [Audio] [doi] [download]
2011
Jalil Taghia, Timo Gerkmann, Arne Leijon, "Blind Source Separation of Nondisjoint Sources in the Time-Frequency Domain with Model-based Determination of Source Contribution", IEEE International Symposium on Signal Processing and Information Technology, Bilbao, Spain, Dec. 2011. [doi] [download]
Nasser Mohammadiha, Timo Gerkmann, Arne Leijon, "A New Approach for Speech Enhancement Based on a Constrained Nonnegative Matrix Factorization", IEEE International Symposium on Intelligent Signal Processing and Communication Systems, Chiangmai, Thailand, Dec. 2011. [doi] [download]
Timo Gerkmann, Richard C. Hendriks, "Noise Power Estimation Based on the Probability of Speech Presence", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2011.
[Audio+Code] [doi] [download]
Nasser Mohammadiha, Timo Gerkmann, Arne Leijon, "A New Linear MMSE Filter for Single Channel Speech Enhancement Based on Nonnegative Matrix Factorization", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, NY, USA, Oct. 2011. [doi] [download]
Timo Gerkmann, "Cepstral Weighting for Speech Dereverberation Without Musical Noise", European Signal Processing Conference (EUSIPCO), Barcelona, Spain, Sep. 2011. [Audio] [doi] [download]
Richard C. Hendriks, Timo Gerkmann, "Estimation of the Noise Correlation Matrix", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Prague, Czech Republic, May 2011. [doi] [download]
2010
Timo Gerkmann, Rainer Martin, "Cepstral smoothing with reduced computational complexity", ITG-Fachtagung Sprachkommunikation, Bochum, Germany, Oct. 2010.
Timo Gerkmann, Rainer Martin, "Empirical Distributions of DFT-Domain Speech Coefficients Based on Estimated Speech Variances", Int. Workshop on Acoustic Echo and Noise Control, Tel Aviv, Israel, Aug. 2010. [download]
Anil Nagathil, Timo Gerkmann, Rainer Martin, "Musical Genre Classification Based on a Highly-resolved Cepstral Modulation Spectrum", European Signal Processing Conference, Aalborg, Denmark, Aug. 2010. [download]
Timo Gerkmann, Martin Krawczyk, Rainer Martin, "Speech presence probability estimation based on temporal cepstrum smoothing", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Dallas, TX, USA, Mar. 2010. [download]
2009
Timo Gerkmann, Rainer Martin, Derya Dalga, "Multi-Microphone Maximum A Posteriori Fundamental Frequency Estimation in the Cepstral Domain ", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Taipei, Taiwan, Apr. 2009. [doi] [download]
2008
Dirk Mauler, Timo Gerkmann, Rainer Martin, "An Analysis of Quefrency Selective Temporal Smoothing of the Cepstrum in Speech Enhancement", Int. Workshop on Acoustic Echo and Noise Control, Seattle, WA, USA, Sep. 2008. [download]
Colin Breithaupt, Timo Gerkmann, Rainer Martin, "A Novel A Priori SNR Estimation Approach Based on Selective Cepstro-Temporal Smoothing", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Las Vegas, NV, USA, Apr. 2008. [doi] [download]
Timo Gerkmann, Colin Breithaupt, Rainer Martin, "Bias Compensation for Cepstro-Temporal Smoothing of Spectral Filter Gains", ITG-Fachtagung Sprachkommunikation, Aachen, Germany, Jan. 2008. [download]
2006
Timo Gerkmann, Rainer Martin, "Soft Decision Combining for Dual Channel Noise Reduction", ISCA Interspeech, Pittsburgh, PA, USA, Sep. 2006. [download]
Justinian Rosca, Timo Gerkmann, Doru-Cristian Balcan, "Statistical Inference of Missing Speech Data in the ICA Domain", IEEE Int. Conf. Acoust., Speech, Signal Process. (ICASSP), Toulouse, France, May 2006. [doi] [download]

Abstracts, Demos, Keynotes

Simon Welker, Bunlong Lay, Maris Hillemann, Tal Peer, Timo Gerkmann, "Flow matching for real-time joint speech enhancement and bandwidth extension," Show-and-Tell Demo at IEEE ICASSP, Barcelona, Spain, April 2026. [info] [paper] [video]
Simon Welker, Maris Hillemann, Tal Peer, Timo Gerkmann, "Real-Time Diffusion Demo for Speech Enhancement with 48ms Latency," Demo at ITG Conference on Speech Communication, Berlin, Germany, September 2025. [paper] [video]
Danilo de Oliveira, Julius Richter, Tal Peer, Timo Gerkmann, "Demonstration of LipDiffuser: Lip-to-Speech Generation with Conditional Diffusion Models Running on a Portable Device," Demo at WASPAA 2025, Tahoe City, CA, USA, October 2025. [paper]
Danilo de Oliveira, Julius Richter, Tal Peer, Timo Gerkmann, "Demonstration of LipDiffuser: Lip-to-Speech Generation with Conditional Diffusion Models Running on a Portable Device," Demo at ITG Conference on Speech Communication, Berlin, Germany, September 2025. [paper]
Julius Richter, Timo Gerkmann, "Diffusion-based Speech Enhancement: Demonstration of Performance and Generalization," Demo at Audio Imagination NeurIPS 2024 Workshop, Vancouver, Canada, Dec. 2024. [openreview] [video]
Timo Gerkmann, "Next Generation Speech Enhancement: Generative Diffusion Models and End-to-End Multichannel Filtering", invited keynote, IWAENC, Aalborg, Denmark, Sep. 2024. [Download]
Timo Gerkmann, "Deep Learning Based Speech Enhancement", invited survey talk, Interspeech, Kos, Greece, Sep. 2024. [Download]
Timo Gerkmann, "Diffusion Models for Speech Enhancement and Restoration", Webinar of the IEEE AASP and Speech&Language Committees, Jun. 2024 [Download]
Kristina Tesch, Timo Gerkmann, "Spatially Selective Deep Non-linear Filters for Real-time Multi-channel Speech Enhancement", Demo at IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, Oct. 2023. [video]
Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning, Timo Gerkmann, "Subjective evaluation of DNN-assisted WPE dereverberation algorithms with end-to-end optimization", 25. Jahrestagung der Deutschen Gesellschaft für Audiologie (DGA), Cologne, Germany, Mar. 2023.
Timo Gerkmann, "Machine Learning for Speech Signal Processing on Hearing Devices", Int. Hearing Aid Research Conference (IHCON), Lake Tahoe, CA, USA, Aug. 2022, invited keynote. [download]
Timo Gerkmann, "Statistical Signal Processing and Machine Learning for Speech Enhancement", ITG Conference on Speech Communication, Kiel, Germany, Oct. 2021, invited keynote. [download]
Timo Gerkmann, "Phase-Aware Speech Processing", 46th Erlanger Kolloquium for audiological research and development, Erlangen, Germany, Feb. 2019, invited keynote. [download]
Robert Rehr, Timo Gerkmann, "On the Robustness of DNN-Based Speech Enhancement for Different Features and Training Sets", 46th Erlanger Kolloquium for audiological research and development, Erlangen, Germany, Feb. 2019.
Benjamin Cauchi, Ina Kodrasi, Robert Rehr, Stephan Gerlach, Ante Jukic, Jan Wellmann, Timo Gerkman, Simon Doclo, Stefan Goetze, "Joint noise reduction and dereverberation for speech enhancement in real-time applications", Real-time demonstration at AES 60th Conference, Leuven, Belgium, Feb. 2016.
R. M. Baumgärtel, M. Krawczyk-Becker, D. Marquardt, H. Hu, T. Herzke, G. Coleman, K. Adiloğlu, K. Bomke, K. Plotz, R. Huber, T. Gerkmann, S. Doclo, B. Kollmeier, V. Hohmann, M. Dietz, "Instrumental and perceptual assessment of binaural speech enhancement algorithms for bilateral CI users", Structured Session "Advanced Signal Processing Techniques for CI and hearing aids", 12th Congress of the European Federation of Audiology Societies, Istanbul, Turkey, 2015
Rainer Huber, Thomas Bisitz, Timo Gerkmann, Jürgen Kießling, Hartmut Meister, "Comparison of Single-channel Noise Reduction Schemes: Can Hearing Impaired Listeners Tell the Difference?", Int. Hearing Aid Research Conference (IHCON), Aug. 2014.
Robert Rehr, Martin Krawczyk, Timo Gerkmann, "A comparison of state-of-the-art speech fundamental frequency estimators in noisy and reverberant environments", DAGA Jahrestagung für Akustik, Mar. 2014.
R. M. Baumgärtel, M. Krawczyk-Becker, D. Marquardt, H. Hu, T. Herzke, G. Coleman, K. Adiloğlu, K. Bomke, K. Plotz, R. Huber, T. Gerkmann, S. Doclo, B. Kollmeier, V. Hohmann and M. Dietz, "Speech understanding in realistic noise environments using binaural signal pre-processing strategies in bilateral CI users", 13th International Conference on Cochlear Implants and Other Implantable Auditory Technologies (CI 2014), Munich, 2014.
R. M. Baumgärtel, D. Marquardt, M. Krawczyk-Becker, H. Hu, T. Herzke, G. Coleman, K. Adiloğlu, K. Bomke, K. Plotz, R. Huber, T. Gerkmann, S. Doclo, B. Kollmeier, V. Hohmann and M. Dietz, "Sprachverstehen bilateral implantierter Cochlea-Implantat-Träger in realistischen Störgeräuschen bei Benutzung binauraler Signalverarbeitungsstrategien", 17. Jahrestagung der Deutschen Gesellschaft für Audiologie, Oldenburg, 2014
Masoumeh Azarpour, Dominic Schmid, Rainer Martin, Timo Gerkmann, "An Evaluation of Binaural Noise and Reverberation Reduction Algorithms", AIA-DAGA Conference on Acoustics, Meran, Italy, Mar. 2013.
Timo Gerkmann, Martin Krawczyk, "Employing the Speech Spectral Phase for an Improved Single Channel Speech Enhancement", Erlanger Kolloquium, Erlangen, Germany, Feb. 2013.
Timo Gerkmann, Martin Krawczyk, Robert Rehr, "Phase Estimation for Single Channel Speech Enhancement: Meaningless, Important, or Impossible?", AUDIS Workshop, Aachen, Germany, Sep. 2012.
Timo Gerkmann, Colin Breithaupt, Dirk Mauler, Martin Krawczyk, Rainer Martin, "Real-time Speech Enhancement Using Temporal Cepstrum Smoothing", ICASSP Show and Tell, Dallas, TX, USA, Mar. 2010.
Timo Gerkmann, Rainer Martin, "On the Statistics of Cepstral Coefficients for Chi-Distributed Spectral Amplitudes", DAGStat, Dortmund, Germany, Mar. 2010.
Timo Gerkmann, Rainer Martin, "Cepstral Smoothing for Speech Enhancement without Musical Noise", Erlanger Kolloquium, Erlangen, Germany, Feb. 2010.
Anil Nagathil, Timo Gerkmann, Rainer Martin, "Cepstral Modulation Features for Classifying Audio Data", 36. Deutsche Jahrestagung für Akustik (DAGA), Berlin, Germany, Mar. 2010.

Granted Patents

Timo Gerkmann, Rainer Martin, Henning Puder, Wolfgang Sörgel: "Hearing Device and Method for Operating a Hearing Device with Two-stage Transformation", German Patent DE102010026884B4, granted Nov. 2013, US Patent US 8948424B2, granted Feb. 2015.
Timo Gerkmann and Rainer Martin: "Method for Determining Unbiased Signal Amplitude Estimates After Cepstral Variance Modification", United States Patent US8208666B2, granted Jun. 2012.
Timo Gerkmann, Colin Breithaupt, and Rainer Martin: "Method for Bias Compensation for Cepstro-Temporal Smoothing of Spectral Filter Gains", European Patent EP2151820B1, granted Oct. 2011, Danish Patent DK2151820T3, granted Feb. 2012, United States Patent US8271271B2, granted Sep. 2012.
Colin Breithaupt, Timo Gerkmann, and Rainer Martin: "Spectral Smoothing Method for Noisy Signals", European Patent EP2158588B1, granted Oct. 2010, Danish Patent DK2158588T3, granted Feb. 2011, US Patent US8892431B2, granted Nov. 2014.
Timo Gerkmann and Rainer Martin: "Method for Noise Reduction and Associated Hearing Device", German Patent DE102008031150B3, granted Nov. 2009.

Publications

Book Publications and Dissertations

Journals

2026

2015

2014

2013

2012

2011

2009

2008

2007

Peer-reviewed Conferences

2026

2018

2016

2015

2014

2013

2012

2011

2010

2009

2008

2006

Abstracts, Demos, Keynotes

Granted Patents