李海洲

教授

语言模型与人机交互中心主任

香港中文大学(深圳)

教育背景

教育经历（按时间倒序）：

1987.09-1990.07: 华南理工大学, 通信与电子系统, 博士
1984.09-1987.07: 华南理工大学, 通信与电子系统, 硕士
1980.09-1984.07: 华南理工大学, 无线电技术, 学士

工作经历（按时间倒序）：

2025.07 - 至今：香港中文大学（深圳）, 人工智能学院, 教授
2021.11 - 2025.06：香港中文大学（深圳）, 数据科学学院, 教授
2014.03 - 2021.11：新加坡国立大学, 电机与计算机工程系, 教授
2003.01 - 2016.01：新加坡科技研究局, 资讯通信研究院, 教授级高级工程师
2001.01 - 2003.01：言丰科技, 研究中心, 教授级高级工程师
1999.01 - 2001.01：Lernout & Hauspie, Asia Pacific office, 教授级高级工程师
1996.01 - 1999.01：苹果公司新加坡研究中心, 语音处理实验室, 教授级高级工程师
1994.01 - 1996.01：法国国家科学研究中心, 南锡计算机科学研究中心, 研究员
1991.01 - 1994.01：华南理工大学, 电子与信息学院, 副教授

研究领域

语音与语言处理、类脑计算、多模态大模型、人机交互、计算语言学、智慧医疗

个人网站

https://sai.cuhk.edu.cn/en/teacher/102

邮箱

haizhouli@slai.edu.cn

个人简介

李海洲，教授，新加坡工程院院士、IEEE Fellow、ISCA Fellow，现任深圳河套学院语言模型与人机交互中心主任、香港中文大学（深圳）人工智能学院院长、深圳市跨模态认知计算重点实验室主任。长期深耕语音与语言处理、类脑计算与多模态大模型，推动技术落地于智能语音、人机交互等领域。曾任新加坡国立大学终身教授、国际语音通信学会主席，指导苹果、百度、Lernout & Hauspie等企业核心语音产品开发，并曾获新加坡共和国学术界最高荣誉—总统科技奖。主持多项国家级重点项目，已培养50余名博士生，论文引用4万多次。欢迎国内外学者加入团队，推动语音语言智能及类脑计算产学研。

学术著作

代表性论文（近5-10年，按影响力排序）：

1. Siqi Cai, Zheyuan Lin, Xiaoli Liu, Wenjie Wei, Shuai Wang, Malu Zhang, Tanja Schultz, Haizhou Li. Spiking neural networks for EEG signal analysis: From theory to practice. Neural Networks, 2026, 194: 108127.
2. Rui Liu, Zhenqi Jia, Feilong Bao, Haizhou Li. Retrieval-Augmented Dialogue Knowledge Aggregation for Expressive Conversational Speech Synthesis. Information Fusion, 2025, 118: 102948.
3. Yidi Jiang, Ruijie Tao, Zhengyang Chen, Yanmin Qian, Haizhou Li. Target Speech Detection with Multimodal Prompts, IEEE Transactions on Audio, Speech and Language Processing, 2025, 33: 2788-2802.
4. Junyi Ao, Mehmet Sinan Yıldırım, Ruijie Tao, Meng Ge, Shuai Wang, Yanmin Qian, Haizhou Li. USED: Universal Speaker Extraction and Diarization, IEEE Transactions on Audio, Speech and Language Processing, 2025, 33: 96-110.
5. Sho Inoue, Kun Zhou, Shuai Wang, Haizhou Li. Hierarchical Control of Emotion Rendering in Speech Synthesis, IEEE Transactions on Affective Computing, 2025, 16(4): 3316-3328.
6. Wenxuan Wu, Xueyuan Chen, Shuai Wang, Jiadong Wang, Lingwei Meng, Xixin Wu, Helen Meng, Haizhou Li. C2AV-TSE: Context and Confidence-Aware Audio Visual Target Speaker Extraction, IEEE Journal of Selected Topics in Signal Processing, 2025, 19(4): 646-657.
7. Rui Liu, Hongyu Yuan, Guanglai Gao, Haizhou Li. Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition, Information Fusion, 2025, 120: 103077.
8. Rui Liu, Jinhua Zhang, Haizhou Li. Hierarchical multi-source cues fusion for mono-to-binaural based Audio Deepfake Detection, Information Fusion, 2025, 120: 103097.
9. Xinyuan Qian, Jiaran Gao, Yaodan Zhang, Qiquan Zhang, Hexin Liu, Leibny Paola García-Perera, Haizhou Li. SAV-SE: Scene-Aware Audio-Visual Speech Enhancement With Selective State Space Model, IEEE Journal of Selected Topics in Signal Processing, 2025, 19(4): 623-634.
10. Yi Ma, Shuai Wang, Tianchi Liu, Haizhou Li. ExPO: Explainable Phonetic Trait-Oriented Network for Speaker Verification, IEEE Signal Processing Letters, 2025, 32: 731-735.
11. Qiyuan Sun, Haolin Zuo, Rui Liu, Haizhou Li. Connecting Cross-Modal Representations for Compact and Robust Multimodal Sentiment Analysis With Sentiment Word Substitution Error, IEEE Transactions on Affective Computing, 2025, 16(3): 1265-1276.
12. Qianhui Liu, Jiadong Wang, Yang Wang, Xin Yang, Gang Pan, Haizhou Li. Human-Inspired Computing for Robust and Efficient Audio-Visual Speech Recognition, IEEE Transactions on Computers, 2025, 74(9): 2950-2961.
13. Siqi Cai, Ran Zhang, Hongxu Zhu, Haizhou Li. Modeling the Temporal Dynamics of EEG Signals in Selective Listening, IEEE Transactions on Consumer Electronics, 2025, 71(1): 1115-1124.
14. Tianchi Liu, Duc-Tuan Truong, Rohan Kumar Das, Kong Aik Lee, Haizhou Li. Nes2Net: A Lightweight Nested Architecture for Foundation Model Driven Speech Anti-Spoofing, IEEE Transactions on Information Forensics and Security, 20: 12005-12018.
15. Ruijie Tao, Xinyuan Qian, Rohan Kumar Das, Xiaoxue Gao, Jiadong Wang, Haizhou Li. Enhancing Real-World Active Speaker Detection With Multi-Modal Extraction Pre-Training, IEEE Transactions on Multimedia, 2025, 27: 2362-2373.
16. Malu Zhang, Xiaoling Luo, Jibin Wu, Ammar Belatreche, Siqi Cai, Yang Yang, Haizhou Li. Toward Building Human-Like Sequential Memory Using Brain-Inspired Spiking Neural Models, IEEE Transactions on Neural Networks and Learning Systems, 2025, 36(6): 10143-10155.

专利成果：

1. 一种可持续学习的唇语识别模型训练方法及装置，ZL202311105378.3，2025年，第一发明人
2. 听觉注意力检测方法、装置、计算机设备和可读存储介质，ZL202510136253.X，2025年，第二发明人
3. 类脑助听方法、装置、助听设备和计算机设备，ZL202210859184.1，2024年，第二发明人
4. 语音处理方法、装置、存储介质及计算机设备，ZL202411415239.5，2025年，第五发明人
5. 脑电听觉语音提取模型训练方法、装置、设备和存储介质，ZL202511135363.0，2025年，第五发明人

科研奖励：

1. 2023年：深圳人工智能自然科学奖，深圳市人工智能学会，第二完成人。

2013年：新加坡总统科技奖 (新加坡共和国学术最高荣誉)，新加坡国家科学院，第一完成人。