李海洲
教授
语言模型与人机交互中心主任
香港中文大学(深圳)
教育经历(按时间倒序):
- 1987.09-1990.07: 华南理工大学, 通信与电子系统, 博士
- 1984.09-1987.07: 华南理工大学, 通信与电子系统, 硕士
- 1980.09-1984.07: 华南理工大学, 无线电技术, 学士
工作经历(按时间倒序):
- 2025.07 - 至今:香港中文大学(深圳), 人工智能学院, 教授
- 2021.11 - 2025.06:香港中文大学(深圳), 数据科学学院, 教授
- 2014.03 - 2021.11:新加坡国立大学, 电机与计算机工程系, 教授
- 2003.01 - 2016.01:新加坡科技研究局, 资讯通信研究院, 教授级高级工程师
- 2001.01 - 2003.01:言丰科技, 研究中心, 教授级高级工程师
- 1999.01 - 2001.01:Lernout & Hauspie, Asia Pacific office, 教授级高级工程师
- 1996.01 - 1999.01:苹果公司新加坡研究中心, 语音处理实验室, 教授级高级工程师
- 1994.01 - 1996.01:法国国家科学研究中心, 南锡计算机科学研究中心, 研究员
- 1991.01 - 1994.01:华南理工大学, 电子与信息学院, 副教授
李海洲,教授,新加坡工程院院士、IEEE Fellow、ISCA Fellow,现任深圳河套学院语言模型与人机交互中心主任、香港中文大学(深圳)人工智能学院院长、深圳市跨模态认知计算重点实验室主任。长期深耕语音与语言处理、类脑计算与多模态大模型,推动技术落地于智能语音、人机交互等领域。曾任新加坡国立大学终身教授、国际语音通信学会主席,指导苹果、百度、Lernout & Hauspie等企业核心语音产品开发,并曾获新加坡共和国学术界最高荣誉—总统科技奖。主持多项国家级重点项目,已培养50余名博士生,论文引用4万多次。欢迎国内外学者加入团队,推动语音语言智能及类脑计算产学研。
代表性论文(近5-10年,按影响力排序):
1. Siqi Cai, Zheyuan Lin, Xiaoli Liu, Wenjie Wei, Shuai Wang, Malu Zhang, Tanja Schultz, Haizhou Li. Spiking neural networks for EEG signal analysis: From theory to practice. Neural Networks, 2026, 194: 108127.
2. Rui Liu, Zhenqi Jia, Feilong Bao, Haizhou Li. Retrieval-Augmented Dialogue Knowledge Aggregation for Expressive Conversational Speech Synthesis. Information Fusion, 2025, 118: 102948.
3. Yidi Jiang, Ruijie Tao, Zhengyang Chen, Yanmin Qian, Haizhou Li. Target Speech Detection with Multimodal Prompts, IEEE Transactions on Audio, Speech and Language Processing, 2025, 33: 2788-2802.
4. Junyi Ao, Mehmet Sinan Yıldırım, Ruijie Tao, Meng Ge, Shuai Wang, Yanmin Qian, Haizhou Li. USED: Universal Speaker Extraction and Diarization, IEEE Transactions on Audio, Speech and Language Processing, 2025, 33: 96-110.
5. Sho Inoue, Kun Zhou, Shuai Wang, Haizhou Li. Hierarchical Control of Emotion Rendering in Speech Synthesis, IEEE Transactions on Affective Computing, 2025, 16(4): 3316-3328.
6. Wenxuan Wu, Xueyuan Chen, Shuai Wang, Jiadong Wang, Lingwei Meng, Xixin Wu, Helen Meng, Haizhou Li. C2AV-TSE: Context and Confidence-Aware Audio Visual Target Speaker Extraction, IEEE Journal of Selected Topics in Signal Processing, 2025, 19(4): 646-657.
7. Rui Liu, Hongyu Yuan, Guanglai Gao, Haizhou Li. Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition, Information Fusion, 2025, 120: 103077.
8. Rui Liu, Jinhua Zhang, Haizhou Li. Hierarchical multi-source cues fusion for mono-to-binaural based Audio Deepfake Detection, Information Fusion, 2025, 120: 103097.
9. Xinyuan Qian, Jiaran Gao, Yaodan Zhang, Qiquan Zhang, Hexin Liu, Leibny Paola García-Perera, Haizhou Li. SAV-SE: Scene-Aware Audio-Visual Speech Enhancement With Selective State Space Model, IEEE Journal of Selected Topics in Signal Processing, 2025, 19(4): 623-634.
10. Yi Ma, Shuai Wang, Tianchi Liu, Haizhou Li. ExPO: Explainable Phonetic Trait-Oriented Network for Speaker Verification, IEEE Signal Processing Letters, 2025, 32: 731-735.
11. Qiyuan Sun, Haolin Zuo, Rui Liu, Haizhou Li. Connecting Cross-Modal Representations for Compact and Robust Multimodal Sentiment Analysis With Sentiment Word Substitution Error, IEEE Transactions on Affective Computing, 2025, 16(3): 1265-1276.
12. Qianhui Liu, Jiadong Wang, Yang Wang, Xin Yang, Gang Pan, Haizhou Li. Human-Inspired Computing for Robust and Efficient Audio-Visual Speech Recognition, IEEE Transactions on Computers, 2025, 74(9): 2950-2961.
13. Siqi Cai, Ran Zhang, Hongxu Zhu, Haizhou Li. Modeling the Temporal Dynamics of EEG Signals in Selective Listening, IEEE Transactions on Consumer Electronics, 2025, 71(1): 1115-1124.
14. Tianchi Liu, Duc-Tuan Truong, Rohan Kumar Das, Kong Aik Lee, Haizhou Li. Nes2Net: A Lightweight Nested Architecture for Foundation Model Driven Speech Anti-Spoofing, IEEE Transactions on Information Forensics and Security, 20: 12005-12018.
15. Ruijie Tao, Xinyuan Qian, Rohan Kumar Das, Xiaoxue Gao, Jiadong Wang, Haizhou Li. Enhancing Real-World Active Speaker Detection With Multi-Modal Extraction Pre-Training, IEEE Transactions on Multimedia, 2025, 27: 2362-2373.
16. Malu Zhang, Xiaoling Luo, Jibin Wu, Ammar Belatreche, Siqi Cai, Yang Yang, Haizhou Li. Toward Building Human-Like Sequential Memory Using Brain-Inspired Spiking Neural Models, IEEE Transactions on Neural Networks and Learning Systems, 2025, 36(6): 10143-10155.
专利成果:
1. 一种可持续学习的唇语识别模型训练方法及装置,ZL202311105378.3,2025年,第一发明人
2. 听觉注意力检测方法、装置、计算机设备和可读存储介质,ZL202510136253.X,2025年,第二发明人
3. 类脑助听方法、装置、助听设备和计算机设备,ZL202210859184.1,2024年,第二发明人
4. 语音处理方法、装置、存储介质及计算机设备,ZL202411415239.5,2025年,第五发明人
5. 脑电听觉语音提取模型训练方法、装置、设备和存储介质,ZL202511135363.0,2025年,第五发明人
科研奖励:
1. 2023年:深圳人工智能自然科学奖,深圳市人工智能学会,第二完成人。
2013年:新加坡总统科技奖 (新加坡共和国学术最高荣誉),新加坡国家科学院,第一完成人。