武执政

副教授

香港中文大学(深圳)

教育背景

教育经历:

[2010-2015]：南洋理工大学（新加坡）计算机工程博士学位（全日制）
[2006-2009]：南开大学（天津，中国）计算机科学硕士学位（全日制）
[2003-2006]：杭州电子科技大学（杭州，中国）计算机科学学士学位（全日制）

工作经历：

[2022.8 - 至今]：香港中文大学（深圳）
[2019.4 - 2022.7]：Meta Platforms Inc（美国）
[2018.2 - 2019.4]：京东硅谷研发中心（美国）
[2016.5 - 2018.2]：苹果公司（美国）
[2014.5 - 2016.5]：爱丁堡大学（英国）
[2012.3 - 2012.8]：东芬兰大学（芬兰）
[2009.8 - 2014.5]：南洋理工大学（新加坡）
[2007.11 - 2009.7]：微软亚洲研究院（中国）

研究领域

语音交互、语音生成、音频鉴伪、AI+音乐

邮箱

zhizhengwu@slai.edu.cn

个人简介

武执政系深圳河套学院双聘教授、香港中文大学（深圳）数据科学学院副教授、博士生导师、深圳市大数据研究院高级研究科学家、深圳市跨模态认知计算重点实验室副主任。深耕语音识别、语音合成、音频理解、语音信号处理等领域，曾任职微软亚洲研究院、苹果、Meta等机构。

学术著作

代表性论文：

Junan Zhang, Jing Yang, Zihao Fang, Yuancheng Wang, Zehua Zhang, Zhuo Wang, Fan Fan, Zhizheng Wu, AnyEnhance: A Unified Generative Model with Prompt‑Guidance and Self‑Critic for Voice Enhancement, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2025
Xianghu Yue, Xiaohai Tian, Lu Lu, Malu Zhang, Zhizheng Wu, Haizhou Li, CoAVT: A Cognition‑Inspired Unified Audio‑Visual‑Text Pre‑Training Model for Multimodal Processing, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2025
Yicheng Gu, Xueyao Zhang, Liumeng Xue, Haizhou Li, Zhizheng Wu, An Investigation of Time‑Frequency Representation Dis‑criminators for High‑Fidelity Vocoders, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024
Junyan Ye, Baichuan Zhou, Zilong Huang, Junan Zhang, Tianyi Bai, Hengrui Kang, Jun He, Honglin Lin, Zihao Wang, Tong Wu, Zhizheng Wu, Yiping Chen, Dahua Lin, Conghui He, Weijia Li, LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models, ICLR 2025
Yuancheng Wang, Haoyue Zhan, Liwei Liu, Ruihong Zeng, Haotian Guo, Jiachen Zheng, Qiang Zhang, Xueyao Zhang, Shunsi Zhang, Zhizheng Wu, MaskGCT: Zero‑Shot Text‑to‑Speech with Masked Generative Codec Transformer, ICLR 2025
Xueyao Zhang, Xiaohui Zhang, Kainan Peng, Zhenyu Tang, Vimal Manohar, Yingru Liu, Jeff Hwang, Dangna Li, Yuhao Wang, Julian Chan, Yuan Huang, Zhizheng Wu, Mingbo Ma, Vevo: Controllable Zero‑Shot Voice Imitation with Self‑Supervised Disentanglement, ICLR 2025
Junyi Ao*, Yuancheng Wang*, Xiaohai Tian, Dekun Chen, Jun Zhang, Lu Lu, Yuxuan Wang, Haizhou Li, Zhizheng Wu, SD‑Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words, NeurIPS 2024
Zeqian Ju, Yuancheng Wang, Kai Shen, Xu Tan, Detai Xin, Dongchao Yang, Yanqing Liu, Yichong Leng, Kaitao Song, Siliang Tang, Zhizheng Wu, Tao Qin, Xiang‑Yang Li, Wei Ye, Shikun Zhang, Jiang Bian, Lei He, Jinyu Li, Sheng Zhao, Natural‑Speech 3: Zero‑Shot Speech Synthesis with Factorized Codec and Diffusion Models, ICML 2024
Yuancheng Wang, Zeqian Ju, Xu Tan, Lei He, Zhizheng Wu, Jiang Bian, Sheng Zhao, AUDIT: Audio Editing by Following In‑structions with Latent Diffusion Models, NeurIPS 2023
Xuehao Zhou, Mingyang Zhang, Yi Zhou, Zhizheng Wu, Haizhou Li, Accented Text‑to‑Speech Synthesis with Limited Data, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024

科研奖励：

2025 Huawei Spark Award, Huawei
2024 Best Paper Finalist, IEEE Spoken Language Technology (SLT) 2024
2021 ‑ now World Top 2% Scientist, Stanford University (Ranked among the top 2% of scientists globally based on citations and research impact.)
2016 Best Student Paper award
2016 Most Cited Article of Speech Communication
2015 Top 1 in Blizzard Challenge (Intelligibility task), Blizzard Challenge
2012 Best Paper award, APSIPA Annual Submit and Conference, Asia‑Pacific Signal and Information Processing Association (APSIPA)