• 内网
  • 搜索
  • English
  • 学院概况
    • 学院概况
    • 联系我们
  • 师资力量
  • 招生培养
    • 招生信息
    • 招生资讯
  • 科研创新
    • 人工智能理论及系统中心
    • 语言模型与人机交互中心
    • 科学与工程智能中心
    • 社会科学智能中心
    • 具身智能与计算机视觉中心
  • 最新资讯
    • 学院动态
    • 活动预告
    • 通知公告
    • 采购公告
  • 人才招聘
    • 行政类职位
    • 学术类职位
  • 学术论坛
    • 论坛预告
    • 论坛回顾

面包屑

  • 首页

高汝霆

副教授

语言模型与人机交互中心副主任

教育背景

教育经历(按时间倒序):

2010年9月 - 2014年6月  香港科技大学  计算机科学与工程哲学博士

2008年1月 - 2010年8月  香港科技大学  计算机科学与工程哲学硕士

2006年9月 - 2007年12月 香港科技大学 集成电路设计工程理学硕士

2000年9月 - 2003年5月  香港中文大学  计算机工程学士

 

工作经历(按时间倒序):

2021年10月 - 2024年12月 字节跳动人工智能实验室  研究科学家

2019年1月 至 2021年9月   南方科技大学  助理教授 (终身教职轨)

2014年6月 至 2019年1月   华为诺亚方舟实验室  研究员

研究领域
全双工語音大模型, 多模態大模型, 深度学习
科目分类
语言智能与人机交互
个人网站
https://tomkocse.github.io/
邮箱
tomko@slai.edu.cn
个人简介

现任河套全职副教授及河套语言模型与人机交互中心副主任, 曾任字节跳动AI Lab研究科学家,南方科技大学助理教授、华为诺亚方舟实验室研究员。他于2014年获香港科技大学计算机科学与工程博士学位,在语音识别与自然语言处理领域拥有十余年研发经验。他发表论文50余篇,总引用超5000次,其中两篇以第一作者发表的语音增强相关论文单篇引用均破千。近年来专注于大语言模型在语音翻译中的应用,参与开发SpeechT5、CLASI 等代表性系统,相关成果发表于ACL、ICLR等顶级会议。高汝霆博士曾获字节跳动优秀团队奖、华为“未来之星”奖,并担任IWSLT、Interspeech等国际会议程序委员及主席,在工业界与学术界均具有广泛影响力。]

学术著作

Tom Ko, Vijayaditya Peddinti, Daniel Povey, Sanjeev Khudanpur

"Audio Augmentation for Speech Recognition",

in Proceedings of Interspeech, September, 2015

 

Tom Ko, Vijayaditya Peddinti, Daniel Povey, Michael L. Seltzer, Sanjeev Khudanpur

"A Study on Data Augmentation of Reverberant Speech for Robust Speech Recognition",

in Proceedings of ICASSP, March, 2017

 

Yingke Zhu, Tom Ko, David Snyder, Brian Mak, Daniel Povey

"Self-Attentive Speaker Embeddings for Text-Independent Speaker Verification",

in Proceedings of Interspeech, September, 2018

 

Junyi Ao, Rui Wang, Long Zhou, Chengyi Wang, Shuo Ren, Yu Wu, Shujie Liu, Tom Ko, Qing Li, Yu Zhang, Zhihua Wei, Yao Qian, Jinyu Li, Furu Wei

“Speecht5: Unified-modal encoder-decoder pre-training for spoken language processing”,

in Proceedings of ACL, May, 2022

 

Xinhao Mei, Chutong Meng, Haohe Liu, Qiuqiang Kong, Tom Ko, … "Wavcaps: A chatgpt-assisted weakly-labelled audio captioning dataset for audio-language multimodal research", IEEE Transactions on Audio, Speech and Language Processing, 2024

关注我们
联系方式
  • 招生咨询邮箱:admission@slai.edu.cn 招生咨询热线:(86)0755 81970253 (工作日:9:30-11:00 15:00-17:00) 教授招聘:FacultyHiring@slai.edu.cn 校企合作:coop@slai.edu.cn
  • 人才招聘:staff_careers@slai.edu.cn 招投标:bidding@slai.edu.cn 院务办公室:executiveoffice@slai.edu.cn 学生事务:student@slai.edu.cn 院长信箱:deanoffice@slai.edu.cn
  • 财务:financeoffice@slai.edu.cn 联系电话:0755-83590055 (工作日:9:30-11:00 15:00-17:00) 地址:福田保税区红棉道6号深圳河套学院
探索更多
  • 学院概况 人才招聘 内网

版权所有 © 深圳河套学院 粤ICP备14099122号-14 

​