预告 | SLAI Seminar第十二期

报告主题

大模型量化稀疏：挑战、方法与机遇

主讲嘉宾

柏昊立研究员

柏昊立博士，华为香港研究所研究员，负责香港基础模型实验室。主要研究方向为大语言模型与推理加速。目前在国际顶级会议发表论文40余篇，提交发明专利10余项，谷歌学术1200余次。担任NeurIPS 2025领域主席，以及NeurIPS，ICML, ICLR等会议程序委员会委员。代表性工作包括BinaryBERT首个二值化预训练语言模型，FlatQuant 无损4bit大模型量化算法，落地华为计算产品线，昇腾芯片，华为自动驾驶等多个产品线。开源成果在Github社区获得超4K星标。曾获得ACML 2016最佳学生论文亚军奖。

报告摘要

随着大模型日益增长的尺寸与上下文窗口，降低大模型推理成本是工业界关注的核心问题。模型量化与稀疏化是降低模型推理成本的常用手段，然而大模型中存在异常值，精度敏感，难以微调等问题，导致模型压缩存在诸多公开挑战。本次报告将回顾大模型压缩加速的近期代表性工作，如异常值处理，旋转量化，压缩感知训练等热点研究，归纳学界与业界近年研究趋势。最后，报告将展望大模型在慢思考和智能体时代，量化与稀疏研究面临的新机遇。

主持人

姬艳丽教授

报告时间

2025年11月19日（星期三）

上午10:00-11:30

报告地点

深圳河套学院B411阶梯教室

（深圳市福田区福保街道红棉路6号，

地图导航“深圳河套学院-南门”）

线上链接

扫码加入会议

腾讯会议号：933-482-940