【SLAI Seminar】第十二期:大模型量化稀疏:挑战、方法与机遇(11月19日10:00)
2025-11-19 论坛预告
随着大模型尺寸与上下文窗口的增长,“推理成本”已成为制约其应用的核心瓶颈。工业界如何解决这一难题?未来的模型压缩有哪些新机遇?本期SLAI Seminar特别邀请到柏昊立博士,带大家深入探讨“大模型量化稀疏”的前沿技术,回顾从异常值处理到压缩感知训练的代表性工作。
主题:大模型量化稀疏:挑战、方法与机遇
时间:11月19日(本周三)上午 10:00-11:30
地点:B411 阶梯教室
主讲嘉宾:柏昊立博士(华为香港研究所)
主持人:姬艳丽教授
腾讯会议号:933-482-940
讲座摘要
随着大模型日益增长的尺寸与上下文窗口,降低大模型推理成本是工业界关注的核心问题。模型量化与稀疏化是降低模型推理成本的常用手段,然而大模型中存在异常值,精度敏感,难以微调等问题,导致模型压缩存在诸多公开挑战。本次报告将回顾大模型压缩加速的近期代表性工作,如异常值处理,旋转量化,压缩感知训练等热点研究,归纳学界与业界近年研究趋势。最后,报告将展望大模型在慢思考和智能体时代,量化与稀疏研究面临的新机遇。
主讲嘉宾简介

柏昊立博士,华为香港研究所研究员,负责香港基础模型实验室。主要研究方向为大语言模型与推理加速。目前在国际顶级会议发表论文40余篇,提交发明专利10余项,谷歌学术1200余次。担任NeurIPS 2025领域主席,以及NeurIPS,ICML, ICLR等会议程序委员会委员。代表性工作包括BinaryBERT首个二值化预训练语言模型,FlatQuant 无损4bit大模型量化算法,落地华为计算产品线,昇腾芯片,华为自动驾驶等多个产品线。开源成果在Github社区获得超4K星标。曾获得ACML 2016最佳学生论文亚军奖。