预告 | SLAI Seminar第十二期
2025-11-19 论坛预告

报告主题
大模型量化稀疏:挑战、方法与机遇
主讲嘉宾

柏昊立 研究员
柏昊立博士,华为香港研究所研究员,负责香港基础模型实验室。主要研究方向为大语言模型与推理加速。目前在国际顶级会议发表论文40余篇,提交发明专利10余项,谷歌学术1200余次。担任NeurIPS 2025领域主席,以及NeurIPS,ICML, ICLR等会议程序委员会委员。代表性工作包括BinaryBERT首个二值化预训练语言模型,FlatQuant 无损4bit大模型量化算法,落地华为计算产品线,昇腾芯片,华为自动驾驶等多个产品线。开源成果在Github社区获得超4K星标。曾获得ACML 2016最佳学生论文亚军奖。
报告摘要
随着大模型日益增长的尺寸与上下文窗口,降低大模型推理成本是工业界关注的核心问题。模型量化与稀疏化是降低模型推理成本的常用手段,然而大模型中存在异常值,精度敏感,难以微调等问题,导致模型压缩存在诸多公开挑战。本次报告将回顾大模型压缩加速的近期代表性工作,如异常值处理,旋转量化,压缩感知训练等热点研究,归纳学界与业界近年研究趋势。最后,报告将展望大模型在慢思考和智能体时代,量化与稀疏研究面临的新机遇。
主持人
姬艳丽 教授
报告时间
2025年11月19日(星期三)
上午10:00-11:30
报告地点
深圳河套学院B411阶梯教室
(深圳市福田区福保街道红棉路6号,
地图导航“深圳河套学院-南门”)
线上链接
扫码加入会议

腾讯会议号:933-482-940