SLAI昇腾系列微课程第一阶段圆满收官
2026年5月11日至22日,深圳河套学院人工智能理论及系统中心携手华为策划举办的首期“SLAI昇腾系列微课程”圆满结束。
昇腾系列微课程采用“1+1+3”的模式,即1门预热课+1门入门实践课+3门进阶实践课,主要聚焦昇腾AI基础软硬件平台、模型自动适配与调优、算子自动生成与优化、多机多卡并行模型训练与推理等内容,围绕学生在自动化工具学习、模型训练和工程实践中的实际需求展开,基于理论与实践相结合的原则,由浅入深、即学即用,帮助学院师生理解昇腾AI生态、提升技术认知和动手实践能力,助力大家快速掌握昇腾平台的使用方法。首期5门微课程开课,60余名师生参与学习,累计参与人次超200。
5月11日,微课程预热分享会拉开帷幕。华为算力先遣队公共事业中队高校分队队长田昆阳围绕昇腾AI软硬件平台、深圳河套学院与华为联合创新成果作专题分享,系统讲解了昇腾AI基础软硬件平台整体架构、昇腾384超节点、模型自动适配与调优工具AscendBridge 2.0等内容,同时对昇腾系列微课程的整体规划、授课内容及课程安排进行详细介绍,帮助同学们形成对昇腾AI技术体系的整体认识,也让大家对后续课程内容和学习路径有了更清晰的了解。
![]() | ![]() |
预热课程现场
5月13日晚上,入门实践课《基于自动化工具的模型训练与推理》正式开讲。本次课程由华为讲师季英国授课,课堂互动氛围浓厚。课程围绕AI Agent发展趋势、模型迁移难点及自动化工具实操应用展开,实操环节演示 了AscendBridge 2.0、Kerminal等工具,完整展示了模型下载、适配调试、精度对齐与性能优化的全流程自动闭环。现场,讲师还同步指导学员进行实操,帮助大家直观掌握昇腾平台上、基于多智能体协同架构的模型训练与推理技术。
![]() | ![]() |
| 基于自动化工具的模型训练与推理课程现场 | |
5月15日下午,专题进阶课《基于自动化工具的算子开发与优化》开讲,由华为讲师张浩授课。课程以昇腾NPU架构与算子开发基础知识为切入点,依次讲解Ascend C编程语言、三段式流水线、Tiling与存储层次、精度对齐以及Agent自动生成工具等内容。讲师结合在线评测系统、KernelCat、CANNBot等工具,现场实操演示 add、relu等算子的自动化生成与优化过程,帮助同学们进一步理解算子开发在AI工程中的关键作用。
![]() | ![]() |
基于自动化工具的算子生成与优化课程现场 | |
5月20日晚上,专题进阶课《基于自动化工具的模型适配与调优》开讲,由华为讲师吕璐凌授课,重点讲解昇腾NPU大模型推理性能调优的五层策略,包括算子替换融合、计算图级优化、下发队列优化、数值精度优化以及推理框架优化。课程结合Profiling分析、vLLM适配插件以及持续批处理、分页KV Cache等内容,演示了如何借助自动化调优工具提升推理效率、降低延迟并保持精度稳定,帮助同学们形成系统化的推理优化思路。
![]() | ![]() |
| 基于自动化工具的模型适配与调优课程现场 | |
5月22日下午,专题进阶课《多机多卡并行的模型训练与推理》开讲,由华为讲师陈思琪授课,将学习视角进一步延伸到昇腾算力的多机多卡场景下系统级优化领域。课程围绕昇腾384超节点架构、数据并行、流水线并行、张量并行、专家并行和上下文并行等内容展开,系统讲解了多卡协作与通信原理、推理服务化部署、PD分离架构以及MindSpeed LLM训练流程,并通过Qwen3-4B模型训练、推理部署和并行策略调优实操,帮助同学们掌握在复杂算力环境下平衡吞吐与时延等核心指标的方法,提升多机多卡训练与推理效率。
![]() | ![]() |
| 多机多卡的模型训练与推理课程现场 | |
本次五节微课课堂学习氛围浓厚,学员参与热情高涨。课堂上大家专心听讲、细致记录;实操环节踊跃动手、积极探讨,围绕模型适配、算子开发、工具应用、模型优化等内容与讲师深入交流,展现出大家对国产算力平台与AI底层技术实践的浓厚兴趣。
首期“SLAI昇腾系列微课程”圆满收官后,深圳河套学院人工智能理论及系统中心将继续围绕国产AI芯片生态建设、自动化工具使用和学生成长需求,持续优化课程内容与组织形式,推动更多高质量、实用型、开放式的学习活动落地。下一阶段,昇腾系列微课程也将继续聚焦模型开发、平台实践、性能优化和科研应用等方向,为同学们开展基于多智能体的模型适配、算子开发、多机多卡并行等方向的科研训练与创新实践提供持续支持。
敬请期待下一阶段课程!









