• 内网
  • 搜索
  • 学院概况
    • 学院概况
    • 联系我们
  • 师资力量
  • 招生培养
    • 招生信息 Admission
    • 招生资讯
    • 学院课程
  • 科研创新
    • 人工智能理论及系统中心
    • 语言模型与人机交互中心
    • 科学与工程智能中心
    • 社会科学智能中心
    • 具身智能与计算机视觉中心
  • 最新资讯
    • 学院动态
    • 活动预告
    • 通知公告
    • 采购公告
  • 人才招聘
  • 学术论坛
    • 论坛预告
    • 论坛回顾

面包屑

  • 首页
  • 学术论坛
  • 论坛回顾
  • 【SLAI Seminar】第十七期回顾|AI重塑三维创作:从物体建模到世界生成

【SLAI Seminar】第十七期回顾|AI重塑三维创作:从物体建模到世界生成

2025-12-25 学术论坛

12月22日(周一)上午,SLAI Seminar第十七期学术讲座在深圳河套学院B411阶梯教室成功举办。本次讲座由姬艳丽教授主持,特邀腾讯专家研究员、混元3D团队负责人郭春超博士,围绕“混元3D-从物体建模到3D世界生成”主题,深入分享AI在三维生成领域的前沿进展、技术体系与产业实践。

 

讲座简介

三维生成是继图像、视频之后,生成式AI浪潮中的新兴热点,旨在将高门槛、长周期、高成本的传统专业3D建模,转变为通过自然语言、图片等简单指令即可快速生成高质量3D资产与场景的智能过程。尽管自2022年DreamFusion才引起广泛关注,但3D生成在游戏开发、工业设计、虚拟社交等领域的巨大商业潜力已清晰显现。

本次讲座系统梳理了3D作为“数字资产”的核心特性与行业痛点,重点展示了腾讯混元3D团队在物体生成基座模型、全链路AI管线、3D世界模型构建三大方向的技术布局与突破,并深入探讨3D世界模型的技术路径之争、具身智能等前沿应用的挑战,以及AI驱动三维创作生态的未来演进趋势。

 

讲座内容

讲座伊始,郭春超博士指出3D文件被称为“资产”,源于其可衡量、可交易的价值,以及需要专业人工投入创造的特性。3D模型具备实时交互性、沉浸式全景展示、高可控性与参数化三大核心优势。然而,传统3D建模流程环节繁多、前后依赖,导致制作周期长:一个精美角色或需三个月、人力成本高:建模师需培训两年以上、资产价格昂贵:单个模型成本可达数万至数十万元。这构成了AI技术“提效降本、降低门槛”亟待发展。

面对传统管线困境,腾讯混元3D团队目标是打造一站式、低门槛的AI创作平台。郭博士强调,3D生成与图像/视频生成不同,其管线更长、任务更分散,单一基座模型无法解决所有问题。

郭博士团队采取双轮驱动战略:

 

3D物体生成基座模型

团队自2023年5月起持续迭代,从早期基于优化的方法转向更符合AI范式的扩散模型(Diffusion Model)。最新发布的3.0版本,在几何生成的保真度和纹理生成的细节上实现显著提升。郭博士指出,纹理生成是当前难点,因其依赖几何质量且高质量数据稀缺。

全链路AI化管线

以数据驱动的AI方法替代传统基于规则或优化的环节。例如:

● 智能重拓扑:开源算法可直接生成布线规整、符合美术生产要求的网格,将道具模型制作周期从“人天”量级实现向“小时”量级的跃迁;

● 组件化生成:实现3D模型的可拆卸、可复用,提升游戏资产生产效率;

● 自动绑定与动画驱动:探索基于自回归与扩散模型的自动蒙皮与动作生成,简化动画制作流程。

构建可交互、可漫游的3D虚拟世界是更具前瞻性的挑战。郭博士继而分享了对“世界模型”多元理解的认识,并指出3D路线的核心优势在于几何与物理的一致性。混元团队在此方向进行的系列探索:

 

世界生成(混元World 1.0)

基于文本或单图生成高质量、空间稳定、可编辑的3D场景。采用分层生成策略,巧妙利用2D全景图作为桥梁,弥补纯3D数据不足的短板。

 

世界重建

从多视角图片或短视频中高质量重建3D场景,大幅扩展了输入兼容性与输出质量。

 

世界交互

引入3D先验,探索在虚拟环境中实现更长时间记忆与实时交互的可能性。

郭博士指出3D生成技术整体仍处于发展的早期阶段,未来需在更紧凑的3D表征、原生3D编辑能力、更精细的系统工程化训练链路等方面持续突破。

讲座尾声迎来展望部分,郭博士就关键问题分享深度思考:

 

路径之争

为何3D世界生成需借鉴视频模型?核心在于纯3D数据不足且构建动态内容成本高,而视频模型能以低成本生成动态画面,二者结合方能兼顾动态与一致性。

 

生态演进

3D生成领域因管线长、任务散,目前力量较分散。未来若出现“大一统”的基础模型,生态可能更聚焦。其普及最终取决于游戏、工业设计等核心应用的爆发。

 

具身智能挑战

面向机器人、自动驾驶的具身应用对3D仿真的物理真实性、可操作性要求极高,且需求极为长尾。这要求3D生成必须围绕物理属性、高保真、复杂关节结构等深入攻关。

问答环节气氛热烈,与会师生围绕七大前沿方向与郭博士展开深入探讨:从技术路线上提问3D世界生成借鉴视频模型的核心动因与数据瓶颈,到技术细节中关切深度估计的具体实现方法;从概念层面辨析“交互”的多元定义与演进方向,到行业生态层面分析国内外模型格局差异与大厂布局逻辑;进而延伸至前沿应用,探讨3D生成在具身智能中面临的新挑战与关键科学问题,并反思当前多模态学习的局限——能否仅凭视频学会按摩等复杂技能、需融合何种模态数据;最后亦触及工程实践,询问大模型训练的资源规模与数据构建方法。

本次讲座不仅全景式地展现了3D生成AI的技术体系与产业画卷,更揭示了其作为连接数字与物理世界、赋能未来泛娱乐与智能制造的关键基础设施的深远潜力。从降低创作门槛到构建可交互的虚拟世界,AI正在三维空间掀起一场深刻效率与创意革命。

相关推荐

SLAI Seminar】第二十三期回顾|跨越虚实鸿沟:基座模型驱动的具身智能泛化之路

【SLAI Seminar】第二十二期回顾|从单智能体到多智能体:强化学习的演进、协作与决策挑战
【SLAI Seminar】第二十一期回顾|行人重识别的演进与挑战:从单人到群体,从地面到空地
关注我们
联系方式
  • 招生:admission@slai.edu.cn 教授招聘:FacultyHiring@slai.edu.cn 校企合作:coop@slai.edu.cn 人才招聘:staff_careers@slai.edu.cn 招投标:bidding@slai.edu.cn
  • 院务办公室:executiveoffice@slai.edu.cn 学生事务:student@slai.edu.cn 院长信箱:deanoffice@slai.edu.cn 财务:financeoffice@slai.edu.cn 地址:福田保税区红棉道6号深圳河套学院
探索更多
  • 学院概况 人才招聘 内网

版权所有 © 深圳河套学院 粤ICP备14099122号-14 

​