【特别论坛】基于“计图”的人工智能方法探索与实践

论坛简介

在人工智能与计算机图形学深度融合的浪潮下,智能图形算法正成为数字内容生成、虚拟现实、人机交互等领域的核心技术。然而,长期以来,图形计算生态严重依赖国外软硬件平台。近年来,国产芯片(如华为昇腾芯片深度学习框架(如计图Jittor)及图形计算平台的崛起,为构建自主可控的智能图形技术体系提供了重要基础。本次论坛汇聚学术界的前沿实践,围绕计图框架基础院里、大模型、3D视觉重建、数字人建模与驱动、几何建模与渲染优化、三维交互智能等核心方向展开深入探讨,希望搭建基于计图深度学习框架的产学研协同的创新平台,加速国产智能图形技术从底层架构到上层应用的全面突破,为构建自主可控的图形计算生态贡献力量。

论坛时间地点

8月23日(星期六) 13:30-15:20

三楼云海厅1

论坛召集人

穆太江

穆太江

清华大学 副研究员

个人简介

2016年于清华大学获得博士学位,主要研究方向为计算图形学和计算机视觉等,主持了自然科学基金委青年科学基金项目和北京市科技计划项目任务,作为骨干参与了多项国家重大项目;在重要国际会议和期刊发表论文50余篇,其中3篇文章入选ESI热点论文;获首届人工智能前沿创新奖(“祖冲之”奖)、2024年度中国图象图形学学会高等教育教学成果激励计划特等奖;现担任The Visual Computer、VCIBA等期刊编委。

高林

高林

中国科学院计算技术研究所 研究员

个人简介

高林,中国科学院计算技术研究所研究员、博士生导师、泛在计算系统研究中心副主任、中国科学院大学岗位教授。研究方向为计算机图形学、生成式人工智能。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文100余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任亚洲图形学学会秘书长,GDC大会联合程序主席,SGP大会联合主席,China3DV程序委员会联合主席,SIGGRAPH技术论文程序委员会委员,CVPR、NeurIPS领域主席,IEEE TVCG编委,作为项目负责人承担国家重点研发计划、国家自然科学基金委优青、北京市杰青(结题优秀)、英国皇家学会牛顿高级学者等项目,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖,CCF CAD&CG开源软件奖等奖励。

论坛讲者信息

国孟昊

国孟昊

清华大学

报告题目:计图在大模型领域的实践与探索

报告摘要:在深度学习技术的迅猛发展推动下,大模型已成为人工智能领域的核心研究方向。本次报告将重点探讨计图在大模型领域的探索与创新,涵盖以下关键议题:(1)国产硬件适配——剖析计图如何优化并适配国产 AI 加速芯片,以充分发挥硬件性能;(2)大模型推理加速优化——介绍计图团队在提升模型推理效率方面的技术进展与实践成果;(3)大模型训练与评测——分享计图团队在多模态大模型训练及其复杂推理能力评估方面的研究进展。

个人简介:国孟昊,清华大学计算机系博士后,博士毕业于清华大学计算机系,师从胡事民教授。研究方向涵盖计算机视觉、计算机图形学与人工智能。在 T-PAMI、ACM TOG、CVPR、SIGGRAPH 等国际顶级期刊及会议发表论文 15 篇,其中多篇以第一作者身份入选最佳论文、热点论文及高被引论文,谷歌学术引用量累计超过 6500 次。曾获国家自然科学基金青年学生基础研究项目(博士研究生)资助,并荣获国家奖学金、清华大学特等奖学金、字节跳动奖学金等多项荣誉,并入选斯坦福大学全球 2% 科学家 2024 榜单。

聂勇伟

聂勇伟

华南理工大学

报告题目:基于元学习的图像3D人体网格重建及Jittor开源实践

报告摘要:图像3D人体网格重建技术在虚拟数字人、虚拟试衣和体育赛事判罚等领域具有重要应用价值。当前主流方法主要分为两类:基于回归的直接预测方法和基于测试时优化的参数调整方法。后者针对每个测试样本,通过分析检测到的2D人体关节点信息,对回归模型的参数进行迭代优化。然而研究发现,当回归模型的训练数据与测试样本存在显著分布差异时,模型提供的初始参数难以作为有效的优化起点,导致最终重建精度下降。为解决这一关键问题,本报告介绍一种基于元学习的测试时优化框架,创新性地引入双网络协同架构:元学习器通过建模参数优化过程的知识迁移,为测试样本生成适配的初始化参数;优化网络则负责执行高效的参数微调。该方法已在国产深度学习框架Jittor平台实现开源,实验数据表明,该方案在保持运算效率的同时,显著提升了跨域场景下的重建精度。报告还将重点阐述该算法在国产计算平台上的实现细节、性能优化策略及其相较于国际主流框架的效能优势。

个人简介:聂勇伟现为华南理工大学副教授,博士生导师,《The Visual Computer》副主编。主持国家自然科学基金,广东省自然科学基金,广州市科技计划等项目近10项。获湖北省自然科学二等奖,湖北省自然科学优秀学术论文一等奖,CCF CAD/CG 2022最佳论文奖。在计算机图形学领域 Top期刊ACM Transactions on Graphics和会议SIGGRAPH,SIGGRAPH Aisa上发表论文 3 篇,在IJCV,TVCG,TIP等Top期刊和CVPR,ICCV,NIPS,ICLR等Top会议上发表或接收论文30余篇,其中CCF A类通讯/一作论文20余篇。申请专利20项,获发明专利授权13项。研究成果涵盖计算机图形学、计算机视觉等方向。

温玉辉

温玉辉

北京交通大学

报告题目:基于计图深度学习框架的数字人建模与驱动技术

报告摘要:数字人是指通过计算机图形学、人工智能等技术手段构建的,具备人类外貌、行为乃至情感特征的三维虚拟形象。作为连接虚拟与物理世界的核心要素,数字人已成为产业界和学术界共同关注的焦点,并在文旅、教育及医疗等多个领域展现出应用价值。本报告将重点探讨基于计图深度学习框架的数字人建模与驱动技术,涵盖高真实感可驱动数字人建模、语音驱动风格化人脸表情生成以及音乐驱动风格化舞蹈动作生成。

个人简介:温玉辉,博士,北京交通大学计算机科学与技术学院副教授、硕士生导师,中国图象图形学学会智能图形专委会委员。主要从事智能图形三维隐式建模与生成技术及其在智能领域的应用等研究,发表TPAMI、TOG、SIGGRAPH、TVCG、CVPR等期刊会议论文20余篇。主持多项国家级、省部级科研项目,包括国家自然科学基金青年基金项目、北京市科委北京市科技计划课题等。

杨洁

杨洁

中国科学院计算技术研究所

报告题目:可建模大尺度几何变形的高斯泼溅表示方法

报告摘要:近年来,三维高斯泼溅(Gaussian Splatting)技术因其融合显式与隐式表示优势的特点,在学术界和工业界获得广泛关注。该技术通过三维高斯球函数的组合表达场景,但其离散几何特性导致几何质量受限,制约了后续二次编辑。为解决上述问题,我们提出一种可以进行高真实感大尺度几何变形建模的“高斯网”几何表示方法,构建基于网格的高斯表示,通过网格面片分裂对3D高斯的分布进行优化,在保证渲染质量的同时,其大尺度变形帧率在20万个高斯球的分辨率上可以达到每秒65帧。该工作在ACM TOG 2024上发表,并提供计图(Jittor)开源代码。

个人简介:杨洁,中国科学院计算技术研究所助理研究员,博士毕业于中科院计算所,研究方向为几何处理和几何学习。相关研究成果发表在ACM SIGGRAPHTOG、IEEE TPAMI、IEEE TVCG、NeurIPS、CVPR等期刊和会议上。曾获得博士后创新人才支持计划、浙江大学陆增镛高科技奖等奖项。目前担任中国计算机学会计算机辅助设计与图形学专委会执行委员、中国图象图形学学会智能图形专委会委员以及中国图象图形学学会三维视觉专委会委员,并担任多个期刊会议的审稿人。

朱晨阳

朱晨阳

国防科技大学

报告题目:三维具身交互任务的结构化求解

报告摘要:在机器人三维交互中(如导航、装配等),亟需对复杂三维环境或三维交互进行高效表征,以解决交互策略学习中存在的样本效率低、可解释性差、迁移泛化难等问题。报告针对产线智能控制和机器人主动场景扫描两个典型场景,讨论基于计图平台的三维具身交互任务的结构化求解问题。

个人简介:朱晨阳,博士,国防科技大学计算机学院计算科学系副教授,研究方向为计算机图形学,三维视觉及几何形状分析。在相关领域发表CCF A类论文及SCI 1区论文34篇,其中SIGGRAPH/TOG文章6篇, CVPR Oral 1篇,AAAI Oral 1篇,esi高被引论文2篇。入选第六届中国科协青年托举计划,湖南省湖湘青年英才计划。获得湖南省自然科学一等奖1项(4),CCF自然科学一等奖1项(3)。担任计算机图形学国际刊物The Visual Computer,国内核心期刊《图学学报》等期刊编委,EG,PG,AAAI, IJCAI, CGI, CVM等会议程序委员。

论坛召集人联系方式

姓名:穆太江
单位:清华大学
邮箱:taijiang@tsinghua.edu.cn