三维内容生成基础及前沿进展
三维内容生成已成为现代制造业、虚拟现实、自动驾驶等领域的关键技术。本课程聚焦三维内容生成基础及前沿进展,从三维生成基本概念与生成范式、面向智能制造的CAD表达与智能重建、CAD参数模型智能生成三个方面,介绍三维内容生成基础理论与前沿技术。首先剖析三维视觉内容生成范式,涵盖二维视觉大模型蒸馏、多视角一致性重建与生成、三维原生模型训练等技术,并探讨当前学术热点与瓶颈问题。然后介绍计算机辅助设计(CAD)模型的智能重建与生成,包括CAD建模的典型表示方式、基于特征建模操作的CAD重建和生成、B-Rep模型高效生成等内容。最后,介绍CAD参数模型的相关概念,以及基于Transformer、扩散模型和大语言模型的生成方法,探讨多模态反演与生成等学术前沿技术。
日期 | 时间 | 课程题目 | 课程讲者 | 课程地点 |
---|---|---|---|---|
8月20日 | 13:30-14:40 | 三维视觉内容生成 | 段岳圻 清华大学 | 三楼云海厅2 |
14:40-15:50 | CAD模型的智能重建与生成 | 全卫泽 中国科学院自动化所 | ||
15:50-16:10 | 课间休息 | |||
16:10-17:30 | CAD参数模型的智能化生成 | 周向东 复旦大学 |
邵天甲,浙江大学CAD&CG国家重点实验室百人计划研究员、博士生导师,获国家基金委优秀青年基金资助。之前在英国利兹大学(University of Leeds)担任Lecturer(终身教职)。本科毕业于清华大学自动化系,博士毕业于清华大学高等研究院,师从微软亚洲研究院副院长郭百宁教授。研究方向是计算机图形学,包括三维场景重建,数字人建模、3D AIGC等。已在计算机图形学和视觉的顶级期刊和会议(TOG, SIGGRAPH, TVCG, CVPR等)发表CCF-A类论文40余篇。他是ACM SIGGRAPH 2022/2023程序委员,CVM 2022程序委员会共同主席,现担任国际期刊《The Visual Computer》编委,中国电子学会虚拟现实分会秘书长。
郭建伟,北京师范大学人工智能学院教授。2016年博士毕业于中国科学院自动化研究所,主要研究方向为计算机图形学与虚拟现实。已在ACM SIGGRAPH/TOG、IEEE TPAMI、IEEE TVCG、CVPR等高水平期刊或会议发表论文80余篇,授权发明专利17项。主持多项国家自然科学基金项目及省部级科研课题,作为核心骨干参与国自然重点项目、科技部重点研发计划,主持企业委托项目9项。曾荣获10项学术奖励,包括入选中国科学院青促会会员、中国体视学学会青年科学技术奖、中国仿真学会优秀博士论文奖、CVMJ期刊年度最佳论文奖、中国图学学会科技进步二等奖等。
韩晓光博士,现任香港中文大学(深圳)理工学院和未来智联网络研究院助理教授,校长青年学者,目前担任未来智联网络研究院助理院长。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文60余篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。目前也担任CVPR2023,NeurIPS 2023以及CVPR2024领域主席。他的工作还曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet),2019年和2020年连续两年入选计算机视觉顶级会议CVPR最佳论文列表(入选率分别为0.8%和0.4%),他也曾获得IEEE TVCG最佳审稿人提名奖。
课程题目:CAD参数模型的智能化生成
课程摘要:CAD参数模型是基于特征建模范式的现代CAD工具软件产生和接收的主要模型数据。基于人工智能的CAD参数模型自动生成将推动CAD设计智能化变革,实现从设计意图到设计模型的自动化与智能化,是当前CAD研究与探索的重要方向之一。本课程围绕CAD参数模型的智能化生成问题,对CAD参数模型的相关概念,基于Transformer、扩散模型以及大语言模型的CAD参数模型的生成,多模态反演与生成等学术研究前沿的主流方法进行讲解和讨论。
个人简介:周向东,复旦大学计算与智能创新学院(计算机科学技术学院)教授,博士生导师。数据库与海量信息处理实验室主任,中国图学学会专委会委员。科技部、教育部、上海市科委专家。长期担任计算机领域多个重要国际学术会议程序委员会委员。主要从事大数据与人工智能等领域的理论与应用研究。在海量数据管理、计算机视觉,工程数据管理(BIM/CAD与数字孪生)等领域获得良好的研究成果。已发表学术论文100余篇、专著1部。先后承担多项国家自然科学基金,国家重点研发课题等国家、省部级项目,及国内大型知名企业的各类科技合作项目二十余项。获得教育部自然科学二等奖、上海市科技进步二等奖、中国电子学会科技进步一等奖、华为优秀技术成果奖等。
课程题目:CAD模型的智能重建与生成
课程摘要:计算机辅助设计(CAD)是现代制造业的核心支撑技术,也是我国工业软件领域亟待突破的关键环节。CAD模型广泛应用于逆向工程、航空航天、虚拟现实与多物理场仿真等高端制造场景,具有重要战略价值。本课程围绕CAD模型的智能重建与生成问题,介绍 CAD 建模的典型表示方式,重点展示:快速鲁棒的CSG重建、基于几何约束的高一致性B-Rep重建、基于特征建模操作的CAD重建和生成、以及基于Transformer的高效网格生成等一系列前沿研究成果。
个人简介:全卫泽,副研究员,中国科学院自动化所多模态全重实验室,主要从事可视媒体智能生成、几何处理方面的研究。目前已在ACM TOG、IJCV、IEEE TIP、CVPR等期刊和会议发表论文30余篇。主持国自然重大子课题、中国科学院先导课题、国自然青年项目;主持/参与多项企业委托项目,部分成果应用于华为、腾讯、蔚来等企业。获得2023年度“陆增镛CAD&CG高科技奖”、 2021年度CCF-腾讯犀牛鸟科研基金“优秀专利奖”。担任国际期刊The Visual Computer编委。
课程题目:三维视觉内容生成
课程摘要:三维视觉内容生成的目的是基于文本和图像等提示,生成高质量、高保真度、多视角一致的三维对象表示。随着VR/AR、自动驾驶、具身智能等应用领域的发展,三维资产需求日益增加,利用生成的方式获得大量三维资产成为了重要的研究问题。本课程围绕三维视觉内容生成问题,对二维视觉大模型蒸馏、多视角生成重建、三维原生模型训练等生成范式进行讲解,并对学术研究前沿的方法和瓶颈问题展开讨论。
个人简介:段岳圻,清华大学电子系助理教授,博士生导师,研究方向为三维计算机视觉。以第一/通讯作者发表计算机视觉与模式识别领域IEEE汇刊和CCF-A类会议论文30余篇,入选中国科协青年人才托举工程项目,获2024年中国电子学会自然科学一等奖、2024年公安部科学技术奖一等奖、2020年中国人工智能学会优秀博士论文。主持科技部国家重点研发计划课题、国家自然科学基金青年项目、腾讯犀牛鸟专项基金、苹果公司委托合作技术项目等,作为项目骨干参与国家自然科学基金重点项目和联合基金重点项目。担任CVPR、ICCV、MM、ICLR等国际会议领域主席,中国计算机学会计算机视觉、人工智能与模式识别、多媒体技术专委会执行委员。