南京大学学报(自然科学), 2023, 59(5): 742-751 doi: 10.13232/j.cnki.jnju.2023.05.002

基于稳定性优化的三维装配补全方法

姚启皓, 王伟昊, 尤鸣宇,

同济大学电子与信息工程学院,上海,201804

3D assembly completion with stability optimization

Yao Qihao, Wang Weihao, You Mingyu,

College of Electronic and Information Engineering,Tongji University,Shanghai,201804,China

通讯作者: E⁃mail:myyou@tongji.edu.cn

收稿日期: 2023-06-26  

基金资助: 国家自然科学基金.  62073244
上海市创新行动计划.  20511100500

Received: 2023-06-26  

摘要

三维装配补全是一项重要的交互式装配任务,对于一个半成品装配体,机器人需要明确其缺失部件,从候选部件中挑选正确部件,计算准确的拼装位姿,最后将半成品补全.稳定性是椅子、桌子等实际装配体设计的首要原则,也是三维装配补全的重要目标,现有的装配补全工作多根据部件的几何关系来优化装配补全过程,没有考虑补全后装配体的稳定性,导致补全结果的正确率不高,难以满足机器人实际装配的需求.针对上述问题,提出一种基于稳定性优化的三维装配补全方法(Finishing the Incomplete 3D Assembly with Transformer,StableFiT),定义了一种装配体稳定性验证方法.基于NVIDIA Isaac Sim仿真平台训练了一个装配体稳定性判别器,并基于稳定性判别器提供的稳定性反馈,优化了三维装配体的补全.在PartNet数据集上开展实验验证,结果表明StableFiT能够有效提升补全的装配体的正确性和稳定性.

关键词: 自动装配 ; 三维装配补全 ; 稳定性验证 ; 稳定性优化

Abstract

3D assembly completion is an essential and complex interactive assembly task. The robot must identify the true missing parts,select the correct parts from a toolkit of candidates,calculate precise assembly poses,and ultimately make the incomplete assembly complete. As the primary principle in the design of actual assemblies such as chairs and tables,stability is also an ultimate goal of 3D assembly completion. Existing works of 3D assembly completion primarily focus on geometric relationship modeling of parts,without taking into account the stability of assembly,leading to low accuracy in completion and making it a challenge to meet the actual requirements of robot assembly. To tackle this issue,we propose StableFiT(Finishing the Incomplete 3D Assembly with Transformer) for 3D assembly completion with stability optimization. We introduce a novel stability verification method for the completed assembly. By training an assembly stability discriminator using the verification results obtained from the NVIDIA Isaac Sim simulation platform,we furtherly optimize 3D assembly completion based on stability feedback from the stability discriminator. Experimental results on the PartNet dataset demonstrate that StableFiT effectively improves the correctness and stability of the completed assemblies,addressing the limitations of existing assembly completion methods.

Keywords: automatic assembly ; 3D assembly completion ; stability verification ; stability optimization

PDF (858KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

姚启皓, 王伟昊, 尤鸣宇. 基于稳定性优化的三维装配补全方法. 南京大学学报(自然科学)[J], 2023, 59(5): 742-751 doi:10.13232/j.cnki.jnju.2023.05.002

Yao Qihao, Wang Weihao, You Mingyu. 3D assembly completion with stability optimization. Journal of nanjing University[J], 2023, 59(5): 742-751 doi:10.13232/j.cnki.jnju.2023.05.002

自动装配是三维计算机视觉领域一个非常重要的研究课题,也是许多智能机器人系统的理想功能1.将自动装配技术应用于智能机器人领域,不仅帮助用户从头组装如积木、家具等各种装配体,也可以对部件缺损的装配体进行修补,很大程度节约了人力成本,也弥补了人类能力的不足.

现有的工作已经使机器人能够从零开始将一组部件组装成一个整体,即三维部件组装2,但是目前对部件缺失装配体的补全以及完整组装过程中特定步骤的实现,研究还较少.例如,训练机器人修理一把缺少一条椅腿的椅子,这是人机协同以及多智能体协同装配场景下一个非常基本但重要的任务,所以,对于三维装配补全的研究将成为今后的重点.

三维装配补全任务,除了任务自身需要机器人详细理解不完整的结构并推断出候选部件及部件⁃结构关系带来的难度,还存在将模型推广到实际应用的问题,即模型补全的装配体应当能应用于实际场景来指导机器人在现实中正确完成相应的装配补全任务,这要求补全的装配体要兼具几何层面的准确性和物理层面的稳定性,以装配更稳定和更实用的产品.现阶段,其他装配补全工作往往忽视对装配体稳定性的考虑,不利于模型从虚拟到现实的推广,也影响装配补全本身的精度.对不稳定装配体的典型展示如图1所示.

图1

图1   不稳定装配体的典型展示

Fig.1   A typical display of unstable assemblies


对于装配体的稳定性研究的主要难点:(1)对各类装配体的稳定性的定义缺乏相关的评价标准;(2)因为点云中不包含部件的物理信息,所以直接利用点云进行装配体稳定性验证的难度很大,也缺乏相关的理论指导和工作支撑;(3)装配体的稳定性验证结论一般通过定性分析得出,难以用来定量优化三维装配补全模型.

针对上述问题,本文提出一种基于稳定性优化的三维装配补全方法StableFiT(Finishing the Incomplete 3D Assembly with Transformer),指导补全出稳定性和实用性更高的装配体.

该方法的主要贡献:(1)定义了一种衡量装配体稳定性的方法,并基于NVIDIA Isaac Sim仿真平台实现了该方法;(2)提出一种点云格式下的装配体稳定性判别器模型,实现了点云格式下装配体的稳定性分类;(3)将提出的判别器模型引入三维装配补全模型,实现了三维装配补全的定量稳定性优化,并在定性和定量实验中取得了优异的表现.

1 三维装配补全相关工作

三维部件装配是一项典型的装配任务,其目标是将一组给定的部件从头组装成完整的装配体3-5,目前对三维部件装配的研究工作较为广泛.Zhan et al2首次正式定义三维部件装配问题,提出开创意义的DGL (Dynamic Graph Learning)框架,基于动态图神经网络对部件之间的几何关系进行建模,预测每个部件的位姿.Harish et al6提出RGL⁃NET (Recurrent Graph Learning),利用递归图学习范式来逐步细化部件之间的关系,能获得更准确的姿态预测.Wu et al7提出一个基于部件的端到端生成式框架PQ⁃Net,通过三维重建对各个部件重新进行建模.Li et al8提出PageNet,同样采用生成式的框架,整个框架由一个基于VAEGANs9-10的部件生成器和一个部件组装器组成,能实现两阶段的三维部件组装.其他相关工作利用其他模态的信息来源作为输入,如Li et al11使用图像作为输入.最新的关于三维部件装配的研究在问题设置上作出一定调整,如Wu et al12按照语义信息划分不同的部件组,Xu et al13将任务目标转为无监督合成新的装配体.但上述工作均以装配体的部件全集作为输入来预测部件的6自由度位姿,三维装配补全在此基础上被提出,两者在任务设置上存在一定差异.

三维装配补全旨在根据给定的半成品装配体,从一系列候选部件组成的工具包中挑选合适的部件并以正确的位姿拼装,最终将半成品补装完整.Wang et al14首次提出并定义三维装配补全这一新任务,设计了一个基于Transformer的框架FiT (Finishing the Incomplete 3D Assembly with Transformer),通过注意力机制对候选部件与半成品部件之间的几何关系进行建模,发掘半成品真正缺失的部件并预测其位姿,完成装配补全.目前,有关三维装配补全的研究仍在初步阶段.

三维点云补全是相近的一项任务,不同于“拼装式”补全,三维点云补全直接对点云数据中的缺失部分进行“生成式”预测和恢复,通常采用带有编码器⁃解码器框架的生成式解决方案,如Tchapmi et al15的TopNet,Yuan et al16的PCN (Point Completion Network)和Wen et al17的SA⁃Net (Skip⁃Attention Network).还有一些方法采用对抗学习的框架来提高点云补全的真实性和一致性,如Sarmad et al18的 RL⁃GAN⁃Net (Reinforcement Learning Agent Controlled GAN Network)和Hu et al19的Render4Completion.最近的一些工作将Transformer20引入三维形状补全来对点云分布进行全局建模,如Yan et al21的ShapeFormer和Mittal et al22的AutoSDF都引入了PQ⁃VAE23-24,在离散空间中学习三维表征并用Transformer来回归补全缺失区域,Wen et al25的PMP⁃Net++和Li et al26的ProxyFormer同样使用Transformer进行三维点云补全.总体地,三维装配补全侧重于部件级别的补全,每个部件都是一组具有特定几何和语义信息的点云,而三维点云补全则侧重由于遮挡等造成的缺失补全.

上述装配工作仅关注部件的几何关系,没有考虑装配体的稳定性,这一方面会影响三维装配补全的准确性,另一方面也不利于将三维装配补全真正应用于实际.本文在Wang et al14的基础上,设计了一种稳定性的验证方式与评价指标,并将稳定性约束引入三维装配补全框架,进一步提升补全的装配体的正确性和稳定性.

2 基于NVIDIA Isaac Sim仿真平台的装配体稳定性验证方法

针对上述装配体稳定性的问题,本文创造性地提出一种基于NVIDIA Isaac Sim仿真平台的装配体稳定性验证方法,如图2所示.首先对数据进行从点云到USD的格式转换,然后将其导入NVIDIA Isaac Sim仿真平台;在物理仿真过程中,仿真环境会实时记录装配体的状态;仿真结束后,系统会根据本文制定的稳定性判断规则来计算装配体的稳定性指标,验证经过三维补全的装配体的稳定性.

图2

图2   基于Isaac Sim仿真平台的装配体稳定性验证方法

Fig.2   A stability verification method for the completed assembly based on Isaac Sim simulation platform


利用仿真平台上的稳定性验证结果,本文训练了一个装配体稳定性判别器模型.输入补全的装配体的点云,模型能直接判定装配体的稳定性.该稳定性判别器模型可以直接在点云数据格式对装配体的稳定性进行判定,不需要在仿真平台中实现,为将稳定性引入三维装配补全网络的优化提供了便利与可能.

2.1 装配体稳定性量化定义

参考相关国家标准27中的稳定性测试方法,本文设计了一种关于装配体稳定性的普适性验证方法与量化指标.为了使补全的装配体具有良好的现实迁移性,稳定性验证应最大程度地模拟装配体在现实中被使用时的情况,本文的做法是将装配体静止放置于水平面上,观察其是否能保持稳定,即是否发生晃动或倾翻等现象.记初始时刻为t=0,此时装配体的状态记作s0=x0,y0,z0,其中x,y,z表示装配体重心的三维坐标.记末尾时刻为t=T,此时装配体的状态记作sT=xT,yT,zT,同时实时记录0~T任意时刻装配体沿xy方向的速度VxtVyt(采用右手坐标系,默认z方向为竖直向上,0tT).则初始时刻与末尾时刻装配体状态s0sT之间的余弦相似度为:

sims0,sT=cosθ=s0sTs0sT

记装配体稳定性为SS为二值变量,S=1表示装配体稳定,S=0表示装配体不稳定,则本文提出的装配体稳定性的具体量化定义可归纳为:

S=0,    maxVxt,Vyt>0.1 or sims0,sT<0.71,                              otherwise

其中,对于速度的约束条件主要是确保稳定的装配体不会发生晃动,对于状态的约束条件主要是确保稳定的装配体不会发生倾翻.

式(2)是本文提出的关于装配体稳定性的一种具有普适性的定义方式,对于某些特定类型的装配体,如椅子、桌子等,其稳定性的定义以及检验方式应当在此基础上作出适当修改,比如在检验时添加适当大小的外力以更贴合其现实的使用场景.本文后续会对此进行更加深入的探索.

2.2 基于NVIDIA Isaac Sim仿真平台的稳定性验证

NVIDIA Isaac Sim是NVIDIA Omniverse平台推出的一款机器人模拟工具包,Isaac Sim具有构建虚拟机器人世界和实验的基本功能,为研究和从业人员提供所需的工具和工作流程来创建稳定的、物理上精确的仿真环境及合成数据集.

基于NVIDIA Isaac Sim仿真平台,本文搭建了一个非常接近现实场景且物理精确的仿真环境来对装配体进行稳定性检验,其具体流程可以参考图2,首先添加一个具有物理属性的水平面来承载待检测的装配体,然后导入装配体.由于仿真平台只支持USD格式文件的导入,所以需要先将点云格式的装配体转换成USD格式.导入装配体后,将其静止放置在水平面上并为其赋予物理属性.为了使提出的稳定性检验方法具有普适性,将所有装配体统一设置为质量m=5 kg,且均由相同材料制成.准备工作完成后,按下Isaac Sim操作界面的仿真按钮,平台内置的物理引擎将自动对物理现象进行实时的精确的模拟,同时,Isaac Sim界面的显示面板也将实时显示装配体的位置坐标及其沿各个方向的速度,方便用户实时掌握装配体的状态.记仿真开始的时刻为0,在T时刻仿真自动结束.最终,仿真环境根据2.1中定义的稳定性量化指标对装配体的稳定性进行评估,并将结果返回给用户.

2.3 装配体稳定性判别器

如果按照2.2所述,每次对补全的装配体进行稳定性检验都要先转换文件格式再导入仿真环境,会大大增加实验的时间成本,并且,通过这种方式获得的装配体稳定性标签不具有梯度信息,无法用于三维装配补全网络的梯度更新与优化.

为了解决上述问题,本文设计了一个基于装配体稳定性的判别器模型,如图3所示.该模型主要由两层结构组成:第一层为特征提取层,采用PointNet28提取部件级别的点云特征;第二层为分类层,包含两个全连接层和一个预测层,全连接层将部件级别的点云特征进行整合,提取实例级别的点云特征,最终在预测层实现从实例级点云特征到稳定性类别标签的预测.

图3

图3   装配体稳定性判别器

Fig.3   Assembly stability discriminator


稳定性判别器模型总体实现的效果为:对模型输入装配体所有部件的点云数据,输出关于该装配体稳定性的预测评分,评分越接近1,表示装配体的稳定性越好.输出的评分还具有梯度信息,为后续对3D装配补全网络进行优化提供可能.

利用基于Isaac Sim仿真平台的稳定性验证方法,本文得到了一批带有稳定性标签的装配体数据,并基于此训练出装配体稳定性判别器模型,具体的训练细节参考4.3.稳定性判别器模型训练过程的损失函数定义如下:

𝓁d=1ni=1nscorei-scorei*

其中,scorei*表示装配体稳定性的真实标签.

3 基于稳定性优化的三维装配补全方法

首先对三维装配补全任务进行简单介绍.

给定一个具有N-j个部件的半成品装配体I=Pii=1N-j,其中,PiR1000×3表示特定部件的一组三维点云,N为完整装配体的部件总数.任务目标是从候选部件库D=Pii=1M中挑选半成品装配体I缺失的部件M=Pii=1j,同时预测这j个部件的6自由度位姿Ri,tii=1j,最终将所选部件装配到半成品装配体上.其中,RiR4表示旋转四元数,tiR3表示平移变换,Ti 表示装配过程中基于位姿Ri,ti的联合变换.

将本课题组已有的FiT框架作为三维装配补全网络的主体架构,在其基础上引入2.3中的装配体稳定性判别器模型,首创性地提出了一种基于稳定性优化的三维装配补全方法StableFiT,整体架构如图4所示.其中,FiT是一个基于Transformer的三维装配补全框架,主要由PointNet、编码器、解码器和预测器四部分组成.PointNet提取半成品装配体部件以及候选部件库中各候选部件的点云特征,编码器将半成品装配体的部件特征编码为记忆向量,解码器将部件库中的候选部件特征编码为查询向量,查询向量通过注意力机制进一步与记忆向量交互.最后一部分的预测器包含两个结构相同的网络,一个挑选可能性最大的缺失部件,另一个预测其最佳的装配补全位姿,最终将半成品补装完整.稳定性判别器采用2.3所述预训练好的装配体稳定性判别器,负责对补全的装配体进行稳定性检验,检验结果以损失函数的形式反馈给三维装配补全网络FiT,实现基于稳定性的三维装配补全网络性能优化,使补全的装配体更符合现实任务的需求.

图4

图4   基于稳定性优化的三维装配补全方法StableFiT

Fig.4   StableFiT for 3D assembly completion with stability optimization


StableFiT的训练过程实际是一个多任务学习过程,包括候选部件分类、位姿预测及稳定性优化.本文分别为候选部件分类任务设计了分类损失lc,为位姿预测任务设计了平移损失𝓁t、旋转损失lr和点云倒角距离损失𝓁s,为稳定性优化任务设计了稳定性损失𝓁sta.关于损失𝓁c𝓁t𝓁r𝓁s的具体定义以及计算方式参见文献[14],本文不再赘述.

本文设计的稳定性损失定义如下:

𝓁sta=1ni=1nscorei-1

StableFiT训练过程的总体损失定义如下:

𝓁=λt𝓁t+λr𝓁r+λs𝓁s+λc𝓁c+λsta𝓁sta

其中,λ表示损失权重,各损失权重的设置参考4.3.

4 实验分析

4.1 实验数据

使用PartNet数据集29对提出的方法进行评估.PartNet是一个大规模的三维模型数据集,附有部件级别的实例分割标注.选用其中的椅子和桌子类别的数据,共包含6323把椅子和8218张桌子,选取部件总数不超过20的椅子和桌子进行实验.对每个部件使用最远点采样(Furthest Point Sampling,FPS)1000个点,并使用PCA (Principal Component Analysis)30将部件点云转换到规范空间.

4.2 评价指标及基准模型

采用匹配精度、点云倒角距离、部件精度、连接精度和不稳定装配体比例五种评价指标对实验结果进行评估.

匹配精度(Match Accuracy,MA)评估候选部件挑选的准确性:

MA=cj

其中,j为缺失部件数量,c为匹配正确的部件数量.

点云倒角距离(Shape Chamfer Distance,SCD)和部件精度(Part Accuracy,PA)衡量装配补全完成的整体质量.

两个点云之间的倒角距离:

dcX,Y=xXminyYx-y22+yYminxXx-y22

部件精度,即与真实值的点云倒角距离在一定阈值内的部件比例:

PA=1mi=1mdcTipi,Ti*pi*<τp

其中,阈值τp设置为0.01.

连接精度2(Connectivity Accuracy,CA)衡量补全的装配体中部件的连接情况:

CA=1Ccij,cjiCTicij-Tjcji22<τc

其中,cij为部件点云pi中与部件点云pj距离最近的点,即接触点;C为半成品装配体与候选部件之间接触点对的集合;阈值τc设置为0.01.

稳定装配体比例(Proportion of Stable Assembly,PSA)评估补全的装配体的稳定性分布情况:

PSA=sa

其中,s代表稳定装配体的数量,a代表所有补全的装配体的数量.

采用多种基准模型与提出的StableFiT方法进行对比,包括Sung et al31的Complement,Li et al11的Single Image和Wang et al14的FiT.

Complement方法通过有无部件的对比学习方法来学习部分形状在特征空间中的表示.本研究保留了其中基于PointNet的特征提取网络和位姿解码器,并通过在候选部件库中采样错误部件的对比学习方法,训练解码器完成部件的挑选和6自由度拼装位姿的预测.

Single Image方法主要采用单张图片指导完成三维组装.本研究删除了模型中的图像编码器部分,采用PointNet将缺失部件的装配体建模为全局特征,将候选部件建模为局部特征,并将二者结合以实现三维装配补全.

FiT方法在模型训练过程中提出一种对称性损失,目的是使模型补全的装配体具有更好的对称性来近似模拟稳定性,但其不具有通用性,在现实场景中的适用范围受限,故本研究在对比实验中没有对基准模型采用该损失.

4.3 实验方法

4.3.1 稳定性判别器模型训练

利用4.1所述数据对基准模型FiT14进行训练,训练轮次分别为20,40,80,160,320和最佳轮次的模型补全的装配体,将其如2.2所述输入NVIDIA Isaac Sim仿真环境中进行稳定性验证,得到带有稳定性标签的半成品装配体数据集.对该数据集进行一定的处理,将其中稳定装配体与不稳定装配体的比例调整至7∶3,再利用处理后的数据集训练2.3提出的稳定性判别器模型.训练过程中,设置初始学习率为0.001,batch size为64,训练轮次为200.对于椅子和桌子数据集分别按上述步骤训练得到对应的稳定性判别器模型,最终得到的椅子稳定性判别器模型的分类准确率可达80%,桌子稳定性判别器模型的分类准确率可达76%.

以上是单部件缺失时的实验方法,对于多部件缺失的情况,处理步骤与上述基本一致,只是训练数据集的构建稍有不同.这里选择训练轮次为40,80,160和最佳轮次的模型补全的装配体进行NVIDIA Isaac Sim仿真环境下的稳定性验证,得到带有稳定性标签的半成品装配体数据集,后续对于稳定性判别器模型训练参数的设置与上述一致.最终训练得到的椅子稳定性判别器模型的分类准确率可达84%,桌子稳定性判别器模型的分类准确率可达77%.

4.3.2 StableFiT模型训练

采用AdamW优化器对StableFiT模型进行训练,设置初始学习率为1.5×10-4,batch size为32,训练轮次为500,使用四张NVIDIA V100显卡进行训练.单部件缺失和多部件缺失情况下的损失函数权重设置稍有不同,具体如表1所示.StableFiT框架中的稳定性判别器模型直接使用4.3.1中训练好的装配体稳定性判别器模型,在训练过程中其参数被冻结,不参与此处的训练.

表1   StableFiT训练过程中损失函数权重的设置

Table 1  Weights settings for loss function during StableFiT training process

jλtλrλsλcλsta
11.010.010.01.50.1
31.010.05.01.50.1

新窗口打开| 下载CSV


4.4 实验结果与分析

为了验证提出的基于稳定性优化的三维装配补全方法StableFiT的有效性,从两个角度设计实验并对实验结果进行分析:(1)验证提出的方法是否可以提升现有的三维装配补全网络的精度;(2)验证提出的方法是否能有针对性地提升补全的装配体的稳定性.

为了完成第一个验证,将StableFiT方法与基准模型Complement,Single Image和FiT在单部件缺失j=1的情况下进行对比实验,同时与基准模型FiT在多部件缺失j=3的情况下进行对比实验,实验结果如表2所示,表中箭头的方向表示更优的结果方向,黑体字表示结果最优.

表2   本文方法与基准方法的性能的比较

Table 2  Performance of our method and the baseline methods

类别j方法MASCDPACAPSA

1Complement77.690.033214.8715.21-
Single Image81.750.014134.7229.80-
FiT87.710.008963.5649.9490.10
StableFiT88.470.008466.4551.1990.95
3FiT70.770.016644.0438.1875.97
StableFiT72.610.015748.2837.5277.47

1Complement80.130.013628.8940.72-
Single Image82.390.009347.0554.21-
FiT92.560.006075.3568.9191.79
StableFiT91.830.005276.9769.8392.19
3FiT62.910.008449.5643.4682.78
StableFiT68.060.008950.7352.2683.98

新窗口打开| 下载CSV


由表可见,单部件缺失时,StableFiT的性能显著优于基准模型Complement和Single Image,大多数指标,尤其是部件精度PA和连接精度CA的优势更明显.这说明Single Image在不进行基于部件分割的特征增强时,其性能会显著下降;Complement的部件精度PA表现较差,是几何相似的部件对对比学习的干扰造成的.无论是在单部件缺失还是在多部件缺失的情况下,StableFiT的性能都基本优于基准模型FiT,验证了StableFiT提升现有三维装配补全网络精度的效果.其中,和FiT相比,StableFiT对部件精度PA的提升最显著,在单部件和多部件缺失的情况下分别提升2.89%和4.24%.这是因为装配体的稳定性直接受部件装配质量的影响,稳定的装配体要求部件以准确的位姿完成补全,所以稳定性优化能直接促进部件精度的提升.部件是否被正确选择也会影响装配体的稳定性,所以引入稳定性优化后模型的匹配精度MA也得到了较大的提升.这些都再次证明了本文StableFiT方法的有效性.

实验结果还显示,各个方法在桌子类别数据上的性能普遍优于在椅子类别数据上的性能,这是因为桌子的结构相对简单,对称性更明显,且部件构成相对固定,不同种类桌子之间的结构化差异比椅子小,因而对桌子进行三维装配补全的难度低于椅子.虽然如此,StableFiT对椅子和桌子两种类别的数据均能很好地适应,在这两种类别数据上的实验结果均得到了一定的提升.

另外还发现,引入稳定性优化后,模型在多部件缺失场景下的性能提升优于单部件缺失场景.这是因为多部件补全任务的难度相对较大,基准模型补全的不稳定装配体的比例会相对较高,所以StableFiT方法发挥作用的空间相对更大.

为了完成第二个验证,分别利用训练好的StableFiT模型与基准模型FiT对同一批半成品装配体进行补全,统计装配补全结果中稳定装配体所占的比例,结果如表2PSA一列所示.分析实验结果可知,单部件缺失时,StableFiT装配补全结果中稳定装配体所占的比例略高于FiT;多部件缺失时,StableFiT装配补全结果中稳定装配体所占的比例和FiT相比,提升比较明显,证明了StableFiT对提升装配体稳定性的效果.

为了直观说明StableFiT对装配体稳定性提升的效果,将StableFiT与基准模型FiT补全的装配体在NVIDIA Isaac Sim仿真平台上进行验证,图5展示了引入稳定性优化前后FiT模型补全的部分装配体的对比情况.图5a和图5b是单部件缺失时两种方法补全的装配体,图5c和图5d是多部件缺失时两种方法补全的装配体.每幅子图中左侧的装配体是由基准模型FiT补全得到的,右侧的装配体是利用StableFiT补全得到的.图中还通过放大局部细节来更好地对比展示装配体的稳定性情况,红色框展示的是装配体不稳定的细节,蓝色框展示引入稳定性优化后的改进情况.

图5

图5   StableFiT与FiT补全装配效果的对比

Fig.5   Assembly completion results of StableFiT and FiT


图5a和图5b中由FiT模型补全的装配体都存在典型的拼装错误.如红色框中所示,图5a中装配体的桌面在装配补全时发生拼装位姿的错误,没有和桌子的边框对齐,图5b中装配体的椅腿在装配补全过程中拼装姿态发生错误,这些都会导致装配体的不稳定.引入稳定性优化后,利用StableFiT补全的装配体不存在上述问题,稳定性得到了提升,如蓝色框中所示.图5c中由FiT模型补全的装配体存在多部件补全中常见的部件选择错误,导致其在某个待补全位置没有椅腿,而在另一个待补全位置上有两条椅腿,这显然是不稳定的.引入稳定性优化后,装配体的部件被正确挑选,并以相对准确的位姿被装配到待补全位置上.图5d中由FiT模型补全的装配体存在典型的连接性错误,桌腿和桌面没有连接成整体,这也是一种不稳定现象.引入稳定性优化后,这种错误得到了针对性的解决.

综上,本文提出的基于稳定性优化的三维装配补全方法StableFiT,一方面可以提升现有三维装配补全网络的精度,补全出更高质量的装配体,另一方面,也能针对性地提升补全的装配体的稳定性,证明了稳定性优化的效果.

4.5 消融实验

为了充分探讨损失函数中各损失项在三维装配补全任务中的作用,在PartNet数据集中某一类别数据的单部件补全场景下设计了全面的消融实验,分析不同损失项对性能的影响.

通过单独删除损失函数中的每个损失项来评估其对性能的影响,实验结果如表3所示,表中箭头的方向表示更优的结果方向,黑体字表示结果最优.由表可知,损失函数的每个损失项都有助于模型性能的提高.具体地,平移损失𝓁t对部件拼装位姿的预测至关重要,删除𝓁t之后部件精度和连接精度都大幅降低;旋转损失𝓁r对部件正确挑选的影响更大,删除𝓁r之后匹配精度比其他指标下降得更明显;点云倒角距离损失𝓁s同样有助于部件以正确的位姿完成拼装,主要影响的是点云倒角距离,但删除𝓁s之后匹配精度反而得到小幅的提升,综合所有指标来看,𝓁s对部件拼装的正向作用高于其潜在的负面作用,应在损失函数中保留.本文设计的稳定性损失𝓁sta的添加,一方面使稳定装配体的比例上升,另一方面,也使其他的性能指标得到提升,充分证明了其有效性.

表3   各损失项对实验性能的影响

Table 3  Effect of loss components on experiment results

ltlrlslstaMASCDPACAPSA
×87.100.010649.3536.9682.31
×84.910.008664.7349.6390.58
×90.010.010063.0048.6891.20
×87.710.008963.5649.9490.10
88.470.008466.4551.1990.95

新窗口打开| 下载CSV


5 结论

三维装配补全任务尝试解决半成品装配体的部件补全问题,具有很高的实用价值.针对现有的三维装配补全方法较少考虑装配体稳定性的问题,本文提出一种基于稳定性优化的三维装配补全方法StableFiT,一方面可以提高补全后装配体的稳定性,使其更加满足机器人装配实施的需求,另一方面,也可对现有的三维装配补全过程进行性能优化,提升补全的装配体的整体质量.后续将继续完善稳定性验证方式,增强其合理性,并基于不同的装配场景设计特定的稳定性验证方式;还将把本文提出的稳定性优化方法拓展到其他装配任务中,如三维部件装配.

参考文献

Zhang R FKong TWang W Het al.

3D part assembly generation with instance encoded transformer

IEEE Robotics and Automation Letters,20227(4):9051-9058.

[本文引用: 1]

Zhan G QFan Q NMo K Cet al.

Generative 3D part assembly via dynamic graph learning

Proceedings of the 34th International Conference on Neural Information Processing Systems. 20206315-6326.

[本文引用: 3]

Chaudhuri SKalogerakis EGuibas Let al.

Probabilistic reasoning for assembly⁃based 3D modeling

Proceedings of the ACM SIGGRAPH 2011. Vancouver,CanadaACM2011:Article No.35.

[本文引用: 1]

Jaiswal PHuang J MRai R.

Assembly⁃based conceptual 3D modeling with unlabeled components using probabilistic factor graph

Computer⁃Aided Design,2016(74):45-54.

Kalogerakis EChaudhuri SKoller Det al.

A probabilistic model for component⁃based shape synthesis

ACM Transactions on Graphics,201231(4):55.

[本文引用: 1]

Harish A NNagar RRaman S.

RGL⁃NET:A recurrent graph learning framework for progressive part assembly

Proceedings of 2022 IEEE/CVF Winter Conference on Applications of Computer Vision. Waikoloa,HI,USAIEEE2022647-656.

[本文引用: 1]

Wu R DZhuang Y XXu Ket al.

PQ⁃NET:A generative part Seq2Seq network for 3D shapes

Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle,WA,USAIEEE2020829-838.

[本文引用: 1]

Li JNiu C JXu K.

Learning part generation and assembly for structure⁃aware shape synthesis

Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York,NY,USAAAAI Press202011362-11369.

[本文引用: 1]

Gulrajani IAhmed FArjovsky Met al.

Improved training of wasserstein GANs

Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach,CA,USACurran Associates Inc.20175769-5779.

[本文引用: 1]

Adler JLunz S.

Banach wasserstein GAN

Proceedings of the 32nd International Conference on Neural Information Processing Systems. Montréal,CanadaCurran Associates Inc.20186755-6764.

[本文引用: 1]

Li Y CMo K CShao Let al.

Learning 3D part assembly from a single image

Proceedings of the 16th European Conference on Computer Vision. Springer Berlin Heidelberg2020664-682.

[本文引用: 2]

Wu CZheng JPfrommer Jet al.

Attention⁃based part assembly for 3D volumetric shape modeling

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Vancouver,CanadaIEEE20232716-2725.

[本文引用: 1]

Xu X HGuerrero PFisher Met al.

Unsupervised 3D shape reconstruction by part retrieval and assembly

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver,CanadaIEEE202320238559-8567.

[本文引用: 1]

Wang W HZhang R FYou M Yet al.

3D assembly completion

Proceedings of the 37th AAAI Conference on Artificial Intelligence. Washington DC,USAAAAI Press20232663-2671.

[本文引用: 5]

Tchapmi L PKosaraju VRezatofighi Het al.

TopNet:Structural point cloud decoder

Proceedings of 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach,CA,USAIEEE2019383-392.

[本文引用: 1]

Yuan W TKhot THeld Det al.

PCN:Point completion network

Proceedings of 2018 International Conference on 3D Vision. Verona,ItalyIEEE2018728-737.

[本文引用: 1]

Wen XLi T YHan Z Zet al.

Point cloud completion by skip⁃attention network with hierarchical folding

Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle,WA,USAIEEE20201939-1948.

[本文引用: 1]

Sarmad MLee H JKim Y M.

RL⁃GAN⁃Net:A reinforcement learning agent controlled GAN network for real⁃time point cloud shape completion

Proceedings of 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach,CA,USAIEEE20195898-5907.

[本文引用: 1]

Hu THan Z ZShrivastava Aet al.

Render4Completion:Synthesizing multi⁃view depth maps for 3D shape completion

Proceedings of 2019 IEEE/CVF International Conference on Computer Vision Workshop. Seoul,Korea (South)IEEE20194114-4122.

[本文引用: 1]

Vaswani AShazeer NParmar Net al.

Attention is all you need

Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach,CA,USACurran Associates Inc.20176000-6010.

[本文引用: 1]

Yan X GLin L QMitra N Jet al.

ShapeFormer:Transformer⁃based shape completion via sparse representation

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New OrleansIEEE20226239-6249.

[本文引用: 1]

Mittal PCheng Y CSingh Met al.

AutoSDF:Shape priors for 3D completion,reconstruction and generation

Proceedings of 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New Orleans,LA,USAIEEE2022306-315.

[本文引用: 1]

van den Oord AVinyals OKavukcuoglu K.

Neural discrete representation learning

Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach,CA,USACurran Associates Inc.20176309-6318.

[本文引用: 1]

Esser PRombach ROmmer B.

Taming transformers for high⁃resolution image synthesis

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. IEEE202112873-12883.

[本文引用: 1]

Wen XXiang PHan Z Zet al.

PMP⁃Net++:Point cloud completion by transformer⁃enhanced multi⁃step point moving paths

IEEE Transactions on Pattern Analysis and Machine Intelligence,202345(1):852-867.

[本文引用: 1]

Li S SGao PTan X Yet al.

ProxyFormer:Proxy alignment assisted point cloud completion with missing part sensitive transformer

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver,CanadaIEEE20239466-9475.

[本文引用: 1]

国家市场监督管理总局国家标准化管理委员会.

办公家具 桌台类 稳定性、强度和耐久性测试方法

GB/T 38607⁃2020.

[本文引用: 1]

State Administration of Market Supervision and Administration of the People's Republic of ChinaStandardization Administration of the People's Republic of China.

Office furniture:Tables and desks

Test methods for the determination of stability,strength and durability. GB/T 38607⁃2020.

[本文引用: 1]

Qi Charles RSu HMo K Cet al.

PointNet:Deep learning on point sets for 3D classification and segmentation

Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu,HI,USAIEEE2017652-660.

[本文引用: 1]

Mo K CZhu S LChang A Xet al.

PartNet:A large⁃scale benchmark for fine⁃grained and hierarchical part:Level 3D object understanding

Proceedings of 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach,CA,USAIEEE2019909-918.

[本文引用: 1]

LIII Pearson K..

On lines and planes of closest fit to systems of points in space

The London,Edinburgh,and Dublin Philosophical Magazine and Journal of Science,19012(11):559-572.

[本文引用: 1]

Sung MSu HKim V Get al.

ComplementMe:Weakly⁃supervised component suggestions for 3D modeling

ACM Transactions on Graphics,201736(6):226.

[本文引用: 1]

/