CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理
Subjects: cs.CV
1.Pose Impact Estimation on Face Recognition using 3D-Aware Synthetic Data with Application to Quality Assessment
标题:使用 3D 感知合成数据对人脸识别进行姿势影响估计并将其应用于质量评估
作者:Marcel Grimmer, Christian Rathgeb, Christoph Busch
文章链接:https://arxiv.org/abs/2303.00491v1
项目代码:https://github.com/datasciencegrimmer/syn-yawpitch
摘要:
评估面部图像的质量对于以足够的准确性操作面部识别系统至关重要。人脸质量标准化的最新进展 (ISO/IEC WD 29794-5) 建议使用组件质量测量方法将人脸质量分解为各个因素,从而为操作员重新捕获低质量图像提供有价值的反馈。鉴于 3D 感知生成对抗网络的最新进展,我们提出了一个新的数据集“Syn-YawPitch”,其中包含 1,000 个具有不同偏航-俯仰角度组合的身份。利用此数据集,我们证明超过 30 度的俯仰角对当前人脸识别系统的生物识别性能有重大影响。此外,我们提出了一种轻量级、高效的姿势质量预测器,它符合 ISO/IEC WD 29794-5 标准。
2.Multimodal Industrial Anomaly Detection via Hybrid Fusion
标题:通过混合融合进行多模式工业异常检测
作者:Yue Wang, Jinlong Peng, Jiangning Zhang, Ran Yi, Yabiao Wang, Chengjie Wang
文章链接:https://arxiv.org/abs/2303.00601v1
项目代码:https://github.com/nomewang/m3dm
摘要:
基于2D的工业异常检测已被广泛讨论,然而,基于3D点云和RGB图像的多模态工业异常检测仍有许多未触及的领域。现有的多模态工业异常检测方法直接将多模态特征进行拼接,导致特征间存在较强的干扰,影响检测性能。在本文中,我们提出了多 3D 记忆 (M3DM),一种具有混合融合方案的新型多模态异常检测方法:其次,我们使用决策层与多个记忆体融合来避免信息丢失,并使用额外的新颖性分类器来做出最终决策。我们进一步提出了点特征对齐操作,以更好地对齐点云和 RGB 特征。大量实验表明,我们的多模式工业异常检测模型在 MVTec-3D AD 数据集的检测和分割精度方面优于最先进的 (SOTA) 方法。代码可在 https://github.com/nomewang/M3DM 获得。
3.ORCHNet: A Robust Global Feature Aggregation approach for 3D LiDAR-based Place recognition in Orchards
标题:ORCHNet:一种用于果园中基于 3D LiDAR 的地点识别的稳健全局特征聚合方法
作者:Barros, L. Garrote, P. Conde, M. J. Coombes, C. Liu, C. Premebida, U. J. Nunes ·
文章链接:https://arxiv.org/abs/2303.00477v1
项目代码:https://github.com/cybonic/orchnet
摘要:
我农业环境中稳健可靠的位置识别和闭环检测仍然是一个悬而未决的问题。特别是,由于整个领域的结构相似性,果园是一个困难的案例研究。在这项工作中,我们利用 3D LiDAR 数据解决了果园中的地点识别问题,这被认为是稳健性的关键模式。因此,我们提出了 ORCHNet,这是一种基于深度学习的方法,可将 3D-LiDAR 扫描映射到全局描述符。具体来说,这项工作提出了一种新的全局特征聚合方法,它将多种聚合方法融合到一个鲁棒的全局描述符中。ORCHNet 是根据在果园中收集的真实数据进行评估的,其中包括来自夏季和秋季的数据。为了评估稳健性,我们将 ORCHNet 与来自同一季节和跨季节的数据的最先进聚合方法进行了比较。此外,我们还评估了所提出的方法作为本地化框架的一部分,其中 ORCHNet 用作闭环检测器。实证结果表明,在地点识别任务上,ORCHNet 优于其余方法,并且跨季节也更加稳健。至于定位,当将 ORCHNet 集成为环路检测器时,解决了路径穿过树木的边缘情况,显示了所提出方法在此任务中的潜在适用性。
更多Ai资讯:公主号AiCharm