西安电子科技大学在国际顶级期刊TPAMI发表3篇研究论文

来源:西安电子科技大学 #人工智能# #事件相机# #西安电子科技大学#
4072

近日,西安电子科技大学人工智能学院博士生在对抗攻防、事件相机去噪、图像美学计算研究等领域的最新研究成果被领域顶级期刊 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE (TPAMI,一区,IF=20.8)收录,标志着所在科研团队在相关领域的研究取得了重要进展。TPAMI作为人工智能领域最具影响力的学术期刊之一,在全球范围内享有盛誉,收录的研究成果通常代表了该领域的最高水平。

人工智能学院与军事科学院联合培养博士生李超作为第一作者,人工智能学院王晗丁教授和军事科学院姚雯研究员为通讯作者,发表题为 Optimizing Latent Variables in Integrating Transfer and Query Based Attack Framework 的论文。

该论文深入探讨了深度学习模型面临的安全性问题,聚焦黑盒攻击场景,提出了一种联合迁移攻击和查询攻击的集成框架,解决了对抗样本迁移性差、黑盒查询率较高等难题。该集成框架主要分为两个部分:利用迁移攻击的思想,通过后接白盒模型,训练能够输出对抗干扰的生成器,并将对抗干扰迁移到黑盒模型上进行攻击,降低模型查询次数;利用查询攻击的思想,使用进化算法优化生成器的输入以提高对抗样本的迁移性。该集成攻击框架具有灵活度高、可扩展性强等特点,通过调整生成器输出可以适配不同的对抗攻击任务。

论文所提方法框架

人工智能学院方华晨博士为第一作者、吴金建教授为通讯作者发表题为 Fast Window-Based Event Denoising with Spatiotemporal Correlation Enhancement 的论文。

事件相机是一种新型仿生传感器,与传统相机积分成像不同,事件相机异步捕捉动态信号。受生物视觉系统动态感光机制启发,课题组设计了一款动态感知芯片,研制了一款仿生相机,该相机具备高时间分辨率、大动态范围等特点,在智能制造、自动驾驶、安防监控等领域实现了创新性突破。

自研晶圆、芯片和相机

然而由于差分成像系统信号触发特性,事件流数据伴随着大量噪声,限制了事件相机的发展。现有深度学习的事件去噪方法大多存在可解释性差和实时处理困难的问题。本文提出了一种基于窗口的事件去噪方法,同时处理窗口内所有事件,大大提升了去噪速度。此外,本文构建了一个新的基于多尺度窗口的事件去噪网络WedNet,并基于时间和空间域的概率分布进行了理论分析。在时间域中,我们使用时间窗(TW)模块来判断时间相关性以过滤出时间无关的事件。在空间域中,我们选择最大后验概率(MAP)来区分真实世界的事件和噪声,并使用学习到的卷积稀疏编码来优化目标函数,构建了软阈值空间特征嵌入(SSFE)模块。

事件窗口去噪网络

研究成果WedNet在四个公开数据集上实现了最高去噪精度(PSNR:25.73dB)和最快速运行速度(112.17s),为复杂场景中实现实时去噪提供了可能。

人工智能学院黄一珀博士为第一作者、李雷达教授为通讯作者发表题为 Multi-modality Multi-attribute Contrastive Pre-training for Image Aesthetics Computing 的论文。

该论文考虑到现有的基于ImageNet数据集的预训练模型往往侧重于高层次语义特征,而忽略了图像中的美学要素,从而提出了一种基于多模态多属性对比学习的图像美学计算预训练方法。借助于多模态大语言模型对图像进行多维度人机混合标注,构建了多模态图像美学属性数据集,在此基础上采用多模态多属性对比学习进行模型训练。实验结果表明提出的方法在图像构图分类、构图回归、美学评价等多种美学相关任务上性能SOTA,相较于常用的ImageNet预训练在六个公开数据集上实现了全面领先优势。该研究成果在手机拍照、网络直播、图像编辑、人工智能生成内容(AIGC)以及艺术与设计等众多领域中都有重要的应用前景。

多模态图像美学属性数据集的构建过程

基于多模态多属性对比学习的预训练方法框图

这些研究成果

不仅展示了西电

在人工智能领域的创新能力

也为相关技术的发展和应用提供了新的动力

未来

西电将继续致力于推动人工智能技术的进步

为社会发展和科技进步贡献更多力量

责编: 赵碧莹
来源:西安电子科技大学 #人工智能# #事件相机# #西安电子科技大学#
THE END
关闭
加载

PDF 加载中...