近期,电气信息工程学院张焕龙教授团队在计算机科学领域的顶级期刊《Knowledge-based Systems》上发表题为“Target-background interaction modeling transformer for object tracking.(用于目标跟踪的目标-背景交互建模Transformer)”的研究论文。
单流Transformer跟踪器因其优异的判别能力而受到广泛关注。然而,现有的大多方法都试图挖掘更多的目标信息,而忽略了对目标周围背景的利用。在本文中,设计了一种基于目标-背景交互建模Transformer的目标跟踪方法。一方面,为了减轻类间场景的影响,设计了一种基于Transformer的目标-背景交互模型。该模型从二维到三维进行多视角时空注意力建模,探索目标时空上下文和搜索区域之间的关系依赖。模型通过最小化纯背景Token的影响,最大限度地获取高质量的目标Token增强目标表征。另一方面,考虑到类内强相似性干扰,设计了一个渐进式状态感知模块,用于优化目标表征的特征结构。该模块将目标的历史状态汇总到自注意力机制中,学习当前帧中目标与干扰物之间的位置关系,从而自适应地突出目标的权重。通过联合学习类间差异性和类内相似性,所提出的方法可以更准确地揭示目标特征的组成和结构,从而改善复杂场景中的视觉感知。
该论文以郑州轻工业大学为第一署名单位,张焕龙教授和研究生付伟强等作者共同完成。论文得到了国家自然科学基金、河南省科技研发联合重点、以及河南省杰出青年等项目支持。
《Knowledge-based Systems》(简称“KBS”)是人工智能领域的一本国际性、跨学科期刊。该期刊将发表该领域的原创、创新和创造性研究成果,旨在重点研究基于知识和其他基于人工智能技术的系统,期刊是中国计算机学会推荐期刊,属于中科院大类分区一区TOP期刊、JCR一区。2025年影响因子为7.2。
原文链接:https://www.sciencedirect.com/science/article/abs/pii/S0950705125002771
引用格式:Zhang H, Fu W, Qi R, et al. Target–background interaction modeling transformer for object tracking[J]. Knowledge-Based Systems, 2025, 315: 113230.