近日,大华股份基于深度学习的视觉目标跟踪算法,在通用目标跟踪评测集GOT-10k(Generic Object Tracking Benchmark)上获得综合精度排行榜第一,超越了其它一流AI公司和顶尖的学术研究机构;同时在OTB2015/VOT2018/VOT2019数据集上刷新了当前跟踪算法SOTA(state-of-the-art)标准,这标志着大华在视觉目标跟踪领域处于领先水平。
GOT-10k数据集由中国科学院自动化研究所CASIA的智能系统与工程研究中心发布并维护,是具有国际权威的通用目标跟踪算法评测数据集。其中,训练集由10000个视频序列组成,包含563个目标类别与87种运动模式;测试集由180个视频序列组成,包含84个目标类别与32种运动模式。训练集与测试集的目标类别不重合,且算法评估时要求使用统一的训练数据,极具挑战性,吸引了海内外广大学者和知名学术机构参与。
该算法是为模拟人眼在目标运动估计及跟踪方面的能力,给定任意目标的初始位置,跟踪算法负责输出后续帧中该目标的位置与分布状态,同时要适应相机视角变化、环境变化、遮挡物、周边干扰物等因素的影响,可广泛应用于智能视频监测、辅助驾驶系统、人机交互、机器人视觉导航等领域。
在本次国际测评中,为实现复杂环境下对运动目标的准确跟踪,大华股份RSIA团队创新使用特征点集取代矩形框进行目标状态估计,进而实现精细化的目标区域表述与几何变换建模能力;在算法框架上使用并行分支结构,结合多层聚合策略,有效获取目标结构信息与对抗干扰物的强鲁棒性。
在大华实际产品中的应用