基于弱监督空间组注意力的细粒度鸟类识别方法
细粒度图像识别是对属于同一大类别的多个子类别进行分类,这具有很大的挑战性,因为同一子类别的差异可能很大,而不同子类别的差异可能很小。以前的方法一般是先定位整体目标或部位,然后判断图像属于哪个子类别,这些方法依赖于耗费大量人力物力的目标或部位标注,是走向实际应用的巨大障碍。还有一些方法从高层特征图中间接提取可识别的区域,但是它们忽略了目标及其部位之间的空间关系,这可能会导致识别不准确。在本文中,我们提出了一个基于弱监督的空间组注意力网络用于细粒度的鸟类图像识别。根据目标及其部位之间的空间关系,我们将空间组注意力模块嵌入到识别网络中,通过建立语义特征空间增强机制来突出正确的语义特征区域。此外,我们应用了矩交换数据增强模块,通过交换两张输入图像特征图的矩(方差和均值)来生成新的特征图(包含两张输入图像的特征)从而达到数据增强的作用。结合实验表明,我们的方法在自建鸟类图像数据集 Bird-65、公开鸟类图像数据集 CUB200-2011 和细粒度图像数据集Stanford Cars上的分类效果都明显优于现有的细粒度鸟类识别方法。
176-176 / 1
评论