|
出品人:Towhee 技术团队 何俊辰、顾梦佳( @JJJael )
面对图像分类问题,子类内部的差异和类别之间的差异都是需要解决的挑战,且有这种需求的数据在爆炸性增长。A2-Net 针对大规模细粒度的图象索引问题,基于索引中细粒度的细节,能够对感兴趣的标签进行排序(子类别标签)。A2-NET 通过生成哈希码,使得索引过程高效,并建立哈希码和视觉参数之间的联系。A2-NET 提出了一个约束以增强特征向量的区分能力。在五个标准测试集合上,A2Net 均取得了具有竞争力的效果。

Framework of A2Net
A2Net 由两个关键模块组成,分别用于学习细粒度的表征与生成能够感知属性的哈希码。它首先利用注意力机制,根据输入图像的全局深度特征和局部线索针对细粒度模式进行建模。为了将这些外观特征转换成语义表示,该网络构建了一个基于码器-解码器的网络的重建任务,无监督地从视觉表征中蒸馏出高维度的特征向量。
相关资料:
- 论文链接:A2-Net: Learning Attribute-Aware Hash Codes for Large-Scale Fine-Grained Image Retrieval
<hr/>如果你觉得我们分享的内容还不错,请不要吝啬给我们一些鼓励:点赞、喜欢或者分享给你的小伙伴!
活动信息、技术分享和招聘速递请关注:
如果你对我们的项目感兴趣请关注:
用于存储向量并创建索引的数据库 Milvus
用于构建模型推理流水线的框架 Towhee |
|