清华大学提出LiVT,用视觉Transformer学习长尾数据,解决不平衡标注数据不在话下_简讯
2023-06-22 21:10:08 来源:机器之心
【资料图】
机器之心专栏
机器之心编辑部本篇文章为大家介绍清华大学在 CVPR 2023 的论文,Learning Imbalanced Data with Vision Transformers(用视觉 Transformer 学习长尾数据),代码已开源。背景在机器学习领域中,学习不平衡的标注数据一直是一个常见而具有挑战性的任务。近年来,视觉 Transformer 作为一种强大的模型,在多个视觉任务上展现出令人满意的效果。然而,视觉 Transformer 处理长尾分布数据的能力和特性,还有待进一步挖掘。 目前,已有的长尾识别模型很少直接利用长尾数据对视觉 Transformer(ViT)进行训练。基于现成的预训练权重进行研究可能会导致不公平的比较结果,因此有必要对视觉 Transformer 在长尾数据下的表现进行系统性的分析和总结。 论文链接:https://arxiv.org/abs/2212.02015 代码链接:https://github.com/XuZhengzhuo/LiVT 本文旨在填补这一研究空白,详细探讨了视觉 Transformer 在处理长尾数据时的优势和不足之处。本文将重点关注如何有效利用长尾数据来提升视觉 Transformer 的性能,并探索解决数据不平衡问题的新方法。通过本文的研究和总结,研究团队有望为进一步改进视觉 Transformer 模型在长尾数据任务中的表现提供有益的指导和启示。这将为解决现实世界中存在的数据不平衡问题提供新的思路和解决方案。 文章通过一系列实验发现,在有监督范式下,视觉 Transformer 在处理不平衡数据时会出现严重的性能衰退,而使用平衡分布的标注数据训练出的视觉 Transformer 呈现出明显的性能优势。相比于卷积网络,这一特点在视觉 Transformer 上体现的更为明显。另一方面,无监督的预训练方法无需标签分布,因此在相同的训练数据量下,视觉 Transformer 可以展现出类似的特征提取和重建能力。 基于以上观察和发现,研究提出了一种新的学习不平衡数据的范式,旨在让视觉 Transformer 模型更好地适应长尾数据。通过这种范式的引入,研究团队希望能够充分利用长尾数据的信息,提高视觉 Transformer 模型在处理不平衡标注数据时的性能和泛化能力。 文章贡献本文是第一个系统性的研究用长尾数据训练视觉 Transformer 的工作,在此过程中,做出了以下主要贡献: 首先,本文深入分析了传统有监督训练方式对视觉 Transformer 学习不均衡数据的限制因素,并基于此提出了双阶段训练流程,将视觉 Transformer 模型内在的归纳偏置和标签分布的统计偏置分阶段学习,以降低学习长尾数据的难度。其中第一阶段采用了流行的掩码重建预训练,第二阶段采用了平衡的损失进行微调监督。 其次,本文提出了平衡的二进制交叉熵损失函数,并给出了严格的理论推导。平衡的二进制交叉熵损失的形式如下: 与之前的平衡交叉熵损失相比,本文的损失函数在视觉 Transformer 模型上展现出更好的性能,并且具有更快的收敛速度。研究中的理论推导为损失函数的合理性提供了严密的解释,进一步加强了我们方法的可靠性和有效性。 不同损失函数的收敛速度的比较基于以上贡献,文章提出了一个全新的学习范式 LiVT,充分发挥视觉 Transformer 模型在长尾数据上的学习能力,显著提升模型在多个数据集上的性能。该方案在多个数据集上取得了远好于视觉 Transformer 基线的性能表现。 不同参数量下在 ImageNet-LT 上的准确性。在 ImagNet-LT(左)和 iNaturalist18(右)数据集上的性能表现同时,本文还验证了在相同的训练数据规模的情况下,使用ImageNet的长尾分布子集(LT)和平衡分布子集(BAL)训练的 ViT-B 模型展现出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 数据集中,可以通过更大的模型和 MGP epoch 获得更好的重建结果。 总结本文提供了一种新的基于视觉 Transformer 处理不平衡数据的方法 LiVT。LiVT 利用掩码建模和平衡微调两个阶段的训练策略,使得视觉 Transformer 能够更好地适应长尾数据分布并学习到更通用的特征表示。该方法不仅在实验中取得了显著的性能提升,而且无需额外的数据,具有实际应用的可行性。 论文的更多细节请参考论文原文和补充材料。
©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
关键词:
[责任编辑:]
相关阅读
- (2023-06-22)清华大学提出LiVT,用视觉Transformer学习长尾数据,解决不平衡标注数据不在话下_简讯
- (2023-06-22)【环球时快讯】全省各地体育新闻播报
- (2023-06-22)双阳区举办学子杯龙舟赛
- (2023-06-22)全球焦点!兰州经开区:锦旗点赞税务人 倾情服务暖人心
- (2023-06-22)肃南:接诉即办接出满意办出成效
- (2023-06-22)农民工工资争议速裁庭建设专项行动启动
- (2023-06-22)全球最资讯丨2023年长沙希望工程“圆梦行动”启动 困难大学新生最高可获5000元资助
- (2023-06-22)全球今热点:圣诞老人来自哪个国家的?
- (2023-06-22)环球最新:AI歌手,不甘心只做“AI孙燕姿”
- (2023-06-22)2023年首都儿科研究所端午节开放吗?工作安排一览|天天快资讯
- (2023-06-22)2023北京中考查分时间及网站登录入口
- (2023-06-22)经济日报:理性看待人民币汇率波动
- (2023-06-22)环球新消息丨端午假期即将到来 汉口火车站多措并举保障市民出行
- (2023-06-22)神化(关于神化介绍)-天天要闻
- (2023-06-22)6月26日遂宁市船山区疾控中心四价九价hpv疫苗预约通知-环球要闻
- (2023-06-22)【新视野】静宁:“夜经济”为城市发展添活力
- (2023-06-22)世界微速讯:广汽集团将按股比向广汽三菱提供不超过9.42亿元委托贷款|每日视讯
- (2023-06-22)世界短讯!焦点消息!照片压缩到20k_谁能告诉我怎么把照片压缩在20K一下
- (2023-06-22)2023年秋季顺德伦教街道公办中小学转学插班政策 世界热议
- (2023-06-22)2023端午期间佛山各场馆开放安排汇总(持续更新)_天天观察
- (2023-06-22)2023佛山南海图书馆端午假期开放安排
- (2023-06-22)恒力石化:公司经营情况明显改善 盈利能力加快修复
- (2023-06-22)快看点丨Kensington推出QuietType Pro静音机械键盘:可编程按键,200美元
- (2023-06-22)博雅生命受邀出席2023年浙江省医学会妇产科学与围产医学学术年会_实时
- (2023-06-22)10克猪肉多少千焦?
- (2023-06-22)今年前5月上海累计离境退税销售额3.5亿元
- (2023-06-22)鱼与牛肉哪个热量高?_天天亮点
- (2023-06-22)前沿热点:涨停复盘:跌上热搜!A股遭遇“端午劫”
- (2023-06-22)ST龙净:收回华泰保险股权转让款14.1亿元_世界今头条
- (2023-06-22)星光农机股份有限公司获得政府补助3000万元