焦点快播:最大CLIP!LAION发布CLIP的扩增定律
2022-12-23 14:19:11


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

热门推荐

文章排行

  1. 2022-12-23焦点快播:最大CLIP!LAION发布CLIP的扩增定律
  2. 2022-12-23中京电子董秘回复:公司全资子公司珠海中京位于珠海富山工业区的新工厂致力于打造数字化工厂的行业标杆:视焦点讯
  3. 2022-12-222022巨量引擎城市峰会召开 聚焦提升城市发展力与美好度-全球通讯
  4. 2022-12-22工信部:1-10月全国锂电产品出口同比增长87%
  5. 2022-12-22快讯:国泰中证全指通信设备ETF净值下跌1.02% 请保持关注
  6. 2022-12-21《阿凡达2》热映,导演卡梅隆在知乎讲述影片背后的故事
  7. 2022-12-21天津公积金二套贷款首付由60%降至40% 今日视点
  8. 2022-12-21今亮点!50亿元人民币央行票据在港发行
  9. 2022-12-20世界速读:传统重资产投资模式已经out,电脑租赁才是主流!
  10. 2022-12-20即时看!国际学子“云游”山西古城 探寻三晋千年历史风采
  11. 2022-12-19理想全面向矩阵式组织升级
  12. 2022-12-19艾紫馨:黄金关注1810关键压力带 白银原油短线偏弱
  13. 2022-12-192023年12月29日特吉生肖 今日特吉的生肖运势吉凶
  14. 2022-12-19商水县被隔离者生活是怎样的?直击商水县集中隔离点!|世界新资讯
  15. 2022-12-18安逸花贷款逾期19天还不起征信有什么影响
  16. 2022-12-17近百元一支! “牙膏刺客”想刺什么客
  17. 2022-12-17水饺要煮多久 水饺要煮多长时间呢_天天观速讯
  18. 2022-12-16今日视点:广东车辆“喝”上国ⅥB车用汽油
  19. 2022-12-16当前看点!新泰市羊流镇:发展特色养殖 助力百姓增收致富
  20. 2022-12-15当前滚动:金价继续大涨!2022年12月15日各大金店黄金价格多少钱一克?