当前位置: 首页 > news >正文

DINO版本进化

1.蒸馏 KD  与 自蒸馏 SD

  普通蒸馏,是有监督(软标签),老师是外部预训练的大模型

  自蒸馏,无监督,老师是 自己的历史版本EMA

 

2.EMA机制

  有一个问题,如果学生和老师输出的内容是一致的,那学生什么也学不到。所以

  老师网络的参数 = 0.996*老师旧参数 + 0.004*学生参数,这样老师也能在不断的学习,又不会因为学生某次的剧烈波动过大的影响老师

 

3.输入数据策略

  多视角增强,随机裁剪,旋转,变换颜色

  老师为大视角,做好分类

  学生为小视角,自己学习细节特征,但又能从老师那里学到全局语义

 

4.稳定机制(防止特征塌陷)

  1.中心化处理(centering)

    老师的数据h_i = h_i - 历史平均

    在没有中心化处理时。模型输出的判断倾向与“有点像猫、狗”。所以输出集中在[0.6,0.6]附近,这样就可能后续造成特征塌陷

    如果中心话处理,输出可能被调整为[0.05,0.05]和[-0.05,-0.05],强制去偏向一边

  2.温度调节

             截屏2025-10-26 11.12.39

    结果:老师输出的很尖锐,例如[0.1, 0.8, 0.1]

       学生输出比较平滑,学习更丰富,细腻的特征

 

 

gram锚定

   在增加训练数据后,虽然在分类等任务上一直在改进,但是在密集型特征任务上就退化

  使用gram矩阵:描述一张图片内部所以图像块特征之间的关系网(预先相似度)

  锚定过程:保存一个训练早期,密集特征还不错的模型作为gram老师。然后后面要求,学生的gram和老师的gram要尽量一致

  

截屏2025-10-26 11.20.59

 

综合的损失

反向传播更新学生,EMA更新老师

 

http://www.hskmm.com/?act=detail&tid=39285

相关文章:

  • 基于深度学习神经网络协同过滤模型(NCF)的视频推荐体系
  • sometime some time sometimes
  • 关于容斥原理
  • 可变字符串
  • 欧拉定理
  • 给安卓设置背景色的时候保持默认按钮样式(关于使用setBackgroundColor导致丢失默认按钮样式的问题)
  • 分片上传与断点续传实现详解
  • 2025 年 10 月展示柜厂家最新推荐,技术实力与市场口碑深度解析!
  • 手把手在 Linux 上安装 Docker 与 Docker Compose(包含 Ubuntu、CentOS 等 11 个发行版)
  • 2025 年 10 月展示柜厂家最新推荐,精准检测与稳定性能深度解析!
  • L
  • 数据处理方法汇总
  • 一些疑问
  • 2025 年 10 月外墙涂料厂家最新推荐,聚焦高端定制需求与全案交付能力
  • 2025年10月长白山亲子酒店推荐榜:四季主题与温泉度假对比排行
  • 2025年10月益生菌品牌推荐榜:全维度对比与榜单解读
  • 2025年10月工装设计公司推荐榜:全国服务力对比评测
  • 2025 年 10 月外墙涂料厂家最新推荐,精准检测与稳定性能深度解析
  • 2025年10月美容仪品牌推荐:无创无痛对比评测榜
  • 进程API
  • 2025年10月中国遗产继承律师推荐榜:五强对比全解析
  • 2025年10月法律咨询律所推荐榜:盈科多领域权威排名一览
  • 2025年10月中国短视频制作公司排行榜:五强实测推荐
  • php_sha1函数特性
  • php非法参数
  • 2025 年 10 月仿石漆厂家最新推荐,专业制造与品牌保障口碑之选
  • php_md5特性
  • php原生类的使用
  • 下午选歌
  • 分治算法在查找第k小元素中的应用与分析