当前位置: 首页 > news >正文

YOLO进阶提升 1YOLOv2 改进

进阶提升 · 1YOLOv2 改进

核心概念

  • YOLOv2:YOLO 的第二代版本,重点提升检测精度,同时保持实时速度。
  • Darknet-19:YOLOv2 使用的主干网络,由 19 层卷积层组成,借鉴 VGG 小卷积核设计。
  • Anchor Boxes(先验框):通过 K-Means 聚类从真实标注框中学习得到的更合理的候选框尺寸。
  • 偏移量预测:采用相对网格坐标和 sigmoid 限制,使预测中心点稳定落在对应网格内。

提出问题

  • YOLOv1 的 7×7 网格和 2 个候选框,导致检测能力不足,尤其是小目标。
  • 固定手工设定的候选框比例(如 Faster R-CNN 的 9 种)不够灵活,无法适配不同数据集。
  • 直接预测绝对偏移量时,训练不稳定,框容易漂移出对应网格。

论点与解决方案

  • 更高分辨率特征图
    • YOLOv2 将输出网格从 7×7 提升到 13×13,可捕捉更多细粒度信息,提高小目标检测能力。
  • 改进主干网络
    • Darknet-19 全卷积结构,使用 3×3 和 1×1 卷积,既扩大感受野又减少参数。
  • 先验框生成
    • 使用 K-Means + IoU 距离度量,自动从数据集中学习合适的候选框尺寸。
    • 选取 k=5 作为折中(提升 Recall 明显,mAP 基本不变)。
  • 偏移量计算改进
    • 预测结果不再是绝对位置,而是 相对于当前网格左上角的偏移量,范围限制在 [0,1]。
    • 通过 sigmoid 函数约束,避免训练初期预测点漂移出网格,提高收敛稳定性。

关键机制 / 细节

  • 多次降采样:输入 416×416,经过 5 次下采样得到 13×13 特征图。
  • 候选框改进
    • YOLOv1:每网格 2 个候选框(人工设定)。
    • YOLOv2:每网格 5 个候选框(聚类得到)。
  • 距离度量改进
    • Faster R-CNN 使用欧式距离聚类 → 受框大小影响。
    • YOLOv2 使用 IoU 距离 (1 - IoU) → 与框大小无关,更合理。
  • Recall 提升
    • 候选框数增加 → Recall 提升约 7%。
    • mAP 基本持平(变化 <0.3)。

总结

  • YOLOv2 的核心改进
    • 更高分辨率的特征图(7×7 → 13×13)。
    • 新的主干网络 Darknet-19。
    • 候选框通过 K-Means 自动学习。
    • 偏移量预测更稳定,限制在网格内。
  • 效果:Recall 提升显著,检测更加全面;速度依然保持实时。
  • 意义:YOLOv2 成功解决了 v1 的候选框不足与训练不稳定问题,为 v3 的进一步改进打下基础。
http://www.hskmm.com/?act=detail&tid=10527

相关文章:

  • C# Avalonia 15- Animation- AnimationPlayerTest
  • 基于Python+Vue开发的体育场馆预约管理系统源码+运行步骤
  • JSONArray集合根据某个字段查询对象
  • 详细介绍:Parasoft C/C++test 针对嵌入式开发的内存错误检测解决方案
  • [WC2006] 水管局长
  • 02-Media-7-uvc.py 应用软件解码的USB摄像头(UVC)捕获视频并显示的程序
  • YOLO入门理解 3YOLOv1 思路与细节
  • YOLO入门理解 评估指标
  • 清除win+r“运行”对话框中的历史记录
  • [ICPC 2024 Yokohama R] Peculiar Protocol
  • YOLO入门理解 基础概念
  • The 2025 ICPC Asia East Continent Online Contest (II)(C,D,E,H,I)
  • 2022年十大Web黑客技术提名开启
  • 13. LangChain4j + 加入检索增加生成 RAG(知识库) - Rainbow
  • 终旅之始——2025 . 9 . 20
  • 深入理解Django Admin只读字段与保存模型的自定义操作 - 详解
  • 深度学习(视觉注意力SeNet/CbmaNet/SkNet/EcaNet)
  • 起床
  • qoj6277 Linear Congruential Generator
  • docker+k8s
  • 多模型适配突围:JBoltAI如何重构企业数智化转型新范式?
  • JBoltAI赋能制造业数智化转型:AI从概念到落地的Java实践
  • JBoltAI赋能医疗数智化转型:AI大模型如何重塑医疗健康新范式
  • JBoltAI多模态赋能:制造业数智化升级的新引擎
  • 深入解析:YARN架构解析:深入理解Hadoop资源管理核心
  • JBoltAI:破解Java企业级AI应用落地难题的利器
  • 直播软件开发,单例设计模式很简单吗? - 云豹科技
  • Java开发者的AI革命:如何用JBoltAI应对数智化转型挑战
  • JBoltAI:赋能Java老项目快速接入AI能力的创新之道
  • Day04 C:\Users\Lenovo\Desktop\note\code\JavaSE\Basic\src\com\David\operator Demo01-08+Doc