当前位置: 首页 > news >正文

GroundingDino针对航空图像检测的改进 MM Grounding Dino Large - MKT

https://arxiv.org/abs/2401.02361

image

 

image

 

image

 

测试数据集构建

针对无人机航拍特性,构建包含以下场景的测试集:

  • 城市航拍:建筑物、车辆、行人(分辨率3840×2160)
  • 乡村农田:农机、作物行、电线杆(分辨率2560×1440)
  • 灾害救援:倒塌建筑、救援车辆、幸存者(分辨率1920×1080)

image

 

典型案例分析
小目标检测能力:在300米高空拍摄的农田图像中(单个农机目标像素尺寸约20×30),模型实现89.7%的召回率,优于YOLOv8x的76.2%。通过可视化特征图可见,Swin-Large的stage4特征层(1/32下采样)仍能保留农机的关键轮廓信息。

类别泛化能力:对于训练集中未出现的"太阳能光伏板"类别,通过文本提示"a solar panel with blue cells",模型实现零样本检测mAP 37.5,验证了GOLD-G数据集带来的开放式词汇理解能力。

 

image

image

 

http://www.hskmm.com/?act=detail&tid=40221

相关文章:

  • 看了个介绍音频相关的视频有感,44100HZ 就是母带
  • GroundingDino目标跟踪+sam2分割 - MKT
  • 【解决方法】通过windows远程桌面连接centos stream10_基于xrdp(网上搜出来的路径里找不到startwm.sh)
  • 25.10.27
  • 在服务器上直接从百度网盘下载文件
  • 【ESP32 在线语音】讯飞星火语音识别功能(听写流式API)文档阅读
  • 10月27日
  • newDay16
  • 新学期每日总结(第14天)
  • 2025.10.27
  • 示性函数引入
  • 算法分析--分治--2.归并排序
  • Vue2随笔-251027
  • Java: Jdk17 异步或同步或并行发邮件
  • 《程序员修炼之道:从小工到专家》笔记3
  • 2025.10.27总结
  • CCUT应用OJ题解——贪吃的松鼠
  • 噪声点验证码的图像处理与识别思路
  • Huggingface 禁止XET后端
  • 对Grid绑定移动
  • 10.27博客
  • 关于结对编程的一些感悟
  • 结对编程心得
  • 关联子查询
  • AI概念
  • 工控modBus TCP, 服务端或客户端, 均可以与PHP 通讯
  • 衡量模型生成图片质量的指标
  • 代码大全2 第一章 与第二章
  • 第二十一天
  • 算法分析--分治--1.二分搜索