当前位置: 首页 > news >正文

CityRefer:城市规模点云数据上的地理感知 3D 视觉接地数据集 - MKT

 

 

城市规模的 3D 点云是表达精细复杂户外结构的一种有效方式。它涵盖了城市各个组成部分(包括汽车、街道和建筑物)的外观和几何特征,可用于实现自动驾驶汽车和无人机的用户交互导航等极具吸引力的应用。然而,与图像和室内场景中丰富的文本标注相比,户外场景文本标注的匮乏对实现这些应用构成了重大挑战。为了解决这个问题,我们引入了CityRefer 数据集,用于城市级视觉接地。该数据集包含 35,000 条 SensatUrban 城市场景中 3D 对象的自然语言描述,以及 5,000 个与 OpenStreetMap 同步的地标标签。为了确保数据集的质量和准确性,CityRefer 数据集中的所有描述和标签均经过人工验证。我们还开发了一个基线系统,该系统可以学习编码语言描述、3D 对象实例以及城市地标的地理信息,从而对 CityRefer 数据集进行视觉接地。据我们所知,CityRefer 数据集是用于定位特定 3D 对象的最大城市级视觉接地数据集。

 

image

 

http://www.hskmm.com/?act=detail&tid=35406

相关文章:

  • SensatUrban语义分割数据集SensatUrban - MKT
  • 推荐算法参考资料
  • LLM学习笔记DAY8
  • 软件工程第二次团队作业——构建一个智能体
  • VoxelNeXt 用于 3D 对象检测和跟踪的完全稀疏 VoxelNet(CVPR 2023) - MKT
  • CityNav:包含地理信息的语言目标空中导航数据集 - MKT
  • Grounded-SAM 使用文本提示检测和分割所有内容 - MKT
  • Linux权限维持-后门
  • 视觉和语言 国防科大清华城市空间无人机导航推理!GeoNav:赋予多模态大模型地理空间推理能力,实现语言指令导向的空中目标导航 - MKT
  • mysql数据库查询参考
  • Python理论题目集
  • 基于yakit的dvwa靶场暴力破解和代码执行漏洞
  • 视觉和语言-港科大 NMPC 控制下的高效自主导航!SkyVLN:城市环境无人机视觉语言导航与非线性模型预测控制 - MKT
  • 北航高低无人机协同导航方案:高空掌全局+低空查细节 - MKT
  • sourcetree 克隆项目仓库地址,输入账号密码后提示:这是一个无效的源路径/URL
  • 软工第三次作业-结对作业
  • 20251020 之所思 - 人生如梦
  • Conda、pip以及虚拟环境在Jupyter中的打开方法
  • 以太坊账⼾模型的理解,合约账⼾、EOA账⼾认识
  • Luogu P12376「LAOI-12」Calculate 题解 [ 蓝 ] [ 贪心 ] [ 线性 DP ] [ 前缀和优化 ] [ 范德蒙德卷积 ]
  • 方格图路径计数 dp 的反射路径优化
  • 每日反思(2025_10_20)
  • java基础9-面向对象进阶
  • 企业信息化建设的钱都花在哪儿了?
  • 身份运算符
  • 位运算符
  • 关系运算符
  • 赋值运算符
  • 算术运算符
  • Inno Setup 打包脚本模板