当前位置: 首页 > news >正文

An Empirical Study on Commit Message Generation using LLMs via In-Context Learning 论文笔记

介绍

(1) 发表:ICSE'25

(2) 背景

最近的一些工作研究了基于 LLM 的提交信息生成,然而目前尚不清楚 LLM 通过 ICL 在该领域的表现如何

(3) 贡献

本文对通过 ICL 使用 LLM 进行提交信息生成进行了实证研究,并创建了一个新的数据集

工作

(1) 研究设计

  • RQ1:不同的提示和提示设置如何影响基于 ICL 的提交信息生成的性能?

    具体来说,我们根据是否提供了角色描述以及是否给出了约束信息来设计四个提示,并从三个维度(即数量、选择方式和顺序)研究演示设置

    所获得的发现:适度数量的演示会增强性能,但过多的演示会降低性能;基于检索的演示选择可以显著提高性能,而演示顺序对性能的影响最小;GPT-3.5-Turbo 和 DeepSeek-V2-Chat 是提交消息生成任务中性能最佳的 LLM。此外,在通用 LLM 上进行额外的代码预训练并不会产生更好的性能

  • RQ2:基于 ICL 的提交信息生成与最先进的方法相比如何?

    表现最好的 LLM 显著优于表现最好的基线,LLM 58.5% 的表现不佳案例是由不准确的测量引起的,这表明传统指标的局限性,迫切需要新的指标来准确评估基于 LLM 的提交消息生成方法的性能

  • RQ3:LLM 表现不佳的根本原因是什么?

    我们抽样了 200 个 LLM 未能在 RQ2 中做出准确预测的表现不佳的案例,并总结了根本原因的类别。LLM 表现不佳的主要根本原因是缺乏上下文知识、不利的演示和模型谬误。两种潜在的缓解策略是提供高质量的演示和改进大型语言模型

(2) 一些结论

迫切需要高质量的数据集, LLM 作为评估方式是很理想的

总结

基于 ICL 的提交信息生成的一个较为全面的实证研究

http://www.hskmm.com/?act=detail&tid=10414

相关文章:

  • 实用指南:人工智能学习:Transformer结构中的编码器层(Encoder Layer)
  • vcpkg 安装依赖
  • Java03课前问题列表
  • JavaScript错误处理完全指南:从基础到自定义错误实战
  • 1、论文准备
  • PION 游击
  • Web3 开发者修炼全图谱:从 Web2 走向 Web3 的实用的系统性学习指南
  • 实用指南:医院高值耗材智能化管理路径分析(下)
  • Flutter应用自动更新系统:生产环境的挑战与解决方案
  • .NET Core中使用SignalR
  • 实用指南:修复Conda连接异常:CondaHTTPError HTTP 000 CONNECTION FAILED故障排除指南
  • 高级数据结构手册
  • Tarjan 学习笔记
  • 使用JavaScript和CSS创建动态高亮导航栏
  • Gridspech 全通关
  • 1967
  • 20253320蒋丰任
  • .
  • 又有两位智驾大牛联手入局具身智能机器人赛道创业,已完成数亿元融资!
  • 纯国产GPU性能对比,谁才是国产算力之王?
  • 地平线明年发布并争取量产舱驾一体芯片;比亚迪补强智舱团队,斑马智行原 CTO 加入
  • 英伟达入股英特尔,当竞争对手便成协作者,真正受益的......
  • ODT/珂朵莉树 入门
  • 在AI技术快速实现功能的时代,挖掘新需求成为关键突破点——某知名游戏资源分析工具需求洞察
  • 蜜罐
  • 【光照】[漫反射]UnityURP兰伯特有光照衰减吗?
  • prenotami.esteri.it 意大利签证预约error
  • reLeetCode 热题 100- 15. 三数之和 - MKT
  • XXL-TOOL v2.1.0 发布 | Java工具类库
  • Python-Pathlib库