当前位置：首页 > news >正文

多领域对话自动评估技术突破

news 2025/10/16 14:06:07

自动评估与语音助手的对话交互

随着与语音助手的交互越来越多地涉及多轮对话，评估这些对话模型的质量变得至关重要。传统方法依赖人工评估，既缓慢又昂贵。

在自然语言处理实证方法会议上，我们提出了一种基于神经网络的新模型，用于估计用户对对话交互的满意度。

技术架构

新模型采用双向长短期记忆网络分析交互序列，结合注意力层确定哪些对话轮次对整体满意度贡献最大。该模型仅使用12个通用特征和5个基于通用句子编码器的新特征，包括用户和系统话语的嵌入表示及其相似度度量。

性能表现

在涵盖28个领域的用户测试中，新模型的客户满意度估计准确率比先前神经网络模型提高27%，比团队早期模型提高7%。值得注意的是，新模型不依赖特定对话管理器的功能，因此能够泛化到新的对话管理系统。

训练方法

与传统方法不同，新模型联合训练逐轮评分和整体用户评估数据，通过注意力机制加权各轮次评分对最终得分的贡献。这些权重从数据中学习，能够跨多个技能和任务泛化应用。

技术细节

模型首先使用LSTM网络预测逐轮评分，然后升级为双向LSTM，同时处理逐轮评分和整体对话评分。双向LSTM的输出经过注意力层加权后传递到网络最终分类层。训练期间使用加权损失函数结合轮级评分和整体对话评分。

当前工作正致力于扩展模型以考虑个体用户偏好，进一步提升个性化评估能力。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

公众号二维码

公众号二维码

查看全文

http://www.hskmm.com/?act=detail&tid=32304

直面挑战：MySQL 千万级数据高性能优化实战指南

泳池水检测仪厂家推荐，余氯检测仪哪个品牌好？COD水质/总氮/氨氮靠谱供应商

常见的名词

线段树与平衡树

面向对象进阶-2

CF2155 Codeforces Round 1056 (Div. 2) 游记(VP)

【隐语SecretFlow社区】万字长文解读构建可信数据空间相关标准

Android四大组件之Servers、BroadcastReceiver、ContentProvider（内容提供者）

2025年智能装备与机器人国际学术会议（IER 2025）

编程计算定投黄金的收益率

客户管理软件是什么？深度解析及标杆产品推荐

openresty开发lua-resty-openssl之rsa公钥加密私钥解密 - liuxm

2025年6款主流CRM系统详解

动手动脑及实验性问题总结

华为云rds pg 11升级17

盘点2025破碎仪厂家/提供研磨处理方案的厂家

全球顶尖的医疗器械CRM软件（深度对比）

uni-app x开发商城系统，tabBar

Delphi TscGPPageControl动态创建新页面与加载Frame框架

静态方法访问类的实例成员

2025年冷冻研磨仪厂家，研磨仪厂家排行，知名品牌介绍

组织研磨仪厂家品牌推荐/知名品牌，组织研磨仪哪家好？

The World of Torrents (How it Works?)

进口微量粘度计代理商推荐，优质供应商分享

10月16日

进口高温高压粘度计优质供应商，粘度计代理商推荐

Apache Doris 内部数据裁剪与过滤机制的完成原理

10.16

2598. 执行操作后的最大 MEX——模运算

自动评估与语音助手的对话交互

技术架构

性能表现

训练方法

技术细节

相关文章：