自然语言生成中的模型幻觉控制
近年来,研究重点集中在自然语言生成领域。在机器学习峰会上,将讨论生成语言时控制参数相关选择的必要性。生成语言的程序必须决定如何表达信息,例如确定传达什么内容、使用什么词汇以及如何排序词汇组成句子。深度学习能生成非常流畅的文本,但通常无法基于指定的输入目标来控制这些选择过程。
可控语言生成的主要关注点是输出应忠实于输入。神经语言生成方法已知会产生内容幻觉,导致生成的文本包含输入中未出现的信息。模型幻觉导致的事实不一致可能发生在实体层面或关系层面。
在前者情况下,模型生成的摘要可能包含源文档中完全缺失的实体。还存在更难以发现的另一种幻觉:关系不一致,即实体存在于源文档中,但这些实体之间的关系却不存在。
当前依赖大规模语言模型的自然语言生成技术能生成流畅文本,但难以通过控制词汇选择或词序来确保说话者意图准确传达。将详细介绍使模型能够忠实呈现说话者意图的技术。
该主题在科学界的相关性
自然语言生成有许多不同用例,包括从数据生成语言、文本摘要、对话中的准确响应生成和机器翻译。在所有用例中,幻觉一直是个问题。生成不准确文本的系统是个严重问题,远比生成不够流畅文本的系统更糟糕。
忠实生成技术详解
幻觉发生的一种情况是训练数据不包含训练期间输入中出现的数据或短语。忠实生成和摘要的方法主要依赖数据增强技术。
对于从数据生成语言,使用自训练方法通过实例对来增强原始训练数据,每个实例包含结构化数据对和传达信息的相关文本,每个实例都是完全新颖的。
值得注意的是,在使用增强数据训练后,即使是带有贪婪解码的简单编码器-解码器模型,也能生成语义正确的话语,在自动和人工质量评估中与最先进输出相当。
还研究了神经序列到序列模型在执行从意义表示的自然语言生成时表现出的细粒度可控性程度。更具体地说,研究了控制词序的效果。
假设有一个意义表示给出了餐厅名称、位置和供应的食物类型。句子可以排序信息使餐厅名称首先出现,或者将食物放在餐厅名称和位置之前,或者从提供位置开始。
可以想象不同排序更合适的场景。例如,假设有人提问"我在哪里可以找到喝咖啡的好地方?"这里,回复的重点可能是位置。然而,对于"阿拉米斯咖啡馆在哪里?它供应什么?"这样的问题,期望回复以"阿拉米斯咖啡馆"开头。
系统比较了四种输入线性化策略对可控性和忠实度的影响。线性化指的是找到给定词汇集合的正确语法顺序的任务。还使用数据增强来提高性能。发现在训练期间正确对齐输入序列能实现高度可控的生成,无论是在从头开始训练时,还是在微调更大的预训练模型时。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码