一种基于大语言模型的对话情感识别系统
- 国知局
- 2024-07-31 22:46:27
本发明涉及对话机器人与自然语言处理领域,尤其涉及一种基于大语言模型的对话情感识别系统。
背景技术:
1、在意见挖掘、人力资源、医疗保健等多个领域,对话情感识别技术逐步广泛使用,并成为许多人工智能应用的重要组成部分。通过分析并识别出会话中每句话的情感状态,机器能根据不同情感做出反馈,从而有效地辅助人类工作。此技术对各领域的信息化和智能化发展具有深远意义。
2、目前情感对话系统在情感识别上的准确率还有较大提升空间,其中很重要的一部分原因在于对话内容涉及范围宽泛,对话没有围绕着一个确定的主题,或者是没有考虑到用户的真实情况与顾虑进行回答,会导致同样的回答出自不同身份的人有不一样的情感。
3、现有的对话系统未考虑对话者的性格因素,很难做到针对性和情感识别的准确性,并且之前的工作缺乏基于统一设计的生成范式,而llms(large language model,大型语言模型)统一了不同任务的输出和输入,在nlp(nature language processing,自然语言处理)任务中表现出显著的性能提升。但是,目前现有的情感识别技术不能通过综合对话上下文信息以及人物性格等因素来提高对话中情感识别的准确率和鲁棒性。
技术实现思路
1、为克服现有技术的不足,通过用户信息和对话文本信息综合信息融合和情感分类算法得到用户精准情感状态,本发明提出一种基于大语言模型的对话情感识别系统。
2、本发明的技术方案是这样实现的:一种基于大语言模型的对话情感识别系统,包括
3、对话文本模块,所述对话文本模块用于存储用户历史对话信息和用户当前对话信息;
4、与对话文本模块连接的性格预测模块,所述性格预测模块训练llm捕捉不同个体的性格特征,对于给定的数据集,提供一组预定义的说话者标签,性格预测模块的指令文本输入包括指令、历史对话信息和标签声明;
5、与对话文本模块和性格预测模块相连的对话情感分析模块,所述对话情感分析模块对话情感识别任务重构为seq2seq形式,包括样例检索模块,所述样例检索模块从训练数据集中构建一个样例域edomain,edomain中添加了说话者的性格信息,但是删除了说话者的身份信息,即检索参考样例时只考虑具体话语和性格信息,对于要识别的给定话语ui,根据性格信息和ui,从edomain检索最相关的样例作为演示,为了执行检索,使用angie来查找语义上相似度最高的前几个样例drvl,如果样例中有相同性格信息就选相同性格信息的样例,否则直接选语义相似度最高的样例,所述对话情感分析模块的输入包括指令、历史对话信息、由性格预测模块预测的说话者性格、标签语句和演示样例。
6、进一步地,性格预测模块和对话情感分析模块的指令用于为大语言模型提供明确定义的角色、任务的精确细节和输入对话文本的标准化格式。
7、进一步地,性格预测模块和对话情感分析模块的历史对话信息采用超参数,即对话窗口来指示历史对话的特定轮次以及相应的说话者信息。
8、进一步地,所述性格预测模块中的标签声明用于将大语言模型的输出限制在有限的标签范围内,其输入为其中ui,i为指令;性格预测模块的损失计算公式为其中ci表示与说话者speakeri相对应的性格标签,为子任务的输入,θ为大语言模型参数。
9、进一步地,所述对话情感分析模块的输入为xi=[ui,i;ui,h;ui,c;ui,l;ui,d],采用token预测损失来衡量模型的输出误差,其损失计算公式为
10、本发明的有益效果在于,与现有技术相比,本发明引入大语言模型来解决erc问题,通过erc主任务和性格预测子任务的联合微调训练,最终得到准确的情感识别结果。
技术特征:1.一种基于大语言模型的对话情感识别系统,其特征在于,包括
2.如权利要求1所述的基于大语言模型的对话情感识别系统,其特征在于,性格预测模块和对话情感分析模块的指令用于为大语言模型提供明确定义的角色、任务的精确细节和输入对话文本的标准化格式。
3.如权利要求1所述的基于大语言模型的对话情感识别系统,其特征在于,性格预测模块和对话情感分析模块的历史对话信息采用超参数,即对话窗口来指示历史对话的特定轮次以及相应的说话者信息。
4.如权利要求1所述的基于大语言模型的对话情感识别系统,其特征在于,所述性格预测模块中的标签声明用于将大语言模型的输出限制在有限的标签范围内,其输入为其中ui,i为指令;性格预测模块的损失计算公式为其中ci表示与说话者speakerii相对应的性格标签,为子任务的输入,θ为大语言模型参数。
5.如权利要求1所述的基于大语言模型的对话情感识别系统,其特征在于,所述对话情感分析模块的输入为xi=[ui,i;ui,h;ui,c;ui,l;ui,d],采用token预测损失来衡量模型的输出误差,其损失计算公式为
技术总结本发明公开了一种基于大语言模型的对话情感识别系统,包括对话文本模块,对话文本模块用于存储用户历史对话信息和用户当前对话信息;与对话文本模块连接的性格预测模块,性格预测模块训练LLM捕捉不同个体的性格特征,对于给定的数据集,提供一组预定义的说话者标签,性格预测模块的指令文本输入包括指令、历史对话信息和标签声明;与对话文本模块和性格预测模块相连的对话情感分析模块,对话情感分析模块对话情感识别任务重构为Seq2seq形式。本发明引入大语言模型来解决ERC问题,通过ERC主任务和性格预测子任务的联合微调训练,最终得到准确的情感识别结果。技术研发人员:陈琰,何星杰,杨嘉伟,许冠超,邱文斌,谢嘉健受保护的技术使用者:华南农业大学技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/194523.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表