技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种基于大语言模型的阅读滋养健心聊天机器人  >  正文

一种基于大语言模型的阅读滋养健心聊天机器人

  • 国知局
  • 2024-07-12 10:39:02

本发明涉及自然语言处理,尤其涉及一种基于大语言模型的阅读滋养聊天机器人技术。

背景技术:

1、当今社会,人们的心理问题及心理危机越发严重。抑郁、焦虑等已成为各个群体中常见的心理问题,若不及时干预很容易发展成心理危机。心理危机往往与应急事件和挫折有关,表现为持续抑郁焦虑、自杀、自杀倾向、攻击、成瘾行为等。患者面临社会病耻感强、疾病教育缺失、就医困难等问题。

2、公开号为cn202110344938的专利“心理问题自动检测与阅疗书方自动匹配推荐的方法与系统”,根据用户填写的各类心理量表检测结果,基于阅读疗愈领域的实证书方成果,通过构建书方诊疗数据库,预设回复,从而推荐匹配书方,实现了阅读疗愈的数字化。其心理问题检测依赖入侵式心理量表。

3、聊天机器人也被称为“智能对话系统”或“虚拟交互助手”,模拟人类的交流方式,为用户提供即时、自动化的响应,聊天机器人在意图识别、语义分析和响应生成等方面不断发展,已在许多领域取代了一部分人类工作。如美国微软技术许可有限公司的专利“具有角色话和性格化的聊天机器人”(公开号:cn109986569a),实现更加拟人化的聊天使得用户感受到更加丰富的人格特性;美国谷歌公司的专利“基于用户状态形成的聊天机器人输出”,通过跟踪用户的状态并提供对应的对话来实现更好地社交礼仪等。

4、当今社会大众心理问题越来越多,心理咨询聊天机器人不断出现,并已被证明是有用的。现有的心理咨询聊天机器人大部分是通过积极情感和消极情感分析对比,粗粒度识别用户的消极情绪,然后从心理学的角度给予回复进行心理咨询和干预。如申请号为202210207627.9的专利“一种心理咨询聊天机器人的回答体贴度检测方法及系统”,基于rcnn改进的网络模型对现有心理咨询聊天机器人的回答的体贴程度进行检测,避免回答过于尖锐。

5、随着深度学习和神经网络技术的进步,聊天机器人的响应从简单的预设回复正转向为更加智能和上下文相关的交互,以人工智能技术驱动的自然语言处理。2023年,以chatgpt为代表的gpt大语言模型(简称大模型)的出现标志着大模型时代的到来。大模型能够胜任自然语言处理任务中的信息抽取、文本生成、问答、翻译等;在预训练阶段,大规模的数据不再需要人工标注,而成为自动生成任务。大模型经过大量的预训练和微调,基于预训练阶段所见的模式和统计规律生成响应,提升用户的聊天体验。大模型使得人机对话能力大大提升,将颠覆众多行业领域,有待推广深入行业应用。

6、综上所述,现有技术存在以下不足。

7、(1)现有的心理咨询类聊天机器人大部分基于预设回复;模型本身普遍质量不高,自然语言处理能力不强,不能处理复杂上下文关系;更不能深入理解领域的核心概念和方法,导致的模型对话质量差。

8、(2)大模型在自然语言处理任务上展现出了卓越的性能,能够根据上下文理解和生成复杂的文本内容。然而,尽管这些大模型在通用任务上表现出色,但在特定领域如心理咨询、阅读疗愈、心灵滋养等领域,仍然缺乏足够的领域知识和专业性,导致模型在针对情绪调节、心理问题干预和心灵滋养等方面的领域聊天对话质量不高。

9、(3)现有的心理咨询聊天机器人主要针对用户的积极情绪和消极情绪进行粗粒度对比分析,缺乏对心理问题及其成因的深入理解和细粒度分类与精准干预,导致其对情绪、心理问题的理解识别及干预的覆盖性、精准性和深入性不够。

技术实现思路

1、本发明的目的在于提供一种基于大语言模型的阅读滋养健心聊天机器人,以构建阅读滋养大模型,提升聊天机器人对阅读滋养领域核心概念与方法的理解,实现对用户情绪和心理问题及其成因的深入理解、细粒度分类及精准阅读干预或阅读滋养,提升聊天机器人对用户情绪或心理状态的识别、情绪或心理问题干预及心灵滋养的覆盖性、精准性和深入性,从而提高大模型在阅读滋养领域的对话质量,并以覆盖因时间、位置、疾病、社恐、病耻感等不便的服务对象群体,数智赋能全民深阅读,为身、心、志方面的健康建设提供技术支撑。

2、为解决以上技术问题实现以上目的,本发明采用的具体技术方案如下。

3、一种基于大语言模型的阅读滋养健心聊天机器人,其特征在于:通过数字化整合阅读滋养领域的大量有效公开数据,构建阅读滋养领域知识体系,形成领域指令监督数据;以大语言模型作为基座模型,在基座模型中注入阅读滋养领域知识,进行二次监督指令微调,经过大量领域数据不断预训练和优化后,从而构建阅读滋养大模型,以深入理解阅读滋养领域的核心概念和方法,针对用户心理状态理解和生成复杂的文本内容,从而提供智能交互响应,滋养用户心灵;具体过程包括:数据采集和预处理、领域知识注入、模型垂直域训练、模型上线应用。

4、所述的阅读滋养是以全媒体为媒介,将阅读作为干预心理问题、建设心理健康和精神卫生、培养优秀道德、树立崇高理想、涵养浩然之气、塑造健全品格等的重要手段,使自己或指导他人通过对阅读内容的学习、讨论和领悟,实现修身、健心、养志的一种方法。

5、所述阅读滋养领域知识包括:阅读推广、阅读疗愈、心理学研究、传统文化领域中对干预心理问题、建设心理健康和精神卫生、培养优秀道德、树立崇高理想、涵养浩然之气、塑造健全品格有效的公开研究成果数据、实证有效书方和领域专家荐读的相关知识;心理学研究包括正向心理学研究、教育心理学、认知行为疗法研究;传统文化包括古今中外优秀传统文化;

6、所述的大语言模型为国内外开源的大语言模型和暂时未开源的大语言模型中的任一种,包括llama、chatglm、百川、通义千问、gpt、文心一言;当阅读滋养领域训练数据为中文数据时,优先选择国内开发的中英文大语言模型,包括开源的chatglm、百川、通义千问,因其在中文领域上的适应能力更强,能更好地被采用作为中文垂直域训练的基座模型;

7、所述具体过程如下:

8、过程一,数据采集和预处理

9、包括数字化整理阅读滋养领域知识,基于大量公开有效数据,对其进行清洗、去噪和人工标注;公开有效数据包括访谈记录、对话记录、问卷调查和量表调查结果、心理问题、问题成因、干预心理问题的书方内容及其靶向性描述、干预心理问题成因的书方内容及其靶向性描述;对所述大量公开有效数据进行细粒度关联,并人工转换成对话形式,从而形成高质量多样话的对话;再根据不同的心理状态类型,分别存储为不同的文件,构建阅读滋养领域知识体系;

10、所述书方包括阅读滋养领域实证研究中针对实验对象的认知、情绪问题、心理问题及成因进行干预后实证有效的书方,还包括阅读滋养领域专家推荐阅读的书方;所述阅读滋养领域专家包括阅读推广、阅读疗愈、心理学研究、传统文化领域的荐读专家;所述书方形式为全媒体形式,包括书籍、图片、音乐、电影、小视频、绘画、游戏中的一种或多种,所述的书籍形式包括纸质书、电子书或音频听书;

11、所述书方内容描述包括:作者、书方名、书方内容简介;所述靶向性描述包括该书方能有效干预的认知、情绪、心理问题、成因的类型,及对应干预效果描述;

12、过程二,领域知识的注入

13、领域指令监督数据的生成:采用python自动化处理技术,根据不同心理状态,将所构建的阅读滋养领域知识自动转换为匹配不同心理状态的多轮对话,形成阅读滋养领域指令监督数据,并进行人工审查校正,从而将阅读滋养领域指令监督数据加载进所述基座模型;

14、过程三,模型垂直域训练

15、指令监督微调:使用lora方式利用阅读滋养领域指令监督数据对基座模型进行二次指令监督微调,让基座模型学习阅读滋养领域知识,从而构建阅读滋养大模型,以适应阅读滋养的特定任务;对经过大量领域数据不断预训练和优化后的阅读滋养大模型采用多项选择评估的方式进行评估:若评估效果理想,则终止训练保存模型文件,否则重新选择超参数重新训练;

16、过程四,模型的上线应用

17、将阅读滋养大模型进行在线部署,采用api接口的形式提供服务端的调用服务;

18、接收用户输入的文本,基于阅读滋养大模型对其进行处理和理解,并生成相应的响应输出,实现多轮交互式聊天功能,同时存储用户与聊天机器人的历史对话记录;若用户输入的是语音,则自动转换成文本。

19、一种阅读滋养健心聊天机器人的方法,其特征在于包括以下步骤:

20、步骤一,通过所述聊天机器人的客户端设备获取用户输入的第一会话内容;所述第一会话的输入形式包括语音输入、文本输入中一种或两种;

21、步骤二,根据用户第一会话输入,所述聊天机器人基于阅读滋养大模型对第一会话内容进行高质量深度语义解析,从而确定用户的心理状态;

22、步骤三,在所述聊天机器人存储器中存储用户的心理状态指示;

23、步骤四,根据用户的心理状态指示,基于阅读滋养大模型,聊天机器人根据指令做出智能响应,并将智能响应输出作为第二会话内容的一部分,通过客户端设备输出到所述用户;所述第二会话内容为聊天机器人形成的回复用户的输出内容;输出内容包括:问候语、庆祝语、安慰语、鼓励语、情绪或心理状态询问、问题成因询问、书方内容及功用介绍、书方推荐中一种或多种。

24、所述的心理状态包括:日常问候、情绪状态、心理问题、问题成因;

25、所述情绪状态包括快乐、悲伤、忧愁、嫉妒、愤怒、痛苦、紧张、憎恨、怨恨、贪婪、迷信中的一种或多种;

26、所述心理问题包括孤独、抑郁、焦虑、敌对、恐怖、偏执、强迫、人际关系敏感、精神病性、躯体化、自卑中的一种或多种;

27、所述问题成因包括学习压力、工作压力、失业破产、人际关系、恋爱关系、家庭关系、婚姻关系、子女教育、身体疾病、亲人离去、宠物死亡、童年创伤、遭遇霸陵、意外事故、突发事件、社会支持中的一种或多种。

28、所述智能响应输出的类型包括:

29、当用户心理状态呈现的是日常问候输入时,聊天机器人作出问候响应;

30、当用户心理状态呈现的情绪状态是快乐时,聊天机器人作出庆祝响应;

31、当用户心理状态呈现的情绪状态是某种具体消极情感时,聊天机器人作出对应的安慰响应、鼓励响应和问题询问响应中的一种或多种;

32、当用户心理状态呈现的是某类心理问题时,聊天机器人做出针对心理问题的心理安慰疏导响应、干预类书方内容推荐响应和问题成因询问响应中的一种或多种;

33、当用户心理状态呈现的是某类心理问题成因时,聊天机器人做出针对心理问题成因的心理安慰疏导响应、干预类书方内容推荐响应;

34、当用户与聊天机器人交流后,下次交流开始时,聊天机器人询问用户上次推荐的书方阅读情况、阅读效果、对其帮助程度,并收集用户反馈信息。

35、所述智能响应输出的形式包括聊天机器人回复的语音、回复的文本、推荐的书方中的一种或多种;

36、推荐的书方内容包括:书方、书方内容介绍和书方靶向性描述;所述书方包括实证研究中针对实验对象的认知、情绪问题、心理问题及成因进行干预后实证有效的书方,还包括阅读滋养领域专家推荐阅读的书方;所述阅读滋养领域专家包括阅读推广、阅读疗愈、心理学研究、传统文化领域的荐读专家;所述书方内容介绍包括著者、书名、内容简介;所述书方靶向性描述包括该书方能有效干预的认知、情绪、心理问题、成因的类型,及对应干预效果描述;

37、所述的书方形式包括:书籍、图片、音乐、电影、小视频、绘画、游戏中的一种或多种;

38、所述的书籍形式包括纸质书、电子书或音频听书。

39、一种阅读滋养健心聊天机器人的计算机系统,其特征在于包括:

40、一个或多个处理器,以及与所述处理器可操作地耦合的存储器;存储器用于存储指令;

41、一个或多个输入设备,接受来自用户的语音输入或文本输入作为第一会话内容,在用户和聊天机器人之间第一会话期间被接收;

42、系统基于阅读滋养大模型对用户输入的第一会话内容进行深度语义解析,深入理解以确定用户表达的心理状态;并将用户心理状态指示存储于存储器中;

43、系统根据交互信号确定其与用户之间的第二会话正在进行中;

44、系统根据所存储的用户表达的心理状态指示,基于阅读滋养大模型作出智能响应,生成与心理状态相匹配的回复内容,返回模型的输出作为聊天机器人第二会话内容的一部分,在用户和聊天机器人之间第二会话期间,通过系统的一个或多个输出设备输出给所述用户;同时存储历史对话记录于系统的存储器内;

45、所述交互信号包括:除了用户和聊天机器人之间对话之外,用户和系统之间存在干涉交互;或自最后交互之后在预定的时间间隔;或自最后交互之后用户的语境变化。

46、一种阅读滋养健心聊天机器人的计算机可读存储介质,其特征在于包括:所述指令,且为非暂时的计算机可读存储介质;

47、客户端设备的处理器执行指令时执行以下操作:

48、接受来自用户客户端的输入,该输入由用户经过客户端设备的输入设备生成的用户界面输入,并在用户和客户端设备操作地聊天机器人之间第一会话期间被接收;

49、由聊天机器人对用户输入进行深度语义解析之后,确定用户向聊天机器人所表达的心理状态;

50、由聊天机器人将用户表达的心理状态指示存储于存储器中,以供将来聊天机器人使用;

51、由聊天机器人根据交互信号确定用户和聊天机器人之间的第二会话正在进行中;

52、由聊天机器人基于存储器中所存储的用户表达的心理状态指示,基于阅读滋养大模型作出智能响应,生成与心理状态相匹配的回复内容,返回模型的输出作为聊天机器人第二会话内容的一部分;所述回复内容由客户端设备输出到用户。

53、一种阅读滋养领域知识生成方法,其特征在于包括:

54、数字化整合现有阅读滋养领域的公开成果数据,包括实证研究过程中的访谈记录、对话记录、问卷调查和量表检测结果、心理问题、心理问题成因、干预心理问题有效的书方内容及其靶向性描述、干预心理问题成因有效的书方内容及其靶向性描述,以及情感词典;

55、基于公开的实证研究成果,进一步结合专家知识,对书方药性进行特征标识:包括名称、著者、内容描述、靶向性描述;抽取书方和心理状态的细粒度关系,关联存储于知识图谱,构建阅读滋养领域知识体系;基于所述阅读滋养健心聊天机器人的人机交互的问题信息和回复信息,生成并更新知识库。

56、所述的生成并更新知识库是基于阅读滋养大模型,训练的具体过程如下:

57、收集用户问题:接受用户输入的第一会话内容作为问题信息;

58、分析用户问题,根据阅读滋养领域大模型对用户输入的问题信息深度语义解析,细粒度识别用户心理状态,并对其进行分类;

59、收集反馈信息:接受基于阅读滋养大模型确定的用户心理状态、根据用户心理状态指示生成的第二会话内容即回复信息、用户对阅读滋养聊天机器人回复的满意度信息;

60、建立知识库:由知识库编辑单元将多轮人机交互结果的第一会话内容、用户心理状态、第二会话内容、用户对回复信息的满意度建立细粒度关联关系,对阅读滋养领域知识执行预设编辑操作,并更新所述知识库,从而帮助聊天机器人更好地回复用户问题,提供有效解决方案;

61、所述知识库编辑单元包括:信息接收模块,用于接受第一会话内容即用户心理状态信息和第二会话内容即聊天机器人的回复信息;关系建立模块,用于将所述的第一会话内容、用户心理状态指示、聊天机器人回复信息建立关联关系。

62、本发明具有有益效果。

63、(1)相比现有的基于大模型的通用聊天机器人,本发明可更好地提升阅读滋养领域的对话质量及用户对心灵滋养的使用满意度。本发明提出的基于大语言模型的阅读滋养健心聊天机器人,一方面基于基座大模型增强了模型的自然语言处理能力;另一方面通过进一步注入阅读滋养领域知识,经过大量的预训练和微调,使得构建的阅读滋养大模型能更深入地理解领域的核心概念和方法,从而更好地理解用户的深层心理状态,生成更自然、流畅、有针对性的响应;从而大大提升了模型的心灵滋养对话质量,进而提高用户使用满意度。

64、(2)相比现有的心理咨询聊天机器人,本发明大大提升了对用户情绪和心理问题干预以及心灵滋养的效果。本发明通过数字化大量的现有阅读推广、阅读疗愈、心理学研究、传统文化等领域对心灵滋养有效的实证研究书方成果或领域专家推荐阅读的书单,构建阅读滋养领域知识体系,从而基于多样化的大量书方形成高质量多样话的对话;形成阅读滋养领域的监督微调指令数据,将阅读滋养领域知识注入基座大模型,进行二次监督指令微调,经过大量专业的阅读滋养领域数据的不断预训练和优化,得到阅读滋养大模型。使得模型能深入理解用户输入,细粒度识别用户心理问题及其背后复杂成因;在此基础上实现人与机器之间智能的上下文关系交互,根据聊天机器人自动生成及更新的阅读滋养领域知识,生成针对用户不同心理问题及其复杂成因的细粒度精准响应;从而提升了心理咨询聊天机器人对用户心理问题识别及干预的覆盖性、精准性和深入性,通过机器人实现对用户的情绪和心理问题的精准阅读疗愈,精准滋养心灵,并保证了对话过程的流畅和舒适感。

65、(3)相比现有的心理问题阅读疗愈系统,本发明具有更好的应用前景。本发明通过提供阅读滋养健心聊天机器人技术,通过提供阅读滋养大模型,避免了入侵式量表检测,且不再依赖预设回复,提升了情绪或心理问题识别及干预的智能性、舒适性和便捷性;可实现全天候在线的情绪问题、心理问题及心理危机的发现与干预,提供在线阅读滋养技术支持,适用于各类人群,包括中学生、大学生、青少年群体、中老年群体、戒毒人员、罪犯等的心灵滋养、心理疗愈或危机干预;其应用可覆盖因工作时间、地理位置、社体疾病、社交障碍、病耻感等不便的服务对象群体;为数智赋能全民深阅读,为身、心、志方面的健康建设提供技术支撑。

66、(4)本发明提供的阅读滋养大模型,是基于现有的大模型,具有很好的可扩展性,可轻松与其他模型或框架集成,以实现更复杂的相关领域应用;提供了api接口,具有很好的易用性。

本文地址:https://www.jishuxx.com/zhuanli/20240614/88288.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。