技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于LLMs的事故触发源分析与ODC元素提取、分类方法及系统  >  正文

基于LLMs的事故触发源分析与ODC元素提取、分类方法及系统

  • 国知局
  • 2024-12-26 14:50:10

本发明涉及自动驾驶危害识别,特别是涉及一种基于llms(英文全称为large language models,中文全称为大语言模型)的事故触发源分析与odc(英文全称为operational design condition,中文全称为设计运行条件)元素提取、分类方法及系统。

背景技术:

1、随着自动驾驶技术的快速发展和应用,其在复杂交通场景下的安全性问题逐渐成为研究的焦点。特别是在无保护左转、行人突然横穿等高风险交通交互情境中,自动驾驶系统可能面临难以预测的事故风险。在此背景下,如何有效识别和应对这些潜在的事故触发源,对于确保自动驾驶车辆的安全性至关重要。

2、目前,自动驾驶危害识别主要依赖于事故分析、测试评价和理论分析等方法。尽管这些方法能够在一定程度上识别潜在的事故触发源,但由于交通环境的复杂性和多变性,传统方法往往难以全面、精确地提取所有可能的风险场景中的事故触发源。此外,人工分析大规模交通事故数据不仅效率低下,而且容易遗漏关键的触发因素。近年来,人工智能和llms的快速发展,为自动驾驶领域的事故触发源识别提供了新的技术手段。基于llms的强大语言处理和数据分析能力,可以自动从海量交通事故数据中提取与事故相关的触发源信息。然而,目前的研究多集中于触发源的识别与提取,对于如何将这些触发源系统化归类,并构建成odc元素框架的研究尚显不足。

3、构建odc元素框架是确保自动驾驶系统安全性的关键环节。通过明确外部环境条件与系统内部状态之间的关系,该框架能够为自动驾驶系统在不同场景下的安全运行提供坚实的基础。目前,尽管触发源的提取技术已逐渐成熟,但如何将这些提取到的触发源进一步系统化,形成odc元素框架并进行有效分级分类,仍是自动驾驶安全领域亟待解决的关键问题。缺乏这一框架的支持,自动驾驶系统在处理复杂交通场景时可能难以准确评估特定环境条件下的风险,进而影响系统的安全决策能力。

4、现有技术一提出了一种使用stpa(英文全称为system theoretic processanalysis,中文全称为系统理论过程分析方法),用于识别lkas(英文全称为lane keepingassist system,中文全称为车道保持辅助系统)的潜在事故触发源。该方法首先对lkas进行详尽的功能分解和控制结构建模,随后通过识别系统中潜在的不安全控制行为并深入分析其原因,从而提取出相应的事故触发源。通过stpa分析方法能够系统性地分析车道保持辅助系统中的潜在危险因素与触发源。但是,这种基于stpa的事故触发源提取方法,自动化程度较低,严重依赖专家的手动分析,处理复杂场景时效率不高。此外,stpa需要大量详细的数据输入,并需要构建复杂的系统控制结构模型,难以适应动态变化的交通事故分析任务场景,缺乏灵活性。同时,其分析结果无法直接输出为结构化格式,需进一步整理才能用于后续步骤。

5、现有技术二设计了一个统一的odd(英文全称为operational design domain,中文全称为操作设计域)监测框架,以应对复杂交通场景中车辆超出odd边界时可能引发的预期功能安全风险。该框架由三个模块组成:天气状况监测(如雨、雪、雾等异常天气)、车辆行为监测(如交通规则违规等异常行为)、以及路况监测(如路面缺陷、意外障碍物、湿滑路面等异常路况),并对各个模块的触发源进行分析,监测其中涉及到的odd元素。最后在应用中验证了该odd监控框架在缓解功能安全风险方面的实用性和有效性。但是,通过分析天气状况、车辆行为和异常路况三个模块的触发源,并将其结果直接作为odd的界定,以期通过odd监测来减轻预期的功能安全风险,但该方法在实施过程中存在明显的不足。主要问题在于,该方法未能包含从触发源中系统地提取关键odd元素的步骤。这一缺失导致在面对触发源细、多、碎时,难以进行有效的筛选和识别,因此需要从系统的角度来建立odd元素框架,以充分覆盖危害触发源。

技术实现思路

1、本发明的目的在于提供一种基于llms的事故触发源分析与odc元素提取、分类方法及系统来克服或至少减轻现有技术的上述缺陷中的至少一个。

2、为实现上述目的,本发明提供一种基于llms的事故触发源分析与odc元素提取、分类方法,其包括:

3、根据交通事故分析任务中国标文件和事故数据文件,将prompt工程的框架与fs(英文全称为few-shot,中文全称为少样本提示)示例结合获得prompt模块,利用prompt模块提供的prompt引导词,引导llms学习事故数据文件的触发源提取方法以及国标文件的odc元素分级分类原则;

4、将原始事故数据预处理后,得到待处理交通事故分析任务的事故数据,输入经由prompt模块引导学习后的llms中,llms利用学习到的触发源提取方法对待处理的事故数据中的触发源进行提取,以及利用学习到的odc元素分级分类原则将提取出的触发源与国标文件结合,形成满足国标要求的odc元素分类框架;

5、其中,“将提取出的触发源与国标文件结合,形成满足国标要求的odc元素分类框架”的方法具体包括:

6、将提取出的触发源进行词向量化,构造触发源词向量空间;对触发源词向量空间中的触发源词向量进行聚类,使用搜索算法检索触发源文本嵌入数据库,找到与触发源词向量最接近的触发源文本,以从触发源词向量中提取出odc元素三级分类,将odc元素三级分类整理到国标文件的二级分类框架下,形成满足国标要求的odc元素二级分类框架。

7、进一步地,promot模块包括:

8、角色定义单元,其用于根据交通事故分析任务,为llms预先设定一个角色,以确保llms在提取过程中具有与角色对应的背景和视角,并能够根据预设角色完成交通事故分析任务;

9、任务提示单元,其用于为llms提供任务提示,以引导llms专注于交通事故分析任务的关键的触发源元素,进而高效地提取所需信息,并按照要求输出对应格式;

10、上下文信息单元,其包含与交通事故分析任务相关的上下文信息,使llms能够依据上下文信息进行判断与学习;

11、fs示例单元,其用于在fs提示中,通过提供少量但具有代表性的示例,指导llms执行交通事故分析任务,使llms能够在新交通事故分析任务中提取出触发源;

12、输入信息单元,其用于接收llms需要处理的实际数据,通过结合角色、任务提示及上下文,从处理实际数据时提取出关键的触发源;

13、输出格式单元,其用于将关键的触发源转换成与llms适配格式的触发源,并输出。

14、进一步地,“形成满足国标要求的odc元素分类框架”具体包括:

15、依据国标文件下的odc元素一级分类和odc元素二级分类,加入odc元素三级分类,整理得到完整的odc元素分级分类框架,示例如下表1所示:

16、表1

17、

18、

19、进一步地,数据预处理包括:

20、数据清洗:1a.将原始事故数据中的重复数据、无关数据与噪音数据进行去除;1b.将原始事故数据汇总到单独字段中描述,简化数据内容;1c.将原始事故数据中的无效数据进行识别与删除;1d.将原始事故数据中核心部分数据缺失的数据进行删除;

21、数据格式化:1e.将经过数据清洗后的事故数据进行合并。

22、进一步地,通过chatgpt中的text-embedding-3-large文本嵌入模型将提取出的触发源进行词向量化具体包括:

23、31a.将提取出的每个触发源对应的词映射为一个初始的嵌入向量,获得词向量;

24、31b.通过自注意力机制同时关注所有31a获得的词向量,并计算两个词向量之间的影响,以使text-embedding-3-large文本嵌入模型生成的触发源词向量不仅包含局部上下文的信息,还能够捕捉两个词向量之间的语义关系;

25、31c.通过多层的transformer编码器,逐步聚合词向量的上下文信息,生成包含全局语义的向量,全局语义的向量用于综合单词的词义、句法结构和上下文信息;

26、31d.生成高维度的触发源词向量,并输出。

27、本发明还提供一种基于llms的事故触发源分析与odc元素提取、分类系统,其包括:

28、prompt模块,其用于根据交通事故分析任务中国标文件和事故数据文件,将prompt工程的框架与fs示例结合获得,并利用prompt引导词,引导llms学习事故数据文件的触发源提取方法以及国标文件的odc元素分级分类原则;

29、llms,其在经由prompt模块引导学习后,用于接收待处理交通事故分析任务的事故数据,并利用学习到的触发源提取方法对待处理的事故数据中的触发源进行提取,以及利用学习到的odc元素分级分类原则将提取出的触发源与国标文件结合,形成满足国标要求的odc元素分类框架;

30、其中,“将提取出的触发源与国标文件结合,形成满足国标要求的odc元素分类框架”的方法具体包括:

31、将提取出的触发源进行词向量化,构造触发源词向量空间;对触发源词向量空间中的触发源词向量进行聚类,使用搜索算法检索触发源文本嵌入数据库,找到与触发源词向量最接近的触发源文本,以从触发源词向量中提取出odc元素三级分类,将odc元素三级分类整理到国标文件的二级分类框架下,形成满足国标要求的odc元素二级分类框架。

32、进一步地,promot模块包括:

33、角色定义单元,其用于根据交通事故分析任务,为llms预先设定一个角色,以确保llms在提取过程中具有与角色对应的背景和视角,并能够根据预设角色完成交通事故分析任务;

34、任务提示单元,其用于为llms提供任务提示,以引导llms专注于交通事故分析任务的关键的触发源元素,进而高效地提取所需信息,并按照要求输出对应格式;

35、上下文信息单元,其包含与交通事故分析任务相关的上下文信息,使llms能够依据上下文信息进行判断与学习;

36、fs示例单元,其用于在fs提示中,通过提供少量但具有代表性的示例,指导llms执行交通事故分析任务,使llms能够在新交通事故分析任务中提取出触发源;

37、输入信息单元,其用于接收llms需要处理的实际数据,通过结合角色、任务提示及上下文,从处理实际数据时提取出关键的触发源;

38、输出格式单元,其用于将关键的触发源转换成与llms适配格式的触发源,并输出。

39、进一步地,“形成满足国标要求的odc元素分类框架”具体包括:

40、依据国标文件下的odc元素一级分类和odc元素二级分类,加入odc元素三级分类,整理得到完整的odc元素分级分类框架,示例如下表1所示:

41、表1

42、

43、

44、进一步地基于llms的事故触发源分析与odc元素提取、分类系统,其还包括:数据预处理单元,其用于将输入llms的原始事故数据预处理后,得到待处理交通事故分析任务的事故数据;

45、其中,数据预处理程序包括:

46、数据清洗:1a.将原始事故数据中的重复数据、无关数据与噪音数据进行去除;1b.将原始事故数据汇总到单独字段中描述,简化数据内容;1c.将原始事故数据中的无效数据进行识别与删除;1d.将原始事故数据中核心部分数据缺失的数据进行删除;

47、数据格式化:1e.将经过数据清洗后的事故数据进行合并。

48、进一步地,通过chatgpt中的text-embedding-3-large文本嵌入模型将提取出的触发源进行词向量化具体包括:

49、31a.将提取出的每个触发源对应的词映射为一个初始的嵌入向量,获得词向量;

50、31b.通过自注意力机制同时关注所有31a获得的词向量,并计算两个词向量之间的影响,以使text-embedding-3-large文本嵌入模型生成的触发源词向量不仅包含局部上下文的信息,还能够捕捉两个词向量之间的语义关系;

51、31c.通过多层的transformer编码器,逐步聚合词向量的上下文信息,生成包含全局语义的向量,全局语义的向量用于综合单词的词义、句法结构和上下文信息;

52、31d.生成高维度的触发源词向量,并输出。

53、本发明由于采取以上技术方案,具有以下优点:

54、1、通过精心设计的prompt,llms能够在特定角色和交通事故分析任务背景下进行推理和判断,有效减少了误判和偏差,提升了提取触发源的准确性;在prompt中引入fs提示技术,减少了对大规模数据集的依赖,提升了模型的泛化能力;利用prompt引导llms提取事故触发源,实现了对事故触发源的自动化提取,减少了人工干预,并有效提升了系统的整体效率。

55、2、通过采用chatgpt中的text-embedding-3-large文本嵌入模型,将llms初步提取出的触发源词向量化,相较于静态词嵌入方法,提升了词向量的上下文敏感性,并且在处理词向量多义性与歧义性上具有明显的优势和更强的泛化能力。

56、3、通过采用基于密度canopy的改进k-means算法来聚类触发源词向量,相较于传统k-means算法,降低了传统k-means对初始类簇中心、噪声和异常值敏感性,避免了随机选择初始中心可能导致算法陷入局部最优解的问题,同时使得计算量大大减少;将聚类形成的odc元素三级分类整理到国标的二级分类框架下,形成完整的odc元素分级分类框架,有效提升了元素分级分类的准确性和效率。

本文地址:https://www.jishuxx.com/zhuanli/20241226/343592.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。