基于行业智能体的可执行流程和检测项的智能生成方法及系统与流程
- 国知局
- 2024-12-06 12:18:16
本发明涉及人工智能,更具体的说是涉及基于行业智能体的可执行流程和检测项的智能生成方法及系统。
背景技术:
1、目前,可执行流程和检测项的智能生成技术,历经多年的研究与实践积累,逐渐构建起一套具有普适性的方法体系,涵盖了从需求分析、规则定义、算法设计到自动化生成等多个关键环节。这一系列过程旨在利用先进的信息技术手段,特别是人工智能和机器学习技术,自动地从大量业务数据和专家经验中提炼出有效的流程逻辑与检测规范,并转化为实际可运行的流程模型及检测项目清单。
2、传统的手动设计流程与检测项不仅耗时耗力,且易受主观因素影响导致效率低下和不一致性。而智能生成方法则通过复杂的数学模型和优化算法实现流程自动化设计,例如运用基于约束满足问题(constraint satisfaction problem,csp)、形式化方法论(formal methods)或petri网等理论来刻画流程结构和动态行为。对于检测项,借助深度学习和模式识别技术,可以从历史案例库中发现潜在规律,自动生成适用于不同场景的检查列表。
3、尽管如此,当前智能生成方法还面临着一系列挑战,诸如复杂流程的完全自动化设计难度高、领域知识难以有效嵌入、以及适应不断变化的业务环境能力较弱等问题。
4、因此,如何实现对复杂业务逻辑的自然语言解释与智能化生成、在更大范围内模拟和优化业务流程是本领域亟需解决的技术问题。
技术实现思路
1、有鉴于此,本发明提供了一种基于行业智能体的可执行流程和检测项的智能生成方法及系统,用于至少解决背景技术中的部分技术问题。
2、为了实现上述目的,本发明采用如下技术方案:
3、本发明一方面公开了一种基于行业智能体的可执行流程和检测项的智能生成方法,包括以下步骤:
4、获取非结构化数据,所述非结构化数据包括包含可执行流程相关信息的文本数据和图像数据;
5、对采集的非结构化数据进行预处理,并生成文本数据和图像数据融合的多模态数据;
6、将预处理后得到的多模态数据输入训练好的多模态垂类大模型,生成对应的xml文件;
7、对生成的xml文件进行验证得到验证通过的最终xml文件。
8、进一步地,对采集的非结构化数据进行预处理,具体包括:数据清洗、数据标准化和数据格式转换。
9、进一步地,所述多模态垂类大模型通过以下步骤进行训练:
10、获取训练数据集,所述训练数据集包括行业知识库数据以及人工标注的行业正样本数据;
11、将行业知识库数据抽象成若干知识单元,多模态垂类大模型基于所述知识单元进行学习,在底层知识层面上建立对应行业领域的深入洞察;
12、将人工标注的行业正样本数据转换成若干业务流程实例fj和对应的标准化流程描述pj,多模态垂类大模型通过对比学习业务流程实例和对应的标准化流程描述来强化对业务流程内在规律的理解;
13、模型训练过程中,通过反向传播算法和adam优化器不断迭代更新模型参数θ,以最小化预测流程描述与标准化流程描述pj之间的损失函数。
14、进一步地,预测流程描述与实际标注pj之间的损失函数,具体包括以下函数:
15、进一步地,还包括对训练好的多模态垂类大模型进行微调,具体包括:
16、将原始文档输入多模态垂类大模型生成对应的模型输出xml文件;
17、将原始文档进行人工校验和优化获取对应的人工优化xml文件;
18、通过比较模型输出xml文件和人工优化xml文件,提升多模态垂类大模型模拟真实业务流程的能力。
19、进一步地,将预处理后得到的多模态数据输入训练好的多模态垂类大模型,生成对应的xml文件,具体包括:
20、将多模态数据输入训练好的多模态垂类大模型,生成对应的包含主流程定义信息的xml文件,所述主流程定义信息包括活动节点task、事件event、网关gateway、数据对象data object以及它们之间的关系链。
21、进一步地,对生成的xml文件进行验证具体包括以下步骤:
22、根据预设的结构规范、逻辑规则以及业务需求,对接收到的xml文件进行验证。
23、本发明还公开了一种基于行业智能体的可执行流程和检测项的智能生成系统,包括非结构化数据采集模块、数据预处理模块、多模态垂类大模型和自动化验证模块;
24、其中,所述非结构化数据采集模块用于采集非结构化数据,所述非结构化数据包括文本数据和图像数据;
25、所述数据预处理模块用于对采集的非结构化数据进行预处理,并生成文本数据和图像数据融合的多模态数据;
26、所述多模态垂类大模型用于接受预处理后的多模态数据,并基于所述多模态数据生成对应的xml文件;
27、所述自动化验证模块用于对生成的xml文件进行验证。
28、优选的,上述系统还包括模型训练模块,所述模型训练模块用于利用训练数据集对所述多模态垂类大模型进行训练。
29、优选的,所述多模态垂类大模型的训练过程具体包括以下步骤:
30、获取训练数据集,所述训练数据集包括行业知识库数据以及人工标注的行业正样本数据;
31、将行业知识库数据抽象成若干知识单元,多模态垂类大模型基于所述知识单元进行学习,在底层知识层面上建立对应行业领域的深入洞察;
32、将人工标注的行业正样本数据转换成若干业务流程实例fj和对应的标准化流程描述pj,多模态垂类大模型通过对比学习业务流程实例和对应的标准化流程描述来强化对业务流程内在规律的理解;
33、模型训练过程中,通过反向传播算法和adam优化器不断迭代更新模型参数θ,以最小化预测流程描述与实际标注之间的损失函数。
34、经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于行业智能体的可执行流程和检测项的智能生成方法及系统,具有以下有益效果:
35、1.非结构化数据采集模块能够处理多种格式的文本和图像数据,这为后续分析提供了大量的原始数据。
36、2.数据预处理:数据预处理模块通过清洗、标准化和格式转换等操作,确保了数据质量,为模型训练提供了准确的输入。
37、3.丰富的样本数据集:样本数据集包括行业知识库、人工标注的正样本数据以及由模型生成并优化过的xml文件,这样的组合有助于模型全面学习领域知识和业务流程。
38、4.模型训练与微调:模型训练/微调模块基于样本数据集对语言大模型进行训练和微调,提高了模型的专业精度和适应性。
39、5.标准化流程输出:多模态垂类大模型能够产生符合bpmn2规范的xml文件,这些文件详细描述了主流程和子流程信息,确保了流程定义的标准化和通用性。
40、6.自动化验证:自动化验证模块利用形式化的方法论和技术手段对生成的xml文件进行深度分析和合规性检测,减少了人为错误,提高了流程定义的准确性和可靠性。
41、7.图形化审核与优化接口:流程和检测项审核/编辑模块将xml文件转换为图形化流程图,便于专家或业务人员进行直观的审核和优化,提高了流程设计的交互性和用户友好度。
42、8.持续改进的闭环机制:经过审核优化后的xml文件被反馈到样本数据集中,用于模型的进一步微调,形成了一个持续学习和改进的闭环机制,使得模型能够不断提升性能和准确性。
本文地址:https://www.jishuxx.com/zhuanli/20241204/340561.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。