一种基于模拟控制的主从并机均流方法与流程

2022-02-20 05:49:03 来源：中国专利 TAG：

1.本发明涉及网络信息技术领域，具体是一种基于模拟控制的主从并机均流方法。

背景技术：

2.传统对公授信业务发放审核，都是信用运营通过人工审核纸质资料及系统信息完成的，信用运营智能审核系统旨在探索通过人工智能相关技术，提升审核的系统自动化水平，针对的痛点主要是替身风险把控能力(这当中就包括减少人为主观或者客观因素影响、提升放贷资料审核规范率)、第二方面是提升效率提升用户体验(特别是远程审核模式下的效率)、第三是缓解人力资源紧张的情况(释放专业审核人员的人力资源)，同时能够增强大数据积累沉淀、智能研发平台机制建设。
3.以“审批意见”场景实现为例，分析必要性、价值包括三方面：
4.1)人力资源方面：
5.2019年全年，全行信用运营审核对公授信业务共计193789笔，按照一笔业务，一份审批意见审核时长平均15分钟计算：193789*15/60＝48447.25小时，即一笔业务，一份审批意见智能审核可以每年释放分行放款审核48447.25小时工作量。
6.2)提升业务办理效率方面：
7.这部分人工耗时被系统自动化替代后，直接提升业务办理效率，极大缩短了市场需求反应时间，提升客户体验，进而提升我行在市场竞争力。
8.3)提升风险管控能力方面：
9.由系统来完成的操作，优势体现在算力强、全天候、不受疲劳因素影响，直接提升作业规范率，降低该环节人为主观因素影响。

技术实现要素：

10.本发明的目的在于提供一种基于模拟控制的主从并机均流方法，以解决上述背景技术中提出的问题。
11.为实现上述目的，本发明提供如下技术方案：
12.一种基于模拟控制的主从并机均流方法，包含以下步骤：
13.步骤1、对表格及文本进行预处理；
14.步骤2、采用brat标注工具进行语料标注；在excel文件中直接进行语料标注；
15.步骤3、根据brat语料标注的结果，运用bilstm crf模型进行命名实体识别；根据excel语料标注的结果，运用bert模型进行分类；
16.步骤4、将抽取的实体要素和分类的文本根据对应关系进行融合。
17.作为本发明的进一步技术方案，步骤1具体是：对表格文本进行的预处理操作包括对表格中意见所在行的提取，将提取并合并后的意见内容转化成文本，以及对文字进行清洗。
18.作为本发明的进一步技术方案，步骤2中，包括以下子步骤：
19.步骤21、采用brat标注工具，用bio的标注方法，将语料分别储存为.txt文件和.ann文件；
20.步骤22、在excel文件中语料单元格后一例，用整数标签进行标注，最后全部放入.txt文件中。
21.作为本发明的进一步技术方案，步骤3包括以下子步骤：
22.步骤31、训练数据首先通过jieba工具包进行分词；
23.步骤32、将分词后的数据按照顺序进行排序获取到对应的下标索引，并保存到word_to_index数组中；
24.步骤33、将分词数据通过word_to_index都转为对应的索引向量，并按照固定的长度进行截断；
25.步骤34、加载下载好的word2vec词向量，并根据word_to_index进行中的保存的索引构建词向量矩阵；
26.步骤35、将词向量的知识输入到模型中，利用步骤34获取词向量矩阵进行编码；
27.步骤36、将编码后的向量输入到长短期记忆网络中，该模块会将上一个时间点的隐节点状态也作为当前的神经网络单元的输入，同时利用门控机制，即会控制性选择上一个时间点隐节点状态的部分信息，进行当前时间节点的信息融合，最后得到隐层信息；
28.步骤37、再将隐层信息输入到crf层中，利用crf的维特比编码算法进行计算，即可得到实体标签结果；
29.步骤38、将隐层信息输入到softmax函数中，得到分类标签的概率的矩阵，最后通过argmax函数，获取到每个段落最终的分类标签。
30.作为本发明的进一步技术方案，步骤4包括以下子步骤：
31.步骤41、单笔审批意见通过调用单笔服务获取文本中编号、前提条件、管理要求、风险提示这些要素；
32.步骤42、综合审批意见通过调用综合服务获取每句话的分类标签：11、0、4、5、6，其中11代表含有子公司的句子；0代表无；4代表含有管理要求的句子；5代表含有前提条件的句子；6代表含有风险提示的句子。
33.与现有技术相比，本发明的有益效果是：本发明通过对银行贷款审批意见进行命名实体识别和文本，以解析要素，返回相关要素信息。
附图说明
34.图1是本发明的流程图。
具体实施方式
35.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
36.请参阅图1所示，一种基于模拟控制的主从并机均流方法，包含以下步骤：
37.步骤1、对文本进行预处理；
38.具体是：对表格文本进行的预处理操作包括对表格中意见所在行的提取，将提取并合并后的意见内容转化成文本，以及对文字进行清洗。
39.步骤2、采用brat标注工具进行语料标注；在excel文件中直接进行语料标注；
40.其中，包括以下子步骤：
41.步骤21、采用brat标注工具，用bio的标注方法，将语料分别储存为.txt文件和.ann文件。
42.步骤22、在excel文件中语料单元格后一例，用整数标签进行标注，最后全部放入.txt文件中；
43.步骤3、根据brat语料标注的结果，运用bilstm crf模型进行命名实体识别；根据excel语料标注的结果，运用bert模型进行分类；
44.其中，包括以下子步骤：
45.步骤31.训练数据首先通过jieba工具包进行分词。
46.步骤32.将分词后的数据按照顺序进行排序获取到对应的下标索引，并保存到word_to_index数组中。
47.步骤33.将分词数据通过word_to_index都转为对应的索引向量，并按照固定的长度进行截断。
48.步骤34.加载下载好的word2vec词向量，并根据word_to_index进行中的保存的索引构建词向量矩阵。
49.步骤35.将词向量的知识输入到模型中，利用步骤34获取词向量矩阵进行编码。
50.步骤36.将编码后的向量输入到长短期记忆网络中，该模块会将上一个时间点的隐节点状态也作为当前的神经网络单元的输入，同时利用门控机制，即会控制性选择上一个时间点隐节点状态的部分信息，进行当前时间节点的信息融合，最后得到隐层信息。
51.步骤37.再将隐层信息输入到crf层中，利用crf的维特比编码算法进行计算，即可得到实体标签结果。
52.步骤38.将隐层信息输入到softmax函数中，得到分类标签的概率的矩阵，最后通过argmax函数，获取到每个段落最终的分类标签。
53.步骤4、将抽取的实体要素和分类的文本根据对应关系进行融合。
54.其中，包括以下子步骤：
55.步骤41、单笔审批意见通过调用单笔服务获取文本中编号、前提条件、管理要求、风险提示这些要素；
56.步骤42、综合审批意见通过调用综合服务获取每句话的分类标签：11、0、4、5、6，其中11代表含有子公司的句子；0代表无；4代表含有管理要求的句子；5代表含有前提条件的句子；6代表含有风险提示的句子。
57.步骤43、根据授信客户将对应子公司的管理要求、前提条件和风险提示添加至单笔对应要素中。
58.对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有
变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
59.此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于模拟控制的主从并机均流方法与流程

相关文献

最热文献