技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于模板范本的招标文件生成方法、系统及存储介质与流程  >  正文

基于模板范本的招标文件生成方法、系统及存储介质与流程

  • 国知局
  • 2024-08-30 15:02:53

本技术涉及电子招投标,尤其涉及一种基于模板范本的招标文件生成方法、系统及存储介质。

背景技术:

1、招标文件作为招标过程的核心组成部分,其文本质量能够直接影响到项目的执行效果和结果。近年来,随着信息技术和自然语言处理技术的迅猛发展,招标文件的自动化生成逐渐成为可能。

2、目前,招标文件的生成主要有两种形式:一种是基于模板范本的招标文件生成,另一种是无模板范本的招标文件生成。其中基于模板范本的招标文件生成是指在现有的、符合招标规范的模板范本基础上,通过向模板范本填充对应的具体信息来生成完整的招标文件。无模板范本的招标文件生成则需要从头开始编写,完全依赖于编写人员的专业知识和经验。针对基于模板范本的招标文件生成来说,现有的方式是基于预先制定的模板范本,工作人员根据项目的实际需求填写特定的字段和内容,从而生成招标文件。

3、然而,基于模板范本的招标文件生成的现有方式主要依赖于专业工作人员,涉及大量的手动劳动和细致的注意力。工作人员需要深入理解项目的具体要求、合同条款以及技术规格等,不仅耗时而且容易出错。因此,如何开发一种基于模板范本的智能化招标文件生成方法,以提高招标文本生成的准确性,降低人为错误的风险,成为当前技术发展的关键方向。

技术实现思路

1、本技术提供了一种基于模板范本的招标文件生成方法、系统及存储介质,能够提高招标文本生成的准确性,降低人为错误的风险。本技术提供如下技术方案:

2、第一方面,本技术提供一种基于模板范本的招标文件生成方法,所述方法包括:

3、获取项目名称和工程规模,在预构建的历史范本库中进行向量化匹配,筛选出最为匹配的模板范本;

4、识别模板范本的待填写字段,将所述待填写字段分类为:直接填写字段、概括填写字段以及扩充填写字段;

5、获取重点字段和标前文件,基于所述重点字段在所述标前文件中抽取直接填写字段,将所述直接填写字段回填到所述模板范本的对应位置;

6、获取法规以及概括要点并输入至预设的深度学习模型,模型输出概括填写字段并将其回填到所述模板范本的对应位置;

7、基于项目名称和工程规模在预构建的招标素材库中筛选出最相似的标段,从所述标段中抽取关键字段并输入至所述深度学习模型进行改写,模型输出扩充填写字段并将其回填到所述模板范本的对应位置。

8、在一个具体的可实施方案中,所述获取项目名称和工程规模,在预构建的历史范本库中进行向量化匹配,筛选出最为匹配的模板范本包括:

9、获取当前招标项目的项目名称和工程规模,由用户输入或者从项目管理系统中导出;

10、历史范本库为动态更新的收录有公开招标文件的模板范本的数据库;

11、使用向量化模型将项目名称和工程规模转换为向量化表示,将历史范本库中的所有招标文件的模板范本转换为向量化表示,通过余弦相似度计算项目名称和工程规模与每一个模板范本的相似度,相似度最高的模板范本即为最为匹配的模板范本。

12、在一个具体的可实施方案中,所述识别模板范本的待填写字段,将所述待填写字段分类为:直接填写字段、概括填写字段以及扩充填写字段包括:

13、分析模板范本,使用字符串匹配技术通过特定的标记或者占位符识别出所有待填写字段,使用自然语言处理技术或者文本分类器将待填写字段分为以下三类:

14、直接填写字段:能够直接从文本中抽取的字段;

15、概括填写字段:需要根据输入的法规和要点进行总结归纳的字段;

16、扩充填写字段:需要根据项目名称和工程规模检索相似标段并进行改写的字段。

17、在一个具体的可实施方案中,所述获取重点字段和标前文件,基于所述重点字段在所述标前文件中抽取直接填写字段,将所述直接填写字段回填到所述模板范本的对应位置包括:

18、重点字段为招投标领域梳理出通用的150个重点字段,获取重点字段和标前文件之后,判断重点字段为简单字段还是复杂字段;

19、若是重点字段为简单字段,使用bm25检索模型检索出与该重点字段相关性最高的标前文件片段,在相关性最高的标前文件片段定位重点字段所在的完整字段,并从该完整字段中提取出直接填写字段,将直接填写字段回填到模板范本的对应位置;

20、若是重点字段为复杂字段,则将标前文件划分为若干个段落,计算重点字段与每个标前文件的段落的覆盖度和语义相似度,使用以下公式计算得出重点字段与每个标前文件的段落的相关度:

21、;

22、计算得到重点字段与每个标前文件的段落的相关度之后,在相关度最高的标前文件的段落中定位重点字段所在的完整字段,从该完整字段中提取出直接填写字段,将直接填写字段回填到模板范本的对应位置。

23、在一个具体的可实施方案中,所述计算重点字段与每个标前文件的段落的覆盖度和语义相似度包括:

24、计算重点字段与每个标前文件的段落的覆盖度,计算公式如下:

25、;

26、其中,表示重点字段与标前文件的某个段落的覆盖度,和分别表示重点字段与标前文件的某个段落的长度,表示重点字段与标前文件的某个段落的重叠词数,表示重点字段与标前文件的某个段落的重叠字符数;

27、使用余弦相似度计算方法计算重点字段与每个标前文件的段落的语义相似度。

28、在一个具体的可实施方案中,所述获取法规以及概括要点并输入至预设的深度学习模型,模型输出概括填写字段并将其回填到所述模板范本的对应位置包括:

29、获取法规以及概括要点,其中法规为招标项目所要求的法规,概括要点为招标人提供,每一个概括填写字段对应一个概括要点;

30、对于每个概括填写字段,将法规以及对应的概括要点输入至预设的深度学习模型中,深度学习模型输出对应的概括填写字段,将概括填写字段回填到模板范本的对应位置。

31、在一个具体的可实施方案中,所述基于项目名称和工程规模在预构建的招标素材库中筛选出最相似的标段,从标段中抽取关键字段并输入至所述深度学习模型进行改写,模型输出扩充填写字段并将其回填到所述模板范本的对应位置包括:

32、预先构建的招标素材库中包含有历史招标文件及其对应的标段,计算项目名称和工程规模与预构建的招标素材库中每个标段的文本相似度,计算公式如下:

33、;

34、其中,为项目名称,为工程规模,为招标素材库中的第个标段,为平滑参数,通常设置为0.01,表示项目名称和标段共同包含的词汇数量,表示工程规模和标段共同包含的词汇数量,、和分别表示项目名称、工程规模和标段的总词汇数量;

35、计算完项目名称和工程规模与预构建的招标素材库中每个标段的文本相似度之后,文本相似度最高的即为筛选出的最相似的标段,随后使用信息增益计算每个词汇在标段中的关键程度,以抽取出关键字段,信息增益值能够定义词汇在标段中对整体信息量的贡献,计算公式如下:

36、;

37、其中,是词汇的信息增益分数,表示词汇对区分不同文本段落的贡献度,是词汇在最相似的标段中的词频;信息增益分数的计算公式如下:

38、;

39、其中,是文本段落的类别集合, 是类别的概率,是类别的熵,是在给定词汇的情况下,类别的条件熵;

40、计算完每个词汇的信息增益值之后,选取信息增益值最大的词汇或者排名前三的词汇所在的字段作为关键字段,抽取关键字段并输入至深度学习模型进行改写,深度学习模型输出扩充填写字段并将其回填到模板范本的对应位置。

41、第二方面,本技术提供一种基于模板范本的招标文件生成系统,采用如下的技术方案:

42、一种基于模板范本的招标文件生成系统,包括:

43、模板范本匹配模块,用于获取项目名称和工程规模,在预构建的历史范本库中进行向量化匹配,筛选出最为匹配的模板范本;

44、字段识别模块,用于识别模板范本的待填写字段,将所述待填写字段分类为:直接填写字段、概括填写字段以及扩充填写字段;

45、直接回填模块,用于获取重点字段和标前文件,基于所述重点字段在所述标前文件中抽取直接填写字段,将所述直接填写字段回填到所述模板范本的对应位置;

46、概括回填模块,用于获取法规以及概括要点并输入至预设的深度学习模型,模型输出概括填写字段并将其回填到所述模板范本的对应位置;

47、扩充回填模块,用于基于项目名称和工程规模在预构建的招标素材库中筛选出最相似的标段,从所述标段中抽取关键字段并输入至所述深度学习模型进行改写,模型输出扩充填写字段并将其回填到所述模板范本的对应位置。

48、第三方面,本技术提供一种电子设备,所述设备包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如第一方面所述的一种基于模板范本的招标文件生成方法。

49、第四方面,本技术提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序被处理器执行时用于实现如第一方面所述的一种基于模板范本的招标文件生成方法。

50、通过获取项目名称和工程规模并进行向量化匹配,筛选出最匹配的模板范本。然后识别模板中的待填写字段,将其分类为直接填写字段、概括填写字段和扩充填写字段。使用bm25检索模型和综合评估方法从标前文件中抽取直接填写字段,回填到模板中。对概括填写字段,获取相关法规和要点,输入深度学习模型生成并回填。对于扩充填写字段,通过文本相似度计算和信息增益提取关键字段,再经深度学习模型改写生成。这种方法解决了现有技术中依赖人工、耗时且易出错的问题,提高了招标文件生成的准确性和效率。

51、上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,并可依照说明书的内容予以实施,以下以本技术的较佳实施例并配合附图详细说明如后。

本文地址:https://www.jishuxx.com/zhuanli/20240830/285268.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。