技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大语言模型的表格-文本数据生成方法及装置  >  正文

基于大语言模型的表格-文本数据生成方法及装置

  • 国知局
  • 2024-09-05 14:38:20

本公开涉及人工智能,尤其涉及自然语言处理领域和大模型领域。本公开具体涉及一种基于大语言模型的表格-文本数据生成方法及装置。

背景技术:

1、表格作为一种被广泛使用的数据载体,在实际使用处理时,由于其二维文本的特点难以被ai理解,因而,其在人工智能领域利用效率低下。同时,某些领域数据通常具有高度敏感性和机密性或者涉及范围小,导致难以获取足够规模的开放数据集,限制了研究的广度和深度。数据集缺乏、训练样本质量不佳等问题始终存在并困扰着研究人员。

2、虽然表格-文本数据生成方法已经取得了很大的进展,但传统的朴素模型不能精准提取关键信息,信息抽取能力不足,且难以生成语句连贯通顺的描述性语言。

技术实现思路

1、本公开提供了一种基于大语言模型的表格-文本数据生成方法及装置。

2、根据本公开的一方面,提供了一种基于大语言模型的表格-文本数据生成方法,包括:

3、基于各个第一表格处理指令,各个第一表格,和采用各个所述第一表格处理指令处理各个所述第一表格所得到的各个第一表格处理结果,构建第一训练数据集,其中,第一表格处理结果为表格和描述性文本中任一个;

4、基于各个第二表格处理指令,各个第二表格,和采用各个所述第二表格处理指令处理各个所述第二表格所得到的各个第二表格处理结果,构建第二训练数据集,其中,所述第二表格处理结果为描述性文本;

5、采用所述第一训练数据集对第一大语言模型进行训练,得到第二大语言模型;

6、采用所述第二训练数据集对所述第二大语言模型进行训练,得到表格文本数据生成模型;

7、将目标表格处理指令和目标表格输入所述表格文本数据生成模型,得到所述表格文本数据生成模型输出的目标表格处理结果,其中,所述目标表格处理结果为描述性文本。

8、根据本公开的另一方面,提供了一种基于大语言模型的表格-文本数据生成装置,包括:

9、第一训练集确定模块,用于基于各个第一表格处理指令,各个第一表格,和采用各个所述第一表格处理指令处理各个所述第一表格所得到的各个第一表格处理结果,构建第一训练数据集,其中,第一表格处理结果为表格和描述性文本中任一个;

10、第二训练集确定模块,用于基于各个第二表格处理指令,各个第二表格,和采用各个所述第二表格处理指令处理各个所述第二表格所得到的各个第二表格处理结果,构建第二训练数据集,其中,所述第二表格处理结果为描述性文本;

11、第一训练模块,用于采用所述第一训练数据集对第一大语言模型进行训练,得到第二大语言模型;

12、第二训练模块,用于采用所述第二训练数据集对所述第二大语言模型进行训练,得到表格文本数据生成模型;

13、模型应用模块,用于将目标表格处理指令和目标表格输入所述表格文本数据生成模型,得到所述表格文本数据生成模型输出的目标表格处理结果,其中,所述目标表格处理结果为描述性文本。

14、根据本公开的另一方面,提供了一种电子设备,包括:

15、至少一个中央处理器;以及

16、与所述至少一个中央处理器通信连接的存储器;其中,

17、所述存储器存储有可被所述至少一个中央处理器执行的指令,所述指令被所述至少一个中央处理器执行,以使所述至少一个中央处理器能够执行本公开实施例中任一基于大语言模型的表格-文本数据生成方法。

18、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例中任一基于大语言模型的表格-文本数据生成方法。

19、根据本公开的技术,基于各个第一表格处理指令,各个第一表格,和采用各个第一表格处理指令处理各个第一表格所得到的各个第一表格处理结果,构建第一训练数据集,其中,第一表格处理结果为表格和描述性文本中任一个。基于各个第二表格处理指令,各个第二表格,和采用各个第二表格处理指令处理各个第二表格所得到的各个第二表格处理结果,构建第二训练数据集,其中,第二表格处理结果为描述性文本。然后,采用第一训练数据集对第一大语言模型进行训练,得到第二大语言模型;以及,采用第二训练数据集对第二大语言模型进行训练,得到表格文本数据生成模型。从而,将目标表格处理指令和目标表格输入表格文本数据生成模型,得到表格文本数据生成模型输出的以描述性文本来表示的目标表格处理结果。因此,在本公开技术中,可以先针对大语言模型的基础表格理解能力对模型进行训练,然后再针对大语言模型的表格处理和描述性文本生成的能力而对模型进行再次训练,如此,可以提高大语言模型对表格的基础理解能力并进一步地对表格生成以描述性文本的方式表达的处理结果,使得大模型的表格理解能力达到自动化、高效化的效果。

20、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种基于大语言模型的表格-文本数据生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述采用所述第一训练数据集对第一大语言模型进行训练,得到第二大语言模型,包括:

3.根据权利要求1所述的方法,其特征在于,所述采用所述第二训练数据集对所述第二大语言模型进行训练,得到表格文本数据生成模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述采用所述第二训练数据集对所述第三大语言模型进行训练,得到所述表格文本数据生成模型,包括:

5.根据权利要求1所述的方法,其特征在于,所述第一表格处理指令的类型包括所述第二表格处理指令的类型。

6.根据权利要求1所述的方法,其特征在于,还包括:

7.一种基于大语言模型的表格-文本数据生成装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,所述第二训练模块,包括:

9. 一种电子设备,其特征在于,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。

技术总结本公开提供了一种基于大语言模型的表格‑文本数据生成方法和装置,涉及人工智能技术领域,尤其涉及自然语言处理领域和大模型领域。具体实现方案为:基于各个第一表格处理指令,各个第一表格和各个第一表格处理结果,构建第一训练数据集,第一表格处理结果为表格和描述性文本中任一个;基于各个第二表格处理指令,各个第二表格和各个第二表格处理结果,构建第二训练数据集,第二表格处理结果为描述性文本;采用第一训练数据集和第二训练数据集对第一大语言模型依次进行训练,得到表格文本数据生成模型;将目标表格处理指令和目标表格输入表格文本数据生成模型,得到目标表格处理结果,其中,目标表格处理结果为描述性文本。技术研发人员:陈海文,倪雨,肖开明,王腾云,吴继冰,葛宁超受保护的技术使用者:中国人民解放军国防科技大学技术研发日:技术公布日:2024/9/2

本文地址:https://www.jishuxx.com/zhuanli/20240905/287448.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。