技术新讯 > 乐器声学设备的制造及制作,分析技术 > 会议纪要生成方法、装置、计算机设备和存储介质与流程 > 正文

会议纪要生成方法、装置、计算机设备和存储介质与流程

国知局
2024-06-21 11:58:18

本技术涉及数据处理，特别是涉及一种会议纪要生成方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、会议是人们工作生活中的一项必要事项。在会议过程中，需要通过会议纪要生成方法准确完整地记录会议纪要，便于后续总结会议内容和传达会议内容。

2、目前的会议纪要生成方法，是通过录音机对会议内容进行录音，得到语音数据，并人工将语音数据转换为文本数据和确定文本数据对应的发言人，从而形成该会议的会议纪要数据。

3、但是，目前的会议纪要生成方法是人工确定文本数据对应的发言人，当存在多位发言人时，由于人工对各发言人的声线不熟悉，使得人工确定发言人的时间较长，导致目前的会议纪要生成方法效率较低。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种会议纪要生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本技术提供了一种会议纪要生成方法，包括：

3、获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；

4、确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；

5、根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。

6、在其中一个实施例中，所述对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇，包括：

7、根据预设的时间周期对所述待识别语音进行分割，得到多个第一语音片段；

8、基于预设的聚类算法对各所述第一语音片段进行聚类处理，得到多个语音簇。

9、在其中一个实施例中，所述确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据，包括：

10、针对各所述语音簇中的每一所述语音簇，在所述语音簇中确定关键语音片段，并合并各所述关键语音片段，得到关键语音数据；

11、根据短时傅里叶算法将所述关键语音数据转换为频谱图像数据；

12、通过特征提取模型对所述频谱图像数据进行特征提取，得到语音特征数据；所述特征提取模型是基于交叉熵损失函数与中心损失函数联合监督的方式训练稠密连接网络得到的。

13、在其中一个实施例中，所述根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，包括：

14、针对各所述语音特征数据中的每一所述语音特征数据，基于预设的相似度算法对所述语音特征数据和特征库中各用户语音特征数据进行计算，得到每一所述用户语音特征数据和所述语音特征数据的相似度；

15、在各所述相似度中确定满足预设的相似度条件的目标相似度，并将所述目标相似度对应的用户语音特征数据确定为目标用户语音特征数据；

16、将所述目标用户语音特征数据所表征的用户确定为目标用户，并建立所述目标用户和所述语音特征数据所在语音簇的关联关系。

17、在其中一个实施例中，所述根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音，包括：

18、针对各所述语音特征数据中的每一所述语音特征数据，确定所述语音特征数据所在的语音簇，并建立所述语音簇中各所述第一语音片段和所述语音特征数据所对应的目标用户的关联关系；

19、基于各所述语音簇中所述第一语音片段的时间戳，对各所述第一语音片段进行顺序排序，得到顺序语音，并根据所述顺序语音和各所述第一语音片段对应的目标用户构建初始语音。

20、在其中一个实施例中，所述根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音之后，所述方法还包括：

21、根据预设的语音识别模型将所述待识别语音转换为文本数据，并根据所述文本数据和所述初始语音生成会议的会议纪要。

22、在其中一个实施例中，所述根据预设的语音识别模型将所述待识别语音转换为文本数据，并根据所述文本数据和所述初始语音生成会议的会议纪要，包括：

23、基于预设的语音识别模型，对所述待识别语音进行分割处理和文本转换处理，得到各第二语音片段和每一所述第二语音片段对应的文本数据；

24、遍历所述待识别语音中的所述第一语音片段和所述第二语音片段，确定各所述第一语音片段和各所述第二语音片段的匹配关系；

25、根据各所述匹配关系、所述初始语音和各所述文本数据，生成会议的会议纪要。

26、第二方面，本技术还提供了一种会议纪要生成装置，包括：

27、处理模块，用于获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；

28、提取模块，用于确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；

29、构建模块，用于根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。

30、第三方面，本技术还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

31、获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；

32、确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；

33、根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。

34、第四方面，本技术还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

35、获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；

36、确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；

37、根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。

38、第五方面，本技术还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

39、获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；

40、确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；

41、根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。

42、上述会议纪要生成方法、装置、计算机设备、存储介质和计算机程序产品，获取待识别语音，并对所述待识别语音中的各第一语音片段进行聚类处理，得到多个语音簇；确定各所述语音簇对应的频谱图像数据，并根据特征提取模型提取各所述频谱图像数据中的声纹特征，得到各语音特征数据；根据预设的特征库和相似度算法确定各所述语音特征数据对应的目标用户，并根据各所述目标用户、各所述语音特征数据和各所述语音簇构建初始语音；所述初始语音用于生成会议的会议纪要。采用本方法，通过对待识别语音中的第一语音片段进行聚类处理，得到了属于同一用户的语音簇，并对语音簇进行数据处理，得到了语音簇的语音特征数据，进而根据语音特征数据确定目标用户，并构建初始语音，实现了自动化确定语音簇的发言人，进而能够根据初始语音快速生成会议的会议纪要，提高了会议纪要生成方法的效率。