一种基于主题生成模型的会议纪要生成方法与流程

2022-03-31 09:01:49 来源：中国专利 TAG：

1.本技术涉及一种计算机技术领域，更具体地，涉及一种基于主题生成模型的会议纪要生成方法。

背景技术：

2.智能会议纪要的目的是记录和总结会议的内容，以便于后续查阅归档。目前的智能会议纪要方法普遍是基于关键词提取和预设字段比对的方法。在记录会议纪要时，用户自己提前设定关键词，然后基于关键词抽取重要的词语或者句子，来组成会议纪要。
3.但是，在实际应用中，每位参会者讨论的内容不尽相同，使得设定的内容过于繁琐，或者遗漏讨论内容，严重影响用户体验。

技术实现要素：

4.鉴于上述问题，本技术提出了一种基于主题生成模型的会议纪要生成方法，以改善上述缺陷。
5.本技术实施例提供了一种基于主题生成模型的会议纪要生成方法，所述方法包括获取待处理的发言文本；将所述发言文本划分为多个字节片段；获取每个所述字节片段在所述发言文本内的出现频率；基于多个所述字节片段序列的出现频率得到多个关键字节片段；基于多个所述关键字节片段获取所述发言文本对应的会议纪要。
6.本技术提供的一种基于主题生成模型的会议纪要生成方法，在获取待处理的发言文本后，将所述发言文本划分为多个字节片段，获取每个所述字节片段在所述发言文本内的出现频率，基于多个所述字节片段序列的出现频率得到多个关键字节片段，基于多个所述关键字节片段获取所述发言文本对应的会议纪要。通过上述方式使得，可以基于多个所述字节片段序列的出现频率得到多个关键字节片段，基于多个所述关键字节片段获取所述发言文本对应的会议纪要，避免了事先频繁设定关键词，从而提高了用户体验。
附图说明
7.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
8.图1示出了本技术实施例提供的基于主题生成模型的会议纪要生成方法的运行环境的示意图；
9.图2示出了本技术一实施例提供的基于主题生成模型的会议纪要生成方法的方法流程图；
10.图3示出了本技术实施例提供的获取待处理的发言文本的方框示意图；
11.图4示出了本技术实施例提供的基于多个所述关键字节片段获取所述发言文本对
应的会议纪要的方框示意图；
12.图5示出了本技术一实施例提供的基于主题生成模型的会议纪要生成装置的结构框图；
13.图6示出了本技术实施例提供的电子设备的结构框图；
14.图7示出了本技术实施例提供的用于保存或者携带实现根据本技术实施例的基于主题生成模型的会议纪要生成方法的程序代码的存储单元；
15.图8示出了本技术实施例提供的计算机程序产品的示意图。
具体实施方式
16.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
17.信息处理经常也用于处理会议纪要文本。在记录会议纪要时，用户自己提前设定关键词，然后基于关键词抽取重要的词语或者句子，来组成会议纪要。
18.发明人在对相关研究中发现，在生成会议纪要之前，需要先设定好一些字段，这些字段通常包含了会议的主题内容。在实际应用中，每位参会者讨论的内容不尽相同，使得设定的内容过于繁琐，或者遗漏讨论内容，严重影响用户的工作状态。
19.因此，发明人提出了本技术中的一种基于主题生成模型的会议纪要生成方法，在获取待处理的发言文本后，将所述发言文本划分为多个字节片段，获取每个所述字节片段在所述发言文本内的出现频率，基于多个所述字节片段序列的出现频率得到多个关键字节片段，基于多个所述关键字节片段获取所述发言文本对应的会议纪要。
20.通过上述方式使得，可以基于多个所述字节片段序列的出现频率得到多个关键字节片段，基于多个所述关键字节片段获取所述发言文本对应的会议纪要，避免了事先频繁设定关键词，从而提高了用户体验。
21.为了更好地理解本技术实施例的方案，下面先结合图1对本技术实施例可能的运行环境进行简单的介绍。
22.请参阅图1，图1示出了本技术实施例提供的基于主题生成模型的会议纪要生成方法的运行环境。如图1中所示，用户终端10包含音频采集设备11，用户终端通过音频采集设备11采集发言文本，用户终端10和服务器20位于无线网络或有线网络中，用户终端10和服务器20进行数据交互。服务器20可以是单独的服务器，也可以是服务器集群，可以是本地服务器，也可以是云端服务器。
23.在一些实施例中，服务器20具有信息处理能力。例如，将用于信息处理的算法或者人工智能模型部署在服务器20内。服务器20通过交互接口接收来自用户终端10发送的待识别的信息或者信息识别请求，再通过服务器20的存储数据的存储器以及数据处理的处理器进行机器学习、深度学习、搜索、推理、决策等方式的信息处理，得到信息识别结果，将信息识别结果发送至显示器30。其中，服务器20的存储器可以是一个统称，包括本地存储以及存储历史数据的数据服务器，数据服务器可以部署在服务器20上，也可以在其它网络服务器上。
24.其中，服务器20可以是服务器集群，即服务器20可以包括多个服务器，在文本处理的过程中，每个服务器所负责的功能不同。例如，服务器20可以包括数据处理服务器、运算服务器和存储服务器，数据处理服务器用于与用户终端交互，获取用户终端发送的待处理的信息，将该待处理文本发送至运算服务器，运算服务器对待处理文本处理，例如，信息分类、语义识别或实体内容识别等，得到识别结果，并将识别结果发送至数据处理服务器，数据处理服务器根据该识别结果确定显示策略，并根据该显示策略由存储服务器内获取该显示策略对应的显示内容，将该显示内容发送至显示器30。需要说明的是，上述存储服务器可以不必使用，而数据处理服务器可以直接将识别结果发送至显示器30。
25.为了克服上述缺陷，本技术实施例提供了一种基于主题生成模型的会议纪要生成方法，如图2所示，该方法包括：s100至s500，该方法的执行主体可以是上述服务器。作为一种实施方式，以该方法的执行主体是服务器为例，对本技术实施例的方法描述。
26.s100：获取待处理的发言文本。
27.其中，待处理发言文本，可以是单个或者是多个。
28.作为一种实施方式，当在会议当中只有一个人发言时，所获得的发言文本为单个。当应用场景为多人发言时，可以依据事先计算机处理器中建立的文本模型，获得与每个发言人对应的发言文本，并对所有发言文本汇总为待处理发言文本，此时对应的即为多个发言文本。
29.在建立文本模型过程中，首先基于设置模式下进行。首先设置如“下一位”、“请某某发言”等关键词，当发言文本出现上述关键词的至少一种，则保存当前文本并且建立新的发言文本。
30.还可以通过设定停顿时间阈值，来实现多个文本的建立。具体如下：首先基于设置模式，设定停顿时间阈值，可以设定停顿时间阈值为十五秒。当发言人停顿时间超过十五秒后，则保存当前文本并且建立新的发言文本。
31.作为一种实施方式，首先从发言文本中提取的i-vector特征，i-vector特征是指基于通用背景模型(universal background model，简称ubm)，从高斯混合模型(gaussianmixture model，gmm)均值超矢量中提取的一个紧凑的特征矢量，i-vector特征包含了发言文本中的声道，话筒，说话方式，语音等特征，可以全面地体现发言文本特征，采用该i-vector特征进行聚类得到的结果更为准确，能够提高聚类结果的准确性。
32.在建模前：设在一个会议发言过程中，发言人的总数有s个。将发言文本段提取的i-vector表示为φ＝{φ1,...,φm}。对于每一个发言文本m＝1，
…
，m，定义一个维度为s*1的指示向量im，如果发言人s在发言文本m中说话了，则im中的元素ims＝1，如果发言人s在发言文本m中没说话，im中的元素ims＝0。令i＝{i1,...,im}为一个给出的关于发言文本的指示向量集合。假设事件为发言人s在一个片段中说话，则给该时间赋上一个先验概率对于每个发言人s的样本ys∈n(y；μ,λ-1)，即每个发言人s的样本服从均值为μ，协方差为λ-1的正态分布，对于每一个发言文本，服从于多项式分布mult(π)的样本im，其中π＝(π1,...,πs)。
33.有了上述建模的前提条件，特征表达模型的表达式为：其中，φm表示第m个发言文本提取的i-vector特征，y表示发言文本中的与发言人关联向量，为了和上述ys中的s做区分，令k为使imk＝1的索引，im表示与发言文本相关的指示向量，表示第m
个发言文本的发言人无关向量∈服从均值为0，协方差为l-1的高斯分布。双协方差概率线性判别分析模型中的双协方差即分别来自yk和∈m。可以理解为，建模的过程即计算每一个发言文本在双协方差概率线性判别分析模型中的特征表示。通过建立每一个发言文本的特征表达模型，可以利用该特征表达模型确定相同发言人的发言文本。可以理解为，将获得的文本划分为多个发言文本。
34.通过上述模型处理后，待处理发言文本可以是文本信息所包含的所有文本单元中或者是其中的部分文本单元。
35.在一些实施例中，文本信息中所包含的文本单元的数量，可以是大于或等于1的自然数。
36.可选地，如图3所示，图3为本技术实施例提供的获取待处理的发言文本s100的方框示意图。
37.s110：通过采集音频设备获得发言语音文本。
38.s120：识别用户的所述发言语音文本获取初始的发言文本。
39.s130：对所述初始的发言文本预处理，得到待处理的发言文本，所述预处理包括去除无意义的符号空格、去除分词以及去除停顿用词的至少一种。
40.作为一种实施方式，待处理发言语言文本是指采集音频设备11在会议上录取到的语音信息。其中，会议可以是参会人员在现场参与的现场会议，也可以是参会人员通过网络在线上参与的线上会议，当然，也可以是参会人员在现场参与的借助网络建立的线上会议，在此不对会议的举办形式进行限定。
41.示例性地，通过用户终端10中的采集音频设备11采集发言语音文本，采集音频设备可以是麦克风，耳机的至少一种。所采集到的发言文本为初始音频数据。将该初始音频数据通过用户终端10和服务器20的数据交互通道传输至计算机处理器中。具体的，用户终端10将初始音频数据发送到服务器20，服务器再发送到计算机处理器。通过计算处理器中事先储存好的音频处理程序对初始音频数据进行识别处理，获得初始的发言文本。该计算机处理器可以是服务器内的处理器，则本方法的执行主体可以是服务器。
42.可选地，对所述初始的发言文本预处理，得到待处理的发言文本，所述预处理包括去除无意义的冗余内容，该冗余内容为对发言文本对应的语义不会造成影响，即该冗余内容不用于确定发言文本对应的语义。作为一种实施方式，该冗余内容可以包括符号空格、分词和停顿用词的至少一种。则预处理可以包括去除符号空格、去除分词以及去除停顿用词的至少一种。
43.示例性地，通过事先在计算机处理器中建立的文本处理模块，去除无意义的符号空格、去除分词以及去除停顿用词。
44.在建立文本处理模块过程中，首先基于设置模式下进行，具体地，基于计算机的输入法将输入法中的“逗号(，)、问号(？)、省略号(
······
)”等所有符号存储于文本处理程序中的存储单元，建立符号空格表。将“列如、假如、或者、的、得、地”等分词存储于文本处理程序中的存储单元，建立分词表。特别是“的、得、地”一般出现的次数比较多，但是对会议纪要没有太大的影响，所以在该处理环节即可去除，以便于后续的进程可以快速进行。将“歇会儿、等一下、一会儿”等表示停顿的词语存储于文本处理程序中的存储单元，建立停顿用词表。
45.作为一种实施方式，将初始的发言文本的输入至建立好的文本处理模块，对文本进行预处理，将出现设置好的符号空格、分词以及停顿用词去除，获得待处理的发言文本。具体地，基于上述的分词表，由初始的发言文本中查找与分词表内的分词匹配的第一内容，将该第一内容从初始的发言文本删除，从而能够去除初始的发言文本中的分词。另外，还可以基于上述的停顿用词表，由初始的发言文本中查找与停顿用词表内的停顿用词匹配的第二内容，将该第二内容从初始的发言文本删除，从而能够去除初始的发言文本中的停顿用词。
46.符号空格、分词以及停顿用词相比较于关键词而言，对会议纪要没有太大的影响，并且最终是获得会议纪要一般也不会出现符号空格、分词以及停顿用词，在这一步剔除上述类型词语可以使得后续进程更加简单快捷。
47.s200：将所述发言文本划分为多个字节片段。
48.发言文本包括多个字节。字节是计算机数据存储的单位，一个字节由8位组成，位是最小的存储单位，每一个位存储一个1位的二进制码。该多个字节对应的是各个发言人的发言信息，该多个字节可以被划分为多个字节片段。
49.作为一种实施方式，可以通过n元模型将所述发言文本划分为多个字节片段，首先建立一个n元模型，所述n元模型，包括n个文本框，所述文本框包括语意处理程序。所述n个文本框，用于存储不同发言人的发言文本。通过函数映射关系建立文本框与发言人一一对应的关系。
50.可选地，通过n元模型将所述发言文本按照字节进行大小为n的滑动窗口操作，得到长度为n的多个字节片段。
51.示例性地，将发言文本输入n元模型中，通过执行滑动窗口操作，将发言文本进行划分，获得长度为n的多个字节片段。
52.可选地，从多个所述字节片段序列中，查找出现频率大于预设阈值的字节片段，以得到多个关键字节片段。
53.示例性地，在设定模式下建立统计函数模型，以及查找函数模型，并将该统计函数模型以及查找函数模型存储于计算机处理器中。统计函数模型用于统计各个字节片段出现的频率。该出现频率可以是各个字节出现的次数，也可以是各个字节占总的字节片段的占比，在这里不做进一步的限定。
54.在设定模式下，设定频率阈值，频率阈值大小为五次。该频率阈值用于衡量字节片段的重要性。查找函数模型用于查找频率大于频率阈值的字节片段，将频率大于频率阈值的字节片段提取出来并命名为关键字节片段。
55.作为一种实施方式，将所有字节片段输入到计算机处理器中的统计函数模型中，基于统计函数获得字节片段频率统计表。通过查找函数对字节片段频率统计表进行查找处理，筛选出现频率大于预设频率阈值五次的字节片段提取出来，将提取出的字节片段命名为关键字节片段。
56.作为另一种实施方式，在得到待处理的发言文本后，通过n元模型中的语意处理程序对所述发言文本按照字节进行大小为n的滑动窗口处理，获得长度为n的多个字节片段，然后将划分后的多个所述字节片段序列。
57.作为另一种实施方式，还可以是，每个目标终端发送音频的时间间隔可能不同，比
如用户终端10每隔二百毫秒向服务端发送一次音频流，或是等间隔发送或是不等间隔发送，在此不做具体限定。同样，其他的终端设备类似，每一间隔时间发送一次音频流。服务端通过接收目标终端发送的音频流，获取音频流的字节长度。比如，二百个字节长度。
58.在一些实施例中，获取发言文本字节的停顿点，具体地，基于贝叶斯信息准则和似然比，检测发言文本的停顿点，其中，贝叶斯信息准则(bayesian information criterion，简称bic)是在不完全情报下，对部分未知的状态用主观概率估计，然后用贝叶斯公式对发生概率进行修正，最后再利用期望值和修正概率做出最优决策。似然比(likelihood ratio，简称lr)是反映真实性的一种指标。
59.基于贝叶斯信息准则和似然比可以对发言文本字节的特征点进行比较，基于贝叶斯信息准则计算发言文本字节的特征点之间的似然比，从而判断特征点是否为发言人停顿点。
60.在得到发言人停顿点后，根据发言人停顿点切割发言文本字节，得到多个字节片段，其中，一个发言人对应一个或多个字节片段。也可以是多个发言人对应一个或多个字节片段。
61.s300：获取每个所述字节片段在所述发言文本内的出现频率。
62.示例性地，将所有字节片段输入到计算机处理器中的统计函数模型中，通过统计函数统计各个字节片段在所述发言文本内的出现频率，该出现频率可以是各个字节出现的次数，也可以是各个字节占总的字节片段的占比，在这里不做进一步的限定。
63.s400：基于多个所述字节片段序列的出现频率得到多个关键字节片段。
64.示例性地，出现频率是衡量字节片段的重要性，将满足条件的字节片段提取出来，作为关键字节片段。满足的条件可以是出现频率满足设定的频率阈值五次，也可以是将所有字节进行排序，将出现次数排名前十的关键字节片段提取出来。
65.作为一种实施方式，将各个字节片段序列出现的频率输入到计算机处理器的统计函数模型以及查找函数模型中，通过统计函数模型统计各个字节片段出现的频率，获得字节片段统计表。基于查找函数模型对字节片段统计表进行查找处理，筛选出频率大于频率阈值五次的字节片段。
66.作为另一种实施方式，将各个字节片段序列出现的频率输入到计算机处理器的统计函数模型以及查找函数模型中，通过统计函数模型统计各个字节片段出现的频率，获得字节片段统计表，并且通过排序函数对所有字节出现的频率值大小进行从大到小的排序，可以理解为对所有字节片段出现的次数进行由大到小的排序。然后通过查找函数查找出现次数排名前十的字节片段。
67.s500：基于多个所述关键字节片段获取所述发言文本对应的会议纪要。
68.示例性地，关键字节片段是由位构成的，位是最小的存储单位，每一个位中包含相应的二进制数据。将每个发言人的发言内容以及声道，话筒，说话方式等信息转化为二进制数据存储于位中。可以理解为，每一个字节片段都对应相应的文字，或者是词语，文字与字节片段是一一对应的关系。在获得关键字节片段后通过计算机译码器，将关键字节信息翻译为文字，该文字即是会议纪要。
69.例如：
70.王总经理：今天会议主要讨论年终假期旅游去哪里玩。大家有什么想法都可以尽
情的发言。今年的效益比较好，作为奖励，这次的旅游经费不受限制。旅游可以使得大家放松心情，释放一下工作压力，当然大家也可以带上家人一起去旅游。
71.李总监：我们可以开车去九寨沟旅游。九寨沟离我们也比较进空气也比较好。目前，九寨沟景区仅保留了树正寨、荷叶寨、则查洼寨这三个村寨，善良淳朴的他们，用微笑迎接着前来九寨沟的每一个人。而在这些村寨中，最壮观的莫过于树正寨前的“九宝莲花菩提塔”，七彩经幡随风飘荡，圣洁的白塔在阳光下仿若闪着光。九寨沟是大自然鬼斧神工之杰作。这里四周雪峰高耸，湖水清澈艳丽，飞瀑多姿多彩，急流汹涌澎湃，林木青葱婆娑。蓝蓝的天空，明媚的阳光，清新的空气和点缀其间的古老村寨、栈桥、磨坊，组成了一幅内涵丰富、和谐统一的优美画卷。
72.张某：我们也可以开车去西岭雪山。西岭雪山离我们更近一点。区内有茫茫的原始林海，险峻的悬崖绝壁，数不尽的奇花异草，罕见的珍禽异兽，终年不断的激流飞瀑，云海、日出、森林佛光、阴阳界、日照金山等变化莫测的高山气象景观，是中国级风景名胜区。
73.王总经理：那我们投票决定去哪里旅游吧。经过投票，我们决定开车去九寨沟旅游。
74.陈某:那么我们还是开车去九寨沟旅游，但是那边的路况比较复杂。所以大家开车要小心一点，注意安全。
75.将上述发言文本，输入至计算机处理器中，通过计算机处理器将发言文本划分为多个字节片段。通过处理可以得出“我们、开车、去、九寨沟、旅游”对应的字节片段满足频率阈值。将该字节片段提取出来，翻译为对应的词组，将词组通过语义排序得到“我们开车去九寨沟旅游”这一会议纪要。
76.可选地，如图4所示，图4为本技术实施例提供的基于多个所述关键字节片段获取所述发言文本对应的会议纪要s500的方框示意图。
77.s510：将多个所述关键字节片段输入预先建立的神经主题模型，得到多个主题，以及每个所述主题对应的关键字节片段，所述神经主题模型预先基于被标记有主题标签的文本样本训练得到。
78.示例性地，神经主题模型可以是三层贝叶斯概率模型，即认为每个文档的每个词都是通过“以一定概率选择某个主题，并从这个主题中以一定概率选择某个词汇”，所以包括两个分布：文档-主题分布，主题-词汇分布。
79.s520：基于每个所述主题以及每个所述主题对应的关键字节片段，得到所述发言文本对应的会议纪要。
80.示例性地，会议纪要包含了会议的讨论主题。每一个主题都对应相应的文字，或者是词语，每个关键字节片段与文字是一一对应的关系。每个主题通过语义整理即可获得组成相应的句子。在获得每个主题以及每个主题对应关键字节片段后通过计算机译码器，将关键字节信息翻译为文字，将文字进行语义整理排序，排序后的文字可以成为一段语句，该语句即是会议纪要。
81.可选地，所述神经主题模型为多层次神经主题模型，所述主题包括m级主题，所述m为大于或等于1的整数，所述将多个所述关键字节片段输入预先建立的神经主题模型，得到多个主题，以及每个所述主题对应的关键字节片段，包括：
82.s530：将多个所述关键字节片段输入所述多层次神经主题模型，得到每一级主题，
以及最后一级主题对应的关键字节片段。
83.示例性地，首先建立多层次神经主题模型，该多层次主题模型由m级主题构成，m大于或等于一，且m为整数。该m级主题又分为多个层次主题，将第一层次命名为一级主题，一级主题由k个主题构成，k大于或等于一，且k为整数。
84.一级主题用于记录发言人各自的发言主题，可以是，每个人的发言文本对应一个一级主题。然后通过对被标记有主题标签的文本样本训练得到一级主题模型。该一级主题又包括多个第二层次，将第二层次命名为二级主题。二级主题与一级主题是从属关系，可以理解为二级主题属于一级主题。同理，当有需要对二级主题进一步划分时，可以在二级主题进一步划分为多个三级主题构成。以此原理可以建立多个层次模型。
85.二级主题由n个二级关键字节片段构成。，将通过计算机处理器中存储的统计函数统计出的关键字节片段的权重也存储于二级主题中。权重是关键字节片段出现的次数，用于衡量关键词片段的重要性。
86.将发言人各自的多个所述关键字节片段文本，输入预先建立的神经主题模型，通过提取处理得到多个一级主题，以及每个所述主题对应的关键字节片段序列。将一级主题进行进一步的划分获得二级主题。
87.基于对每个一级主题以及每个一级主题对应的关键字节片段的语意，得到一级主题的会议纪要。
88.基于对每个二级主题以及每个二级主题对应的关键字节片段的语意，得到二级主题的会议纪要。
89.例如：
90.王总经理：今天会议主要讨论采购食物。大家根据最近的市场分析一下，买什么食物，然后将食物囤积起来到冬季的时候售出，可以获得较大的利润。
91.李总监：土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯这些食物最近的价格比较低。而且保存的时间也比较长，保存技术也不难，成本也不高。我建议可以考虑保存土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯。
92.张某：土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯这些食物虽然易保存，但是利润空间不是很大，所以我不建议保存。
93.王总经理：那我们投票决定采购什么食物吧。经过投票，我们决定采购土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯等食物。
94.陈某:那我们分头进行，购买土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯等食物。
95.将上述发言文本，输入至计算机处理器中，通过计算机处理器将发言文本划分为多个字节片段。通过处理可以得出“食物”对应的字节片段满足频率阈值。将该字节片段提取出来，翻译为对应的词组，该词组“食物”为一级主题会议纪要。同时，通过处理还可以得出“土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯”对应的字节片段满足二级主题频率阈值。将该字节片段提取出来，翻译为对应的词组，该词组“土豆、芋头、胡萝卜、白萝卜、藕、山药、红薯”为二级主题会议纪要。
96.可选地，所述基于每个所述主题以及每个所述主题对应的关键字节片段，得到所述发言文本对应的会议纪要，包括：
97.s540：统计每个所述主题中所包含的所述关键字节片段出现的频率，获得所述关
键词片段的权重。
98.示例性地，将多个一级主题，以及每个所述主题对应的关键字节片段序列输入预先建立的神经主题模型，通过对模型的运行处理，得到各个一级主题的多个二级主题。
99.统计每个一级主题中的各个二级主题中所包含的所述关键字节片段出现的频率，通过统计函数处理，获得所述关键词片段的权重。
100.s550：基于每个所述主题、每个所述主题对应的关键字节片段以及所述关键词片段的权重，获得会议纪要。
101.示例性地，基于每个一级主题、每个二级主题以及每个二级主题的n元词组的权重，获得会议纪要。
102.基于每个一级主题一级、每个二级主题以及每个二级主题的n元词组的权重，获得会议纪要。可以理解为每个一级主题是本次会议的关键词，也就是本次会议讨论的主题。每个二级主题中的n元词组是用于解释关键词的意思。每个二级主题中的n元词组包含多个分词。作为一种实施方式，将发言文本分词，得到多个词组，其中，每次词组为一个字节。由多个词组中确定一个词组作为目标词组，基于该目标词组选择与该目标词组连续n-1个词组，将该目标词组与该n-1个词组组成一个n元词组，该n元词组与目标词组对应，且该n元词组为前述的长度为n的字节片段。然后，基于前述方式确定每个词组对应的n元词组。作为一种实施方式，前述的一个字节为一个词组。
103.作为一种实施方式，通过n元模型将所述发言文本按照字节进行大小为n的滑动窗口操作，得到长度为n的多个字节片段的实施方式可以是，由多个词组中确定一个词组作为目标词组，基于大小为n的滑动窗口选择连续的n个词组作为目标词组对应的n元词组，其中，n个连续词组包括目标词组。
104.然后，由多个词组中确定新的目标词组，并返回执行获取新的目标词组对应的n元词组的操作，直至确定每个词组对应的n元词组。
105.作为一种实施方式，该n元词组包括目标词组和该目标词组之后连续的n-1个词组，例如，文本内容为“我决定今天中午吃牛肉面”，则多个词组为“我”“决定”“今天”“中午”“吃”“牛肉”“面”，假设n为2，则n元词组分别为“我决定今天”“决定今天中午”“今天中午吃”“中午吃牛肉”“吃牛肉面”。示例性地，多个词组构成词组序列，该词组序列内的多个词组的排序与各个词组在发言文本内的排序相同。则基于该目标词组选择与该目标词组连续n-1个词组包括，基于该目标词组选择该目标词组之后的连续n-1个词组，将该目标词组以及该目标词组之后的连续n-1个词组作为该目标词组对应的n元词组。由多个词组中确定新的目标词组的实施方式为，基于该词组序列，将目标词组之后的相邻的词组作为新的目标词组。
106.然后，获取每个n元词组在所有的n元词组中的出现频率，查找出现频率大于预设阈值的n元词组，作为关键字节片段。
107.将所有的关键字节片段按照语句的词语构成规律，构成完整的语句，以得到会议纪要，其中，词语构成规律可以包括主语、谓语、宾语、状语等不同类型的词组在语句中的排布规则。
108.例如：
109.王总经理：今天会议主要讨论采购水果。看看公司员工都喜欢吃什么水鬼，然后让采购部去购买。
110.李总监：我觉得葡萄、苹果、梨、桃子、李子、杏、草莓这些水果比较好吃。可以考虑买葡萄、苹果、梨、桃子、李子、杏、草莓。
111.张某：葡萄、苹果、梨、桃子、李子、杏、草莓这些水果相对来说价格也不是很高，也比较好吃，所以我也建议买这些水果。
112.张某：刚好我认识一个卖水果的，他那边葡萄、苹果、梨、桃子、李子、杏、草莓这些水果比较新鲜，也是有机水果。
113.王总经理：那就买葡萄、苹果、梨、桃子、李子、杏、草莓这些水果。
114.陈某:那我们分头进行，购买葡萄、苹果、梨、桃子、李子、杏、草莓这些水果。
115.将上述发言文本，输入至计算机处理器中，通过计算机处理器将发言文本划分为多个字节片段。通过处理可以得出“水果”对应的字节片段满足一级主题对应的频率阈值。将该字节片段提取出来，翻译为对应的词组，该词组“食物”为一级主题会议纪要。
116.同时通过处理可以得出“买、葡萄、苹果、梨、桃子、李子、杏、草莓、这些水果”对应的字节片段满足二级主题频率阈值。将该字节片段提取出来，翻译为对应的词组。该词组即是每个二级主题中的一元词组模型。那么就先分词，然后从第一个词组开始，连续取一个词，然后从第二个词组开始再取一个，这样往后得到这篇文本所有可能的一元词语。
117.所提取的词依次为“买、葡萄、苹果、梨、桃子、李子、杏、草莓、这些水果”。将所有提取出来的词组通过词性处理。其中，“买”是动词，“葡萄、苹果、梨、桃子、李子、杏、草莓、”是名词，“这些水果”是概括统称置于句末。进行排序，即可组成完整的语句。排列后获得的语句为：“买葡萄、苹果、梨、桃子、李子、杏、草莓这些水果”。该句子则是此次会议纪要的内容。
118.请参考图5，其示出了本技术实施例提供的基于主题生成模型的会议纪要生成装置600的结构框图。该装置600包括：采集单元610、划分单元620、统计单元630、获取单元640和确定单元650。
119.采集单元610，用于获取待处理的发言文本。
120.进一步，采集单元610还用于识别用户的所述发言语音文本获取初始的发言文本；对所述初始的发言文本预处理，得到待处理的发言文本，所述预处理包括去除无意义的符号空格、去除分词以及去除停顿用词的至少一种。
121.划分单元620，用于将所述发言文本划分为多个字节片段。
122.进一步，划分单元620还用于通过n元模型将所述发言文本按照字节进行大小为n的滑动窗口操作，得到长度为n的多个字节片段。
123.进一步，划分单元620还用于将所述发言文本分词，得到多个词组；由多个词组中确定一个词组作为目标词组，基于该目标词组选择与该目标词组连续的n-1个词组，n为大于1的正整数；将所述目标词组与所述n-1个词组组成一个n元词组，所述n元词组与所述目标词组对应，所述n元词组为所述字节片段；由多个词组中确定新的目标词组，并返回执行获取新的目标词组对应的n元词组的操作，直至确定每个词组对应的n元词组。
124.进一步，多个词组构成词组序列，该词组序列内的多个词组的排序与各个词组在发言文本内的排序相同，划分单元620还用于基于所述词组序列，选择该目标词组之后的连续n-1个词组，作为与该目标词组连续的n-1个词组。
125.统计单元630，用于统计获取每个所述字节片段在所述发言文本内的出现频率。
126.进一步，统计单元630还用于从多个所述字节片段序列中，查找出现频率大于预设
阈值的字节片段，以得到多个关键字节片段。
127.获取单元640，用于基于多个所述字节片段序列的出现频率得到多个关键字节片段输出基于多个所述字节片段序列的出现频率得到的多个关键字节片段。
128.进一步，获取单元640还用于从多个所述字节片段序列中，查找出现频率大于预设阈值的字节片段，以得到多个关键字节片段。
129.确定单元650，用于基于多个所述关键字节片段获取所述发言文本对应的会议纪要显示基于多个所述关键字节片段获取所述发言文本对应的会议纪要。
130.进一步，确定单元650还用于将多个所述关键字节片段输入预先建立的神经主题模型，得到多个主题，以及每个所述主题对应的关键字节片段，所述神经主题模型预先基于被标记有主题标签的文本样本训练得到。
131.进一步，确定单元650还用于基于每个所述主题以及每个所述主题对应的关键字节片段，得到所述发言文本对应的会议纪要。
132.进一步，确定单元650还用于将多个所述关键字节片段输入所述多层次神经主题模型，得到每一级主题，以后最后一级主题对应的关键字节片段。
133.进一步，确定单元650还用于统计每个所述主题中所包含的所述关键字节片段出现的频率，获得所述关键词片段的权重。
134.进一步，确定单元650还用于基于每个所述主题、每个所述主题对应的关键字节片段以及所述关键词片段的权重，获得会议纪要。
135.进一步，确定单元650还用于将所有的关键字节片段按照语句的词语构成规律，构成完整的语句，以得到会议纪要。
136.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
137.在本技术所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。
138.另外，在本技术各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。
139.请参考图6，其示出了本技术实施例提供的一种电子设备的结构框图。该电子设备可以是智能手机、平板电脑、电子书、计算机等能够运行应用程序的电子设备。作为一种实施方式，本技术中的电子设备700可以是上述的服务器，则该电子设备可以执行上述图2至图4的方法实施例。
140.本技术中的电子设备700可以包括一个或多个如下部件：处理器710、存储器720、以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器720中并被配置为由一个或多个处理器710执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。
141.处理器710可以包括一个或者多个处理核。处理器710利用各种接口和线路连接整个电子设备700内的各个部分，通过运行或执行存储在存储器720内的指令、程序、代码集或指令集，以及调用存储在存储器720内的数据，执行电子设备700的各种功能和处理数据。可选地，处理器710可以采用数字信号处理(digital signal processing，dsp)、现场可编程
门阵列(field－programmable gate array，fpga)、可编程逻辑阵列(programmable logic array，pla)中的至少一种硬件形式来实现。处理器110可集成中央处理器(central processing unit，cpu)、图像处理器(graphics processing unit，gpu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户界面和应用程序等；gpu用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器710中，单独通过一块通信芯片进行实现。
142.存储器720可以包括随机存储器(random access memory，ram)，也可以包括只读存储器(read-only memory)。存储器720可用于存储指令、程序、代码、代码集或指令集。存储器720可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
143.请参考图7，其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，程序代码可被处理器调用执行上述方法实施例中所描述的方法。
144.计算机可读存储介质810可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地，计算机可读存储介质810包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质810具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
145.请参考图8，其示出了本技术实施例提供的一种计算机程序产品900，包括计算机程序/指令910，其特征在于，该计算机程序/指令被处理器执行时实现上述方法。
146.最后应说明的是：以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：测试用例的验证方法、装置、电子设备和存储介质与流程

一种基于主题生成模型的会议纪要生成方法与流程

相关文献

最热文献