一种直播互动摘要生成方法和装置与流程

2022-04-25 02:19:54 来源：中国专利 TAG：

1.本发明涉及网络直播技术领域，特别是涉及一种直播互动摘要生成方法和一种直播互动摘要生成装置。

背景技术：

2.在一些线上直播场景中，观众可以发送弹幕，主播可以对观众的弹幕进行语音回复。
3.对于观看直播的观众来说，有可能因为发送弹幕后离开了直播间、或者网络波动等客观原因，没能观看或收听主播之后的直播语音内容，可能会错过主播对弹幕内容的回复，而重新翻看直播回看则一般要等到主播下播后发出直播回看才能够从回看中查看，不够便利。

技术实现要素：

4.鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种直播互动摘要生成方法和相应的一种直播互动摘要生成装置。
5.为了解决上述问题，本发明实施例公开了一种直播互动摘要生成方法，应用于主播端，所述方法包括：
6.获取由观众端发送的待回复弹幕；所述主播端与所述观众端与同一虚拟直播间连接；
7.针对采集的语音信息进行语音识别，生成语音识别信息；
8.基于与所述待回复弹幕匹配的语音识别信息生成直播摘要；
9.将所述直播摘要发送至所述观众端。
10.可选地，所述获取由观众端发送的待回复弹幕的步骤，包括：
11.获取由观众端输出的已发送弹幕；
12.按照预设过滤规则，对所述已发送弹幕进行过滤，得到待回复弹幕。
13.可选地，所述针对采集的语音信息进行语音识别，生成语音识别信息的步骤包括：
14.获取所述主播端采集的语音信息；
15.对所述语音信息进行自动语音识别，生成语音识别信息。
16.可选地，所述方法还包括：
17.调用预设词向量模型，生成与所述语音识别信息匹配的第一词向量；
18.调用所述词向量模型，生成与所述待回复弹幕匹配的第二词向量；
19.计算所述第二词向量与所述第一词向量的相似度；
20.在所述相似度不小于预设阈值时，确定所述第二词向量对应的待回复弹幕与所述第一词向量对应的语音识别信息匹配。
21.可选地，所述基于与所述待回复弹幕匹配的语音识别信息生成直播摘要的步骤包括：
22.确定所述语音识别信息的生成时间；
23.按照所述生成时间对与待回复弹幕匹配的语音识别信息进行排序；
24.基于排序后的与所述待回复弹幕匹配的语音信息生成直播摘要。
25.可选地，在所述生成语音识别信息之后，所述方法还包括：
26.展示针对所述语音识别信息的第一交互控件；
27.响应于针对所述第一交互控件的操作，确定针对所述语音识别信息的第一准确性反馈信息；
28.按照所述第一准确性反馈信息调整所述语音识别信息。
29.可选地，所述观众端用于在展示所述直播摘要时，展示第二交互控件；所述观众端还用于响应于针对所述第二交互控件的操作，确定针对所述直播摘要的第二准确性反馈信息；所述方法还包括：
30.接收所述第二准确性反馈信息；
31.按照所述第一准确性反馈信息，确定所述语音识别信息中的第一错误样本；
32.按照所述第二准确性反馈信息，确定所述直播摘要中的第二错误样本；
33.基于所述第一错误样本和所述第二错误样本构建第一文本特征模型；所述第一文本特征模型用于纠偏所述直播摘要。
34.可选地，所述方法还包括：
35.按照所述第一准确性反馈信息，确定所述语音识别信息中的第一正确样本；
36.按照所述第二准确性反馈信息，确定所述直播摘要中的第二正确样本；
37.基于所述第一正确样本和所述第二正确样本构建第二文本特征模型；所述第二文本特征模型用于计算所述相似度。
38.本发明实施例还公开了一种直播互动摘要生成方法，应用于主播端，所述装置包括：
39.待回复弹幕获取模块，用于获取由观众端发送的待回复弹幕；所述主播端与所述观众端与同一虚拟直播间连接；
40.语音识别信息生成模块，用于针对采集的语音信息进行语音识别，生成语音识别信息；
41.直播摘要生成模块，用于基于与所述待回复弹幕匹配的语音识别信息生成直播摘要；
42.直播摘要发送模块，用于将所述直播摘要发送至所述观众端。
43.本发明实施例还公开了一种电子设备，包括：处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的直播互动摘要生成方法的步骤。
44.本发明实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上所述的直播互动摘要生成方法的步骤。
45.本发明实施例包括以下优点：
46.通过对观众端针对虚拟直播间发送的弹幕进行筛选，筛选出需要主播用户回复的待回复弹幕，在采集到主播用户对应的语音信息时，对语音信息进行语音识别，得到对应的
语音识别信息，将基于与待回复弹幕匹配的语音识别信息生成直播摘要，并将直播摘要发送至观众端，使得提供一种新的交互方式，观众用户与主播用户不限于实时交互，例如实时问答。可以在观众用户发送弹幕后，向其反馈包含主播用户针对该弹幕进行回复得到的文本形式的直播摘要，观众用户可以后续回顾主播用户对其弹幕的回复，提升了观众用户在虚报直播间的受关注感受，提升了观众用户观看直播的体验。
附图说明
47.图1是本发明的一种直播互动摘要生成方法实施例的步骤流程图；
48.图2是本发明的一种直播互动方法示例流程图；
49.图3是本发明的一种直播互动摘要生成装置实施例的结构框图。
具体实施方式
50.为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
51.参照图1，示出了本发明的一种直播互动摘要生成方法实施例的步骤流程图，本发明实施例可以应用于主播端。在直播场景中，通常有至少一个主播用户，主播用户通过指定程序(例如：应用程序或者小程序)在预先创建的虚拟直播间中进行直播，主播端为主播用户所使用的程序。主播端可以采集多媒体数据(包括：音频、视频中的至少一种)，并通过虚拟直播间展示多媒体数据。与该虚拟直播间连接的观众端可以接收由主播端采集的多媒体数据，以使观众用户可以通过观众端观看虚拟直播间。
52.可以理解的是，主播端也可以展示虚拟直播间并播放其上传的多媒体数据。主播端、观众端与服务器连接，主播端和观众端还可以接收服务器设置的内容，例如：指定虚拟背景等。
53.本发明实施例具体可以包括如下步骤：
54.步骤101，获取由观众端发送的待回复弹幕；所述主播端与所述观众端与同一虚拟直播间连接；
55.在直播场景中，观众用户可以通过在观众端中进行操作，向虚拟直播间发送弹幕，以向主播用户进行提问、咨询等线上沟通。主播端可以获取到与其连接于同一虚拟直播间的观众端发送的弹幕，主播用户可以通过主播端观看到观众端发送的弹幕。
56.弹幕内容可以包括文字、表情、符号中一种或多种，并在虚拟直播间中依次播放各个弹幕。
57.观众端发送的弹幕可能是需要主播用户进行回复的内容，例如：对某事务的提问等，也可能是无需主播用户进行回复的内容，例如：弹幕仅包含表情和/或符号。可以按照弹幕内容进行筛选，筛选出需要主播用户进行回复的弹幕为待回复弹幕。
58.步骤102，针对采集的语音信息进行语音识别，生成语音识别信息；
59.主播用户可以在观看到观众端发送的弹幕后，进行语音回复。主播端能够接收主播用户的语音内容得到语音信息，并对语音信息进行语音识别(也可以称为语义识别)，得到与该语音信息相匹配的语音识别信息，语音识别信息为文本信息，从而将主播用户说出的语音内容转化为文本内容。
60.步骤103，基于与所述待回复弹幕匹配的语音识别信息生成直播摘要；
61.由于主播用户在直播过程中，不一定只是针对弹幕进行回复，即可能存在得到的语音识别信息并不与待回复弹幕相匹配。
62.通过对待回复弹幕与得到的语音识别信息进行匹配，确定出主播用户针对待回复弹幕进行回答时得到的语音识别信息，即与待回复弹幕相匹配的语音识别信息。
63.并基于一个或多个与待回复弹幕匹配的语音识别信息，生成直播摘要。例如：将某个时间区间或者是整个直播过程中的与待回复弹幕匹配的语音识别信息作为直播摘要。
64.步骤104，将所述直播摘要发送至所述观众端。
65.将直播摘要发送至观众端，观众端用于展示直播摘要。观众可以通过查看直播摘要，回顾主播用户针对待回复弹幕进行回复的内容的文本，使得观众用户在虚拟直播间发送弹幕后离开，未能看到主播用户对弹幕的回复问题时，能够通过直播摘要查看主播用户对其弹幕的回复。
66.在本发明实施例中，通过对观众端针对虚拟直播间发送的弹幕进行筛选，筛选出需要主播用户回复的待回复弹幕，在采集到主播用户对应的语音信息时，对语音信息进行语音识别，得到对应的语音识别信息，将基于与待回复弹幕匹配的语音识别信息生成直播摘要，并将直播摘要发送至观众端，使得提供一种新的交互方式，观众用户与主播用户不限于实时交互，例如实时问答。可以在观众用户发送弹幕后，向其反馈包含主播用户针对该弹幕进行回复得到的文本形式的直播摘要，观众用户可以后续回顾主播用户对其弹幕的回复，提升了观众用户在虚报直播间的受关注感受，提升了观众用户观看直播的体验。
67.进一步的，目前的直播场景中大部分与语音以及文本形式的交互都是由主播用户或观众用户主动发起并回应的，本发明通过上述步骤实现了智能交互方式，增加了主播用户与观众用户的交互方法。
68.在本发明的一种可选实施例中，所述步骤101可以包括：获取由观众端输出的已发送弹幕；按照预设过滤规则，对所述已发送弹幕进行过滤，得到待回复弹幕。
69.将观众端成功针对虚拟直播间发送的弹幕为已发送弹幕，在主播端接收到观众端的已发送弹幕时，采用过滤规则对已发送弹幕进行过滤，筛选掉主播用户无需回复的弹幕(例如：常见感叹词语等没有实际表达内容的弹幕、包含主播端屏蔽的关键词弹幕、表情图像弹幕、单纯的标点符号弹幕)，并将经过筛选的已发送弹幕作为待回复弹幕。
70.可以理解的是，可以针对实际应用中设置不同的过滤规则，本发明实施例对过滤规则的具体内容不作限定。
71.在本发明的一种可选实施例中，所述步骤102可以包括：获取所述主播端采集的语音信息；对所述语音信息进行自动语音识别，生成语音识别信息。
72.主播端可以运行于智能设备中，例如：手机、平板电脑、笔记本电脑、个人计算机等。智能设备通过内置或外置的语音采集器件采集主播用户发出的语音内容，语音采集器件输出主播用户发出的语音内容相匹配的语音信息，语音采集器件可以为麦克风。
73.可以调用已训练的语音识别模型，上述的语音信息进行自然语言处理，包括对语音信息进行自动语音识别(asr，automatic speech recognition)，得到与语音信息的语义匹配的语音识别信息。
74.在本发明的一种可选实施例中，在步骤103之前，可以通过如下步骤判断待回复弹
幕与语音识别信息是否匹配：调用预设词向量模型，生成与所述语音识别信息匹配的第一词向量；调用所述词向量模型，生成与所述待回复弹幕匹配的第二词向量；计算所述第二词向量与所述第一词向量的相似度；在所述相似度不小于预设阈值时，确定所述第二词向量对应的待回复弹幕与所述第一词向量对应的语音识别信息匹配。
75.可以调用预设的已训练的词向量模型(例如：word2vec模型)，语音识别信息进行处理，生成与语音识别信息相匹配的第一词向量。相似的，调用上述词向量模型对待回复弹幕进行处理，生成与待回复弹幕相匹配的第二词向量。计算第二词向量与第一词向量的相似度，该相似度大于或等于预设阈值时，确定第二词向量对应的待回复弹幕与第一词向量对应的语音识别信息相互匹配，基于与该待回复弹幕匹配的语音识别信息生成直播摘要。
76.上述相似度可以为第二词向量与第一词向量的余弦相似度。
77.在实际应用中，在得到第一词向量后，可以确定出目标待回复弹幕，第二词向量与目标待回复弹幕相匹配。由于直播一般是持续性的，主播用户一般是针对其看到的弹幕进行回复，如果计算全部由待回复弹幕得到的第二词向量，可能会使得相似度计算结果造成偏差。例如：主播用户在01：00看到弹幕a时进行了回复，主播端在主播用户回复弹幕a时采集到的语音信息并得到相应的语音识别信息，但是该语音识别信息的词向量与弹幕a的词向量相似度小于与弹幕b的词向量的相似度，但是弹幕b实际是主播端在00：30时向主播用户展示的内容。可以待回复弹幕对于主播用户而言，具有一定的时效性。故可以在计算第二词向量时，先确定出目标待回复弹幕，目标待回复弹幕为得到语音识别信息的时间往前较短预设时间(例如1分钟)内的待回复弹幕，并计算目标待回复弹幕的第二词向量，以此可以减少相似度计算的数据处理量，同时提高匹配语音识别信息与待回复弹幕的准确性。
78.在本发明的一种可选实施例中，所述步骤103可以包括：确定所述语音识别信息的生成时间；按照所述生成时间对与待回复弹幕匹配的语音识别信息进行排序；基于排序后的与所述待回复弹幕匹配的语音信息生成直播摘要。
79.在确定与待回复弹幕匹配的语音识别信息后，确定该语音识别信息的生成时间，并基于生成时间对与待回复弹幕匹配的语音识别信息进行排序，基于排序后的语音信息生成直播摘要。
80.在实际应用中，可以将待回复弹幕与待回复弹幕匹配的语音识别信息以及观众昵称，也保存在直播摘要用，观众用户可以直观查看主播用户回复的内容是对应于哪一弹幕。
81.进一步的，观众端在显示直播摘要时，可以突出显示与其匹配的观众昵称(登录该观众端的账户的昵称)，进一步突出显示与该观众昵称对应的待回复弹幕以及语音识别信息，使得观众用户能够快速在直播摘要中，查看自己在先发送的弹幕，并快速获知主播用户针对该弹幕的回复，提高观众用户查看直播摘要的效率。
82.在本发明的一种可选实施例中，在所述生成语音识别信息之后，所述方法还包括：展示针对所述语音识别信息的第一交互控件；响应于针对所述第一交互控件的操作，确定针对所述语音识别信息的第一准确性反馈信息；按照所述第一准确性反馈信息调整所述语音识别信息。
83.在主播端生成语音识别信息后，可以展示语音识别信息，并在指定区域展示第一交互控件，主播用户可以针对第一交互控件进行操作，以提交针对语音识别信息的第一准确性反馈信息，例如：该语音识别信息正确、该语音识别信息存在错误等。进一步的，主播用
户可以通过第一交互控件反馈语音识别信息出错的内容，并调整该出错的内容使得能够按照第一准确性反馈信息调整并得到正确的语音识别信息。
84.在实际应用中，为简化主播用户的操作，可以在生成语音识别信息后一定时间内未检测到主播用户针对第一交互控件的操作时，确定该语音识别信息正确。
85.在本发明的一种可选实施例中，所述观众端用于在展示所述直播摘要时，展示第二交互控件；所述观众端还用于响应于针对所述第二交互控件的操作，确定针对所述直播摘要的第二准确性反馈信息；所述方法还包括：
86.接收所述第二准确性反馈信息；按照所述第一准确性反馈信息，确定所述语音识别信息中的第一错误样本；按照所述第二准确性反馈信息，确定所述直播摘要中的第二错误样本；基于所述第一错误样本和所述第二错误样本构建第一文本特征模型；所述第一文本特征模型用于纠偏所述直播摘要。
87.可以依据第一准确性反馈信息提取出语音识别信息中存在错误的第一错误样本，以及依据第二准确性反馈信息提取直播摘要中存在错误第二错误样本，以第一错误样本和第二错误样本，以及对应的修正后的直播摘要，构建第一文本特征模型。采用第一文本特征模型能够对直播摘要、语音识别信息进行纠偏，降低直播摘要发生错误的概率。
88.在本发明的一种可选实施例中，所述方法还包括：按照所述第一准确性反馈信息，确定所述语音识别信息中的第一正确样本；按照所述第二准确性反馈信息，确定所述直播摘要中的第二正确样本；基于所述第一正确样本和所述第二正确样本构建第二文本特征模型；所述第二文本特征模型用于计算所述相似度。
89.可以依据第一准确性反馈信息提取出语音识别信息中不存在错误的第一正确样本，以及依据第二准确性反馈信息提取直播摘要中不存在错误第二正确样本，以第一正确样本和第二正确样本构建第二文本特征模型。后续的计算第一词向量与第二词向量的相似度中，可以采用第二文本特征模型进行计算，提高相似度计算的置信度。
90.参照图2，示出了本发明提供的一种直播互动方法示例流程图，包括如下步骤：
91.步骤201、将不需要回复的弹幕内容过滤掉：获取多个观众用户端发送的弹幕内容，过滤掉不需回复的弹幕内容，比如表情图像和单纯的标点符号等。
92.步骤202、将过滤后剩余的弹幕内容建立成弹幕库：利用已过滤得到的弹幕，建立当前直播间独立的弹幕库，并实时进行滚动更新。具体地，主播终端上会对过滤后的弹幕进行滚动显示，这些弹幕都是经过过滤后得到的弹幕，其中不包括单纯的表情图像和标点符号。其中，每条弹幕包括观众昵称(例如“可爱小猪”)和弹幕内容(例如“请问商品产地是哪里”)。
93.此外，针对过滤后剩余的每条弹幕，利用词向量模型word2vec，计算观众昵称的词向量a和弹幕内容的词向量b。
94.步骤203、直播流语音识别，并建立主播语音文本库：基于语音识别技术，对直播间的语音流进行识别，准实时返回识别结果(即识别成的自然语言文字)，并按照语音识别结果的时间顺序，建立主播语音文本库。
95.步骤204、将语音识别结果与弹幕库匹配：针对返回的每一条语音识别结果，利用词向量模型word2vec，计算该条语音识别结果的词向量c。
96.在计算出当前语音识别结果的词向量c之后，将词向量c与当前页面上正在显示的
多条弹幕各自的词向量a和词向量b进行相似度比较。当词向量c与某条弹幕的词向量a或词向量b的相似度达到目标值(例如0.6)时，可以认为主播当前正在回复该条弹幕。其中，在计算词向量之间的相似度时，可以计算词向量的余弦相似度。
97.为便于理解，例如主播在看终端上滚动显示的弹幕时，如果主播想回复某条弹幕，主播有可能会说一下弹幕发送者(即观众)的昵称。比如，当主播对“可爱小猪：请问商品产地是哪里”这条弹幕感兴趣时，主播可能会在直播间内回复：“可爱小猪宝宝在吗”。因此，对于“可爱小猪宝宝在吗”这一句语音的词向量c，其与观众昵称“可爱小猪”的词向量a的相似度很高。因此，主播终端通过比较词向量相似度，可以确定主播当前正在回复“可爱小猪：请问商品产地是哪里”这一条弹幕。
98.又比如，当主播对“可爱小猪：请问商品产地是哪里”这条弹幕感兴趣时，主播可能会在直播间内回复：“咱们家商品的产地是内蒙古”。因此，对于“咱们家商品的产地是内蒙古”这一句语音的词向量c，其与弹幕内容“请问商品产地是哪里”的词向量b的相似度很高。因此，主播终端通过比较词向量相似度，可以确定主播当前正在回复“可爱小猪：请问商品产地是哪里”这一条弹幕。
99.步骤205、自动提取主播回复内容，生成并发送摘要：如果当前处理的这条语音识别结果匹配出相似度较高的弹幕，则将：当前这条语音识别结果、以及其前n条语音识别结果和后m条语音识别结果，按照时间先后顺序，整理成文字版本的直播互动摘要，并将当前语音识别结果在摘要中突出显示，便于观众快速从摘要中定位出重点内容。
100.整理出文字版本的直播互动摘要后，将该份摘要发送给匹配出的弹幕的发送者(即观众用户)。
101.步骤206、智能回复反馈：在智能回复内容周围提供反馈的交互选项，便于手机主播或观众反馈的语音回复内容与观众弹幕内容不对应的情况，或者反馈回复内容准确的情况。
102.步骤207、智能分析错误回复：收集主播、观众反馈的智能回复错误情况，建立错误回复文本库，建立出现错误回复的文本特征模型，应用于步骤204的相似度匹配系统中，智能过滤或纠正会出现错误回复的匹配结果。
103.步骤208、智能分析主播回复：收集智能回复中反馈为准确的内容，以每个主播智能回复以及观众弹幕内容为基础，建立智能回复内容的文本特征模型，应用于步骤204的相似度匹配中，提升智能匹配的效率。
104.在上述示例中，引入语音识别与文本匹配系统，分析主播语音内容与观众弹幕内容相似度，从而获取主播可能在回复观众弹幕提问这一事件。进而通过获取主播正在回复观众弹幕提问事件，继而提取主播语音内容，以文本形式将主播回复内容展现给直播间内容发送弹幕的观众。
105.需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。
106.参照图3，示出了本发明的一种直播互动摘要生成装置实施例的结构框图，具体可
以包括如下模块：
107.待回复弹幕获取模块301，用于获取由观众端发送的待回复弹幕；所述主播端与所述观众端与同一虚拟直播间连接；
108.语音识别信息生成模块302，用于针对采集的语音信息进行语音识别，生成语音识别信息；
109.直播摘要生成模块303，用于基于与所述待回复弹幕匹配的语音识别信息生成直播摘要；
110.直播摘要发送模块304，用于将所述直播摘要发送至所述观众端。
111.在本发明的一种可选实施例中，所述待回复弹幕获取模块301包括：
112.已发送弹幕获取子模块，用于获取由观众端输出的已发送弹幕；
113.待回复弹幕确定子模块，用于按照预设过滤规则，对所述已发送弹幕进行过滤，得到待回复弹幕。
114.在本发明的一种可选实施例中，所述语音识别信息生成模块302包括：
115.语音信息获取子模块，用于获取所述主播端采集的语音信息；
116.语音信息识别子模块，用于对所述语音信息进行自动语音识别，生成语音识别信息。
117.在本发明的一种可选实施例中，所述装置还包括：
118.调用预设词向量模型，生成与所述语音识别信息匹配的第一词向量；
119.调用所述词向量模型，生成与所述待回复弹幕匹配的第二词向量；
120.计算所述第二词向量与所述第一词向量的相似度；
121.在所述相似度不小于预设阈值时，确定所述第二词向量对应的待回复弹幕与所述第一词向量对应的语音识别信息匹配。
122.在本发明的一种可选实施例中，所述直播摘要生成模块303包括：
123.生成时间确定子模块，用于确定所述语音识别信息的生成时间；
124.语音识别信息排序子模块，用于按照所述生成时间对与待回复弹幕匹配的语音识别信息进行排序；
125.直播摘要生成子模块，用于基于排序后的与所述待回复弹幕匹配的语音信息生成直播摘要。
126.在本发明的一种可选实施例中，所述装置还包括：
127.第一交互控件模块，用于展示针对所述语音识别信息的第一交互控件；
128.第一准确性反馈信息获取模块，用于响应于针对所述第一交互控件的操作，确定针对所述语音识别信息的第一准确性反馈信息；
129.语音识别信息调整模块，用于按照所述第一准确性反馈信息调整所述语音识别信息。
130.在本发明的一种可选实施例中，所述观众端用于在展示所述直播摘要时，展示第二交互控件；所述观众端还用于响应于针对所述第二交互控件的操作，确定针对所述直播摘要的第二准确性反馈信息；所述装置还包括：
131.第二准确性反馈信息接收模块，用于接收所述第二准确性反馈信息；
132.第一错误样本确定模块，用于按照所述第一准确性反馈信息，确定所述语音识别
信息中的第一错误样本；
133.第二错误样本确定模块，用于按照所述第二准确性反馈信息，确定所述直播摘要中的第二错误样本；
134.第一文本特征模型构建模块，用于基于所述第一错误样本和所述第二错误样本构建第一文本特征模型；所述第一文本特征模型用于纠偏所述直播摘要。
135.在本发明的一种可选实施例中，所述装置还包括：
136.第一正确样本确定模块，用于按照所述第一准确性反馈信息，确定所述语音识别信息中的第一正确样本；
137.第二正确样本确定模块，用于按照所述第二准确性反馈信息，确定所述直播摘要中的第二正确样本；
138.第二文本特征模型构建基于所述第一正确样本和所述第二正确样本构建第二文本特征模型；所述第二文本特征模型用于计算所述相似度。
139.对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
140.本发明实施例还公开了一种电子设备，包括：处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的直播互动摘要生成方法的步骤。
141.本发明实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上所述的直播互动摘要生成方法的步骤。
142.本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。
143.本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
144.本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
145.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
146.这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得
在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
147.尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
148.最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
149.以上对本发明所提供的一种直播互动摘要生成方法和一种直播互动摘要生成装置、电子设备、存储介质，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种图像采集同步加密隐私保护的处理方法和装置与流程

一种直播互动摘要生成方法和装置与流程

相关文献

最热文献