技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于语音转文字的关键词识别确定重点内容的方法与流程 > 正文

一种基于语音转文字的关键词识别确定重点内容的方法与流程

国知局
2024-08-05 11:38:54

本发明涉及教育在线授课，尤其涉及一种基于语音转文字的关键词识别确定重点内容的方法。

背景技术：

1、网络授课是基于互联网络的远程在线互动培训课堂，一般系统采用音视频传输以及数据协同等网络传输技术，模拟真实课堂环境，通过网络给学生提供有效地培训环境。

2、现有公开专利cn108961874a公开了一种基于计算机的网络远程教育系统，包括主授课系统，远程视频教学系统及客户端，远程视频教学系统及客户端均与主授课系统无线连接；远程视频教学系统包括高清录播主机，高清云台摄像机，电脑，音频处理器，投影，功放，音箱，全向拾音器及无限麦克风，电脑，高清云台摄像机，音频处理器均与高清录播主机电性连接，高清录播主机和电脑均与投影电性连接，全向拾音器及无限麦克风与音频处理器电性连接且通过音频处理器和功放与音箱连接；基于计算机的网络远程教育系统还包括授课接收主机台，高清录播主机包括跟踪模块、回放模块、导播模块、点播模块、直播模板及录制模块。

3、目前的网络授课一般都具有录制模块和回放模块，其将授课老师在直播时讲解的内容进行记录，方便学生课后复习查看，但是，现有的回放模块无法快速得知录制视频中本节授课内容的重点部分，导致学生无法抓取授课的重点，降低了学生的学习效率。

技术实现思路

1、有鉴于此，本发明提出了一种基于语音转文字的关键词识别确定重点内容的方法，可快速得知录制视频中本节授课内容的重点部分，帮助学生快速准确的抓取授课的重点，提高了学生的学习效率。

2、本发明的技术方案是这样实现的：本发明提供了一种基于语音转文字的关键词识别确定重点内容的方法，用于在线网络授课，包括以下步骤：

3、步骤s1，构建数据库，所述数据库存储有历史音频完整文本数据；

4、步骤s2，通过音频采集设备按照预设时长连续性采集音频片段数据；

5、步骤s3，对音频片段数据进行预处理，将处理后的音频片段数据通过音频识别接口转化为片段文本数据；

6、步骤s4，将多个片段文本数据按照时间序列进行拼接，得到采集音频完整文本数据；

7、步骤s5，设定关键词，根据关键词与采集音频完整文本数据匹配，获取关键词在采集音频完整文本数据中出现的总次数，将采集音频完整文本数据按照字数分割成若干等份的子文本数据，根据关键词与各子文本数据匹配，获得关键词在子文本数据匹配中出现的次数；

8、步骤s6，获取授课时长，根据授课时长、关键词在采集音频完整文本数据中出现的总次数、关键词在子文本数据匹配中出现的次数和子文本数据的总数量，计算获得第一时间段；

9、步骤s7，根据第一时间段，预设与第一时间段连续的第二子时间段和第三子时间段，分别获取第二子时间段和第三子时间段的历史关键词平均数和采集关键词数，并判断第二子时间段和第三子时间段内的采集关键词数是否大于历史关键词平均数，若大于则将第二子时间段和第三子时间段与第一时间段进行拼接，若小于则舍弃，获得一个授课内容的重点部分。

10、在以上技术方案的基础上，优选的，步骤s1中所述构建数据库，所述数据库存储有历史音频完整文本数据，其中，历史音频完整文本数据为老师历史授课采集的音频转换成的完整文本数据，历史音频完整文本数据根据授课标题分类存储在数据库中，所述数据库中还存储有各老师历史授课采集的音频对应的授课时长。

11、在以上技术方案的基础上，优选的，步骤s3中所述对音频片段数据进行预处理，将处理后的音频片段数据通过音频识别接口转化为片段文本数据，其中，采用维纳滤波法对音频片段数据进行滤波降噪处理，将滤波降噪处理后的音频片段数据格式转化为音频识别接口输入的语音格式。

12、在以上技术方案的基础上，优选的，步骤s4中所述在得到采集音频完整文本数据之后，还包括将采集的音频对应的授课时长以及采集音频完整文本数据按照授课标题分类存储在数据库中，并与对应的授课老师相关联。

13、在以上技术方案的基础上，优选的，所述音频对应的授课时长为所有采集到的音频片段数据时长之和，并且采集音频的预设时长为30秒。

14、在以上技术方案的基础上，优选的，步骤s5中所述的设定关键词，根据关键词与采集音频完整文本数据匹配，获取关键词在采集音频完整文本数据中出现的总次数，将采集音频完整文本数据按照字数分割成若干等份的子文本数据，根据关键词与各子文本数据匹配，获得关键词在子文本数据匹配中出现的次数，其中，包括以下子步骤：

15、s51，设定关键词，根据关键词与采集音频完整文本数据匹配，获取关键词在采集音频完整文本数据中出现的总次数m；

16、s52，获取采集音频完整文本数据的总字数，将采集音频完整文本数据按照字数分割成若干等份的子文本数据，子文本数据的总数量为n；

17、s53，根据关键词与各子文本数据匹配，获得关键词在子文本数据匹配中出现的次数ji，i为子文本数据的排序值，其中，i∈(1、2、3...n)。

18、在以上技术方案的基础上，优选的，步骤s6中所述获取授课时长，根据授课时长、关键词在采集音频完整文本数据中出现的总次数、关键词在子文本数据匹配中出现的次数和子文本数据的总数量，计算获得第一时间段，其中，包括以下子步骤：

19、s61，根据关键词在采集音频完整文本数据中出现的总次数m和子文本数据的总数量n，计算得到各子文本数据关键词出现的平均次数p，计算表达式为：

20、p＝m/n；

21、s62，判断各子文本数据匹配中出现的次数ji是否大于子文本数据关键词出现的平均次数p，如果大于则获取该子文本数据的排序值i；

22、s63，获取授课时长x，并根据获取到的各子文本数据的排序值i与子文本数据的总数量n，计算获得对应的第一时间段t，该计算表达式为：

23、

24、式中，t-s为第一时间段的起始时间，ta为第一时间段的结束时间。

25、在以上技术方案的基础上，优选的，步骤s6中所述在计算获得第一时间段之后，还包括建立预设时间段子集，将计算获得的各第一时间段添加到预设时间段子集中，判断预设时间段子集中是否存在有连续的两个第一时间段；若存在，则将连续的第一时间段进行拼接，得到拼接后的第一时间段。

26、在以上技术方案的基础上，优选的，步骤s7中所述根据第一时间段，预设与第一时间段连续的第二子时间段和第三子时间段，分别获取第二子时间段和第三子时间段的历史关键词平均数和采集关键词数，并判断第二子时间段和第三子时间段内的采集关键词数是否大于历史关键词平均数，若大于则将第二子时间段和第三子时间段与第一时间段进行拼接，若小于则舍弃，获得一个授课内容的重点部分，其中，包括以下子步骤：

27、s71，根据第一时间段，预设与第一时间段前后连续的第二子时间段和第三子时间段，第二子时间段和第三子时间段均由若干个连续性的采集音频预设时长组成；

28、s72，根据授课标题从数据库中获取该类别下的所有历史音频完整文本数据，根据预设的第二子时间段和第三子时间段，将关键词与各历史音频完整文本数据中对应的第二子时间段和第三子时间段的文本数据进行匹配，获得各历史关键词出现次数；

29、s73，根据获取的各历史关键词出现次数及对应授课标题下的历史音频完整文本数据数量，计算得到对应预估子时间段的历史关键词平均数，计算表达式为：

30、zo＝(w1+w2+w3+...+wo)/o；

31、其中，zo为历史关键词平均数，o为授课标题类别下的所有历史音频完整文本数据数量，wo为授课标题类别下第o个历史音频完整文本数据的历史关键词出现次数；

32、s74，根据预设的第二子时间段和第三子时间段，将关键词与采集音频完整文本数据中对应的第二子时间段和第三子时间段的文本数据进行匹配，获取采集关键词数；

33、s75，判断第二子时间段和第三子时间段内的采集关键词数是否大于历史关键词平均数，若大于则将第二子时间段和第三子时间段与第一时间段进行拼接；若小于则舍弃，以确定授课内容的重点部分。

34、在以上技术方案的基础上，优选的，步骤s75中所述若大于则将第二子时间段和第三子时间段与第一时间段进行拼接，其中，还包括再次设定与第二子时间段连续的前序时间段和与第三子时间段连续的后序时间段，并分别获取前序时间段和后序时间段的历史关键词平均数和采集关键词数，判断前序时间段或后序时间段内的采集关键词数是否小于历史关键词平均数，若小于则舍弃相应的前序时间段或后序时间段，若大于则继续追溯前序时间段或/和后序时间段，并判断获取满足采集关键词数大于历史关键词平均数条件的连续时间段，并将所有连续时间段进行拼接，确定授课内容的重点部分。

35、本发明的基于语音转文字的关键词识别确定重点内容的方法相对于现有技术具有以下有益效果：

36、(1)通过采集授课的音频片段数据，将音频片段数据转化为片段文本数据，并拼接成采集音频完整文本数据，设定关键词，根据关键词、采集音频完整文本数据和授课时长，计算获得授课重点部分的预估第一时间段，根据第一时间段预设与第一时间段连续的第二子时间段和第三子时间段，分别获取第二子时间段和第三子时间段的历史关键词平均数和采集关键词数，并判断采集关键词数是否大于历史关键词平均数，若大于则将第二子时间段和第三子时间段与第一时间段进行拼接，若小于则舍弃，获得授课重点内容的时间段，进而本方案可快速获得录制视频中本节授课内容的重点部分，便于学生在课后复习时直接选取授课的重点部分进行观看，进而可提高学生的学习效率，同时可为未参入该课的学生课后回播时快速抓取授课的重点，进而有效的提高了授课的效果；

37、(2)通过根据关键词、采集音频完整文本数据和授课时长，计算获得第一时间段，该第一时间段为本授课重点内容在视频中预估的时间段，根据第一时间段再预设第二时间段和第三时间段，对该预估的时间段朝两端进行时间追溯，并获取追溯时间段内的历史关键词平均数和采集关键词数进行判断，若采集关键词数大于历史关键词平均数，则继续追溯，并获取满足判断条件的追溯时间段，并将所有追溯时间段与第一时间段进行拼接，从而获得授课重点内容的时间段，该过程通过预先获取一个预估时间段，再通过该预估时间段进行追溯，使得获取到的授课重点内容部分更加准确、完整。