技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于虚拟助手通过语音控制的计划生成方法与流程 > 正文

一种基于虚拟助手通过语音控制的计划生成方法与流程

国知局
2024-06-21 10:41:12

[]本发明涉及人工智能，尤其涉及一种基于虚拟助手通过语音控制的计划生成方法。

背景技术：

0、[背景技术]

1、现有的任务计划中，如工作周报计划、产品开发计划、营销计划、学习计划等任务计划，均需要用户在电脑等智能设备上进行人工规划编写，一般为用户人工收集素材，再根据计划类型选择模板，选择模板后根据计划主体、时间、任务内容范围等内容编写模板内的各项内容，存在操作繁琐，效率低等问题。

技术实现思路

0、[技术实现要素：]

1、本发明克服了现有技术的不足，提供了一种基于虚拟助手通过语音控制的计划生成方法，实现了向虚拟助手输入生成计划的语音，使虚拟助手自动收集素材并生成对应任务计划并输出的功能。

2、为实现上述目的，本发明采用了下列技术方案：

3、一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，包括

4、s1、语音采集模块采集语音信息；

5、s2、语音识别模块将语音信息转换为文本信息；

6、s3、控制模块提取文本信息中的关键词；

7、s4、通过联网模块联网收集与关键词有关的素材数据；

8、s5、将文本信息转换为词汇和位置结合的向量参数，作为输入参数输入到大模型函数中；

9、s6、大模型根据输入参数对素材数据中的词汇进行概率猜测，预测最高概率词汇并回复；

10、s7、将回复的词汇加入输入参数中，重复步骤s6，直到预测词汇概率为0时，依次整合回复词汇生成计划文本；

11、s8、计划文本通过虚拟助手的语音播放模块进行播报。

12、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，还包括有s9、计划文本推送到用户智能设备的app中首页聊天记录中。

13、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s3中关键词包括有主体、时间和任务内容。

14、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s3还包括有

15、s31、在提取文本信息中的关键词缺少主体、时间或任务内容时，通过语音播放模块询问缺少的关键词信息，返回s1，直到关键词收集完毕。

16、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s2中包括有

17、s21、语音识别模块对语音信息进行预处理；

18、s22、语音识别模块对预处理的语音信息进行特征提取；

19、s23、语音识别模块对提取特征进行模式匹配和语言处理，得到文本信息。

20、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s21中包括有

21、s211、对语音信息进行静音切除处理；

22、s212、对静音切除处理的语音信息进行噪音处理；

23、s213、对噪音处理后的语音信息进行语音增强处理。

24、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s22中通过梅尔频率倒谱系数mfcc进行特征提取。

25、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s22中包括有

26、s221、对预处理后的语音信息进行预滤波处理；

27、s222、对预滤波处理后的语音信息进行a/d变换处理；

28、s223、对a/d变换处理后的语音信息进行预加重处理；

29、s224、对预加重处理后的语音信息进行分帧处理；

30、s225、对分帧处理后的语音信息的每一帧语音采用哈明窗进行加窗处理；

31、s226、对加窗处理后的语音信息进行傅里叶变换处理；

32、s227、对傅里叶变换处理的语音数据进行三角窗滤波处理；

33、s228、对三角窗滤波处理后的语音数据进行求取对数处理；

34、s229、对求取对数处理后的语音数据进行离散余弦变换处理；

35、s2210、对离散余弦变换处理后的语音数据进行谱加权处理；

36、s2211、对谱加权处理后的语音数据进行倒谱均值减处理；

37、s2212、对倒谱均值减处理后的语音数据进行差分参数处理；

38、s2213、对差分参数处理后的语音数据进行短时能量处理，提取语音特征。

39、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s23中使用声学模型和语音模型进行模式匹配和语言处理，得到文本信息。

40、如上所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s23中使用动态时间规整算法dtw或隐马尔科夫模型hmm进行模式匹配和语言处理，得到文本信息。

41、本发明的有益效果是：

42、本发明通过向虚拟助手输入包含关键词的生成任务计划的语音，虚拟助手识别语音后自动分析提取关键词，并根据关键词联网收集相关素材，通过大模型对素材数据中的各词汇进行概率猜测，将最高概率词汇依次回复，最后整合回复词汇生成计划文本，并通过虚拟助手进行语音播报，实现了自动根据语音内容生成任务计划的功能，无需用户人工操作电脑等智能设备以及收集及整理素材；本发明语音关键词包含主体、时间和任务内容信息，缺少关键词信息时虚拟助手要求用户进行二次语音补充，保证后续生成任务计划的顺利进行以及生成的任务计划内容充足完善；本发明虚拟助手的语音识别模块对语音信息依次进行预处理、特征提取以及模式匹配和语言处理，使语音信息转换为准确的文本信息，保证任务计划的准确生成。

技术特征：

1.一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，包括

2.根据权利要求1所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，还包括有s9、计划文本推送到用户智能设备的app中首页聊天记录中。

3.根据权利要求1所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s3中关键词包括有主体、时间和任务内容。

4.根据权利要求3所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s3还包括有

5.根据权利要求1所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s2中包括有

6.根据权利要求5所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s21中包括有

7.根据权利要求5所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s22中通过梅尔频率倒谱系数mfcc进行特征提取。

8.根据权利要求7所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s22中包括有

9.根据权利要求5所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s23中使用声学模型和语音模型进行模式匹配和语言处理，得到文本信息。

10.根据权利要求5所述的一种基于虚拟助手通过语音控制的计划生成方法，其特征在于，s23中使用动态时间规整算法dtw或隐马尔科夫模型hmm进行模式匹配和语言处理，得到文本信息。

技术总结本发明公开了一种基于虚拟助手通过语音控制的计划生成方法，包括S1语音采集模块采集语音信息；S2语音识别模块将语音信息转换为文本信息；S3控制模块提取文本信息中的关键词；S4、通过联网模块联网收集与关键词有关的素材数据；S5将文本信息转换为词汇和位置结合的向量参数，作为输入参数输入到大模型函数中；S6大模型根据输入参数对素材数据中的词汇进行概率猜测，预测最高概率词汇并回复；S7将回复的词汇加入输入参数中，重复步骤S6，直到预测词汇概率为0时，依次整合回复词汇生成计划文本；S8计划文本通过虚拟助手的语音播放模块进行播报，实现了自动根据语音内容生成任务计划的功能。技术研发人员：王茂林受保护的技术使用者：深圳市金大智能创新科技有限公司技术研发日：技术公布日：2024/1/25