技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频流处理方法及装置、存储介质及电子装置与流程 > 正文

音频流处理方法及装置、存储介质及电子装置与流程

国知局
2024-06-21 11:33:44

本申请涉及智慧家庭，具体而言，涉及一种音频流处理方法及装置、存储介质及电子装置。

背景技术：

1、随着物联网技术的成熟发展，智能家居通过物联网技术将家中的各种设备连接在一起。在人机交互过程中，语音模块一般为智能家居设备的基础组件，设备通过集成语音模块使其具备“听音”功能。用户在使用智能语音设备时，设备需检测出音频流的尾帧来确定用户语音输入是否结束，但目前的尾帧检测依赖语音识别结果，规则约束条件偏向于语音完整性和识别准确性的判定，导致音频流的尾帧判定的时间较用户语音输入的实际结束时间较晚。

2、针对相关技术中，确定音频流的音频流结束时刻的准确性较低的问题，目前尚未提出有效的解决方案。

3、因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

技术实现思路

1、本发明实施例提供了一种音频流处理方法及装置、存储介质及电子装置，以至少解决确定音频流的音频流结束时刻的准确性较低的问题。

2、根据本发明实施例的一方面，提供一种音频流处理方法，包括：对多个连续预设时间间隔内分别获取到的音频片段进行声学检测，得到多个所述音频片段的声学属性；其中，所述音频片段为目标设备进行音频采集所得到的音频流中所包括的音频片段；以及对所述多个连续预设时间间隔内分别获取到的音频片段进行语音识别，得到多个所述音频片段的识别文本；根据所述声学属性和/或所述识别文本确定所述音频流的音频流结束时刻。

3、根据本发明实施例的另一方面，还提供了一种音频流处理装置，包括：第一检测模块，用于对多个连续预设时间间隔内分别获取到的音频片段进行声学检测，得到多个所述音频片段的声学属性；其中，所述音频片段为目标设备进行音频采集所得到的音频流中所包括的音频片段；第二检测模块，用于对所述多个连续预设时间间隔内分别获取到的音频片段进行语音识别，得到多个所述音频片段的识别文本；确定模块，用于根据所述声学属性和/或所述识别文本确定所述音频流的音频流结束时刻。

4、根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述音频流处理方法。

5、根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述音频流处理方法。

6、通过本发明，对多个连续预设时间间隔内分别获取到的音频片段进行声学检测和语音识别，得到多个所述音频片段的声学属性和识别文本，其中，所述音频片段为目标设备被唤醒的情况下，持续进行音频采集所得到的音频流中所包括的音频片段；进而根据声学属性和/或识别文本确定音频流的音频流结束时刻。采用上述技术方案，提高了确定音频流的音频流结束时刻的准确性，解决了确定音频流的音频流结束时刻的准确性较低的问题。

技术特征：

1.一种音频流处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，对多个连续预设时间间隔内分别获取到的音频片段进行声学检测，包括：

3.根据权利要求1所述的方法，其特征在于，对多个连续预设时间间隔内分别获取到的音频片段进行声学检测，得到多个所述音频片段的声学属性，包括：

4.根据权利要求1所述的方法，其特征在于，根据所述声学属性和/或所述识别文本确定所述音频流的音频流结束时刻，包括：

5.根据权利要求4所述的方法，其特征在于，根据所述声学属性确定n个音频片段中每个音频片段的片段类型，包括：

6.根据权利要求4所述的方法，其特征在于，根据所述每个音频片段的片段类型和所述n个音频片段中全部音频片段的总时长确定所述音频流的音频结束时刻，包括：

7.根据权利要求4所述的方法，其特征在于，根据所述每个音频片段的片段类型和所述n个音频片段中全部音频片段的总时长确定所述音频流的音频结束时刻，包括：

8.根据权利要求4所述的方法，其特征在于，根据所述每个音频片段的片段类型、所述n个音频片段中部分音频片段的总时长和所述识别文本确定所述音频流的音频结束时刻，包括：

9.根据权利要求4所述的方法，其特征在于，根据所述每个音频片段的片段类型、所述n个音频片段中部分音频片段的总时长和所述识别文本确定所述音频流的音频结束时刻，包括：

10.一种音频流处理装置，其特征在于，包括：

11.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至9中任一项所述的方法。

12.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至9中任一项所述的方法。

技术总结本申请公开了一种音频流处理方法及装置、存储介质及电子装置，涉及智慧家庭技术领域，该音频流处理方法包括：对多个连续预设时间间隔内分别获取到的音频片段进行声学检测，得到多个音频片段的声学属性；其中，音频片段为目标设备被唤醒的情况下，持续进行音频采集所得到的音频流中所包括的音频片段；以及对多个连续预设时间间隔内分别获取到的音频片段进行语音识别，得到多个音频片段的识别文本；根据声学属性和/或识别文本确定音频流的音频流结束时刻，其中，音频流结束时刻为目标设备停止进行音频采集的时刻。采用上述技术方案，解决了确定音频流的音频流结束时刻的准确性较低的问题。技术研发人员：高婷婷,田聪受保护的技术使用者：海尔优家智能科技（北京）有限公司技术研发日：技术公布日：2024/3/11