技术新讯 > 乐器声学设备的制造及制作,分析技术 > 自主现场学习人工智能沉浸式音频系统以及人工智能训练方法与流程 > 正文

自主现场学习人工智能沉浸式音频系统以及人工智能训练方法与流程

国知局
2024-09-14 14:22:54

本发明有关于一种人工智能沉浸式音频系统以及人工智能训练方法，尤指一种利用堆栈降噪自动编码器进行现场学习并消除误差音讯的自主现场学习人工智能沉浸式音频系统以及人工智能训练方法。

背景技术：

1、现今的影音产品，相当讲究用户的观影及聆听体验，研发人员无不在相关技术领域上努力研发。为了让使用者带入沉浸式体验(immersive experience)的效果，目前市面上多数的产品会利用多声道音效体验(例如双声道、5.1声道、5.12声道、7.12声道等)或是提升声音的指向性提升使用者的沉浸感，以此增加使用者的观影及聆听感受。然而不管是单声道或是多声道的音效设备，用户往往为了提升沉浸感因而不自觉的增加设备的音效音量，造成这些音效外溢至周边进而影响其他人，造成使用者本人及他人的困扰。

2、例如一般人在看电视的时候，常常会不自觉想将音量调大以增加听感效能，然而在周遭附近或其他区域想休息或是专心进行阅读的人，常常会被用户看电视的音量打扰而无法好好休息。而这样的配置，在多声道或是虚拟多声道的情况下由于音效会经由四面八方各种方向上输出，将导致这些外溢的声音更可能会进一步对更多人造成影响。

技术实现思路

1、本发明的主要目的，在于提供一种自主现场学习人工智能沉浸式音频系统，包括音频设备及至少一声音消除装置。该音频设备包括一音频处理器以及一音频输出装置，该音频输出装置依据该音频处理器提供的音源讯号于一沉浸式空间输出播放声音。该声音消除装置设置于该音频设备上，该声音消除装置包括一误差麦克风、一连接于该误差麦克风的人工智能处理器、一连接至该音讯处理器及该人工智能处理器的反向抵消音频生成模块，以及一连接至该反向抵消音频生成模块的反向声音输出模块。其中，该误差麦克风用于接收非沉浸式空间中的误差声音并将其转换为误差音讯，该人工智能处理器将该误差音讯输入至经神经网络训练的堆栈降噪自动编码器后，由该堆栈降噪自动编码器输出反向声音修饰讯号，并传输至该反向抵消音频生成模块，该反向抵消音频生成模块用于经由该音源讯号生成反向抵消音讯并经由该反向声音修饰讯号修饰该反向抵消音讯后输出至该反向声音输出模块，以经由该反向声音输出模块输出反向声音。

2、本发明的另一目的，在于提供一种如上所述的自主现场学习人工智能沉浸式音频系统的人工智能训练方法，包括：该人工智能处理器的训练模块于目标环境中通过该误差麦克风采样一段时间的该误差音频做为训练样本，并将该训练样本进行正规化，并将正规化后的该训练样本转换成时间序列数据；提取该训练样本的特征，及添加噪声输入至该降噪自动编码器；估计权重及误差，并预测及核算绩效指标；以及重复执行该堆栈降噪自动编码器神经网络的训练，计算误差值并更新权重，直至完成该堆栈降噪自动编码器训练。

3、是以，本发明通过降噪自动编码器可以有效的将误差音频中的噪声予以消除，以此最小化误差麦克风所接收到的路径误差，提升沉浸式音频系统的声音消除效率。

技术特征：

1.一种自主现场学习人工智能沉浸式音频系统，其特征在于，包括：

2.如权利要求1所述的自主现场学习人工智能沉浸式音频系统，其特征在于，其中该反向抵消音频生成模块包括一音频混合器，用于将该反向声音修饰讯号与该反向抵消音讯相加以修饰该反向抵消音讯。

3.如权利要求1所述的自主现场学习人工智能沉浸式音频系统，其特征在于，其中该音频输出装置包括扬声器、设置于该扬声器前端的功率放大器、连接于该功率放大器前端的重建滤波器，以及连接于该重建滤波器前端的数字-模拟转换器。

4.如权利要求1所述的自主现场学习人工智能沉浸式音频系统，其特征在于，其中该反向声音输出模块包括扬声器、连接于该扬声器前端的功率放大器、连接于该功率放大器前端的重建滤波器，以及连接于该重建滤波器前端的数字-模拟转换器。

5.如权利要求1所述的自主现场学习人工智能沉浸式音频系统，其特征在于，其中该误差麦克风包括麦克风，以及设置于该麦克风前端并连接至该人工智能处理器输入的模拟数字转换器。

6.如权利要求1所述的自主现场学习人工智能沉浸式音频系统，其特征在于，其中该人工智能处理器包括一正规化模块，用于采样一段时间的该误差音讯并将采样段正规化后输入至该堆栈降噪自动编码器，该堆栈降噪自动编码器依据正规化后的该采样段输出降噪后的该反向声音修饰讯号，该堆栈降噪自动编码器由输入至输出包括：

7.如权利要求6所述的自主现场学习人工智能沉浸式音频系统，其特征在于，该降噪自动编码器包括：

8.一种用于权利要求1-7中任一项所述的自主现场学习人工智能沉浸式音频系统的人工智能训练方法，其特征在于，包括：

9.如权利要求8所述的人工智能训练方法，其特征在于，该训练模块依据下列条件触发现场训练模式：

10.如权利要求9所述的人工智能训练方法，其特征在于，该训练模块于启动该现场训练模式后设定降噪规则，该降噪规则包括选择该堆栈降噪自动编码器中添加的噪声层数、添加噪声的概率、添加噪声模式并对应于该噪声模式进行参数设定。

11.如权利要求8所述的人工智能训练方法，其特征在于，该编码层组的初始权重、误差、转换方程式以及该解碼层组的初始权重、误差、转换方程式预先进行设定。

技术总结本发明公开了一种自主现场学习人工智能沉浸式音频系统以及人工智能训练方法，人工智能沉浸式音频系统包括音频设备，以及设置于该音讯设备上的至少一声音消除装置。该音讯设备于沉浸式空间输出播放声音。该声音消除装置通过误差麦克风接收非沉浸式空间中的误差声音，并通过人工智能处理器训练后的堆栈降噪自动编码器修饰反向声音输出模块的反向抵消音频，以提升非沉浸式空间中误差声音的消除效率。技术研发人员：请求不公布姓名受保护的技术使用者：昱盛电子股份有限公司技术研发日：技术公布日：2024/9/12