技术新讯 > 乐器声学设备的制造及制作,分析技术 > 程序、信息处理方法、记录介质和信息处理装置与流程 > 正文

程序、信息处理方法、记录介质和信息处理装置与流程

国知局
2024-06-21 11:31:16

本公开涉及程序、信息处理方法、记录介质以及信息处理装置。

背景技术：

1、已知从包含多个声源信号的混合声音信号提取目标声源信号的声源分离技术。例如，专利文献1公开了使用深度神经网络(deep neural network，dnn)的声源分离技术。

2、引用列表

3、专利文献

4、专利文献1：wo 2018/047643

技术实现思路

1、本发明要解决的问题

2、使用dnn的技术实现高声源分离性能，但是需要执行诸如乘法和加法之类的大量运算。而且，在实现高声源分离性能的dnn中，使用大量的系数，使得用于存储系数的存储器的容量也需要增加。

3、因此，本公开的目的是提供在实现等于或高于特定水平的声源分离性能的同时最小化运算量的程序、信息处理方法、记录介质、以及信息处理装置。

4、问题的解决方案

5、例如，本公开内容是用于使计算机执行信息处理方法的程序，该信息处理方法包括：

6、通过神经网络单元生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息；

7、通过包括在神经网络单元中的编码器对从混合声音信号提取的特征量进行变换；

8、将来自编码器的处理结果输入至包括在神经网络单元中的多个子神经网络单元中的每一个；以及

9、将来自编码器的处理结果和来自多个子神经网络单元中的每一个的处理结果输入至包括在神经网络单元中的解码器。

10、例如，本公开内容是一种信息处理方法，该信息处理方法包括：

11、通过神经网络单元生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息；

12、通过包括在神经网络单元中的编码器对从混合声音信号提取的特征量进行变换；

13、将来自编码器的处理结果输入至包括在神经网络单元中的多个子神经网络单元中的每一个；以及

14、将来自编码器的处理结果和来自多个子神经网络单元中的每一个的处理结果输入至包括在神经网络单元中的解码器。

15、例如，本公开内容是记录介质，该记录介质记录用于使计算机执行信息处理方法的程序，该信息处理方法包括：

16、通过神经网络单元生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息；

17、通过包括在神经网络单元中的编码器对从混合声音信号提取的特征量进行变换；

18、将来自编码器的处理结果输入至包括在神经网络单元中的多个子神经网络单元中的每一个；以及

19、将来自编码器的处理结果和来自多个子神经网络单元中的每一个的处理结果输入至包括在神经网络单元中的解码器。

20、例如，本公开内容是一种信息处理装置，该信息处理装置包括神经网络单元，该神经网络单元被配置为生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息，其中

21、神经网络单元包括：

22、编码器，该编码器被配置为对从混合声音信号提取的特征量进行变换；

23、多个子神经网络单元，该多个子神经网络单元被配置为接收来自编码器的处理结果；以及

24、解码器，该解码器被配置为接收来自编码器的处理结果并且接收来自多个子神经网络单元中的每一个子神经网络单元的处理结果。

25、例如，本公开内容是用于使计算机执行信息处理方法的程序，该信息处理方法包括：

26、通过多个神经网络单元中的每一个神经网络单元生成用于从包含多个声源信号的混合声音信号中分离不同的声源信号的声源分离信息；

27、通过包括在多个神经网络单元中一个神经网络单元的编码器对从混合声音信号提取的特征量进行变换；以及

28、将来自编码器的处理结果输入至包括在多个神经网络单元中的每一个神经网络单元中的子神经网络单元。

29、例如，本公开内容是一种信息处理方法，该信息处理方法包括：

30、通过多个神经网络单元中的每一个神经网络单元生成用于从包含多个声源信号的混合声音信号中分离不同的声源信号的声源分离信息；

31、通过包括在多个神经网络单元中一个神经网络单元的编码器对从混合声音信号提取的特征量进行变换；以及

32、将来自编码器的处理结果输入至包括在多个神经网络单元中的每一个神经网络单元中的子神经网络单元。

33、例如，本公开内容是记录介质，该记录介质记录用于使计算机执行信息处理方法的程序，该信息处理方法包括：

34、通过多个神经网络单元中的每一个神经网络单元生成用于从包含多个声源信号的混合声音信号中分离不同的声源信号的声源分离信息；

35、通过包括在多个神经网络单元中的一个神经网络单元的编码器对从混合声音信号提取的特征量进行变换；以及

36、将来自编码器的处理结果输入至包括在多个神经网络单元中的每一个神经网络单元中的子神经网络单元。

37、例如，本公开内容是一种信息处理装置，该信息处理装置包括多个神经网络单元，该多个神经网络单元被配置为生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息，其中

38、该多个神经网络单元中的每一个神经网络单元包括：

39、子神经网络单元；以及

40、解码器，该解码器被配置为接收来自子神经网络单元的处理结果，

41、该多个神经网络单元中的一个神经网络单元包括被配置为对从混合声音信号提取的特征量进行变换的编码器，以及

42、将来自编码器的处理结果输入至包括在多个神经网络单元中的每一个神经网络单元中的子神经网络单元。

技术特征：

1.一种用于使计算机执行信息处理方法的程序，所述信息处理方法包括：

2.根据权利要求1所述的程序，其中，

3.根据权利要求2所述的程序，其中，

4.根据权利要求1所述的程序，其中，

5.根据权利要求4所述的程序，其中，

6.根据权利要求4所述的程序，其中，

7.根据权利要求4所述的程序，其中，

8.根据权利要求1所述的程序，其中，

9.根据权利要求4所述的程序，其中，

10.根据权利要求1所述的程序，其中，

11.根据权利要求1所述的程序，其中，

12.根据权利要求1所述的程序，其中，

13.根据权利要求12所述的程序，其中，

14.一种信息处理方法，包括：

15.一种记录介质，记录用于使计算机执行信息处理方法的程序，所述信息处理方法包括：

16.一种信息处理装置，包括神经网络单元，所述神经网络单元被配置为生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息，其中

17.一种用于使计算机执行信息处理方法的程序，所述信息处理方法包括：

18.根据权利要求17所述的程序，其中，

19.根据权利要求18所述的程序，其中，

20.一种信息处理方法，包括：

21.一种记录介质，记录用于使计算机执行信息处理方法的程序，所述信息处理方法包括：

22.一种信息处理装置，包括多个神经网络单元，所述多个神经网络单元被配置为生成用于从包含多个声源信号的混合声音信号中分离预定的声源信号的声源分离信息，其中

技术总结为了在不降低声源分离性能的情况下减少计算的数量，根据本发明的程序使计算机实现一种信息处理方法，其中，神经网络单元生成用于从包括多个声源信号的混合声音信号中分离规定的声源信号的声源分离信息，该神经网络单元的编码器对从该混合声音信号中提取的特征值进行变换，来自编码器的处理结果被输入到神经网络单元的多个子神经网络单元中的每一个，将来自编码器的处理结果和来自多个子神经网络单元中的每个子神经网络单元的处理结果输入至神经网络单元的解码器。技术研发人员：大迫庆一,光藤祐基,泽田充奖受保护的技术使用者：索尼集团公司技术研发日：技术公布日：2024/2/29