处理方法、装置以及存储介质与流程
- 国知局
- 2024-06-21 11:57:53
本公开涉及通信,尤其涉及处理方法、装置以及存储介质。
背景技术:
1、随着多媒体技术的快速发展,可以通过对音频数据进行编码并传输,后续再对编码数据进行解码即可得到对应的音频数据,保证音频数据可以高效传输。
技术实现思路
1、本公开解决了音频数据的信息较少的问题,通过生成用于描述音频数据的第一数据,保证对音频数据描述的准确性,进而保证后续对音频数据进行机器分析或机器训练的准确性。
2、本公开实施例提出了处理方法、装置以及存储介质。
3、根据本公开实施例的第一方面,提出了一种处理方法,所述方法由第一设备执行,所述方法包括:
4、基于音频数据生成多个第一数据,所述第一数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
5、根据本公开实施例的第二方面,提出了一种处理方法,所述方法由编码器执行,所述方法包括:
6、对第一数据和音频数据中的至少一项进行编码,得到编码数据,所述第一数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
7、根据本公开实施例的第三方面,提出了一种处理方法,所述方法由解码器执行,所述方法包括:
8、对编码数据进行解码,得到第二数据和音频数据中的至少一项,所述第二数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
9、根据本公开实施例的第四方面,提出了一种处理方法,所述方法包括:
10、第一设备基于音频数据生成多个第一数据,所述第一数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练;
11、编码器对第一数据和音频数据中的至少一项进行编码,得到编码数据;
12、解码器对编码数据进行解码,得到第二数据和音频数据中的至少一项,所述第二数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
13、根据本公开实施例的第五方面,提出了一种处理装置,包括:
14、处理模块,用于基于音频数据生成多个第一数据,所述第一数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
15、根据本公开实施例的第六方面,提出了一种处理装置,包括:
16、处理模块,用于对第一数据和音频数据中的至少一项进行编码,得到编码数据,所述第一数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
17、根据本公开实施例的第七方面,提出了一种处理装置,包括:
18、处理模块,用于对编码数据进行解码,得到第二数据和音频数据中的至少一项,所述第二数据用于描述音频数据且还用于对所述音频数据进行机器分析或机器训练。
19、根据本公开实施例的第八方面,提出了一种处理装置,包括:
20、一个或多个处理器;
21、其中,所述处理装置用于执行第一方面中任一所述的方法。
22、根据本公开实施例的第九方面,提出了一种处理装置,包括:
23、一个或多个处理器;
24、其中,所述处理装置用于执行第二方面中任一所述的方法。
25、根据本公开实施例的第十方面,提出了一种处理装置,包括:
26、一个或多个处理器;
27、其中,所述处理装置用于执行第三方面中任一所述的方法。
28、根据本公开实施例的第十一方面,提出了一种编解码系统,包括:
29、第一设备、编码器和解码器,其中,所述第一设备被配置为实现第一方面所述的处理方法,所述编码器被配置为实现第二方面所述的处理方法,所述解码器被配置为实现第三方面所述的处理方法。
30、根据本公开实施例的第十二方面,提出了一种存储介质,所述存储介质存储有指令,当所述指令在通信设备上运行时,使得所述通信设备执行如第一方面或第二方面或第二方面中任一项所述的方法。
技术特征:1.一种处理方法,其特征在于,所述方法由第一设备执行,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述音频数据或所述第一数据中的至少一项还用于编码器进行编码并传输。
3.根据权利要求2所述的方法,其特征在于,所述第一数据采用霍夫曼huffman编码进行编码。
4.根据权利要求1至3任一所述的方法,其特征在于,每个所述第一数据对应一个通道,所述通道包括所述第一数据对应的所述音频数据。
5.根据权利要求1至4任一所述的方法,其特征在于,所述第一数据包括参考信息,所述参考信息用于指示所述第一数据对应的参考音频数据用于与待测音频数据进行匹配。
6.根据权利要求5所述的方法,其特征在于,所述第一数据属于第一分组,所述第一分组包括多个所述第一数据,所述第一分组包括的第一数据均包括所述参考信息。
7.根据权利要求1至4任一所述的方法,其特征在于,所述第一数据包括待测信息,所述待测信息用于指示所述第一数据对应的待测音频数据用于与参考音频数据进行匹配。
8.根据权利要求7所述的方法,其特征在于,所述第一数据属于第二分组,所述第二分组包括多个所述第一数据,所述第二分组包括的第一数据均包括所述待测信息。
9.根据权利要求1至8任一所述的方法,其特征在于,所述第一数据包括位置信息,所述位置信息用于指示所述第一数据对应的音频数据的采集位置。
10.根据权利要求1至9任一所述的方法,其特征在于,所述第一数据包括环境信息,所述环境信息用于指示采集所述第一数据对应的音频数据时所处的环境。
11.根据权利要求10所述的方法,其特征在于,所述环境信息包括以下至少一项:
12.根据权利要求1至11任一所述的方法,其特征在于,所述第一数据包括字符串、数值、所述字符串与所述数值的组合中的任一种。
13.根据权利要求1至12任一所述的方法,其特征在于,所述第一数据承载在元数据音频元素mae扩展域中。
14.一种处理方法,其特征在于,所述方法由编码器执行,所述方法包括:
15.根据权利要求14所述的方法,其特征在于,所述对第一数据和音频数据中的至少一项进行编码,得到编码数据,包括:
16.根据权利要求14所述的方法,其特征在于,所述对第一数据和音频数据中的至少一项进行编码,得到编码数据,包括:
17.根据权利要求14所述的方法,其特征在于,所述对第一数据和音频数据中的至少一项进行编码,得到编码数据,包括:
18.根据权利要求14至17任一所述的方法,其特征在于,所述第一数据承载在mae扩展域中。
19.一种处理方法,其特征在于,所述方法由解码器执行,所述方法包括:
20.根据权利要求19所述的方法,其特征在于,所述对编码数据进行解码,得到第二数据和音频数据中的至少一项,包括:
21.根据权利要求19所述的方法,其特征在于,所述对编码数据进行解码,得到第二数据和音频数据中的至少一项,包括:
22.一种处理方法,其特征在于,所述方法包括:
23.一种处理装置,其特征在于,所述处理装置包括:
24.一种处理装置,其特征在于,所述处理装置包括:
25.一种处理装置,其特征在于,所述处理装置包括:
26.一种处理装置,其特征在于,所述处理装置包括:
27.一种处理装置,其特征在于,所述处理装置包括:
28.一种处理装置,其特征在于,所述处理装置包括:
29.一种编解码系统,其特征在于,包括第一设备、编码器和解码器,其中,所述第一设备被配置为实现权利要求1至13任一项所述的处理方法,所述编码器被配置为实现权利要求14至18任一项所述的处理方法,所述解码器被配置为实现权利要求19至21任一项所述的处理方法。
30.一种存储介质,所述存储介质存储有指令,其特征在于,当所述指令在通信设备上运行时,使得所述通信设备执行如权利要求1至13任一项所述的处理方法,或执行如权利要求14至18任一项所述的处理方法,或执行如权利要求19至21任一项所述的处理方法。
技术总结本公开涉及处理方法、装置以及存储介质,一种处理方法,方法由编码器执行,包括:对至少一个声道分组中的声道进行下混,生成每个所述声道分组的声道信息,所述至少一个声道分组中存在N个第一声道分组和M个第二声道分组,所述第一声道分组包括三个声道,所述第二声道分组包括两个声道,所述N为1,所述M为非负整数。上述实施例中,解决了对声道进行下混后生成对应的声道信息的问题,提供了一种生成每个声道分组的声道信息的方案,保证每个声道分组具有对应的声道信息,保证生成的声道分组的准确性,进而保证编解码的可靠性。技术研发人员:王宾受保护的技术使用者:北京小米移动软件有限公司技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240618/24758.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。