技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频三维码编码方法和解码方法与流程 > 正文

音频三维码编码方法和解码方法与流程

国知局
2024-06-21 10:42:20

本技术涉及计算机，特别是涉及一种音频三维码编码方法和解码方法。

背景技术：

1、据第二次全国残疾人抽样调查显示，我国的听力残疾人口己经超过2000万，占残疾人总数的34％。如何改善这些听力损失人群的听力状况己经成为迫在眉睫的重要课题，对我国经济社会的稳定发展以及和谐社会都具有重大的意义。在现有医疗水平条件之下，助听器的使用己经成为治疗矫正听损患者听力状况的主要手段。但助听器的验配受很多因素的影响，其中不同助听器验配机构技术水平的差异、听力障碍患者需要多次往返验配机构进行助听器调试等不便因素是助听器验配面临的实际困难。近年来网络技术和助听器各项功能的发展，听障者足不出户就能获得助听器验配服务成为可能。

2、但是现有的远程验配还存在各种不足，如何将验配结果输入助听器，现有的解决方案一般事采用有限或蓝牙进行传输。这需要助听器配备相应的通信设备，不利于助听器的推广使用。最近有人提出了一种新的技术方案，通过音频三维方法能够将各项控制命令传入助听器，其中编解码部分比较简单，只适合长度较短的二进制向量。但是验配信息比普通的控制命令信息长的多，也即是说，作为验配信息的二进制向量的长度要远远大于控制命令的，再采用现有简单的编解码方法会带来大量的解码错误，从而导致验配信息传输失误。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够解决验配信息传输失误问题的音频三维码编码方法和解码方法。

2、一种音频三维码编码方法，所述方法包括：

3、接收操作指令并将所述操作指令编码为第一数字向量，将所述第一数字向量转化为预设位数的第二数字向量；

4、根据预先设置的差异消除算法，对所述第二数字向量进行差异消除，得到第三数字向量；

5、获取预设语音信号对应的第一音频三维码，将所述第一音频三维码进行划分，选择划分结果中的一个子图进行取值范围划分，得到级别指标，以及根据所述第三数字向量计算每个级别指标对应的像素点个数；其中，级别指标的级别数量与所述第三数字向量的位数相同；

6、根据所述级别指标以及级别对应像素点个数，将所述子图转化为处理后子图；

7、根据所述处理后子图以及所述划分结果中其他子图，生成第二音频三维码；

8、将所述第二音频三维码转化为声音控制信号发送至声音接收设备。

9、在其中一个实施例中，所述第一数字向量为二进制向量；所述第二数字向量为十进制向量；还包括：将二进制的所述第一数字向量转化为预设位数的十进制第二数字向量。

10、在其中一个实施例中，还包括：将所述第一数字向量平均分为所述预设位数的组别，将每个组别转化为一个十进制数，得到预设位数的十进制第二数字向量。

11、在其中一个实施例中，还包括：根据预先设置的差异消除算法，对所述第二数字向量进行差异消除，得到第三数字向量为：

12、

13、其中，λ∈(0,1)为控制参数，vect2(i)表示所述第二数字向量中的第i位，vect3(i)表示所述第三数字向量中的第i位，i＝1,…32，所述预设位数为32。

14、在其中一个实施例中，还包括：获取所述子图中的最大值和最小值，将所述最大值和所述最小值的区间划分为所述预设位数的级别，得到级别指标。

15、在其中一个实施例中，还包括：根据所述第三数字向量计算每个级别指标对应的像素点个数为：

16、

17、其中，pi表示第i个级别指标对应的像素点个数，vect3(i)表示第三数字向量的第i位，w×h×k表示第一语谱图的图像大小，其中，w表示宽度，h表示高度，k表示长度。

18、在其中一个实施例中，还包括：根据所述子图中每个像素点的取值落在的所述级别指标，对所述像素点进行重新赋值，得到处理后子图。

19、在其中一个实施例中，还包括：从所述子图中随机选择所述像素点个数的像素点，并将所述像素点赋值为对应级别指标，重复进行32次，得到处理后子图。

20、一种音频三维码编码装置，所述装置包括：

21、向量编码模块，用于接收操作指令并将所述操作指令编码为第一数字向量，将所述第一数字向量转化为预设位数的第二数字向量；

22、差异消除模块，用于根据预先设置的差异消除算法，对所述第二数字向量进行差异消除，得到第三数字向量；

23、向量融合模块，用于获取预设语音信号对应的第一音频三维码，将所述第一音频三维码进行划分，选择划分结果中的一个子图进行取值范围划分，得到级别指标，以及根据所述第三数字向量计算每个级别指标对应的像素点个数；其中，级别指标的级别数量与所述第三数字向量的位数相同；根据所述级别指标以及级别对应像素点个数，将所述子图转化为处理后子图；

24、发送模块，用于根据所述处理后子图以及所述划分结果中其他子图，生成第二音频三维码；将所述第二音频三维码转化为声音控制信号信号发送至声音接收设备。

25、一种音频三维码解码方法，所述方法包括：

26、接收终端发送的上述声音控制信号；

27、将所述语音信号进行转化，得到第三音频三维码，将所述第三音频三维码和预先存储的第一音频三维码进行配准，若配准成功，则从所述第三音频三维码中提取第四数字向量；

28、根据所述第四数字向量和预先存储的数字向量和操作指令的映射关系，解析得到操作指令。

29、在其中一个实施例中，还包括：遍历所述第一音频三维码和所述第三音频三维码中的元素值，当所述第一音频三维码和所述第三音频三维码中的元素值的差和小于阈值时，则配准成功，并得到配准点。

30、在其中一个实施例中，还包括：根据所述第三音频三维码以及所述配准点，提取得到第四数字向量。

31、在其中一个实施例中，还包括：

32、根据所述第三音频三维码以及所述配准点，得到携带配验信息的语谱图为：

33、

34、其中，r4表示携带配验信息的语谱图，f3表示第三语谱图，a0表示配准点；

35、统计所述携带配验信息的语谱图中每个取值级别的像素点个数为：

36、

37、其中，qi表示携带配验信息的语谱图中每个取值级别的像素点个数，di表示每个级别对应的取值，＝＝表示逻辑运算符，其中，如果相等取值为1否则为0，i＝1,…32；

38、根据携带配验信息的语谱图中每个取值级别的像素点个数，确定第五向量为：

39、

40、其中，vect5(i)表示第五向量中的第i位；

41、根据所述第五向量，计算得到第六向量为：

42、

43、其中，vect6(i)表示第六向量中的第i位；

44、将所述第六向量转化为二进制向量，得到第四向量。

45、一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

46、一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

47、上述音频三维码编码方法和解码方法，首先，不再采用简单的把每个分量赋值给图像，这是因为每个分量的数值不再像传统技术中只可能是0或者1，本发明的第二数字向量中每个分量都是独立的，可能想差很大也可能相差很小甚至相等，直接赋值会导致解码时任何一个分量的位置计算错误后随之后面的分量全部会算错，这样解码正确率会大大的降低。为了解决这个问题，本发明采用一种新的统计方法进行编码，解码时就不需要计算每个分量所处的位置只需要对整幅图像进行统计分析即可，大大的提高了解码的正确率。