技术新讯 > 乐器声学设备的制造及制作,分析技术 > 抗篡改语音水印的制作方法  >  正文

抗篡改语音水印的制作方法

  • 国知局
  • 2024-06-21 11:39:34

本文描述了用于对语音信号加水印的机制。

背景技术:

1、许多系统和应用是语音使能的,允许用户经由语音与系统交互。语音有时用于经由话音生物特征、短语等来认证用户。然而,随着文本到语音(tts)技术的发展,合成语音变得难以检测。为了防止语音信号的未授权复制或合成语音信号的使用,可以用某些水印对语音信号进行编码。当前加水印的技术可能无法确保语音信号的适当认证,或者音频信号的质量可能受损。

技术实现思路

1、一种用于将水印信号应用于语音信号以防止未授权使用语音信号的方法,该方法可以包括:接收原始语音信号;确定所述原始语音信号的对应的频谱图;选择固定帧长度且均匀分布的相位序列;以及基于相应的频谱图和相位序列生成经编码的水印信号。

2、在另一个实施例中,该方法包括获取原始语音频谱图的幅度以生成经编码的水印。

3、在另一实施例中,通过应用短时傅里叶变换(stft)来确定频谱图,以确定原始输入信号的每个帧的正弦频率和相位内容。

4、在另一实施例中,该方法包括在生成经编码的水印之前应用比特编码。

5、在另一个实施例中,比特编码包括基于关于原始语音信号的信息来分配比特。

6、在另一实施例中,比特编码通过频率仓的子集展开,以允许在不利条件下检测比特编码。

7、在另一实施例中,该方法包括至少部分地基于原始语音信号的频率来确定频率相关增益因子。

8、在另一实施例中,频率相关增益因子基于至少一个频率阈值,其中针对低于第一阈值频率的频率选择第一增益因子,并且其中针对高于第二阈值频率的频率选择第二增益因子。

9、在另一个实施例中,为第一阈值频率与第二阈值频率之间的频率选择转换增益因子。

10、在另一个实施例中,该方法包括存储用于认证未来语音信号的经编码的水印,经编码的水印定义使用未来语音信号的许可。

11、在另一实施例中,该方法包括向水印信号添加完美隐私(pretty good privacy)(pgp)或公钥加密术中的至少一个。

12、在另一个实施例中,水印信号包括在原始语音信号中说出的词语,其中每个词语与序列定位相关联。

13、在另一个实施例中,水印信号包括原始语音信号中所说的每个词语的开始和结束时间。

14、一种非暂时性计算机可读介质,包括用于将水印信号应用于语音信号以防止未授权使用语音信号的指令,所述指令在由处理器执行时使得所述处理器执行操作,所述操作可以包括:接收原始语音信号;确定原始语音信号的对应的频谱图;选择固定帧长度且均匀分布的相位序列;基于对应的频谱图和相位序列生成经编码的水印信号。

15、在另一个实施例中,处理器被编程为执行还包括以下的操作:获取频谱图的幅度以生成经编码的水印。

16、在另一实施例中,通过应用短时傅里叶变换(stft)来确定频谱图,以确定原始输入信号的每个帧的正弦频率和相位内容。

17、在另一实施例中,处理器被编程为执行还包括以下的操作:在生成经编码的水印之前应用比特编码。

18、在另一实施例中,比特编码包括基于关于原始语音信号的信息来分配比特。

19、一种用于将水印信号应用于包括语音内容的音频信号以防止未授权使用语音内容的方法,该方法可以包括:接收具有语音内容的原始音频信号;基于所述原始语音信号生成经编码的水印信号,经编码的水印信号定义原始音频信号的允许使用;以及发送包括原始音频信号和水印信号的经编码的音频信号。

技术特征:

1.一种用于将水印信号应用于语音信号以防止未授权使用语音信号的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:获取所述原始语音频谱图的幅度以生成所述经编码的水印。

3.根据权利要求1所述的方法,其中,通过应用短时傅立叶变换(stft)来确定所述频谱图,以确定所述原始输入信号的每个帧的正弦频率和相位内容。

4.根据权利要求1所述的方法,还包括在生成所述经编码的水印之前应用比特编码。

5.根据权利要求4所述的方法,其中,所述比特编码包括基于关于所述原始语音信号的信息来分配比特。

6.根据权利要求5所述的方法,其中,所述比特编码通过频率仓的子集展开,以允许在不利条件下检测所述比特编码。

7.根据权利要求1所述的方法,还包括至少部分地基于所述原始语音信号的频率来确定频率相关增益因子。

8.根据权利要求7所述的方法,其中所述频率相关增益因子基于至少一个频率阈值,其中,针对低于第一阈值频率的频率选择第一增益因子,并且其中,针对高于第二阈值频率的频率选择第二增益因子。

9.根据权利要求8所述的方法,其中,针对所述第一阈值频率和所述第二阈值频率之间的频率选择转变增益因子。

10.根据权利要求1所述的方法,还包括存储所述经编码的水印以用于认证未来语音信号,所述经编码的水印定义使用所述未来语音信号的许可。

11.根据权利要求1所述的方法,还包括:向所述水印信号添加完美隐私(pgp)或公钥加密术中的至少一个。

12.根据权利要求1所述的方法,其中,所述水印信号包括在所述原始语音信号中说出的词语,其中,每个词语与序列定位相关联。

13.根据权利要求12所述的方法,其中,所述水印信号包括在所述原始语音信号中说出的每个词语的开始时间和结束时间。

14.一种非暂时性计算机可读介质,包括用于将水印信号应用于语音信号以防止未授权使用语音信号的指令,所述指令在由处理器执行时使得所述处理器执行操作,所述操作包括:

15.根据权利要求14所述的计算机程序产品,其中,所述处理器执行操作还包括:获取所述频谱图的幅度以生成所述经编码的水印。

16.根据权利要求14所述的计算机程序产品,其中,通过应用短时傅里叶变换(stft)来确定所述频谱图,以确定所述原始输入信号的每个帧的正弦频率和相位内容。

17.根据权利要求14所述的计算机程序产品,其中,所述处理器执行操作还包括:在生成所述经编码的水印之前应用比特编码。

18.根据权利要求17所述的计算机程序产品,其中,所述比特编码包括基于关于所述原始语音信号的信息来分配比特。

19.一种用于将水印信号应用于包括语音内容的音频信号以防止未授权使用所述语音内容的方法,所述方法包括:

技术总结一种用于将水印信号应用于语音信号以防止未授权使用语音信号的方法,该方法可以包括:接收原始语音信号;确定原始语音信号的对应的频谱图;选择固定帧长度且均匀分布的相位序列;以及基于对应的频谱图和相位序列生成经编码的水印信号。技术研发人员:F·福贝尔,J·荣克劳森,M·格罗伯,H·夸斯特,O·范波滕,M·芬克受保护的技术使用者:塞伦妮经营公司技术研发日:技术公布日:2024/3/27

本文地址:https://www.jishuxx.com/zhuanli/20240618/22727.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。