技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于AI的降噪扩声方法、系统、电子设备及介质与流程  >  正文

一种基于AI的降噪扩声方法、系统、电子设备及介质与流程

  • 国知局
  • 2024-06-21 11:31:30

本发明涉及降噪扩声领域,更具体地说,涉及一种基于ai的降噪扩声方法、系统、设备及介质。

背景技术:

1、据《教育研究》杂志介绍,教师中70%以上不同程度地患有喉炎及声带疾病,比歌唱演员的声带疾病患者比例还要高,为了有效保护教师的嗓子,扩音在教学过程中是必不可少的。

2、在已知的一些技术方案中,在课堂上对老师声音扩声时,由于课堂上会有不少的杂音,也会被扩声,导致教师讲课的声音杂乱,而且教室外还有其他的声音,杂音较多。

3、为此,我们提出一种基于ai的降噪扩声方法、系统、设备及介质及其制备方法来解决上述问题。

技术实现思路

1、要解决的技术问题

2、针对现有技术中存在的问题,本发明的目的在于提供一种基于ai的降噪扩声方法、系统、设备及介质,解决了在课堂教学时,声音杂乱,扩声受干扰影响大的问题。

3、技术方案

4、为解决上述问题,本发明采用如下的技术方案。

5、一种基于ai的降噪扩声方法,包括采用预设方式获取课程信息,将课程信息转化为课程文字信息;使用收音装置采集声音信息,将声音信息转化为声音文字信息;采用ai识别模型,将课程文字信息与声音文字信息进行比对,滤除与课程文字信息不匹配的声音文字信息对应的声音信息,保留课程声音;对课程声音扩声。

6、在新一实施例中,所述采用预设方式获取课程信息,将课程信息转化为课程文字信息包括:从外接设备上获取课程信息;将课程信息转化为图片或文档;识别图片或文档中的文字,并将识别出的文字视为课程文字信息。

7、在新一实施例中,所述将课程文字信息与声音文字信息进行比对包括:将课程文字信息和声音文字信息成句进行比较;采用ai识别模型,将课程文字信息与声音文字信息比较,选出声音文字信息中与本句课程文字信息不同的句子;将不同的句子中的不同的词语与当前课程文字信息中的对应位置的词语进行比较是否为近义词;若为近义词,则视为课程文字信息与声音文字信息匹配;若不为近义词,则视为课程文字信息与声音文字信息不匹配。

8、在新一实施例中,所述滤除与课程文字信息不匹配的声音文字信息对应的声音信息,保留课程声音包括:针对与课程文字信息不匹配的声音进行降噪;将降噪处理后的声音视为课程声音。

9、在新一实施例中,所述从外接设备上获取课程信息包括:获取外接设备中的全部课程信息,并根据课程信息内容更新时间,获取最近时间更新的课程信息,其中,外接设备包括移动硬盘、手机、笔记本电脑中的任意一种。

10、在新一实施例中,所述将课程信息转化为图片或文档包括:将最近更新的课程信息转化为图片或文档,所述文档为word文档或pdf文档。

11、在新一实施例中,所述将课程文字信息与声音文字信息进行比对还包括:将近义词和当前课程文字信息导入数据库,并在下次比对过程中,选取数据库中的当前课程文字信息进行比对。

12、一种基于ai的降噪扩声系统,包括:课程转换模块,用于采用预设方式获取课程信息,将课程信息转化为课程文字信息;声音转换模块,用于使用收音装置采集声音信息,将声音信息转化为声音文字信息;比对模块,使用收音装置采集声音信息,将声音信息转化为声音文字信息;扩声模块,对课程声音扩声。

13、一种电子设备,包括:存储器,用于存储由电子设备的一个或多个处理器执行的指令,以及处理器,是电子设备的处理器之一,用于执行上述的降噪扩声方法。

14、一种可读介质,所述可读介质上存储有指令,该指令在电子设备上执行时使电子设备执行上述的降噪扩声方法。

15、有益效果

16、相比于现有技术,本发明的优点在于:

17、(1)能够根据讲课课程的ppt等文件中的文字与教师发出声音的文字进行比对,这样老师的文字被识别出,而杂音,比如学生的私语,室外的鸟鸣等声音都能够被滤除,这样只有老师的声音被保留下来,然后针对老师的声音进行扩声,能够消除杂音,保证学生能够听的更加清楚。

18、(2)通过将课程文字与声音文字信息进行近义词的替换,这样即使老师讲课时,说的文字与准备的课件中的文字并不完全对应,也能够将其视为相同的句子,这样能够提高在识别老师文字课件的准确性,提高扩声的精确度。

技术特征:

1.一种基于ai的降噪扩声方法,其特征在于,包括:

2.根据权利要求1所述的降噪扩声方法,其特征在于,所述采用预设方式获取课程信息,将课程信息转化为课程文字信息包括:

3.根据权利要求1所述的降噪扩声方法,其特征在于:所述将课程文字信息与声音文字信息进行比对包括:

4.根据权利要求1所述的降噪扩声方法,其特征在于:所述滤除与课程文字信息不匹配的声音文字信息对应的声音信息,保留课程声音包括:

5.根据权利要求2所述的降噪扩声方法,其特征在于:所述从外接设备上获取课程信息包括:

6.根据权利要求5所述的降噪扩声方法,其特征在于:所述将课程信息转化为图片或文档包括:

7.根据权利要求3所述的降噪扩声方法,其特征在于,所述将课程文字信息与声音文字信息进行比对还包括:

8.一种基于ai的降噪扩声系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种可读介质,其特征在于,所述可读介质上存储有指令,该指令在电子设备上执行时使电子设备执行权利要求1至7中任一项所述的降噪扩声方法。

技术总结本发明公开了一种基于AI的降噪扩声方法、系统、设备及介质,属于降噪扩声领域,包括采用预设方式获取课程信息,将课程信息转化为课程文字信息;使用收音装置采集声音信息,将声音信息转化为声音文字信息;采用AI识别模型,将课程文字信息与声音文字信息进行比对,滤除与课程文字信息不匹配的声音文字信息对应的声音信息,保留课程声音;对课程声音扩声。本发明在使用过程中,只有老师的声音被保留下来,然后针对老师的声音进行扩声,能够消除杂音,保证学生能够听的更加清楚。技术研发人员:任军军,孙云云,陈飞霞,罗浩受保护的技术使用者:杭州艾力特数字科技有限公司技术研发日:技术公布日:2024/3/4

本文地址:https://www.jishuxx.com/zhuanli/20240618/22043.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。