基于单火面板的语音识别控制系统的制作方法
- 国知局
- 2024-06-21 11:37:19
本发明涉及自动控制,尤其涉及一种基于单火面板的语音识别控制系统。
背景技术:
1、基于单火面板的控制系统是一种能实现智能家居设备控制的技术,通过在家庭电路中集成智能化的单火面板,能够远程监测和控制家电设备的电力使用情况。所使用技术包括电力监测、远程控制、物联网技术等领域,为用户提供便捷、高效、安全的智能家居控制体验。
2、公开号cn112735416a的专利公开了一种单火线离线语音控制开关面板及控制方法,包括主控模块,以及连接至主控模块的单火取电模块、按键输入模块、语音输入模块、指示模块和控制信号输出模块,单火取电模块用于给弱电系统供电;按键输入模块长按模式和短按模式,分别用于直接输入控制信号和语音指令的学习;语音输入模块在没有按键信息时输入开关控制信号,长按模式时用于输入学习指令;主控模块用于处理按键、语音信息,并输出控制信号给输出模块;指示模块用于指示开关及指令学习状态;控制信号输出模块包括电磁继电器主体及驱动电路,用于控制灯具等外接设备的通断,无需外接零线,也无需网关,能够方便、快捷地实现灯具等外接设备的离线语音控制;
3、此发明的语音识别技术能够受到环境噪声、语音质量等因素的影响,从而影响语音指令的准确性和识别率,如果语音识别不准确,能够导致控制指令的误操作或执行错误。
技术实现思路
1、为此,本发明提供一种基于单火面板的语音识别控制系统,用以克服现有技术中语音识别不准确能够导致控制指令的误操作或执行错误的问题。
2、为实现上述目的,本发明提供一种基于单火面板的语音识别控制系统,包括:
3、语音识别主控电路,其与电压转换电路串联,用于接收、处理和执行语音指令;
4、开关电路,其与电压转换电路串联,用于控制电路中电流的流动;
5、所述电压转换电路,其分别与所述开态取电电路和所述闭态取电电路串联,并与所述开关电路和所述语音识别主控电路分别串联,用于将开态取电电路和闭态取电电路的电压转换成工作电压和将开态取电电路和闭态取电电路的输出电压进行隔离后,再给开关电路和语音识别主控电路供电;
6、开态取电电路,其与闭态取电电路并联,用于开态取电模式的运行;
7、所述闭态取电电路,其与所述开态取电电路并联,用于闭态取电模式的运行。
8、进一步地,所述语音识别主控电路内设有语音识别芯片,所述语音识别芯片通过初始化,构建能够用于语音识别、方言声纹识别的卷积神经网络,对接收的语音指令进行处理;
9、进一步地,所述语音识别芯片初始化方法包括以下步骤:
10、s1、所述语音识别芯片进行复位;
11、s2、所述电源管理芯片检测电压是否正常,若电压不正常则复位至电压正常;
12、s3、若电压正常则检测是否有闪存,若有闪存,则检测闪存中是否有能用固件,若有能用固件则直接加载固件;若没有闪存,则等待从电路外部加载固件,待固件加载后,则运行固件;
13、s4、加载卷积神经网络模型和参数;
14、s5、关键字识别。
15、进一步地,所述步骤s4中的卷积神经网络模型为deepspeech模型,所述语音识别芯片使用编程语言和tensorflow深度学习库定义模型的结构,所述deepspeech模型包括声学模型和语言模型,便于识别方言类的语音数据。
16、进一步地,所述加载完成的deepspeech模型结构如下:
17、输入层:接受音频特征作为输入,音频被转换为时域上的频谱图形式;
18、卷积层:使用一维卷积操作,对音频特征进行卷积运算,以提取时间和频率相关的特征,卷积核为3×3,步长为1;
19、池化层:2×2池化核,步长为2,通过池化操作减小特征图的长度,减少参数数量,同时保留重要的时间相关特征;
20、多个卷积层和池化层:堆叠3个卷积层和池化层,提取更高级的特征;
21、全连接层:将最后一层特征图展平为一维向量,连接到全连接层,全连接层通常用于分类或回归任务;
22、输出层:使用ctc损失函数将语音指令的特征序列映射到对应的词序列。
23、进一步地,所述关键字识别,包括:
24、s51、特征提取,针对包含方言的语音指令数据,所述语音识别芯片使用mfcc算法将语音指令转换为特征矢量,
25、所述语音识别芯片将提取的方言的特征矢量进行音素对齐,将特征矢量对齐到所述原始语音指令中的音素,音素对齐的目的是将特征矢量与对应的音素进行时间对齐,以便在后续的语音识别过程中准确识别每个音素;
26、s52、模型训练:所述语音识别芯片选择所述deepspeech模型,并使用带有方言的训练数据集对所述deepspeech模型中的所述声学模型和所述语言模型进行训练,训练数据包含含有关键字的示例和不含关键字的示例;
27、所述语音识别芯片合成或增加方言语音数据,增加训练数据集中方言数据的样本数量;
28、s53、模型评估:所述语音识别芯片使用独立于训练数据的测试数据集对模型进行评估,计算关键字识别的准确率、召回率、f1得分,根据评估结果,对模型进行调整和改进,
29、准确率表示正确预测的样本在所有样本中的比例,准确率值接近1表示模型的预测结果与真实结果吻合度高;
30、召回率表示真实关键字被正确预测为关键字的比例,也能够理解为覆盖了多少真实关键字,召回率值接近1表示模型能够精准识别出真实正例;
31、f1得分是准确率和召回率的综合指标,它综合了准确率和召回率的性能,f1得分值接近1表示模型的综合性能好;
32、若三个值不合格,则所述语音识别芯片通过调整深度神经网络的层数和节点数对模型进行调整,直至模型评估性能合格;
33、s54、预测和应用:完成模型训练和评估后,将训练好的deepspeech模型用于关键字识别的实际应用,deepspeech模型中的声学模型根据特征矢量和音素序列计算每个音素的概率分布,语言模型根据先验知识指导对能够的词序列进行评分。
34、进一步地,所述准确率值为真阳性和真阴性之和比上真阳性、假阳性、真阴性和假阴性之和;
35、所述召回率值为真阳性比上真阳性和假阴性之和;
36、f1得分值为准确率和召回率的乘积比上准确率和召回率之和的两倍;
37、所述真阳性为模型将关键字正确地预测为关键字的样本数量;
38、所述假阳性为模型错误地将非关键字预测为关键字的样本数量;
39、所述真阴性为模型将非关键字正确地预测为非关键字的样本数量;
40、所述假阴性为模型错误地将关键字预测为非关键字的样本数量。
41、进一步地,所述电压转换电路采用二极管作为隔离电路器件。
42、进一步地,所述闭态取电模式的取电电路设计采用超低待机功耗的恒压驱动芯片方案;
43、当主电源供电稳定时,所述闭态取电模式自动切换至开态取电模式,所述开态取电模式运行,市电电压落在灯两端,开态取电电路与开关电路串联在灯回路中,开关电路处于吸合状态,火线和灯线之间的电压差为零,闭态取电回路失效,所述电压转换电路通过开态取电电路在灯串联回路中增加取电回路。
44、进一步地,所述电压转换电路采用能够同步降压的电压转换器将所述开态取电电路和闭态取电电路的电压转换成工作电压。
45、与现有技术相比,本发明的有益效果在于,本发明采用了带有神经网络模型和的语音识别芯片和低功耗电路方案的语音识别技术,神经网络模型具有较高的识别准确度和泛化能力,能够更加准确地识别语音指令,同时,低功耗电路方案降低了系统的能耗,提高了系统的稳定性和可靠性,使得本发明的语音识别控制系统更具高效性、准确性和可靠性,进一步提升了用户的使用体验和系统的性能。
46、进一步地,本发明所使用的卷积神经网络模型在语音识别领域具有自动特征学习、局部感知能力、参数共享、并行计算、鲁棒性和泛化能力,以及良好的可扩展性等优点,被广泛应用于语音识别任务中。
47、进一步地,本发明在电路转换过程中,较少的能量被浪费,电路可以更有效地工作,节省能源和延长工作寿命,确保电路始终工作在稳定和可靠的状态下,这种稳定性对于设备的正常运行至关重要,确保芯片和其他元件在合适的电压下进行工作,从而提高性能和可靠性,这使得该方案可以适用于各种不同的电源系统和电压级别,提供了更大的灵活性,无论是在工业设备、通信系统还是消费电子产品中,本发明的电路方案都能适应不同的应用场景,满足不同电压转换需求。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22493.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。