一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音翻译文本校正系统、方法、装置及设备与流程

2021-11-03 12:54:00 来源:中国专利 TAG:

技术特征:
1.一种语音翻译文本校正系统,其特征在于,包括:服务端,用于确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后的第一子句文本,确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端;客户端,用于实时采集语音流数据,发送语音流数据;以及,显示所述文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。2.一种语音翻译文本校正方法,其特征在于,包括:确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;接收客户端发送的人工校正后的第一子句文本;确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端。3.根据权利要求2所述的方法,其特征在于,还包括:对第一子句文本执行校正处理,作为校正后的第三子句文本;所述确定与第一子句文本对应的目标语言的第二子句文本,包括:确定与第三子句文本对应的所述第二子句文本。4.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:对所述第一子句文本执行方言校正处理。5.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:根据实体词替换规则信息,对第一子句文本执行实体词替换处理。6.根据权利要求5所述的方法,其特征在于,所述实体词替换规则包括:人名替换规则,企业实体名替换规则。7.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:根据黑名单过滤规则信息,对第一子句文本执行黑名单过滤处理。8.根据权利要求2所述的方法,其特征在于,还包括:对第二子句文本执行校正处理。9.根据权利要求2所述的方法,其特征在于,还包括:根据热词信息,优化语音识别模型和/或语音翻译模型。10.根据权利要求2所述的方法,其特征在于,还包括:确定所述第二子句文本包括的译文不确定的词、及所述译文不确定的词的多个候选译文词;向客户端发送所述译文不确定的词和候选译文词,以便于客户端用户根据候选译文词,修改所述译文不确定的词。11.根据权利要求10所述的方法,其特征在于,根据相似词表,确定所述译文不确定的词和所述多个候选译文词。12.一种语音翻译文本校正方法,其特征在于,包括:
实时采集语音流数据,将语音流数据发送至服务端;显示服务端回送的与语音流数据对应的源语言的文本片段;确定人工校正后的第一子句文本,将第一子句文本发送至服务端;显示服务端回送的与第一子句文本对应的目标语言的第二子句文本。13.根据权利要求12所述的方法,其特征在于,还包括:确定与第二子句文本对应的人工校正后的第三子句文本;将显示的第二子句文本更新为第三子句文本。14.根据权利要求12所述的方法,其特征在于,通过第一显示装置,执行人工校正原文处理;通过第二显示装置,显示与语音进度对应的源语言文本和目标语言文本。15.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:确定第一显示装置中第二显示装置已经显示完成的源语言的历史文本;将第一显示装置显示的所述已经显示完成的源语言的历史文本调整为第三显示属性。16.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据调整的标点符号,调整所述第一子句文本。17.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据单步回退指令,还原单步修改前的文本。18.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据句子回退指令,还原修改前的句子文本。19.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:以句子隔离方式,显示各个句子文本。20.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:以第一显示属性显示光标聚焦的句子文本,以第二显示属性显示非光标聚焦的句子文本。21.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:若执行文本选取操作,则显示文本处理快捷操作选项。22.根据权利要求21所述的方法,其特征在于,所述文本处理快捷操作选项包括:添加热词选项,添加实体词替换规则选项,人称代词快速切换选项,标点符号快速切换选项,划选文本区域删除选项,整句删除选项。23.根据权利要求13所述的方法,其特征在于,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:以句子隔离方式,显示各个句子文本。
24.根据权利要求13所述的方法,其特征在于,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:以第一显示属性显示光标聚焦的目标语言的句子文本,以第二显示属性显示非光标聚焦的目标语言的句子文本。25.根据权利要求24所述的方法,其特征在于,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:确定与光标聚焦的目标语言的句子文本对应的源语言的句子文本;以第一显示属性显示所述源语言的句子文本。26.根据权利要求24所述的方法,其特征在于,所述第一显示属性包括:高亮显示;所述第二显示属性包括:非高亮显示。27.根据权利要求13所述的方法,其特征在于,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:根据句子删除指令,删除句子文本。28.根据权利要求13所述的方法,其特征在于,通过第一显示装置,执行人工校正译文处理;通过第二显示装置,显示与语音进度对应的源语言文本和目标语言文本;所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:确定第一显示装置中第二显示装置已经显示完成的目标语言的历史文本;将第一显示装置显示的目标语言的历史文本调整为第三显示属性。29.根据权利要求13所述的方法,其特征在于,还包括:确定语音流数据的音量增益;根据音量增益和音量增益阈值,调整语音流数据的音量增益。30.根据权利要求12所述的方法,其特征在于,还包括:以句子对齐方式,显示源语言的第一子句文本和目标语言的第二子句文本。31.根据权利要求2所述的方法,其特征在于,还包括:接收服务端发送的所述第二子句文本包括的译文不确定的词、及所述译文不确定的词的多个候选译文词;根据候选译文词,修改所述译文不确定的词。32.一种语音翻译文本校正装置,其特征在于,包括:语音识别单元,用于确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;数据接收单元,用于接收客户端发送的人工校正后的第一子句文本;语音翻译单元,用于确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端。33.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储实现语音翻译文本校正方法的程序,该设备通电并通过所述处理器运行该方法的程序后,执行下述步骤:确定与客户端实时采集的语音流数据对应的源语言
的文本片段,将文本片段发送至客户端;接收客户端发送的人工校正后的第一子句文本;确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端。34.一种语音翻译文本校正装置,其特征在于,包括:语音数据采集及发送单元,用于实时采集语音流数据,将语音流数据发送至服务端;原文显示单元,用于显示服务端回送的与语音流数据对应的源语言的文本片段;原文校正单元,用于确定人工校正后的第一子句文本,将第一子句文本发送至服务端;译文显示单元,用于显示服务端回送的与第一子句文本对应的目标语言的第二子句文本。35.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储实现语音翻译文本校正方法的程序,该设备通电并通过所述处理器运行该方法的程序后,执行下述步骤:实时采集语音流数据,将语音流数据发送至服务端;显示服务端回送的与语音流数据对应的源语言的文本片段;确定人工校正后的第一子句文本,将第一子句文本发送至服务端;显示服务端回送的与第一子句文本对应的目标语言的第二子句文本。36.一种语音翻译文本校正系统,其特征在于,包括:服务端,用于确定与语音数据播放进度对应的源语言的文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后的第一子句文本,确定与第一子句文本对应的目标语言的第二子句文本;客户端,用于播放所述语音数据,显示文本片段,确定第一子句文本,发送第一子句文本。37.一种语音翻译文本校正方法,其特征在于,包括:确定与语音数据播放进度对应的源语言的文本片段,将文本片段发送至客户端;接收客户端发送的人工校正后的第一子句文本;确定与第一子句文本对应的目标语言的第二子句文本。38.根据权利要求37所述的方法,其特征在于,还包括:将第二子句文本发送至客户端,以便于对第二子句文本执行人工校正处理。39.一种语音翻译文本校正方法,其特征在于,包括:播放语音数据;显示服务端发送的与语音数据播放进度对应的源语言的文本片段;确定第一子句文本,将第一子句文本发送至服务端,以使得服务端确定与第一子句文本对应的目标语言的第二子句文本。40.根据权利要求39所述的方法,其特征在于,还包括:显示服务端发送的第二子句文本;确定与对第二子句文本对应的人工校正后的第二子句文本。

技术总结
本申请公语音翻译文本校正系统、方法、装置及相关设备。其中,所述系统通过服务端确定与客户端实时采集的语音流数据对应的源语言文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后第一子句文本,确定与第一子句文本对应的目标语言第二子句文本,将第二子句文本发送至客户端;客户端实时采集语音流数据,发送语音流数据;以及,显示文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。采用这种处理方式,使得随着实时语音识别进度,对原文子句文本进行人工校正,并在一句话识别完成前,对经过人工校正的原文子句文本进行翻译,实现子句粒度的翻译文本校正处理;因此,可以有效提升校正效率和校正质量。和校正质量。和校正质量。


技术研发人员:曹宇
受保护的技术使用者:阿里巴巴集团控股有限公司
技术研发日:2020.04.30
技术公布日:2021/11/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献