一种基于大数据的语言翻译方法及系统
- 国知局
- 2024-07-31 22:35:57
本发明涉及电数字数据处理,具体为一种基于大数据的语言翻译方法及系统。
背景技术:
1、随着全球化的进行,跨语言交流对于商业、科技、文化等各个领域都变得越来越重要,通过翻译技术,可以轻松地获取外语资料、新闻、学术论文等,增强信息获取能力,对于跨国企业以及国际合作项目来说,语言翻译技术可以提高工作效率,能够快速、准确地翻译商务文件、合同、会议记录等,节省了大量的时间和人力成本。
2、现有技术如公告号为:cn106537373b的发明专利公告的一种语言内容翻译,包括:在翻译服务器处接收来自请求设备的针对与令牌和第一语言相关联的文本数据的翻译服务请求;在令牌匹配先前处理过的令牌的情况下,在翻译服务器处获取来自翻译数据库的、使用第二语言的文本数据的翻译版本,所述翻译数据库存储自动翻译文本数据和手动翻译文本数据;在令牌不匹配先前处理过的令牌的情况下,在翻译服务器处获取来自自动翻译服务的使用第二语言的文本数据的翻译版本;在翻译服务器处获取来自手动翻译服务的使用第二语言的文本数据的翻译版本;以及在翻译服务器处向请求设备传输自动翻译文本数据和手动翻译文本数据中的一个或多个。
3、现有技术如公告号为:cn102722479b的发明专利公告的一种实现语言翻译的方法及装置。该方法包括:解析获取待翻译项目文件中的文本内容的编码信息;根据获取的编码信息读取项目文件文本内容,分别提取需要翻译的文本内容以及不需翻译的文本内容形成文字翻译模式;确定文字翻译模式库中未存储的文字翻译模式,为该文字翻译模式分配标识;展示文字翻译模式,获取需要翻译的文本内容对应的多语言翻译结果,建立多语言翻译结果与分配的标识的映射关系,并存储;将获取的多语言翻译结果分别与提取的不需翻译的文本内容进行合并,得到相应语言版本的项目文件。
4、结合上述方案发现,当前在语言翻译技术领域中,通常只是对文本语言的翻译进行分析,由于文本语言翻译会受到翻译模型的影响,可能会影响翻译结果的准确性,导致翻译结果不准确、丢失重要信息,会影响后续文本语言翻译结果的阅读。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于大数据的语言翻译方法及系统,能够有效解决上述背景技术中涉及的问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种基于大数据的语言翻译方法,包括将语言翻译软件的语言翻译流程划分为口语输出翻译识别阶段和文本翻译转化阶段。
3、对语言翻译软件的口语输出翻译识别阶段进行监测,并分析语言翻译软件的口语翻译识别质量表征值,由此对语言翻译软件的口语翻译识别进行优化预提醒。
4、对语言翻译软件的文本翻译转化阶段进行监测分析,并基于语言翻译软件的口语翻译识别质量表征值,构建语言翻译软件的口语翻译识别的表征修正系数,由此处理得到语言翻译软件的质量指标。
5、根据所述语言翻译软件的质量指标,对语言翻译模型进行调整。
6、进一步地,所述对语言翻译软件的口语输出翻译识别阶段进行监测,具体过程为:提取语言翻译软件的正确识别的文本的数量和总输入文本的数量,将语言翻译软件正确识别的文本的数量和总输入文本的数量的比率作为语言翻译软件的识别准确率,结合语言翻译软件的识别流畅度评分,综合分析得到语言翻译软件的口语翻译识别质量表征值。
7、进一步地,所述对语言翻译软件的口语翻译识别进行优化预提醒,具体过程为:将语言翻译软件的口语翻译识别质量表征值与设定的语言翻译软件的口语翻译识别质量表征阈值进行对比,若语言翻译软件的口语翻译识别质量表征值低于设定的语言翻译软件的口语翻译识别质量表征阈值,则进行优化预提醒。
8、进一步地,所述对语言翻译软件的文本翻译转化阶段进行监测分析,具体分析过程为:获取语言翻译软件的翻译结果和参考翻译,统计语言翻译软件的翻译结果和参考翻译之间的编辑次数,统计参考翻译的总词数,将编辑次数除以参考翻译的总词数的比率作为语言翻译软件的翻译错误率。
9、布置监测周期,在监测周期中监测提取语言翻译软件的文本输入到输出翻译结果的时间,并统计输出翻译结果的文本的长度,综合分析得到语言翻译软件的翻译速度。
10、结合语言翻译软件的翻译错误率和翻译速度,并统计语言翻译软件的双语评价词数比,综合分析得到语言翻译软件的文本翻译转化质量表征值。
11、进一步地,所述构建语言翻译软件的口语翻译识别的表征修正系数,具体过程为:若语言翻译软件的口语翻译识别质量表征值低于设定的语言翻译软件的口语翻译识别质量表征阈值,则将语言翻译软件的口语翻译识别质量表征阈值与语言翻译软件的口语翻译识别质量表征值的差值作为语言翻译软件的口语翻译识别的表征修正系数。
12、进一步地,所述处理得到语言翻译软件的质量指标,具体过程为:根据语言翻译软件的文本翻译转化质量表征值和语言翻译软件的口语翻译识别的表征修正系数,通过加权分析得到语言翻译软件的质量指标。
13、所述语言翻译软件的质量指标是对语言翻译软件的语言翻译流程进行分析得到数值量化结果,用于综合量化语言翻译软件的翻译准确程度。
14、进一步地,所述对语言翻译模型进行调整,具体过程为:将语言翻译软件的质量指标与设定的语言翻译软件的质量指标阈值进行比对,若语言翻译软件的质量指标低于设定的语言翻译软件的质量指标阈值,则将语言翻译软件的质量指标阈值与语言翻译软件的质量指标的差值记为语言翻译软件的修正指标。
15、若语言翻译软件的修正指标高于或等于设定的语言翻译软件的修正指标阈值,则将该语言翻译模型记为异常模型,并更改语言翻译模型。
16、若语言翻译软件的修正指标小于设定的语言翻译软件的修正指标阈值,则基于大数据对该语言翻译模型的参数进行调整。
17、进一步地,所述语言翻译软件的文本翻译转化质量表征值,具体分析条件为:
18、;式中,表示语言翻译软件的文本翻译转化质量表征值,表示语言翻译软件的翻译错误率,表示设定的界定翻译错误率,表示设定的翻译错误率对应的影响因子,表示语言翻译软件的翻译速度,表示设定的界定翻译速度,表示设定的翻译速度对应的影响因子,表示语言翻译软件的双语评价词数比,表示设定的界定双语评价词数比,表示设定的双语评价词数比对应的影响因子,表示自然常数。
19、进一步地,所述语言翻译软件的质量指标,具体分析条件为:
20、;式中,表示语言翻译软件的质量指标,表示语言翻译软件的文本翻译转化质量表征值,表示设定的文本翻译转化质量表征值对应的权重因子,表示语言翻译软件的口语翻译识别的表征修正系数,表示设定的口语翻译识别的表征修正系数对应的权重因子。
21、本发明第二方面提供了一种基于大数据的语言翻译系统,包括:流程划分模块,用于将语言翻译软件的语言翻译流程划分为口语输出翻译识别阶段和文本翻译转化阶段。
22、口语输出翻译识别模块,用于对语言翻译软件的口语输出翻译识别阶段进行监测,并分析语言翻译软件的口语翻译识别质量表征值,由此对语言翻译软件的口语翻译识别进行优化预提醒。
23、文本翻译转化模块,用于对语言翻译软件的文本翻译转化阶段进行监测分析,并基于语言翻译软件的口语翻译识别质量表征值,构建语言翻译软件的口语翻译识别的表征修正系数,由此处理得到语言翻译软件的质量指标。
24、语言翻译模型调整模块,用于根据所述语言翻译软件的质量指标,对语言翻译模型进行调整。
25、本发明具有以下有益效果:
26、(1)本发明提供一种基于大数据的语言翻译方法及系统,首先对语言翻译流程进行划分,对口语输出翻译识别阶段进行监测分析,得到口语翻译识别质量表征值,可以识别口语翻译的准确性和流畅性,然后对文本翻译转化阶段进行监测分析,得到语言翻译软件的质量指标,有助于识别翻译中可能存在的问题,从而优化文本翻译质量,可以提升翻译的准确性和自然度,进而根据质量指标对语言翻译模型进行调整,可以不断优化翻译效果。
27、(2)本发明通过分析得到语言翻译软件的口语翻译识别质量表征值,有助于更准确地评估语言翻译软件的质量指标,可以发现语言翻译软件翻译过程中可能存在的问题,进而提高语言翻译软件整体翻译的性能和可靠性,提高语言翻译软件翻译的准确性和效率。
28、(3)本发明通过分析得到语言翻译软件的文本翻译转化质量表征值,有助于评估语言翻译软件在不同语境下的翻译准确性,从而进行后续调整,可以提高语言翻译软件对不同语言环境的适应能力,增强语言翻译软件的适应性和灵活性,从而提高语言翻译准确性。
29、(4)本发明根据语言翻译软件的质量指标,对语言翻译模型进行调整,有助于改进语言翻译软件的模型,从而提高语言翻译准确性和流畅度,有助于生成更加自然、准确的翻译结果,对语言翻译模型进行调整可以优化语言翻译软件的性能。通过调整模型参数等方式,可以提高翻译速度和效率,提高语言翻译软件的高效性和可靠性。
30、当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
本文地址:https://www.jishuxx.com/zhuanli/20240731/193791.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表