一种音译方法及电子设备与流程
- 国知局
- 2024-06-21 11:33:49
本技术涉及计算机,尤其涉及一种音译方法及电子设备。
背景技术:
1、音译是指根据源语言信息的发音在目标语言中寻找发音相近的信息进行替代翻译,例如用发音相近的汉字将英语翻译过来。音译通常用于人名,地名,国名,舶来词,文学著作、电影、音乐等作品的名称等信息的翻译。
2、但是,用户使用电子设备的音译功能时,电子设备往往只能逐音逐节的翻译,返回给用户的音译结果单一、质量不高,很可能无法满足用户的音译需求。
技术实现思路
1、本技术公开了一种音译方法及电子设备,能够提升音译结果的质量,并且可以一次性返回多个音译结果以供用户参考,有效满足用户的音译需求。
2、第一方面,本技术提供一种音译方法,应用于电子设备,该方法包括:接收用户输入的第一语言的第一信息;对所述第一信息进行音译并得到第二语言的多个第二信息,所述多个第二信息包括第三信息和第四信息,所述第三信息和所述第四信息的长度不同;显示所述多个第二信息。
3、例如,第一信息为“harmony”,多个第二信息包括长度为2的“鸿蒙”和“哈梦”,以及长度为3的“哈莫尼”。
4、在上述方法中,电子设备音译第一信息时,可以一次性输出多个长度不同的音译结果(即多个第二信息)以供用户参考,因此,可供用户选择的音译结果的范围大大提升,增加了用户获取到所需音译结果的概率,有效满足用户的音译需求。
5、在一种可能的实现方式中,所述第一信息为企业名称、品牌名称、商标名称、产品名称、人名、地名、国名、舶来词、文学著作的名称、电影的名称、音乐的名称或者音译热词。
6、在上述方法中,上述类型的第一信息和通常翻译的句子不同,对于通常翻译的句子,若是逐音逐节音译并返回单一音译结果,很可能是符合用户需求的(因为人工音译往往也是这样的),但是对于上述类型的第一信息,人工音译通常会使用谐音转换、清/浊辅音转换、首音优化、尾音省略等音译技巧,并且不同用户和/或不同场景下,即使是同一个第一信息,用户所需的音译结果也可能是不同的,因此,若是逐音逐节音译并返回单一音译结果,很可能无法满足用户的音译需求。本技术中,电子设备一次性输出多个长度不同的音译结果以供用户选择,可以满足不同用户和/或不同场景下的个性化需求,提升用户体验。
7、在一种可能的实现方式中,所述方法还包括:接收用户输入的第三语言的第五信息;对所述第五信息进行直译或者意译并得到第四语言的第六信息;对所述第六信息进行音译并得到所述第三语言的至少一个第七信息;显示所述至少一个第七信息。
8、例如,第五信息为“基因膝盖领带五月”,第六信息为“genekneetiemay”,至少一个第七信息包括“鸡你太美”。
9、在上述方法中,电子设备可以先对第五信息进行直译或者意译,然后再对翻译结果进行音译,可以很好地适用于一些特定场景(例如第五信息为音译热词),满足用户的个性化需求。
10、在一种可能的实现方式中,所述显示所述多个第二信息之前,所述方法还包括:判断所述第二信息是否包括黑名单中的字符;当所述第二信息包括黑名单中的第一字符时,将所述第二信息中的所述第一字符替换为白名单中的第二字符,所述第二字符是所述白名单中和所述第一字符的发音相似度大于或等于第一阈值的字符。
11、在一些示例中,白名单包括寓意好的吉利字(例如“美”、“斯”)和实际可用于音译的字符,例如企业名称、品牌名称、商标名称、产品名称、人名、地名、国名、舶来词、文学著作的名称、电影的名称、音乐的名称以及音译热词。黑名单包括寓意不好的晦气字(例如“没”、“死”)和实际不用于音译的字符。
12、在上述方法中,电子设备可以使用白名单中的字符替换掉第二信息中属于黑名单的字符,例如,使用吉利字替换掉晦气字,音译结果的内容高度可控,更加符合人工音译的习惯,进一步提升音译结果的质量。
13、在一种可能的实现方式中,所述方法还包括:接收用户输入的第一指令,所述第一指令用于指示所述第一信息的音译结果中的第一个字符为第三字符;所述多个第二信息是基于所述第一指令确定的,所述第二信息中的第一个字符为所述第三字符。
14、在上述方法中,用户可以自定义音译结果的首字,音译结果的内容高度可控,可以满足用户的个性化需求,提升用户体验。
15、在一种可能的实现方式中,所述方法还包括:接收用户输入的第二指令,所述第二指令用于指示所述第一信息的音译结果中的最后一个字符为第四字符;所述多个第二信息是基于所述第二指令确定的,所述第二信息中的最后一个字符为所述第四字符。
16、在上述方法中,用户可以自定义音译结果的尾字,音译结果的内容高度可控,可以满足用户的个性化需求,提升用户体验。
17、在一种可能的实现方式中,所述方法还包括:接收用户输入的第三指令,所述第三指令用于指示所述第一信息对应的音译结果包括第五字符;所述多个第二信息是基于所述第三指令确定的,所述第二信息包括所述第五字符。
18、在上述方法中,用户可以自定义音译结果的包含字,音译结果的内容高度可控,可以满足用户的个性化需求,提升用户体验。
19、在一种可能的实现方式中,所述对所述第一信息进行音译并得到第二语言的多个第二信息,包括:对所述第一信息进行音译并得到所述第二语言的第八信息;将所述第八信息中的第六字符替换为所述第三指令指示的所述第五字符,所述第二信息为替换后的所述第八信息,所述第六字符为所述第八信息中和所述第五字符的发音相似度最大的字符。
20、在上述方法中,电子设备可以将音译的第八信息中和用户指定字符发音最相似的第六字符,替换为用户指定字符,而不是将预设位置的字符替换为用户指定字符,在满足用户个性化需求的同时保证了音译结果的质量,提升用户体验。
21、在一种可能的实现方式中,所述方法还包括:接收用户输入的第五语言的第九信息,接收用户输入的第一长度;对所述第九信息进行音译并得到第六语言的至少一个第十信息,所述第十信息的长度为所述第一长度;显示所述至少一个第十信息。
22、在上述方法中,用户可以自定义音译结果的长度,音译结果的长度高度可控,可以满足用户的个性化需求,提升用户体验。
23、在一种可能的实现方式中,所述对所述第一信息进行音译并得到第二语言的多个第二信息,包括:使用发音嵌入层将所述第一信息映射为第十一信息,所述第十一信息和第十二信息的距离大于所述第十一信息和第十三信息的距离,所述第十一信息和所述第十二信息的发音相似度大于所述第十一信息和所述第十三信息的发音相似度;将所述十一信息作为音译模型的输入获取输出,所述输出为所述多个第二信息。
24、在一种可能的实现方式中,所述发音嵌入层是基于多个语句训练得到的,所述多个语句包括第一语句和第二语句,所述第一语句和所述第二语句均包括n个单词,所述第一语句中的第i个单词和所述第二语句中的第i个单词的发音相似度小于或等于第二阈值,n为正整数,i为小于或等于n的正整数。
25、例如,第十一信息为高维向量。
26、在上述方法中,发音嵌入层是基于多个发音相似和/或相同的语句训练得到的,经发音嵌入层映射得到的信息之间的距离是根据发音相似度确定的,而不是根据语义相似度确定的,充分考虑到了音译需求和直译和/或意译需求的差异,而音译模型的输入是经发音嵌入层映射得到的信息,因此大大方便了音译模型学习发音拆分和组合规则,让音译模型可以充分捕捉到谐音转换、清/浊辅音转换、首音优化、尾音省略等音译技巧,减少自动音译和人工音译之间的质量差距。
27、第二方面,本技术实施例提供了一种电子设备,包括收发器、处理器和存储器;上述存储器用于存储计算机程序,上述处理器调用上述计算机程序,用于执行本技术实施例第一方面以及第一方面的任意一种实现方式提供的音译方法。
28、第三方面,本技术实施例提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,该计算机程序被处理器执行时,用于执行本技术实施例第一方面以及第一方面的任意一种实现方式提供的音译方法。
29、第四方面,本技术实施例提供了一种计算机程序产品,当该计算机程序产品在电子设备上运行时,使得该电子设备执行本技术实施例第一方面以及第一方面的任意一种实现方式提供的音译方法。
30、第五方面,本技术实施例提供一种电子设备,该电子设备包括执行本技术任一实施例所介绍的方法或装置。上述电子设备例如为芯片。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22263.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。