一种网页转换方法、装置、设备、介质及产品与流程
- 国知局
- 2024-11-21 11:40:30
本技术属于物联网,尤其涉及一种网页转换方法、装置、设备、介质及产品。
背景技术:
1、随着网络技术的发展以及世界的扁平化发展,网络传递信息的范围不再局限于一城一地。当一个信息需要基于网页在不同的文化环境中进行准确地传播,需要的不仅仅是硬件网络的通畅,更需要包含信息的网页在展示时,更加贴合对应的文化环境。所以网站的国际化和本地化已经成为了当下较为热门的网站技术之一。
2、目前,一个网页在不同的文化环境中进行传播时,最重要的就是进行语言的翻译,在多语言的翻译场景中,往往需要准备大量的语料库对网站内容加以翻译。每增加一种语言,就要加载上一套完整的语料库和与其他语料库的映射关系。特别是在遇到相近的语言系统时(比如:英式英语和美式英语),重复完整的语料库就会带来大量的冗余存储并且降低系统响应速度。
技术实现思路
1、本技术实施例提供一种网页转换方法、装置、设备、介质及产品,能够降低冗余存储,从而提升系统响应的速度。
2、一方面,本技术实施例提供一种网页转换方法,包括:
3、确定原始网页的原始语言环境,以及需要转换为的目标语言环境;所述原始语言环境属于原始语种,所述目标语言环境属于目标语种;所述原始语种下的原始元素与所述目标语种下的目标元素之间存在元素映射关系;所述原始元素以及所述目标元素至少包括文字元素和/或样式元素;
4、获取所述目标语种对应的目标树形元素库;所述目标树形元素库包括一个基础元素库以及至少一个元素库补丁;所述基础元素库包含所述目标语种下所有的所述目标元素;所述元素库补丁与所述目标语种下特定的语言环境对应,所述元素库补丁包含对应的语言环境下部分所述目标元素的变形元素,所述变形元素与所述目标元素存在相同的所述元素映射关系;所述目标树形元素库至少包括语料库和/或样式库;
5、基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以构建目标网页。
6、另一方面,所述目标树形元素库包括多个所述元素库补丁;各所述元素库补丁之间存在层级关系,且根据所述目标语种下各所述语言环境之间的包含关系所建立;同一层级关系下,所述元素库补丁的层级与对应的所述语言环境的范围呈负相关;所述目标语言环境为同一包含关系下范围最小的语言环境。
7、另一方面,所述基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以构建目标网页,包括:
8、在所述目标树形元素库中,确定所述目标语言环境在同一包含关系下所属的所有语言环境对应的目标元素库补丁;
9、基于所述目标元素库补丁中的所述变形元素,对所述基础元素库中对应的所述目标元素进行替换,以得到本地化动态元素库;在多个所述目标元素库补丁针对同一所述目标元素均对应有所述变形元素的情况下,保留层级最高的所述目标元素库补丁中的所述变形元素;
10、基于所述本地化动态元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以得到所述目标网页。
11、另一方面,所述基于所述目标元素库补丁中的所述变形元素,对所述基础元素库中对应的所述目标元素进行替换,以得到本地化动态元素库,包括:
12、在仅存在一个所述目标元素库补丁的情况下,基于所述目标元素库补丁中的所述变形元素,对所述基础元素库中对应的所述目标元素进行替换,以得到所述本地化动态元素库;
13、在存在多个所述目标元素库补丁的情况下,按所述目标元素库补丁的层级从高到低的顺序,执行以下操作:
14、在所述目标元素未被替换的情况下,基于所述目标元素库补丁中的所述变形元素,对所述基础元素库中对应的所述目标元素进行替换,以得到所述本地化动态元素库。
15、另一方面,所述元素映射关系包括:相对应的所述原始元素与所述目标元素具有对应的序号;不同所述目标元素的序号不同,相对应的所述目标元素与所述变形元素的序号相同;
16、所述基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以构建目标网页,包括:
17、确定所述原始网页中的所述原始元素对应的目标序号;
18、基于所述目标树形元素库,确定与所述目标序号对应的所述目标元素和/或所述变形元素;
19、基于确定出的所述目标元素和/或所述变形元素,构建所述目标网页。
20、另一方面,所述基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以构建目标网页,包括:
21、基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素;
22、基于转换得到的所述目标元素和/或所述变形元素,按预设规则构建所述目标网页;所述预设规则至少基于所述目标语言环境下的阅读习惯和/或敏感元素确定;所述阅读习惯至少包括:阅读方向和/或阅读宽度;所述敏感元素至少包括:敏感词汇和/或敏感颜色。
23、另一方面,所述基于转换得到的所述目标元素和/或所述变形元素,按预设规则构建所述目标网页,包括:
24、按所述预设规则,对各所述目标元素进行分析;
25、在各所述目标元素满足所述预设规则的情况下,将所述目标元素和/或所述变形元素确定为敏感元素;
26、将所述敏感元素替换为预设的非敏感元素;
27、根据未被替换的所述目标元素和/或所述变形元素,以及替换后的所述非敏感元素,构建所述目标网页。
28、另一方面,在所述基于转换得到的所述目标元素和/或所述变形元素,按预设规则构建所述目标网页之后,所述方法还包括:
29、基于评分规则,对所述目标网页进行评分,以得到评分结果;所述评分规则至少基于所述阅读习惯和/或所述敏感元素确定;
30、在所述评分结果小于评分阈值的情况下,判定生成的所述目标网页不合格。
31、另一方面,所述评分规则包括:预设敏感词汇出现的频率与评分呈负相关;
32、所述基于评分规则,对所述目标网页进行评分,以得到评分结果,包括:
33、确定所述目标网页中所述预设敏感词汇出现的频率;
34、基于所述预设敏感词汇出现的频率,确定所述评分结果。
35、另一方面,网页的元素显示在图层容器内部;图层容器由组件形式构成,并跟随网页生成、刷新以及销毁。
36、再一方面,本技术实施例提供了一种网页转换装置,所述装置包括:
37、确定模块,用于确定原始网页的原始语言环境,以及需要转换为的目标语言环境;所述原始语言环境属于原始语种,所述目标语言环境属于目标语种;所述原始语种下的原始元素与所述目标语种下的目标元素之间存在元素映射关系;所述原始元素以及所述目标元素至少包括文字元素和/或样式元素;
38、获取模块,用于获取所述目标语种对应的目标树形元素库;所述目标树形元素库包括一个基础元素库以及至少一个元素库补丁;所述基础元素库包含所述目标语种下所有的所述目标元素;所述元素库补丁与所述目标语种下特定的语言环境对应,所述元素库补丁包含对应的语言环境下部分所述目标元素的变形元素,所述变形元素与所述目标元素存在相同的所述元素映射关系;所述目标树形元素库至少包括语料库和/或样式库;
39、转换模块,用于基于所述目标树形元素库以及所述元素映射关系,将所述原始网页中的所述原始元素,转换为所述目标语言环境下的所述目标元素和/或所述变形元素,以构建目标网页。
40、再一方面,本技术实施例提供了一种网页转换设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;
41、所述处理器执行所述计算机程序指令时实现如上所述的网页转换方法。
42、再一方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的网页转换方法。
43、再一方面,本技术实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如上所述的网页转换方法。
44、本技术实施例的一种网页转换方法,先确定原始语言环境以及目标语言环境,并获取目标语种对应的目标树形元素库;然后基于目标树形元素库以及元素映射关系,将原始网页中的原始元素,转换为目标语言环境下的目标元素和/或变形元素,以构建目标网页。本技术实施例中,目标树形元素库包括一个基础元素库以及至少一个元素库补丁;基础元素库包含目标语种下所有的目标元素;元素库补丁与目标语种下特定的语言环境对应,元素库补丁包含对应的语言环境下部分目标元素的变形元素,变形元素与目标元素存在相同的元素映射关系。则在进行存储时,可将相近的元素库相互合并。同一语种下,不同语言环境中重复的元素保存在共有的基础元素库中,再结合元素库补丁保存特定语言环境下的变形元素。以上,最大程度减少了元素库的体积,进而能够降低冗余存储,提升系统响应的速度。
本文地址:https://www.jishuxx.com/zhuanli/20241120/332331.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表