藏汉英混合字符串的排序方法
- 国知局
- 2024-07-31 22:48:11
本发明涉及字符排序,具体为藏汉英混合字符串的排序方法。
背景技术:
1、藏文的排序是由来已久的问题,许多学者从理论和实践的角度用不同的方法研究了藏文排序,为后人指出了方向,为藏文排序在文件检索、信息检索和文本排序等技术领域中的应用打下了良好的理论基础,但是,实践中发现,现有方法有各种不同的缺点和不足,无法满足社会和科研的需要。
2、参考现有文件欧珠的文献《基于藏文编码gb的藏文排序方法研究》中由于基于藏文编码国家标准(gb)的整字编码方案的排序方法,不具有国际通用性;
3、参考现有文件扎西才仁的文献《藏文的排序规则及其计算机自动排序的实现》由于没有考虑只有上加字的藏文字符和既有前加字又有上加字的藏文字符的排序规则,排序结果不符合现代藏文字、词典排序规则。
4、为此,本发明提供了藏汉英混合字符串的排序方法。
技术实现思路
1、针对现有技术的不足,本发明提供了藏汉英混合字符串的排序方法,解决了现有的藏汉英混合字符串的排序过程中没有考虑只有上加字的藏文字符和既有前加字又有上加字的藏文字符的排序规则,排序结果不符合现代藏文字、词典排序规则的问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:藏汉英混合字符串的排序方法,具体包括以下步骤:
3、s1、首先将需要排序的所有字符串输入至排序系统中;
4、s2、然后选择其中字符串进行逐一判断,判断字符串藏汉英字符串中的类别;
5、s3、对字符串进行排序的操作。
6、优选的,所述s3中判断字符串为汉文字符串的具体排序步骤为:
7、a1、对汉文字符串中的字符进行标记并标记为b{b1,b2,,bn},
8、a2、判断字符串是否符合汉字拼音的顺序,按照汉文字符顺序a、b、c、、x、y、z完成对字符b{b1,b2,,bn}进行排序;
9、a3、并将相同的字符按照字符的声调进行排序,最终得到排序规整的汉文字符串。
10、优选的,所述a3中字符的声调具体分为:字符一声调、字符二声调、字符三声调和字符四声调。
11、优选的,所述s3中判断字符串为英文字符串的具体排序步骤为:
12、c1、对汉文字符串中的字符进行标记并标记为d{d1,d2,,dn},
13、c2、判断字符串是否符合汉字拼音的顺序,按照汉文字符顺序a、b、c、、x、y、z完成对字符d{d1,d2,,dn}进行排序;
14、c3、并将相同的字符按照字符的大小写进行排序,最终得到排序规整的英文字符串。
15、优选的,所述c3中字符的大小写具体分为:a和a的区分,且a排在a的前面。
16、优选的,所述s3中判断字符串为藏文字符串的具体排序步骤为:
17、e1、采用藏文字构件识别方法判断藏文字符串是否为合法的藏文音节;
18、e2、把藏文音节分解为:基字t0、前加字t1、上加字t2、下加字t3、元音t4、后加字t5、再后加字t6,再把藏文音节中的部件字符全部转换成藏文字母字符;
19、e3、对藏文音节中构件的顺序做调整:基字t0、0(没有上加字时)/1(有上加字时)、前加字t1、上加字t2、下加字t3、元音t4、后加字t5、再后加字t6;
20、e4、对所有藏汉英字符串作出排序。
21、有益效果
22、本发明提供了藏汉英混合字符串的排序方法。与现有技术相比具备以下有益效果:
23、(1)、该藏汉英混合字符串的排序方法,通过将字符串中的藏文音节的构件顺序调整方法:把传统藏文音节的顺序:“前加字t1→上加字t2→基字t0→下加字t3→元音t4→后加字t5→再后加字t6”调整为“基字t0→0(没有上加字时)/1(有上加字时)→前加字t1→上加字t2→下加字t3→元音t4→后加字t5→再后加字t6”,以此解决了现代藏文字的排序问题,藏文排序码选用了藏文字符本身,使得藏文的排序完全符合《新编藏文字典》的排序规范,并且藏文字符串的排序码采用了藏文字符本身,从而可以与其它的语种一起排序。
技术特征:1.藏汉英混合字符串的排序方法,其特征在于:具体包括以下步骤:
2.根据权利要求1所述的藏汉英混合字符串的排序方法,其特征在于:所述s3中判断字符串为汉文字符串的具体排序步骤为:
3.根据权利要求2所述的藏汉英混合字符串的排序方法,其特征在于:所述a3中字符的声调具体分为:字符一声调、字符二声调、字符三声调和字符四声调。
4.根据权利要求1所述的藏汉英混合字符串的排序方法,其特征在于:所述s3中判断字符串为英文字符串的具体排序步骤为:
5.根据权利要求4所述的藏汉英混合字符串的排序方法,其特征在于:所述c3中字符的大小写具体分为:a和a的区分,且a排在a的前面。
6.根据权利要求1所述的藏汉英混合字符串的排序方法,其特征在于:所述s3中判断字符串为藏文字符串的具体排序步骤为:
技术总结本发明公开了藏汉英混合字符串的排序方法,本发明涉及字符排序技术领域。该藏汉英混合字符串的排序方法,通过将字符串中的藏文音节的构件顺序调整方法:把传统藏文音节的顺序:“前加字t1→上加字t2→基字t0→下加字t3→元音t4→后加字t5→再后加字t6”调整为“基字t0→0(没有上加字时)/1(有上加字时)→前加字t1→上加字t2→下加字t3→元音t4→后加字t5→再后加字t6”,以此解决了现代藏文字的排序问题,藏文排序码选用了藏文字符本身,使得藏文的排序完全符合《新编藏文字典》的排序规范,并且藏文字符串的排序码采用了藏文字符本身,从而可以与其它的语种一起排序。技术研发人员:拉毛措,安见才让受保护的技术使用者:青海民族大学技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/194687.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表