UrF.16编码等同于UC毕业硕士毕业论文S编码对应的16位无符号整数
毕业论文库:计算机 时间:2016-10-20 点击:
次
界说3藏文字(Tibetanword):由前加字、基字、VCC、后加字以及再后加字,凭据藏文拼写法则举办横向拼写组成的一个音节,称为藏文字。
文献[2】研究了海内藏文信息处理惩罚技能的研究近况,对藏文操纵系统、藏文信息技能尺度、藏语信息处理惩罚、综合应用等举办了阐明。文献[3]研究了基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通费用统计阐明的理论与要领,实现了大局限藏文词汇频度与通费用统计原型。文献[4】研究了藏文字符集的特点,实现了切合ISO/IEC14651尺度语义的藏文字典序排序的要领。文献[5】在总结现有Linux国际化框架条理布局的基本上,阐明白Windows焦点系统国际化的要害问题。文献【61提出了基于IS0/mC10646的藏文字符集尺度和音节分别、利用Openab,pe字体及相应的文本引擎,团结藏文正字法要求,办理藏文“叠加"字符显示的要领。文献[7】
别的,每个藏文字都须利用音节脱离符脱离,所以该字符的利用频率也很是高。这一阐明功效与“《中华大藏经丹珠尔》藏文对勘本字频统计阐明”一文的藏文字频统计功效根基一致。
U,rF.16以16位为单位对UCS(universal multiple~octetcodedcharacterSet)举办编码,对付小于OxFFFF的UCS码,UrF.16编码等同于UCS编码对应的16位无标记整数,对付编码为0XOl000~0x10FFFF之间的字符利用双字暗示,高字的取值范畴为U+D800"-'
(1)从藏文文法角度看,由于lO个后加字中包括了所有的前加字和再后加字,又都可以做基字,所以这lO个字母必然是30个字母中利用频率最高的。
高字节=(0xD7C0+(c>>10))低字节-=(OxDC00I c&Ox3FF)下面是一些编码功效:
【摘要】通过对藏文文法的深入阐明研究,操作藏文字符在藏文文法上的排出性,在通用计较机键盘键有限的键位上公道布置了所有根基藏文字符,并团结藏文字符字频统计、计较机键盘机关理论以及藏文字母与英文字母在发音上的近似性,设计了无重码藏文输入法键盘键位机关,办理了在不利用上档键和冗余键的环境下实现计较机藏文快速输入的困难;通过对藏文编码尺度的阐明研究,实现了基于《信息技能信息互换用藏文编码字符集根基集》和《信息技能藏文编码字符集扩充集越B)))国际/国度尺度的快速藏文输入法.要害词中文信息处理惩罚;藏文;编码;计较机键盘机关;输入法;藏文藏文输入法研究是藏文信息处理惩罚研究的基本和重要构成部门,对敦促藏文信息处理惩罚技能的成长,促进民族地域的经济社会成长具有出格重要的意义。文献[1]先容了对《中华大藏经丹珠尔》藏文对勘本中藏文构件、字符和字的频率的统计阐明功效。
界说l 纵向组合字符(verticalcombingcharacter,VCC):以藏文辅音字母为焦点(称为基字),在基字的上部叠加称之为上加字的特定藏文辅音字母;在基字的下部叠加称之为下加字的特定藏文辅音字母,在基字上部或下部、或上加字上部、或下加字下部叠加藏文元音标记,凭据该叠加法则组合形成的字母和标记组,称为藏文纵向组合字符,简称纵向组合字符。