U+DBFF,低字的取值范畴为U+DC00一,U+DFFF,即:1101lOxxXXXXXXXX1101 1lxxXXXXXXXX。假定c的编码大于OxFFFF,则详细算法如下:
4快速藏文输入法的实现要领·4.1藏文字符编码Windows系统内核回收Unieode编码,即所有的字符都为双字节。Unicode对应于ISO/IEC10646的BMP平面,所以对付扩充集A中的VCC可以直接处理惩罚。而对付扩充集B中的字符必需用UTFl6举办转换。在ISO/IEC10646BMP(basicmulti-lingualplane)中,U+D800~U+DFFF区划定为S区(surrogatesarea),用于UTF.16似CS transformation format)。
界说l 纵向组合字符(verticalcombingcharacter,VCC):以藏文辅音字母为焦点(称为基字),在基字的上部叠加称之为上加字的特定藏文辅音字母;在基字的下部叠加称之为下加字的特定藏文辅音字母,在基字上部或下部、或上加字上部、或下加字下部叠加藏文元音标记,凭据该叠加法则组合形成的字母和标记组,称为藏文纵向组合字符,简称纵向组合字符。
别的,每个藏文字都须利用音节脱离符脱离,所以该字符的利用频率也很是高。这一阐明功效与“《中华大藏经丹珠尔》藏文对勘本字频统计阐明”一文的藏文字频统计功效根基一致。
【摘要】通过对藏文文法的深入阐明研究,操作藏文字符在藏文文法上的排出性,在通用计较机键盘键有限的键位上公道布置了所有根基藏文字符,并团结藏文字符字频统计、计较机键盘机关理论以及藏文字母与英文字母在发音上的近似性,设计了无重码藏文输入法键盘键位机关,办理了在不利用上档键和冗余键的环境下实现计较机藏文快速输入的困难;通过对藏文编码尺度的阐明研究,实现了基于《信息技能信息互换用藏文编码字符集根基集》和《信息技能藏文编码字符集扩充集越B)))国际/国度尺度的快速藏文输入法.要害词中文信息处理惩罚;藏文;编码;计较机键盘机关;输入法;藏文藏文输入法研究是藏文信息处理惩罚研究的基本和重要构成部门,对敦促藏文信息处理惩罚技能的成长,促进民族地域的经济社会成长具有出格重要的意义。文献[1]先容了对《中华大藏经丹珠尔》藏文对勘本中藏文构件、字符和字的频率的统计阐明功效。
和“藏文字符”与本文所界说的“藏文字符”观念沟通,本文从以下两个方面临该文统计功效的精确性举办了进一步的验证:
(1)从藏文文法角度看,由于lO个后加字中包括了所有的前加字和再后加字,又都可以做基字,所以这lO个字母必然是30个字母中利用频率最高的。
藏文字(音节)以一个辅音字母(基字)为焦点,其余辅音字母均以此为基本前后附加和上下叠加,组合成一个完整的字表布局。藏文字形布局最少为一个辅音字母(即单独由一个基字组成),最多由7个辅音字母与元音标记组成。藏文30+辅音字母均可作基字,个中5个辅音字母可以作为前加字:lO个辅音字母可以作为后加字;2个辅音字母可以作为再后加字;3个辅音字母可以作为上加字;4个辅音字母可以作为下加字。上加字和下加字字形会产生必然变革。藏文不只有横向拼写性,尚有纵向拼写性。藏文的拼写顺序为:【前加字】【上加字】基字【下加字】【元音】【后加字】[再后加字】。藏文中尚有大量的梵文的藏文转写字。
3藏文输入法研究近况及存在的问题今朝常见的基于Windows的藏文输入法开拓模式有以下3种:(1)直接在应用层面开拓。(2)挂接在现有的精髓文Windows下。(3)成立keyboardlayout文件,将键码直接映射为藏文字符。微软WiIldowsVista提供的藏文输入法回收第3种模式,其余的藏文输入法多半在应用层面上开拓或在汉英文Windows下挂接实现。在藏文编码尺度的应用方面,微软WindowsVista提供的藏文输入法回收了藏文的Unicode编码,其他绝大大都藏文输入法都没有回收藏文的国际、国度编码尺度,使得藏文信息无法交互和共享。在藏文的输入效率方面,由于缺乏对藏文文法的深入研究,所以绝大大都藏文输入法无法实现盲打输入,即在藏文键盘机关中,沟通的键位对应多个藏文字符时,用户必需按数字键选择需要的藏文字符;一些输入法固然可以或许实现盲打,可是利用了大量的上档键或冗余键,大大低落了藏文的输入速度。
操作图论和概率要领求出藏字构件的极大独立集,使键位合并所发生的重码现象降到最低,并团结工程心理学要领,实现了藏字构件公道机关至尺度键盘上。文献[8]基于藏文语料库的字符、部件、音节、词汇统计数据,遵循藏语语礼貌则及其非凡性,对键盘键位的属性举办专门研究,研制出了“一键多符”和“一键到位”的智能化藏文计较机通用键盘机关与输入法。文献【9】研究了基于藏文音节的手机输入要领,并在WindowsCE上实现。文献【10]先容了在移动电话上实现藏文输入/输出和短动静编码/解码的要领。本文在担任以上文献的研究要领和成就的基本上,通过对藏文文法及构字特点等要害问题的研究,设计了无重码藏文键盘键位机关,开拓了基于藏文编码国际/国度尺度的阳光藏文输入法,实现了藏文的快速输入。今朝,该藏文输入法已由西藏自治区相关部分在全区推广应用。
4.2.1 藏文字符频率统计阐明“《中华大藏经丹珠尔》藏文对勘本字频统计阐明”一文先容了对《丹珠尔》中藏文构件、字符和字的频率统计阐明功效。该文所述的“藏文构件”
而对于扩充集B中的毕业硕士论文字符必须用UTFl6进行转换
毕业论文库:计算机 时间:2016-10-17 点击:
次