当前位置:去问问>百科问答>啥是汉字全息码?

啥是汉字全息码?

2024-11-12 07:29:54 编辑:zane 浏览量:563

啥是汉字全息码?

的有关信息介绍如下:

啥是汉字全息码?

本发明的汉字全息码电脑通用键盘输入技术包括部首;笔画:横(一)、竖(丨)、点(丶)、撇(丿)提( );笔顺:从上到下、从左到右、先横后竖、先中间后两边。所述的部首选用100个部首字,按照其拼音的第一个字母标识在相应的公知电脑通用键盘的26个英文字母键上,其结构如下:英文键 汉语拼音的第一个字母码Q [犬(大犭 豕)] (示礻)W [王]( )韦( )文(攵)E [耳(阝卩)]二( )儿儿 )R [人(亻)]日T 扌(手)] 亠(丄)土田Y [月(曰 )]乂又幺( )羊( )U [巫( )]I [衣( 衤)]O (去 码功能键)P [爿(丬片)]丿( )A [广]厂( )S [水( 氵)]丨( )十( )厶( )D [丁(丅 )]、( 丶)刀(刂)歹F G [弓]?6?5(丨乚 工( )骨H [火(灬)]-(一)禾J [金(钅)几(几几)巾彐( 彐 )己( )臼K [口]凵L [立]了力 (角)里( )Z [竹(?6?8)]止( )爪(爫 )走( 之辶廴)足(?6?4)隹X [心(忄 )]夕(攵)习(习)小( )C [艹( 屮)]寸车( )虫V( )[鱼(鱼)]雨B [卜( )]八(丷八)勹( ?6?8 )匕冫( )贝( )白髟N [女]丶廿( )牛( ?6?4)M [木)冖(冂 ) (门)马(马)目(目四)*说明:[ ]内为键名部首,( )内为变化、繁体。从上表可见,在这些英文键盘的26个键名中,V没有相应的语音拼音改作 ,O没有相应部首字,留作功能键。所述的笔画还包括弯、捺、钩,并以横、竖、点、撇、弯、提、捺、钩的顺序编排,其中凡带钩的笔画一律作钩,所述的笔顺还包括先撇后捺,先外后里再封口,并以先横后竖,先撇后捺,先外后里,先外后里再封口先中间后两边的编码规则编排。使用上述100个部首的汉字全息编码全部采用英文键盘的四位代码输入方法。这种汉字编码输入技术,简称全息 码。与以往的汉字信息检索输入码相比,本发明的汉字全息码电脑通用键盘输入技术,由于优先选用了常用的100个形、音、义皆全的并具有极强的组字能力的传统部首以及简易的笔画规则,既符合人们常识和习惯,易于记忆,又可使汉字信息边界清楚,具有简单易学,操作方便,输入速度快,重码率低以及推广容易等优点。本发明比较以往的输入码,只要掌握100个常识部首字的第一个拼音字母,用相应的外文(英、俄、德、法、意、日、拉丁、国际音标等等)键盘配合,100个部首字第一个拼音字母、在电脑通用键盘的26个英文字母键上标识,使全世界学习、使用汉文的人共同使用;本发明的独创性还在于它的简约化,一切从简从易,抛弃了所有人为的口诀和主观地定角、定高低、定区位的死记硬背的繁文褥节;本发明还灵活、和谐地将字母码与数码结合起来,使各种用户与机件都可通用。本发明能广泛用于通用小键盘电子计算机和各种汉语工具书,取得了电脑、辞书、资料、电信四者编码的一致性。采用本发明,大约只要化半天或一天时间就能编码上机,并具有不需专门培训,软硬件成本低廉,适合于小键盘通用件,平均击键次数少(每字平均约1.33次),重码率低(低于千分之一)等优点。此外,本发明至少还可以在以下十个方面应用:1,中文电脑打字、编辑、排版;2,电报码与电传码统一于拉丁化字母,可由机器自动译为中文;3,全国邮政编码;4,中外文机器助译;5,古汉语与白话文机器助译;6,速记;7,缩写;8,图书编目、辞书索引用全息码;9,速抄、缩录;10,医药自我咨询,及农林牧副渔工商财文军政各行各业管理咨询。本发明使繁难的方块汉字变成超过任何一种西文的全息码且发掘了汉字内在的美质,使汉字变成科学、规范、精炼、整齐、优美的集约化的编码,从而成为东西方文明大交流的一座宏伟的桥梁。以下,将结合实施例对本发明作更详细的叙述。实施例1按100部首字汉语拼音的第一个字母顺序排列。26个字母中,V改作 使用,O没有相应的部首字,留作功能键使用。100个部首字都是常用字,第一个拼音字母为广大用户所熟知。基本笔画出于唐宋以来沿习一千多年的“永字八法”,念作:横、竖、撇、点、捺、挑、弯、勾。凡带钩的一律作勾。用8种笔画显然比5笔、6笔更符合汉字实际,又大大增加了区分重码的离散度。2,笔顺的七条规则:五万多个汉字,其形体千变万化,但书写的笔顺只有下列七条简单的规则。(“杞”字码等编码将笔顺规则增加到10条以上,是不合理的。)初小文化程度的用户,从小到老都应遵守这些规则,千百年来已成人们的习惯。无论从习惯上说,还是从视觉上说,起笔部首、续笔部首和接尾部首收笔部首、是最容易识别的。汉字中80%以上为形声字,由形旁与声旁两个偏旁组成,取起笔部首、续笔部首和接尾部首、收笔部首,也就完全兼顾了左右或上下两个偏旁,而不至于集中在一个偏旁里,充分发挥了加大离散度和去重码的作用。依笔顺的7条习惯规则(先横后竖、先撇后捺、先左后右、先上后下、先外后里、先外后里再封口、先中间后两边),将汉字分解为部首(包括笔画);分解部首取最多笔画者。汉字笔顺规则并举例如下:(1)先横后竖 “十”为“一丨”“干”为“一一丨”(2)先撇后捺 “人”为“丿 ”“大”为“一丿 ”(3)先上后下 “兀”为一丿乚”“区”为“一丿丶乚”(4)先左后右 “么”为“丿 丶”“仆”为“丿丨丨丶”(5)先外后里 “月”为“丿一一”“勺”为“丿丶”(6)先外后里再封口 “日”为“丨一一”“四”为“丨乛丿 一”(7)先中间后两边 “小”为“亅′丶”“山”为“丨 丨”以上是为了说明笔顺规则,将例字分解成笔画,而本发明的编码表,则是依笔顺分解部首,每一步分解以最多笔画的部首为原则。如“鞘”字分解为“廿口十小月”,而不是“一…一”等等。汉字中极个别字需倒转纸张书版写成反文,如“或”字等,仍依实际书写的笔顺分解部首。3,编码实例:(1)部首字:100部首表中的部首,既是最常用的部首,又基本是独立的常识字。我反对把部首割裂成支离破碎的“字根”或“字元”,因为除了专门的编码员外谁都不识。部首以音归类,分一笔部首和组字能力较强的键名部首、一般部首。这样区分目的,是为了下面给复合字编码时减少重码字,使用上述100部首的汉字全息码电脑通用键盘输入技术,其编码步骤全部采用四个代码输入方法。在检索单部首字时不必区分,都以部首拼音声母、韵母的第一字母、起笔笔画、续笔笔画、末笔笔画代码击键,正体、变体、简体、繁体都这样编码,不能再分笔画的击O键。因为一个拼音字母之下有几个部首字,用上述三个笔画具有8×8×8=512的离散度,不会有重码。例如:一:HHOO 二:EHHO 三:SHHH::MDGO 门:MDSG 金:JPNH马:MWGH 木:MHSN 目:MSWH在同一拼音字母下,由于离散度大,部首基本不重码。(2)两个部首的复合字:也用4个拼音字母代码,击键4次。本发明编码不用字型区分,与王永明发明的“五笔字型”不同。王永明将字型分为左右型、上下型、杂型,实际上汉字字型远不止3种,还有左中右、上中下、对角、交叉、半包、全包等多种,而且有时实难区分。信息利用的价值,在于信息的确定性。对于边界模糊的、难以区分的信息,用了反而容易出错。故本发明的全息码将字型区分排除在外。两个部首的复合字,编码如下:××××起起收末笔 笔笔部笔部首 首部末部末笔 笔首画首画这样,在两部首代码相同的情况下,还有8×8=64种离散度,比王永明用3种字型和5种笔画区分的3×5=15种离散度大4倍以上,因此重码少得多。如起、末两部首为键名部首,可特殊对待,不需加笔画来区分,都改为O,用移动O还可以调整重码字使之不重码。双部首复合字编例:冰:BTSO 江:SOGH 扛:TOGO闰:MGWO 枉:MOWO 枚:MOWN(3)三个部首复合字:4个代码依次为:起笔部首、起笔部首末笔画、续笔部首、收笔部首。当起笔部首为键名部首时,连击O键,不再击其末笔笔画代码。例如:种:HDKS 桂:MOTT 花:CORB祝:QDKE 贺:LPKB 你:ROBX合:ROHK 欢:YDBR 树:MOYC如遇极少的重码字,可用插入O去重。0键去重码的作用很大,因为用足26个字母比用25个字母增加离散度为264-254=66,351,大大减少重码。(4)四个以上部首的复合字:一般取起笔部首、起笔部首末笔画、接尾部首、收笔部首。若遇起笔部首为键名部首时,第二码改为续笔部首。本发明充分利用26个字母,总离散度为26×26×26=456,976,对区分6万个汉字已足够。例:民:GGHG 族:TBRQ 麒:AWEB麟:AGWS 醇:XHLH(5)词语文献快速码:本发明的全息码,离散度达到456,976,除可输入5万多汉字外,还可输入40万条词语。输入词语,同样是用4个拼音字母,击键4次,这就意味着可以大提高输入单字的速度。汉字词语有2、3、4、5…等单字构成,40万条词语平均约120万字,原来要击键120万×4=480万次,现在只要击键160万次,平均每个方块字输入击键为1.33次,汉字具有单字构词能力,一个方块字相当于西文一个词汇,这就大大优于任何一种西文词语。1).二个字的词语编码:2个字都分别取起笔部首与收笔部首(部首字改为末笔画),为4个字母的等长码。如词语中有一字为键名部首字,作特殊对待,后加O码,以区别末笔画相同部首。如:海洋:SDSY 国家:MHDB 乙炔:GGHR人民:ROGG 幸福:TSQT 辛勤:LSNL2)三个字的词语编码:第一个字取首尾两个部首,再取第二、三字的起始部首;如第一个字为部首字,取其起始部首、末笔笔画;如第一个字为键名部首,则取其部首编码加O。例如:地球仪:TGWR;金字塔:JODT;大世界:QNNT;不夜城:DBTT;游乐场:SHPT。3)四个以上字的词语:取一、二、三及末字起始部首。如:统一战线:YHBY,胸有成竹:YSAZ;成竹在胸;AZSY;中华人民共和国:KRRM;诺贝尔奖金:YBBJ;马列主义:MDTD;马克思列宁主义。MSTD;鲁迅全集:VGRZ;二十四史:ESMK;达尔文学说:QBWY;高能物理:TSNW;万里长城:DLPT;万里长征;DLPE。当然,专用名词还可划分词类编码,如“中华 人民 共和 国”为“KSRS ROGG NBHK MWDH”,划分后译成方块汉字同“中华人民共和国(KRRM)”。在上述编码输入技术的基础上,为了充分利用公知电脑通用键盘,另选用100个部首,它们以二位数字代码代替拼音字母,安排在同一电脑通用键盘英文键上部的0-9共10个数字键上,其结构如下:数字键 部首部分 数字键 部首部分 数字键 部首部分 数字键部首部分01 一(一) 02 丨(丿) 03 丿( ) 04 丶( 丶)05 06 丿 07 ( ) 08 ?6?5( )09 二( ) 10 十( ) 11 厂( ) 12 丁( )13 卜(卜) 14 乂 15 八(丷 ) 16 人(亻)17 勹( ) 18 儿(儿儿) 19 几(几 ) 20 匕21 冫(丄) 22 ( ) 23 24 凵25 厶( ) 26 又 27 了 28 刀(刂)29 力 30 三( 彡巛) 31 干( ) 32 土33 工( ) 34 卄( 屮) 35 寸 36 扌( 手)37 口 38 山 39 巾 40 夕(久)41 广 42 门 (门) 43 ( 彐 ) 44 尸(卩已)45 弓 46 己( ) 47 女 48 幺( )49 马(马) 50 小(忄 ) 51 习(习) 52 丰( )53 王 54 韦( ) 55 廿( ) 56 木57 犬(大犭 豕) 58 歹 59 车( ) 60 止( )61 日 62 贝(贝) 63 牛( ) 64 爪(爫 )65 月(日 ) 66 67 文(攵) 68 火(灬)69 心(忄 ) 70 爿(丬片) 71 水 ( 氵) 72 示(示衤)73 石 74 目(目四) 75 田 76 禾77 白 78 立 79 穴 80 耳(阝卩)81 西(西) 82 虫 83 竹(?6?8) 84 臼83 86 衣( 衤) 87 羊( ?6?2) 88 走( 之辶廴)89 巫( ) 90 里( ) 91 足(?6?4) 92 身93 言(讠) 94 面 95 隹 96 金(钅)97 鱼(鱼) 98 骨 99 食 (食饣) 00 髟这种输入技术简称为“全息Ⅲ码”,其编码步骤除了部首有唯一的编码,毋须用起末笔画外,其它编码顺序则似“全息Ⅰ码”。编码步骤则全部采用六个代码输入方法。“全息Ⅱ码”与“全息Ⅰ码”在总体上是一致的,都顺应了群众对部首、笔顺、笔画的常识、习惯,少利用拼音这一信息,是完全适应不识西文和拼音字母的用户的,但它可用于只有10个数字键的更小的键盘,也适用于用数字代码的电报码。它的又一特点是离散度更大,为100×100×100=100万,是“全息Ⅰ码”离散度约46万的2.2倍,可容纳的字、词更多而重码更少。2.编码实例:“全息Ⅲ码”规则基本上同“全息Ⅰ码”,但考虑到Ⅲ码是两个数字码针对一个部首字,不需要在同一个拼音字中用起末笔画来选定,故用*来填空位,重码字亦可用*号并移动它来区分;括弧内的变体则加击起笔笔画、续笔笔画。(1)单部首字:在6位数中第一、二位击其编号,后连击空格键填空;括弧内的变体则加击起笔笔画、续笔笔画。一:01**** 二:09**** 三:30****:23**** 门:42****马:49**** 木:56**** 目:74****(2)双部首复合字:在6位数中第一至四位击其编号,后连击空格键填空冰:2271** 江:7133** 扛:3633**闰:4253** 杠:5633** 枚:5667**(3)三个以上部首复合字:在6位数中第一至六位编号,例种:763702 桂:56323 花:341620祝:723718 贺:293762 你:161750合:160137 欢:261716 树:562635民:330108 族:211657 麒:410915麟:410702 醇:812701(5)词语文献快速码:(1)双字词:取第一字起、末部首(如首字为部首字,则改为第二字起笔部首)、第二字末部首,例:海洋:710487 国家:230122 乙炔:086816人民:163308 幸福:321075 辛勤:781029(2)三字以上词:取第一个起笔部首、第二字收笔部首、末字收笔部首。例:地球仪:370414 金字塔:960137大世界:571709 不夜城:120504游乐场:715009统一战线:480104 胸有成竹:656583成竹在胸:118324 中华人民共和国:371001诺贝尔奖金:936296 马列主义:495814马克思列宁主义:4910143.调整部首、去重码与功能键(1)调整部首:部首是可以调整的。为了统一“全息Ⅰ码”与“全息Ⅱ码”,才统一用“100部首”的名称。“Ⅰ码”与“Ⅱ码”也可不统一,“Ⅰ码”可增减部首,甚至可用《康熙字典》的214个部首,也可用王竹溪的56个新部首,或更少的部首,但用100个左右为宜。“Ⅱ码”可减少到100个以下,保持二位数,反之,亦可对部首字和数百个常用偏旁字编成三位数,取二个部首、偏旁字编成6位数码,也可取三个部首、偏旁字编成9位数码。只要查码方便,有足够的离散度就行。如“三”为071,“刘”为271,那么“浏”为071271(六位码)或071***271(九位码)。其余类推。(2)去重码:重码率再低,总还有个别重码字或重码词。“Ⅰ码”可用击0键并移动其位置或击1、2、3……8、9、0数字键去重码。“Ⅱ码”可用*键去重码,去重码的让码以词频为序。(3)功能键:提示,改错,分简繁体、正字、异体、讹体,中西文夹排等,都可使用多余的键。综上所述,本发明的优点还在于易推广、用途多。至少可以有下列几项可供开发应用:1.中文电脑打字、编辑、排版;2.电报码与电传码统一于拉丁字明码,并且比西文简约,可由机器自动译码为中文,可大大节约人工、费用;3.全国邮政编码统一,人人可自编,且使地址的字母化略写与邮政编码相一致。全国几百个省、市、几千个县基本上不重码。省、自治区、市、县、乡、镇等行政区划单位:北京:SBTX 上海:BHSD 天津:ERSG广州:AODS 广东:AOHX 广西:AOXH云南:ESSS 浙江:SDSG 江西:SGXH江苏:SGCB 福建:QTJZ 湖北:SYSB湖南:SYSS 青海:FYSD 河南:SKSS海南:SDSS 新疆:LDGH 西藏:XHCD贵州:KBDS 宁夏:DDDX 台湾:SKSG四川:MHPS 辽宁:LZDD 吉林:SKMM河北:SGSB 山东:SSHX 山西:SSXH安徽:DNEW 黑龙江:LHSS 内蒙古:MRCS4.中外文机器助译。中国人学外语、外国人学汉语,主要困难不在语法,而在于记大量词汇。全息码使汉字、汉语词汇化为四个拉丁字母,这就比贮存西文容易。有了全息码,中国人与外国人只要化很少的时间学会语法、字母拼音法则、编码方法,就能借助机器的词汇对译来进行对话交流。一个人要掌握几门外语是很容易的。翻译专业工作者也可省去大量查辞典的功夫。5.古汉语与白话文机器助译。原理同上。6.速记。用全息码速记统一、规范、迅速,对速记整理、翻译也可借助机器,省去大量时间。7.缩写。用全息码可用1.33个拉丁字母代替一个方块汉字,可大量节约篇幅时间。8.图书编目、辞书索引用全息码,规范、简便,不重码,能消除难检字。9.速抄、缩录。原理同速记、缩写。10.医药自我咨询,及农村牧副渔工商文军政各行各业管理咨询。例如输入①感冒②年龄③性别④肪膊⑤体温⑥痰的浓与清⑦有否咳嗽等信息,即可输出名医名方。全息码可作各种咨询汉字卡。以上10项都同本发明使繁难的方块汉字变成超过任何一种西文的全息码有关。本发明发掘了汉字内在的美质,使汉字变成科学、规范、精炼、优美的集约化的编码,从而成为东西方文明大交流的一座宏伟的桥梁。

版权声明:文章由 去问问 整理收集,来源于互联网或者用户投稿,如有侵权,请联系我们,我们会立即处理。如转载请保留本文链接:https://www.qwenw.com/answer/421189.html
热门文章