人类历史上最伟大的文字——汉字

南风

<p style="text-align: center;"><br></p><p style="text-align: center;"><b style="font-size: 20px;">探秘中国汉字</b></p><p><br></p> <p><br></p><p> 汉语与英语的比较(此节引用自《争鸣:再谈汉语和英文的比较和评价》一文)</p><p><br></p><p> 汉字的优势在于,汉字是二维表现方式,二维是平面媒介表达信息能达到的最高效率。中英文对照,英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。</p><p><br></p> <p><br></p><p> 中国国家汉字的扫盲标准是1500个字,理工科的大学生一般掌握2000个汉字。就凭这2000个字,大家可以读书、看报、搞科研。只要有小学文化就可以看懂绝大多数文章,有初中文化,其掌握的科学知识,就足以了解绝大多数产品的使用。</p><p><br></p> <p><br></p><p> 比如高科技的电脑要求高吧,在中国那些考不上大学的高中生经过一年半载的培训就能熟练操作,一些没有条件上高中的初中生也能做到。汉字的重复利用率非常高,历代积累的汉字总数以万计,康熙字典就收录了4万多,专家指出常用仅三千五,选取当代的常用字作为学习和使用汉字的重点,是历代历朝整理和教学汉字的一个重要内容。历史上的《三字经》《千字文》都是用当时的常用字编成的识字课本。</p><p><br></p> <p><br></p><p> 而英文呢?例如因为一个地名就是一个单词,想正确认识,需要的时间精力只有少数人能够应付,英文真是笨人的语言,由于在表达方面的缺陷,靠字母的一维线性组合,试图给天下每一事物起一个名字,一种东西就是一个单词。宇宙无穷,英文词汇无穷——可惜人的精力有限!英文是发散的。</p><p><br></p> <p><br></p><p> 在英文世界里,一般美国高中毕业生掌握的单词量也就在三千到三千五百个左右,这样已经应付日常生活需求足矣,但是没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随着英文新词,例如火箭(ROCKET),计算机(COMPUTER)等,可汉语表达这些很轻松,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-DRIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。</p><p><br></p> <p><br></p><p> 人的视角有限,太长的字会降低文章的可读性与读者的理解能力。这是因为英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。</p><p><br></p> <p><br></p><p>  目前英语词汇量已经超过40万,预计本世纪中叶会达到百万。而汉语则相对稳定,现在只有很少的古文知识的中学生就可以琅琅上口地读屈原的楚辞。英文就难了,太不稳定。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。</p><p><br></p> <p><br></p><p> 由于英语以表音为主,同时号称是讲者分布最广泛的语言。正因如此,讲英语者往往因语义词汇和地域习惯,引起误会。因此谓英语是“世上最广泛被误解语言”,也绝不过分。英语也是世界上最容易引起人事纠纷的语言。就目前英国和美国还分出了英式和美式英语,加上其他所谓的英语国家,虽然都说英语,其拼写读的差异不次于中国各地方言之间的差别,交流的难度是远超过使用表意的中文的。</p><p><br></p> <p><br></p><p> 研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。</p><p><br></p> <p><br></p><p> 我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:</p><p> 法文:3.98比特</p><p> 西文:4.01比特</p><p> 英文:4.03比特</p><p> 俄文:4.35比特</p><p> 中文:9.65比特</p><p><br></p> <p><br></p><p> 可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。</p><p><br></p> <p><br></p><p> 汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进制,或更高的进制呢?</p><p><br></p> <p><br></p><p> 一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。</p><p><br></p> <p><br></p><p> 信息熵高是不是就不利于计算机处理呢?这方面恐怕还很难下结论。简单的比较汉字与英文的输入速度是不能说明问题的,因为“字”与“word”是不同的概念。要比较只能比较同一内容的中英文两个不同文本,计算击键数的差值。在“词”的单位基础上,现代汉语与英语是可以进行比较的。</p><p><br></p> <p><br></p><p> 现代英语为了应付不断涌现的新事物、新思想、新科技、新概念,也在不断地造词。无非是借助拉丁词根、或重新组合已有单词,结果越是专业科技的词汇,就越长、越难记。或者是大量使用缩写:如WTO、FBI、IBM、UFO等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。这就是汉字字符集信息熵高的优势。</p><p><br></p> <p><br></p><p> 用现代计算机技术作为信息化的标准,来衡量汉字与英文字母的优劣是件很荒诞的事情。现代计算机技术说到底就是基于“二极管”的技术,将来的发展很难预料。难道要人类高度智能的思维模式,去模仿“二极管”式的思维?那是典型的削足适履。试想,难道当年就因为发明了黑白照像术,人们就该废掉油画的色彩?难道当年就因为摩尔斯电码适合新发明的电报,人们的语言就都应该改成“嘀嗒”?</p><p><br></p> <p><br></p><p> 汉字在应用中遇到的一些困难,我们不应该忽视,但是没必要过分夸大。当年中国人发明了活字印刷术之后,在很长一段时间内一直没有得到真正的应用。直到清朝末年中国还在大量使用雕版印刷术。其原因就是汉字数量太大,要制造一套足够印书的字模难度太大,也不经济。最后还是20世纪初,西方人引入了机制字模,中国才实现了活字印刷。在20世纪,人类进入计算机时代的初期,汉字处理软件的缺乏也曾经是一种阻碍,但是很快也就解决了。现在在计算机技术的帮助下,汉字的传播比以往更方便了。</p><p><br></p> <p><br></p><p> 汉字不仅构筑了隐性的中国哲学体系,也塑造着中国人的心理结构。汉字浓缩着字前史中国人对自然的认识。表面上看,汉字不过是一个符号,指称着对应的事物,但就在这对应背后,还潜伏着中国人的情感、习惯甚至本能。</p><p><br></p> <p><br></p><p> 汉语是C语言,英语是Basic(ZT),汉语是C语言高度灵活;英语是Basic,是半成品,僵硬呆板;汉语可以从基础上构造一切,只要想得到就能表达出来,而英语则是固定配置,不能很好地表达个性的需要;汉语的最小单位是字,英语的最小单位是词,一个汉字可以组成一个词,而英语的词就是词,比如汽车火车自行车都有车这个字,于是抓住了共性和个性,共性上加个性就是新概念,可组合性非常强,而英语的bus、car、bike没有任何共性,因此中国人只要知道几千个字就可以表达世界,英语由于没掌握共性与个性的关系,每一个事物都要造一个词,描述世界需要极大的词汇量,十分愚蠢。</p><p><br></p> <p><br></p><p> 事实也是如此,聪明人一般学不好英语,而死记硬背的笨蛋都出国了。</p><p><br></p><p> 汉语里没有时态,有表示时间的词,因此不需要在动词上变来变去,只要把动作与为数不多的表时间的词组合,就可以清晰地表达时间中的动作。</p><p><br></p> <p><br></p><p> 英语里为了表示时间要把所有的动词都变换形式,这些动词数以千计,不是有表示时间的词吗?为什么还要在动词上变化?还是愚蠢;英语只能横排不能竖排,竖排是神经病,而汉语就没有这个问题,汉语从前就是竖排的,汉语可以从右往左排,在阅读上没有困难,但是英语的单词因为是表音的,只能从左往右读,如果把英文语句从右往左排,读者必定跟吃了摇头丸一样,10分钟后头晕至死;英语以空格作分隔符,本身不表达任何含义,却占一格,浪费版面,浪费bit天理难容。汉字没有这个问题,汉字之间不需要空格,这个字与下一个字不会混淆,这就是汉字的优势。</p><p><br></p> <p><br></p><p> 汉字是方的,英语是长条的,因此汉字写的扁一些长一些都可以,不会比例失调。而英语如果写成方的就非常难看,并且由于有的单词长,有的短,都写成方的,也不知道占几行,并且,由于英语的长,英语书一般也很长,浪费纸,不环保,这行的词无法与上一行的词对齐,看上去乱七八糟的;汉字书写自由;可以倒笔画;而英语就不行,英语必须按照顺序写。如果倒笔画了,将一塌糊涂;英语单词有长有短,换行是个问题,如果用-号,一个单词被分两行看起来费劲,如果整个单词换到下一行,对齐又很困难;汉字的信息含量非常大,比如道字之字有很多很多义,而英语则十分弱智,一个词的含义有限。</p><p><br></p><p><br></p> <p><br></p><p> 中国的小学生都会拼音,可见英语之简单。事实上中国人完全可以把语言建立在拼音之上,而拼音由声母韵母构成,可以很简单地组合出汉语的发音来。而英语就笨得跟笨蛋似的,一个词需要很多音标;有人说汉语难学难写难认,要改成表音文字,而英语能读一般就会写,于是比汉语好。其实那是放屁,崇洋媚外(就是那个什么余彦中)。</p><p><br></p> <p><br></p><p> 汉语拼音是中国的拼音文字,比英语简单得多,完全可以做到能读就会写,但是中国人只把拼音当作识字的工具,当作小儿科。</p><p><br></p><p><br></p> <p><br></p><p> 语言的目的是表达思想和客观世界的,而不是一些字形和声音,读和写,在语言表达世界方面只占很小的一部分,重要的是语言的含义,是语言表达世界的能力,而汉语在表形和表意方面比英语强一万倍。</p><p><br></p> <p><br></p><p> 从汉语本身就可以直接映射部分客观世界,而英语完全缺乏这个功能;英语仅仅是语音的编码,而汉语则是音形意的编码,是立体的编码;阅读英语时人们往往注意了读音,而忽略了含义,然后再从音去检索意,这种音与意的映射全靠死记硬背。</p><p><br></p> <p><br></p><p> 语言反映了人的思维,英语国家的人比中国人单纯呆板幼稚的多,他们宏观思维能力很糟糕,处理事情缺乏灵活性,做事偏激,与阿拉伯的极端分子处于同一个档次;汉字输入比英语麻烦,这只能说计算机笨蛋,而不能说明人笨蛋,毕竟汉字是按照音形意编码的,现在的计算机和程序还没聪明到能够完美地处理汉字的程度,计算机能够很好地处理英语,说明英语的水平也就是计算机的水平。</p><p><br></p> <p><br></p><p> 计算机不能很好地处理汉语;说明汉语太丰满和复杂。难道汉语的先进也是一种错吗?世界变化发展,新的概念层出不穷,字母文字应付的办法只好是造词,过了上千上万年之后,超负荷将把字母文字压垮,整个世界唯有汉字独领风骚!</p><p><br></p> <p><br></p><p><br></p><p> 本文摘自赵世民的《探秘中国汉字》</p><p><br></p><p><br></p>