王正阳带着秦毅来到了研究所里面,来到一间会议室当中,会议室里面坐满了研究所的研究汉语编程和汉语操作系统的人。
王正阳仔细的整理了一番自己的语言,想了想说道:“先从语言说起吧,汉语相比起英语来,有很多优势。”
“汉语文字精炼,言简意赅,冗余度低,以最少的符号表达最丰富的含义,我们从信息学的角度予以阐述,汉字、西文字母作为语言文字的最基本单位,用以构成词汇、句子,传达一定的信息,是信息的载体,如何对每一个汉字、字母所负载的信息进行度量?”
“现代信息学用熵来衡量平均信息量,熵表示指定符号出现的不肯定性。西文字母采用的拼音文字字母有30个左右,汉语以方块字为书写单位,数目成千上万,显然其随机出现的不肯定程度比西文字母的不肯定程度要大得多,从这一角度讲每个汉字载荷的信息量远远大于一个字母的信息载荷量。”
“我们经过统计计算,得出法语字母的零阶熵值为3.98比特,意大利字母零阶熵值为4.00比特,西班牙字母零阶熵值为4.01比特,英语字母的零阶熵值为4.03比特,德语4.10比特,罗马尼亚语为4.12比特,俄语为4.35比特。”
“英语词的零阶熵为10.0比特,汉语词的零阶熵为11.46 比特,这表明汉语的词义也比英语丰富。”
王正阳一边说,旁边有人开始打开投影仪,播放出他们对汉语和英语差异方面的研究成果。
“因为我们的汉语太过言简意赅,一个字、一个词表达的意思太丰富了,同样的一个字一个词在不同的场合下,语气下,意思就完全不一样。”
“因而由汉字组成的句,它的意思就更加的丰富,往往非常简单的一句话,它却是拥有多个意思。”
“比如能穿多少是多少?”
“这一句非常简答的话,它就有两种意思,一种是尽可能的多穿衣服,一种是尽可能的少穿衣服,两种意思完全不同,可是偏偏又是同样的一句话。”
“本来语言精简是非常不错的一件事情,但是在计算机领域内,因为计算机从根本上来说,它是一种精准的计算。”
“意思表达不明确,它就根本没有办法去计算。”
“相反英语就比较冗长,但是冗长归冗长,冗长度高的语言结构性好,语言信息表达精确,纠错能力强,利于计算机的计算、编程等等。”
秦毅仔细的听着,王正阳讲的这些东西一听就懂,对于计算机也深入学习过的秦毅自然就明白。
“据我所知,程序编码的过程当中是尽可能的要求精炼,按理来说我们汉语的优势应该是更明显才对。”
听到这里,秦毅想了想提出了自己的疑惑。
“你说的不错,从计算机发展的历程来说,编程方面一直都要求精炼,特别是在计算机刚刚发展起步的时候,因为存储容量有限,编码都是尽可能的精炼。”
“这就好比是我们古代,在还没有发明纸张之前,书写仅仅只能够在羊皮、竹子上面的时候,因为书写材料制作不已,所以书写的时候都尽可能的简练,于是有了我们现在的文言文。”
“但是精炼归精炼,计算机说到底还是一种运算,一种计算方式,精炼也要表达出准确的意思才行,我们汉语意思太丰富,精炼是绝对够,但表达的意思太过丰富,它对于计算就带来了巨大的困扰。”
听到秦毅的话,王正阳点点头,他是计算机文字信息处理方面的专家,对这些东西都很懂。
“那这样说来,汉语编程和汉语系统是不可能实现了?”
听到这里,秦毅忍不住皱起了眉头,听这王正阳的话,总觉得让人比较郁闷外加气愤,心里面都考虑着要不要换过一个人过来主持这个工作。
这还是秦毅第一次动了换人的年代,一直以来秦毅都没有换过任何一个研究单位的负责人,但是这次,秦毅真的有点动了这个年代了。
“不~这英语可以实现,我们汉语也可以实现。”
“因为我们的汉语表达的意思更加的丰富,我认为在未来计算机发展的历程当中,我们汉语的优势会越来越明显。”
“另外,计算机是计算机,语言是语言,这英语可以,我们汉语也可以,其它的日语、阿拉伯语等等也都可以,本质上来说任何一种语言都是可以的。”
“只是我们可能是因为受到了英语的限制,受到了现有编程思维限制,一直无法打破英语编程和英语操作系统留下的条条框框,所以我们一直没有什么进展。”
ps:有没有学计算机的,都出来说说汉语编程的可能性~
广告位置下