第七百四十一章 生僻字的重要性(1 / 2)
“是吗?”周至说道:“那为何我研究过一些关于文字系统的论述,结果发现一般中文应用系统,也需要一万三千个左右的汉字;而大型的中文应用系统,则需要两万三千个左右的汉字;政府机关的专用中文应用系统,则需要四万八千个左右的汉字;而大型图书馆用的中文应用系统,需要的汉字可能超过十万呢?”
“哪里这么夸张?”李红江是计算机信息技术的大拿,然而对汉字编码也是半路出家,对于编码算法,字库编程,函数耦合等技术性的东西有丰富的经验,然而大型图书馆需要超过十万的汉字这种概念,也彻底颠覆了他的认知。
“的确有这么夸张。”辜老说话了:“光康熙字典,就有四万七千零三十五个汉字,也就是说,如果我们图书馆要对康熙字典进行数字化采集,你们这个还没有投入的gb13000,将有一半的汉字,在系统当中显示不出来。”
辜振铎也开口了:“我主持编纂的《汉语大字典》,收入的单字也有五万六千个,如果用gb2312标准,只够一个零头,如果用gb13000,也只够一小半。”
旦增大师作为历史系的重要人物,今天也参与了这个会议,这时候也说道:“大家不要忘了,我们祖国是一个多民族的国家,除了汉语以外,还有藏文,蒙文,壮文,维吾尔文等十多种文字,这些少数民族文字的信息化编码工作,也是应该要纳入考虑的。”
辜振铎听着都觉得有些过分,这最大最主要的语种都还没有搞定呢,哪里顾得到其他,于是说道:“这个要求也实在太苛刻了,得让搞信息技术的同志们一步步来嘛……”
“还不止这些啊!”旦增不退反进:“除了少数民族文字,还有古代文字呢,比如甲骨文,啊甲骨文不算,可以算作一种字体,但是突厥文,回鹘文、于阗文、西夏文,这些不能不算吧?”
“旦增主任,我们先解决主要矛盾,主要矛盾。”麦主任听得头都大了:“次要矛盾先放一放……”
“不用放,无解。”李红江将手一摊:“码位就好像放字的盒子,码位就那么多,因此能放的字也就那么多,gb13000标准两万一千零三个汉字,是我们经过辛苦的研究才搞出来的。”
“况且我们使用gb2312编码这么久了,除了一些生僻字以外,还是基本能够满足需要的嘛,这么多年都这么过来了,现在又扩展了这么多,应该满足绝大多数应用场景了嘛。”
“哈哈哈哈……”辜幼文听到这个说法,不禁没有生气,反而像听到一个懵懂的孩童讲出无忌的童言那般给逗乐了:“小王是理科生,以前是搞数学的是吧?所以你有这个想法我们也不怪你。”
“我给大家讲一个历史故事吧。”
“大禹治水的故事,大家都知道吧?”
所有人都是点头。
“那大禹的父亲,因为治水失败而被舜殛死于羽山的鲧,大家知道吗?”
这下理科参会者那边,点头的就少了一半。
“大禹的父亲,名字叫鲧,鲧字有三种写法,大家知道吗?”
这回连文科这边的教授都有不清楚的了。
“肘子,你来讲。”辜老将装逼的机会留给了周至。
周至只好接着:“鲧字有三种写法,一种是大家熟悉的,一个鱼,一个系;第二种是一个鱼,一个玄;第三种是一个骨,一个系。”
“鲧是禹的父亲,相传为颛顼之子,一说颛顼五世孙,姒姓,字熙。居于今河南嵩山一带,当时是崇地,所以称有崇氏,又称崇伯。”