首页 百科知识南航附中毕业55年校友回母校分享成功青春记

南航附中毕业55年校友回母校分享成功青春记

【摘要】:锲而不舍者必成——毕业55年向母校汇报张炘中张炘中1954届校友。今年是南京七中命名60周年。天道酬勤,自1980年直到2002年底退休,经过22年持之以恒、锲而不舍的钻研,我这个智力一般的人仍做出一点成绩,这里向母校简略汇报如下:22年来,我作为课题组长承担了多项科研任务,其中包括7项国家级科研项目,如“863”国家高科技、国家五年计划攻关、国家自然科学基金项目等,取得了多项科研成果。

锲而不舍者必成——毕业55年向母校汇报

张炘中

张炘中

1954届校友。1958年清华大学毕业,留校工作。历任清华大学教授、北京信息科技大学“北京精密印刷照排系统(京748)”科研组长,长期从事计算机汉字识别研究,上世纪七十年代即担任“北信OCR——汉字文本自动录入系统”科研组长,曾在全国评测中多次获第一名,对我国印刷汉字识别初期实用化起了关键作用,1990年获国家科技进步三等奖,1997年获联合国颁发发明创新科技之星奖,1992年出版《汉字识别技术》专著。在国内的刊物和国际会议上发表论文65篇,1991年获国务院政府特殊津贴。

今年是南京七中命名60周年。我1954年七中高中毕业后考进清华大学,1958年提前毕业留校工作,1987年转入北京信息科技大学(现名),工作44年后于2002年底67岁时退休。(www.chuimin.cn)

回顾一生虽然平凡,但在汉字识别领域还是做了一些工作。1978年我在清华大学计算机系任教时,担任了“北京精密印刷照排系统(京748)”科研组长,首次进入到中文信息处理领域。1980年,是十一届三中全会召开后不久百废待兴的年代,我感到应该确定一个科研方向,在退休前锲而不舍地坚持下去。定什么呢?我选择了汉字识别。汉字识别通俗地讲就是让计算机认汉字,用计算机自动辨识印刷或手写在纸上的汉字,准确地讲是用计算机抽取汉字特征,和机器内预先存放的汉字特征库匹配判别后将纸上汉字自动转换成某种代码的一种技术。为此,首先要将纸上汉字用扫描仪(市场已有商品)扫描后形成数字图像点阵存入计算机,然后要研究抽取汉字特征的方法并编制程序,让计算机认数字化后的汉字。汉字识别的关键在于研究汉字特征抽取方法和编制整个识别流程程序。当时为什么选汉字识别作为今后的科研方向呢?一是我已进入到中文信息处理领域,汉字识别是中文信息处理中的一个尖端项目。二是当时国内汉字识别研究基本未开展,属空白,国外研究多的是英文字符识别,欧美科研人员对汉字不熟悉,研究的人少,水平也不高。日本日文汉字识别的研究正在浪头上,代表了汉字识别的世界最高水平。中国汉字比日本多,研究难度更大,我想我国汉字识别技术应该由中国人自己来开创,不能等日本人研究成功后再学用。人活在世上,总要对自己的国家和人民做点有用的事,哪怕一点点小事也好。三是自知智力不佳,在广泛领域中研究问题难有作为,在汉字识别这个相对窄的领域坚持研究下去能得到一些成果。天道酬勤,自1980年直到2002年底退休,经过22年持之以恒、锲而不舍的钻研,我这个智力一般的人仍做出一点成绩,这里向母校简略汇报如下:22年来,我作为课题组长承担了多项科研任务,其中包括7项国家级科研项目,如“863”国家高科技、国家五年计划攻关、国家自然科学基金项目等,取得了多项科研成果。这些项目和成果的核心技术是基于我1987年提出的“汉字识别特征点方法”所研制成功的“北信OCR——汉字文本自动录入系统”,该系统在我国前、中期全国评测中多次获第一名,有4 000余套在国内外使用,对我国印刷汉字识别初期实用化起了关键作用。这些成果在1981年和1984年两次获得北京市科技进步三等奖,1989年获得机电部科技进步一等奖,1990年获得国家科技进步三等奖,1997年获得联合国技术信息促进系统中国国家分部颁发的发明创新科技之星奖。在论著方面,1992年出版了《汉字识别技术》专著,在国内外刊物和国际会议上共发表了65篇论文,和他人合作编著了5本书并正式出版。1990年赴新加坡国立新加坡大学讲学,1992年赴台湾参加“两岸中文电脑输入学术研讨会”。此外,作为中国中文信息学会理事和中国中文信息学会基础理论专委会副主任委员,在1987年到2002年,主持了第二届到第八届的“全国汉字及汉语语音识别学术会议”(后三届取消汉语语音识别)。使我欣慰的是1991年获得了国务院第二次颁发的政府特殊津贴证书,享受国家特殊津贴待遇,是国家对自己科研工作的肯定。

我能取得以上这些成绩,几十年来始终如一地坚持锲而不舍的精神起了关键作用。古语云:“锲而舍之,朽木不折;锲而不舍,金石可镂。”具有百折不挠精神,坚持到底的人才能成为最终胜利者!抚今追昔,我能多年锲而不舍地扎根于汉字识别研究不动摇,首先要感谢南京七中母校老师们对我的培养和熏陶,使我在青少年时代初步养成对学习锲而不舍、不断向上的习惯。今天我还能清晰地回忆起五十多年前南京七中吉星老师自为表率的严格要求,使我数学作业评分由C、B逐渐上升到A(全对),再由A变为赏心悦目的A+(全对且书写整齐、清晰、美观)。是包括吉星老师在内的各位老师的耐心教育,使我期考成绩从入初中时的全班中下等进步到高中毕业时的上等。考进清华大学,我也带去了学习要锲而不舍、刻苦向上的传统,在清华名师谆谆教导和优良学风的熏陶下,进一步锤炼了我为达到目标要锲而不舍追求的意志。我在清华低年级有难度的基础课学习时能刻苦钻研,期考成绩为全5分(5级分制,最高分),获得学校颁发的“学习优良奖状”。毕业后进入到汉字识别这个对我既空白又带有神秘感的研究领域时,更是把锲而不舍的精神发挥到极致。在我提出“汉字识别特征点法”之前,日本学者已经提出不少识别日文汉字并抽取其特征的经典方法,用这些已发表的识别日文汉字的方法来识别中国汉字原则上也可行,但缺点不少,如识别率低,存储特征集字典容量大从而识别速度慢……能不能抛开日本已有的方法,研究出新的识别中国汉字的方法呢?关键在于能否找出藏在汉字字形中的本质特征。识别就是区分,要识别两个人,只要找到能区分开他们的特征(例如身高)就可以了。如何区分开千千万万个汉字且用最少的特征呢?我想认一个汉字和汉字笔画粗细、形状等基本无关,用细铅笔写一个汉字和用仿、宋、楷、黑体印刷的大大小小的汉字对认字来讲几乎无差别。这就是说,一个数字化汉字的点阵信息绝大部分集中在汉字骨架上,抽取特征时就可以去掉除骨架以外的其他点阵信息。能否进一步减少汉字骨架信息又不去掉能区分千万汉字的本质特征呢?可以的,汉字骨架有用信息又大多集中在骨架笔画的若干特征点上,如直笔画的起、止点(叫端点),拐弯笔画的转折点(叫折点),两笔画的交叉点(叫交点),一笔画到另一笔画但不穿过的点(叫歧点)。这样,就把汉字骨架信息浓缩到端、折、歧、交四种特征点上,大大减少了汉字特征的信息量。初战告捷,按此方法编程识别汉字时,识别速度比日本的方法快多了,但识别率增加不多,有不少误识的汉字。进一步研究分析发现一个汉字数字化点阵的空白(背景)部分也包含区分汉字的丰富信息,丢掉这些信息会造成误识多,经过反复思考、编程,我又在汉字数字点阵的背景部分选取若干点(叫关键背景点)重新编程识别,识别率大大提高了,还增加了抗干扰能力,初步达到实用化水平。我在提出“汉字识别特征点法”前后近半年的时间里,脑子里塞满了特征点,怎样抽取?怎样匹配?……吃饭没有滋味,做梦也是端、折、歧、交、背景关键点,把当时许多人追求的住房、晋升、工资、福利等切身利益抛在身后,把自己有限的全部精力投放到研究思考中,水到渠成地提出了该方法,建成了北信OCR系统。

如今正是我国改革开放、经济腾飞、知识创新、人才辈出的时代,知识决定命运,创新改变未来,正是我们为国为民,甚至为全世界奋斗的时代。回想我们年轻时,大好光阴浪费在人斗人中,读书求知当作白专道路批斗,那时多想有一个安心学习的环境!如今同学们赶上这样一个我们年轻时想都不敢想的好时代,希望大家根据自己的兴趣爱好、能力条件,想想自己这一辈子准备为国为民为全世界做点什么?早定目标、脚踏实地、锲而不舍坚持下去,十年、二十年、三十年、四十年、五十年不动摇,我相信所有的同学都一定能取得辉煌成功!