从阅读的目的来看,外文阅读可分为以语言学习为目的的阅读、工作需要进行的阅读和享受型阅读。现代汉字是指现代白话文用到的字,包括古今通用的字和白话文专用的字,合起来称“现代汉字”。与现代汉字相对的是只用于文言文中的字,我们称为文言古语用字。到目前为止,汉字生僻字的输入,还一直是困扰文史工......
2023-11-23
目前,汉语已列为世界十大语言中的第二位,世界上学习汉语的人数越来越多,我国在国外开设的孔子学院和来华学习汉语的人数都在增加,但汉语的推广和发展中存在很多问题,如对外汉语教材问题,国内由于拼音键盘输入等导致的“失写症”问题,汉语推广与文化连接问题等等,总体说来,汉语一方面存在大力推广和发展的良好契机,同时也面临着艰巨的改革和创新困难,希望数字出版中的语言服务,特别是词汇和难句抽取服务能为解决汉语的推广和发展中存在的上述困难发挥某些作用。
1.对外汉语推广
对外汉语推广中存在的几个难点中包括:汉语难写、难记,对外汉语教材词汇量过大、形式单调。国内汉语教材一贯重视词汇、语法编排的科学性与系统性,而忽略了课文的生动性、趣味性,对未成年学习者,这就成为一个主要问题。美国人编的儿童语言教材,一篇课文往往安排十几个游戏活动可供教师选择。
“中国大陆出版的教材很少注意设计活动”,澳大利亚中文教师赵小梅说,“我觉得中国大陆在研究课堂游戏方面还是一个空白,如果教学研究者、教材编写者能好好把这个问题研究透,编出有意思的教学手册,在西方国家肯定会畅销的”。
美国最受欢迎的儿童文学家、教育家苏斯博士(D r.Seuss)的代表作《戴高帽子的猫》只用了236个英文单词,《绿色鸡蛋和火腿》仅用了50个词。但是他的作品语言幽默风趣,韵文易记易诵,情节夸张而富有想象力。虽然汉语教材与文学作品有性质上的区别,但是殊途同归,尤其是针对海外只有零星业余时间学习汉语的大量学习者来说,教材的语言生动有趣,词汇与语法简单好用,课文易懂易记才能激发学习者持续的学习兴趣。
为了编出优秀的对外汉语教材和儿童读物,可以尝试从以下几方面考虑:
1)建立专门的用于对外汉语的写作语料库。为了写出优秀的对外汉语用教材和儿童等读物,可以利用信息技术工具集中古今中外汉语名作,帮助语言学家扩大视野和优化写作。虽然一个人的力量和智慧有限,但中华民族穿越历史和空间的众多的智慧和文化精华合起来就可以产生质的飞跃。实现的方法就是建立传统和现代优秀语料的写作语料库,由国家出资,组织专门的力量建立语料库,即完成词类和词义的标注。语料库不必很大,但要精,例如从唐诗宋词、童话到文学名篇中相关的作品。写作者可以通过词汇和句子抽取的方式,实现方便简洁地查询同类词和类比句等,如各种对人物、事情、场景、社会和个体活动的幽默、明快、简洁描述的对比,丰富对外汉语教材和儿童读物等编写的资料。语料库的操作务必要简单实用,方便从事语言研究和文学写作人员的使用。
2)对编写完成的教材或读物提供词汇抽取,形成能按字母、页码和课程序号等自由筛选的词汇表,在词汇表中设置词汇书写显示和字理解释属性字段,词汇书写字段提供展示对应汉字的书写过程动画,字理解释阶段提供对每个汉字的字理解释。
3)针对教材中的课文,设计包括文字、幽默和动画等多方面素材的课堂游戏。
4)把编制的教材和读物放到汉语学习和推广平台以付费或免费的方式供各国家汉语学习者使用,为了方便不同母语语言的学习者,所有资料配以相关本土母语的辅助解释和翻译,如字理的解释,就应采用使用者的母语。(www.chuimin.cn)
2.语文教材
目前,我国的语文教材基本还是纸质形式,随着数字出版技术的发展,电子书的普及,各种电子版、多媒体等形式的教材会出现,但无论是纸质书教材还是电子书教材,在教材出版中都可提供词汇抽取服务,学生通过对词汇表进行抄写的方式预习或复习生词。同时在词汇表中通过提供字理释义帮助词汇记忆和文化学习。语文教材中也需要设计各种与汉字和课文学习的语言游戏。实际上,国家可以通过建立语言游戏库的方法,收集整理、形成共享资源。
3.中小学生课外读物
为了促进我国中小学生的课外阅读,国家数字出版中应该提供阅读难度、内容分类和词汇抽取服务,使孩子们能选择语言难度合适感兴趣的课外读物,并通过词汇抽取服务方便词汇学习,词汇表中应含有词汇发音。在条件许可下,或者说有合理的字理释义资源的情况下也可以添加字理解释。字理解释可以是文字、图片和动画等多种形式。
4.成人读物
在成人阅读书籍出版时,可以通过词汇抽取服务提供低频词或生僻字词汇表,使人们在阅读中方便容易地学习掌握少量的新词汇,使智力得到更好利用,间接促进对汉语词汇的了解和书写。
5.古籍阅读
在古籍出版中提供词汇和句子解释服务,减轻阅读难度,使更多的人能够享受和欣赏传统文化的瑰宝。
从阅读的目的来看,外文阅读可分为以语言学习为目的的阅读、工作需要进行的阅读和享受型阅读。现代汉字是指现代白话文用到的字,包括古今通用的字和白话文专用的字,合起来称“现代汉字”。与现代汉字相对的是只用于文言文中的字,我们称为文言古语用字。到目前为止,汉字生僻字的输入,还一直是困扰文史工......
2023-11-23
此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。目前数字出版中的语言服务,有代表性的有以下几种:1)数字出版编辑中的语言服务:文字编辑与校对。3)数字出版面向读者的语言服务:文本难度。......
2023-11-23
数字出版提供词汇抽取服务主要是基于这样一个统计事实,一种成熟的语言,一般词汇量很大,但在人们的日常生活会话和书籍中,常用词占了绝大部分。在现代汉语文章中,2500个常用字的覆盖率达97.97%,3500个常用字的覆盖率达99.48%[4]。如果把一种语言的词汇按词频分段,语言水平高的读者,生词少且趋于低频词段,语言水平较低的读者,生词较多,生词词频段跨度会较大。......
2023-11-23
2014年,新技术在我国数字出版中的应用将得到进一步发展。因此,数字出版的潮流势不可挡。韩国的数字出版产业政策对其数字出版产业发展起了极大的促进作用,其扶持政策值得我国借鉴。为了加强数字出版产业振兴政策的实施效果,韩国政府进一步明确了数字出版相关法律,培养专业性的数字出版人才顺应发展数字出版产业的趋势。......
2023-11-23
所以外文数字出版中提供难句抽取服务具有积极的意义。实现外文数字出版中的难句抽取的完全自动化,从理论上说,需要涉及语篇的预处理、难句识别及抽取算法和机器翻译,而这在目前还存在一些困难。其次,除了语料的标注,难句抽取还需要根据高效准确的难句识别和抽取算法,开发相应的难句抽取软件工具。......
2023-11-23
在自然语言处理中,无论是语音还是文本语言的处理,都要求具有丰富的词的知识。因此,自然语言处理要完成对一个语篇的处理,不仅需要句子的标注,还需要进行更深入复杂的工作。英语的自然语言处理水平处于世界先进水平,对英语实现词汇抽取服务很容易的。......
2023-11-23
外文原版教材具有篇幅长、语言正式、句式复杂、专业性强等特点。尽管一些优秀的外文原版教材一般语言简洁流畅,但由于专业知识的讲解涉及概念、相关理念、规律等,强调语言的缜密性、准确性,经常会使用长句和大量术语,较一般的文学读物等更不容易理解。我国目前的外文原版教材主要是纸制书形式,但将来以电子书形式的教材会增加。因此,对于原版教材阅读来说,无论是电子阅读还是纸质阅读,词汇问题是需要解决的关键问题。......
2023-11-23
相关推荐