首页 理论教育数字出版语言服务现状:自然语言处理技术助力阅读

数字出版语言服务现状:自然语言处理技术助力阅读

【摘要】:在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。目前数字出版中的语言服务,有代表性的有以下几种:1)数字出版编辑中的语言服务:文字编辑与校对。3)数字出版面向读者的语言服务:文本难度。

在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。例如,全媒体出版通过手机互联网、手持终端、数字图书馆等媒体把版权提供给不同的用户;通过CD、PPT和视频等多媒体手段将内容资源整合到电子图书中,使电子版的教科书里有互动图表、音频和视频;关注大数据技术,根据对教学平台在学校使用之后产生的大量用户行为数据的深度分析,帮助出版商实现个性化服务等。电子书从1.0、2.0朝着3.0[2]方向发展等。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。

目前数字出版中的语言服务,有代表性的有以下几种:

1)数字出版编辑中的语言服务:文字编辑与校对。

2)数字出版产品形态中的语言服务:词典编辑,屏幕阅读中的屏幕取词。

3)数字出版面向读者的语言服务:文本难度(阅读分级)。(www.chuimin.cn)

其中,根据文字编辑与校对技术开发的语言服务工具是数字出版行业编辑人员普遍使用的,如Word中的文字与校对功能。词典编辑技术不仅使辞书出版所花费的人力物力大大减少,同时提高了词典的质量和形式创新;通过屏幕阅读中的屏幕取词技术,提高了外文阅读效率;更多的国家在书籍出版中提供文本难度服务,帮助读者选择语言难度等级合适的读物。总的说来,数字出版行业在利用技术对阅读和语言学习提供帮助方面,注重声音、画面等多媒体感官刺激的较多、注意与人类认知规律相结合方面的考虑较少。

此外,随着现代社会环境的数字化或称为“智能社会”,各种数字装置扩大了人类有限的智能,但同时损害了人们的深层思考能力。随着数字化环境对人类生活的这种副作用日渐显现,人类认知能力和信息技术的相悖关系正在成为人类需要进行深度思考的一个课题[8]

希望本书后面介绍的数字出版提供词汇和难句抽取服务会在各方面为人们阅读和语言学习提供具有实际意义的帮助,并在辅助改善数字化阅读对人类阅读深层思考所产生的副作用方面,发挥某些作用。