首页 理论教育数字出版的语言服务理念

数字出版的语言服务理念

【摘要】:鉴于现代技术不断发展,特别是云计算的出现以及人工智能领域的研究成果将来在数字出版中的应用,数字出版中可能会出现更多的语言层面的服务形式。同时结合目前已经存在的一些自然语言处理在数字出版中的应用形式,如文版编辑与校对、词典编辑和文本难度等,才提出数字出版语言服务这一理念。

数字出版提供词汇抽取服务是源于本书作者在国际上发表的两篇论文,一篇是2012年美国《出版研究季刊》(Publishing ResearchQuarterly)中发表的“Popularizing Vocabulary Extraction Service on Digit-al Publishing Platform”,探讨的是通过数字出版提供词汇抽取服务辅助人们更好地阅读外文文学原著的问题;另一篇是2013年年初在世界编辑出版类主流期刊《学术出版》(Learned Publishing)发表的“Vocab-ulary extraction in foreign-language journals:how natural language process-ing can help readers”,探讨的是在国际主流期刊文献出版平台提供词汇抽取服务,辅助世界各国的科技工作者提高阅读外文期刊文献效率的问题。此外,在2013年和2014年分别在国内出版业核心期刊《科技与出版》和《出版科学》中发表了两篇关于数字出版语言服务的论文,提出通过词汇和难句抽取服务辅助外文原版教材阅读和在各类数字出版产品中都可以提供类似语言服务的观点。

由于作者先是经历了外语学习的枯燥折磨,当好不容易享受英文小说阅读的乐趣时,却常被词汇问题打扰;有的书籍很想去读,但词汇难度把乐趣浇灭的同时,把阅读本身也止住了。因此,才提出数字出版提供词汇和难句抽取服务这样一个较“原始”但实用的方法。

数字出版提供词汇和难句抽取服务的出发点是把读者所要阅读的文本中的生词和难句提前抽取出来,放到出版平台上供下载,并通过合适的显示属性设置如页码和章节等,使读者能快速返回原文语境。这样,既方便读者对词汇和难句的预习和复习,也方便读者在任何时候,随机选择他所喜爱的章节里的生词和难句。经过有意识的分析和学习后,然后对那部分进行更好的阅读。而读者可在不同的设备上显示词汇表,如电脑显示器、手机等,也可以打印或抄写。先以页码或章节为单位抄写生词,然后阅读对应页或章节原文,这个过程本身就是一种有效的学习语言的方法。(www.chuimin.cn)

目前,这种数字出版中提供词汇和难句抽取服务在很大程度上还只是一种理念,在实际的数字出版中还没有实施,但在将来可以应用于每个国家的数字出版平台中。

鉴于现代技术不断发展,特别是云计算的出现以及人工智能领域的研究成果将来在数字出版中的应用,数字出版中可能会出现更多的语言层面的服务形式。同时结合目前已经存在的一些自然语言处理在数字出版中的应用形式,如文版编辑与校对、词典编辑和文本难度(阅读分级)等,才提出数字出版语言服务这一理念。