首页 理论教育数字出版与自然语言处理技术实现难句翻译和显示

数字出版与自然语言处理技术实现难句翻译和显示

【摘要】:在目前网络环境普及、数字出版中的云阅读以及社会性阅读快速发展的情况下,可根据读物的特点,通过群体智能完成翻译工作。在云环境下,“云”所积极整合的计算资源不仅包含电子计算资源,还包含人力计算资源。所以,在云出版平台上给出专门的论坛区,供阅读同一本书的读者讨论协商,并与社会中从事翻译工作的自愿者协作给出正确翻译结果,这样既可以增加大家学习探索的积极性,也是对文化的学习和传播。

1.难句翻译策略

数字出版提供难句抽取服务时,目前的机器翻译的水平还不能达到正确的自动翻译,对于通过文本难度算法提取出来的难句,由于不能通过机器翻译方法给出准确的翻译结果和句子分析,而出版社不可能投入人力物力来组织相关领域的专家或人员进行难句的翻译工作,所以必须采用其他方法。

在目前网络环境普及、数字出版中的云阅读以及社会性阅读快速发展的情况下,可根据读物的特点,通过群体智能完成翻译工作。在云环境下,“云”所积极整合的计算资源不仅包含电子计算资源,还包含人力计算资源。人力计算(Human Computing)是将很多的人脑利用起来,解决更复杂更庞大的问题。人力计算属于互联网环境中的一类强大计算资源,也是互联网环境中最基本和最有效的计算节点。人的计算性和群体智能在“云”时代具有广阔的发展和社会化应用前景[17]。通过人力计算的群体智能解决抽取出的难句翻译问题并不困难,同时在情况许可时,对一本再版或多次再版的书籍,可将早期为读者们提供的优质的翻译结果,放置到出版社平台供下载,实现资源的有效利用。

(1)外文文学原著和学术专著

对于外文文学原著,有的是非常著名的,阅读的人很多;有的可能在一定区域范围内阅读的人数并不多。对于学术专著也有同样的情况,但无论如何,从全国范围内,阅读人数的基数是可以足够大的。所以,在云出版平台上给出专门的论坛区,供阅读同一本书的读者讨论协商,并与社会中从事翻译工作的自愿者协作给出正确翻译结果,这样既可以增加大家学习探索的积极性,也是对文化的学习和传播。由于翻译是一件需要非常认真细致和涉及综合知识的专业性质的工作,通过讨论得出的结果可能更合适。

(2)外文原版教材(www.chuimin.cn)

对于国内使用较多的原版教材,其中的难句可由授课教师或教材引进部门组织专家翻译放到服务器上提供给学生,同时也可以通过论坛或参考双语平行语料库的信息服务平台等辅助翻译完成[18]

(3)视频、动漫和用网络游戏外语学习

相对于阅读文本,视频、动漫和用网络游戏外语学习中的难句可能很少,但对于其中一些经典句子,甚至某些经典情节等,通过大家的讨论会理解更深,所以可通过专门的论坛来解决。

2.难句显示

对于难句的显示,只需给出难句本身和其对应的页码和章节号,使读者能准确定位其原来所在的语境,根据上下文进行理解。对于再版书籍,如果已经有难句解释资源,则可在释义属性中给出。