所以外文数字出版中提供难句抽取服务具有积极的意义。实现外文数字出版中的难句抽取的完全自动化,从理论上说,需要涉及语篇的预处理、难句识别及抽取算法和机器翻译,而这在目前还存在一些困难。其次,除了语料的标注,难句抽取还需要根据高效准确的难句识别和抽取算法,开发相应的难句抽取软件工具。......
2023-11-23
1.难句翻译策略
数字出版提供难句抽取服务时,目前的机器翻译的水平还不能达到正确的自动翻译,对于通过文本难度算法提取出来的难句,由于不能通过机器翻译方法给出准确的翻译结果和句子分析,而出版社不可能投入人力物力来组织相关领域的专家或人员进行难句的翻译工作,所以必须采用其他方法。
在目前网络环境普及、数字出版中的云阅读以及社会性阅读快速发展的情况下,可根据读物的特点,通过群体智能完成翻译工作。在云环境下,“云”所积极整合的计算资源不仅包含电子计算资源,还包含人力计算资源。人力计算(Human Computing)是将很多的人脑利用起来,解决更复杂更庞大的问题。人力计算属于互联网环境中的一类强大计算资源,也是互联网环境中最基本和最有效的计算节点。人的计算性和群体智能在“云”时代具有广阔的发展和社会化应用前景[17]。通过人力计算的群体智能解决抽取出的难句翻译问题并不困难,同时在情况许可时,对一本再版或多次再版的书籍,可将早期为读者们提供的优质的翻译结果,放置到出版社平台供下载,实现资源的有效利用。
(1)外文文学原著和学术专著
对于外文文学原著,有的是非常著名的,阅读的人很多;有的可能在一定区域范围内阅读的人数并不多。对于学术专著也有同样的情况,但无论如何,从全国范围内,阅读人数的基数是可以足够大的。所以,在云出版平台上给出专门的论坛区,供阅读同一本书的读者讨论协商,并与社会中从事翻译工作的自愿者协作给出正确翻译结果,这样既可以增加大家学习探索的积极性,也是对文化的学习和传播。由于翻译是一件需要非常认真细致和涉及综合知识的专业性质的工作,通过讨论得出的结果可能更合适。
(2)外文原版教材(www.chuimin.cn)
对于国内使用较多的原版教材,其中的难句可由授课教师或教材引进部门组织专家翻译放到服务器上提供给学生,同时也可以通过论坛或参考双语平行语料库的信息服务平台等辅助翻译完成[18]。
(3)视频、动漫和用网络游戏外语学习
相对于阅读文本,视频、动漫和用网络游戏外语学习中的难句可能很少,但对于其中一些经典句子,甚至某些经典情节等,通过大家的讨论会理解更深,所以可通过专门的论坛来解决。
2.难句显示
对于难句的显示,只需给出难句本身和其对应的页码和章节号,使读者能准确定位其原来所在的语境,根据上下文进行理解。对于再版书籍,如果已经有难句解释资源,则可在释义属性中给出。
所以外文数字出版中提供难句抽取服务具有积极的意义。实现外文数字出版中的难句抽取的完全自动化,从理论上说,需要涉及语篇的预处理、难句识别及抽取算法和机器翻译,而这在目前还存在一些困难。其次,除了语料的标注,难句抽取还需要根据高效准确的难句识别和抽取算法,开发相应的难句抽取软件工具。......
2023-11-23
此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
在自然语言处理中,无论是语音还是文本语言的处理,都要求具有丰富的词的知识。因此,自然语言处理要完成对一个语篇的处理,不仅需要句子的标注,还需要进行更深入复杂的工作。英语的自然语言处理水平处于世界先进水平,对英语实现词汇抽取服务很容易的。......
2023-11-23
2014年,新技术在我国数字出版中的应用将得到进一步发展。因此,数字出版的潮流势不可挡。韩国的数字出版产业政策对其数字出版产业发展起了极大的促进作用,其扶持政策值得我国借鉴。为了加强数字出版产业振兴政策的实施效果,韩国政府进一步明确了数字出版相关法律,培养专业性的数字出版人才顺应发展数字出版产业的趋势。......
2023-11-23
目前,我国许多高校“看电影学外语”的教学模式为越来越多的教师所采纳和应用。在原版电影中学生能接触到大量形象生动、标准地道的生活语言,从而充分调动学生的语言学习积极性,有利于培养学生的语感和听说能力。自20世纪80年代至今,国内外众多学者,一直不断地对英文电影在教学中的应用展开研究,人们已经逐渐认识到原版电影在大学英语教学的诸多优势。......
2023-11-23
在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。目前数字出版中的语言服务,有代表性的有以下几种:1)数字出版编辑中的语言服务:文字编辑与校对。3)数字出版面向读者的语言服务:文本难度。......
2023-11-23
外文原版教材具有篇幅长、语言正式、句式复杂、专业性强等特点。尽管一些优秀的外文原版教材一般语言简洁流畅,但由于专业知识的讲解涉及概念、相关理念、规律等,强调语言的缜密性、准确性,经常会使用长句和大量术语,较一般的文学读物等更不容易理解。我国目前的外文原版教材主要是纸制书形式,但将来以电子书形式的教材会增加。因此,对于原版教材阅读来说,无论是电子阅读还是纸质阅读,词汇问题是需要解决的关键问题。......
2023-11-23
从语言实用论的角度来说,词典不仅记录人类语言发展的事实、反映社会环境发展过程和结果,而且能通过改变人类认知世界的方式,从某种程度上推进某一特定社会发展时期生产力的发展。这个定义表明数字化科技发展给“词典”一词带来了新的意义和用法,词典的内涵和外延都发生了变化,把光盘词典、掌上电子词典、手机词典、网络词典和机器词典等各类电子词典融入了词典定义的范畴。......
2023-11-23
相关推荐