俚语有很多特征,其中口语化是俚语的基本特征。此外,俚语的另一个典型特征是时间限制特征。时间限制指俚语是随着时代的变化而变化的,某一时代盛行的俚语会随着这一代的结束而消失。因此,现在盛行的俚语,在未来的岁月里则可能会受到质疑。有文章说,俚语占口语比重20%。把俚语提取出来形成俚语表,可方便有意识学习和记忆。每种语言的俚语各有其特点,有自身对应的俚语词典,可根据对应的俚语电子词典完成俚语的自动抽取。......
2023-11-23
期刊文献是人们进行科学交流的重要工具,对于促进人类社会的发展具有重要意义。随着数字出版产业的形成,目前国际主流科技期刊已全面实现编辑出版的数字化和网络化[12]。世界各国为科研和学术交流的需要,都购买了国际主流科技期刊一些数据库的使用权。但对于阅读外文参考文献的读者来说,由于科技文献的语言特点,如客观、精确、文体正式和大量使用术语等,较一般的文学读物更不容易理解。同时由于期刊论文的写作特点和要求,即科技论文的描述不仅需要精确、逻辑性强,而且受文字数量的限制,更需要简洁,所以很多时候,期刊文献中的论文较外文原版教材的阅读更有难度。
一般来说,能选择阅读外文参考文献的读者,都具有一定的外语水平基础。但生词,特别是专业术语的影响使读者在阅读的开始阶段比较困难,查生词花费很多时间。而对外语水平和专业水平还处在学习发展期的在校学生来说,阅读外文参考文献似乎更有难度。
目前期刊文献电子阅读的过程中,能通过词典和翻译软件实现屏幕取词和例句,但还不能保证专业术语翻译的准确性,并且电子阅读本身缺点也对保证阅读质量有干扰[13];而纸质期刊阅读由于完全需要人工查词典,就更不方便。如果出版平台能把读者不认识的源语言单词提前抽取出来,并给出对于目标语言的翻译(英译汉时,英语是源语言,汉语是目标语言),生成能按字母和页码顺序进行删除、排序、筛选和保存的单词表,使读者在读一篇文献之前,能集中精力对生词和专业术语进行有意识强化记忆,不仅减少了查生词的时间,也符合认知规律,同时对促进外语学习也有益处。(www.chuimin.cn)
为此,本节探讨了在数字期刊出版平台应用自然语言处理技术,为期刊文献提供词汇抽取服务,帮助读者更有效和容易地阅读外文参考文献的问题。
俚语有很多特征,其中口语化是俚语的基本特征。此外,俚语的另一个典型特征是时间限制特征。时间限制指俚语是随着时代的变化而变化的,某一时代盛行的俚语会随着这一代的结束而消失。因此,现在盛行的俚语,在未来的岁月里则可能会受到质疑。有文章说,俚语占口语比重20%。把俚语提取出来形成俚语表,可方便有意识学习和记忆。每种语言的俚语各有其特点,有自身对应的俚语词典,可根据对应的俚语电子词典完成俚语的自动抽取。......
2023-11-23
所以外文数字出版中提供难句抽取服务具有积极的意义。实现外文数字出版中的难句抽取的完全自动化,从理论上说,需要涉及语篇的预处理、难句识别及抽取算法和机器翻译,而这在目前还存在一些困难。其次,除了语料的标注,难句抽取还需要根据高效准确的难句识别和抽取算法,开发相应的难句抽取软件工具。......
2023-11-23
此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
外文原版教材具有篇幅长、语言正式、句式复杂、专业性强等特点。尽管一些优秀的外文原版教材一般语言简洁流畅,但由于专业知识的讲解涉及概念、相关理念、规律等,强调语言的缜密性、准确性,经常会使用长句和大量术语,较一般的文学读物等更不容易理解。我国目前的外文原版教材主要是纸制书形式,但将来以电子书形式的教材会增加。因此,对于原版教材阅读来说,无论是电子阅读还是纸质阅读,词汇问题是需要解决的关键问题。......
2023-11-23
从语言实用论的角度来说,词典不仅记录人类语言发展的事实、反映社会环境发展过程和结果,而且能通过改变人类认知世界的方式,从某种程度上推进某一特定社会发展时期生产力的发展。这个定义表明数字化科技发展给“词典”一词带来了新的意义和用法,词典的内涵和外延都发生了变化,把光盘词典、掌上电子词典、手机词典、网络词典和机器词典等各类电子词典融入了词典定义的范畴。......
2023-11-23
在自然语言处理中,无论是语音还是文本语言的处理,都要求具有丰富的词的知识。因此,自然语言处理要完成对一个语篇的处理,不仅需要句子的标注,还需要进行更深入复杂的工作。英语的自然语言处理水平处于世界先进水平,对英语实现词汇抽取服务很容易的。......
2023-11-23
2014年,新技术在我国数字出版中的应用将得到进一步发展。因此,数字出版的潮流势不可挡。韩国的数字出版产业政策对其数字出版产业发展起了极大的促进作用,其扶持政策值得我国借鉴。为了加强数字出版产业振兴政策的实施效果,韩国政府进一步明确了数字出版相关法律,培养专业性的数字出版人才顺应发展数字出版产业的趋势。......
2023-11-23
目前,语料库是自然语言处理统计方法的基础,在自然语言处理的研究中占有不可替代的地位。按语料库的结构划分语料库可以分为平衡结构语料库和自然随机结构的语料库。按语料库的用途划分语料库可分为通用语料库和专用语料库。利用语料库从事语言研究,可以克服传统语言学研究中的很多困难和不足。......
2023-11-23
相关推荐