英文自动校对的研究大约始于20世纪60年代。同时,一些学者提出了拼写检查和语法检查的方法,对英文错误进行自动拼写改正。英文文本的自动校对基本以词的校对为核心,在“非词错误”和“真词错误”两个层次上进行。英文文本中非词错误的比例较大,所以较容易做出实用的英文校对系统。国内在文本自动校对方面的研究主要是针对汉语文本开展的。所以中文文本自动校对系统还需与人工校对相互补充,才能保证校对质量。......
2023-11-23
由于中文文本自动校对是在字、词级别上,计算机校对是以词语检查为主、基于规则和词典信息的机械校对。虽然计算机校对还不能达到人工校对的认知智能,但由于有词典的支持,在字、词的识别上有很高的效率,是人工校对所无法比拟的。
目前所使用的汉语校对软件都带有大规模的词料库,按词典标准设立的词语认字具有高度的精确性和稳定性。人工校对是基于一定背景知识和语感的启发性校对,人工校对之所以能发现句子中的文字错误,是因为人的记忆中存有大量的信息,但人的记忆是有限的和不稳定的,各人知识背景的差异对错别字不能完全识别,而且人脑容易受到外界和各种心理因素干扰,对一些似是而非的错别字视而不见。
人工校对的薄弱环节,恰是电脑的强项。电脑中能存储丰富的词语信息,而且都以编码形式存储,一个汉字对应一个编码。对人脑而言形似、义近的难辨字词,在电脑中是不同的编码,电脑很易分辨,而且机校还具有快速、稳定的特点。因而在错别字的校对方面,计算机校对大大优于人工校对。目前的计算机校对软件基本都能实现对丢字多字、打字错误、错别字、英文单词拼写错误、不规范标点、年月日错误的自动校对。
目前计算机校对软件对识别语义与构词错误的正确率还不高,需通过人工校对方法,根据原文的意思来识别,对于常见的语法错误计算机校对也无法正确识别,需人工校对进行纠错。此外,对于公式、图表,人工校对很容易识别其中的错误,而计算机校对却无法识别。(www.chuimin.cn)
专业术语、新词语也是计算机校对的一大障碍。因为计算机校对一般都是以词料库为背景的机械校对,书稿中的句子经校对系统分词后与库中的词语进行比对,找出书稿中的错误。但目前由于学科专业的多样化,交叉学科的发展,新专业、新名词的不断涌现,词料库是无法穷尽的。一般来说,词料库的更新总是滞后于学科专业的发展,专业性越强的书稿,计算机校对进行句子的分词难度就越大,查错率将越低。尤其是新专业、交叉学科的书稿,计算机校对将很难应付。因此,为了达到好的校对效果,计算机校对系统需不断更新丰富其词料库[7]。对一个有经验的校对人员来说,自身丰富的背景知识、专业知识、语言知识、经验知识等对最后的校对结果起着非常重要的作用。
目前,自然语言处理在新词获取方面的研究一直在进行着,特别是合理利用互联网上的文本数据,从中获取领域术语词典成为一个既具有挑战性又具有实际应用价值的课题[8]。随着领域术语获取技术的进步,相应的计算机自动校对水平将会进一步提高。
英文自动校对的研究大约始于20世纪60年代。同时,一些学者提出了拼写检查和语法检查的方法,对英文错误进行自动拼写改正。英文文本的自动校对基本以词的校对为核心,在“非词错误”和“真词错误”两个层次上进行。英文文本中非词错误的比例较大,所以较容易做出实用的英文校对系统。国内在文本自动校对方面的研究主要是针对汉语文本开展的。所以中文文本自动校对系统还需与人工校对相互补充,才能保证校对质量。......
2023-11-23
在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。目前数字出版中的语言服务,有代表性的有以下几种:1)数字出版编辑中的语言服务:文字编辑与校对。3)数字出版面向读者的语言服务:文本难度。......
2023-11-23
我们每天都在成百上千次地搬运东西,“搬运”这个动作已经成为我们日常生活的一部分。在生产中,每次当工件被转移、储存、传输或组装时,都会发生搬运的动作。搬运任务的自动化是众多可用设计解决方案中的一种。本章介绍了对于当代搬运工序中可用自动化组件的基本理解。本章也审视了搬运技术的发展和在工业生产的所有领域中发展的源动力,它对于阐述此项技术未来发展的驱动力和得到未来组件发展的蓝图有所帮助。......
2023-06-15
在目前网络环境普及、数字出版中的云阅读以及社会性阅读快速发展的情况下,可根据读物的特点,通过群体智能完成翻译工作。在云环境下,“云”所积极整合的计算资源不仅包含电子计算资源,还包含人力计算资源。所以,在云出版平台上给出专门的论坛区,供阅读同一本书的读者讨论协商,并与社会中从事翻译工作的自愿者协作给出正确翻译结果,这样既可以增加大家学习探索的积极性,也是对文化的学习和传播。......
2023-11-23
但是DVD电影的这一特性却使学生很有可能太放松,他们感觉不到来自电影对他们的要求,电影不会要求他们回答问题。DVD电影提供丰富地道的语言输入,包括一些书面上甚少出现的口语语素,是非常好的语言学习资料。......
2023-11-23
鉴于现代技术不断发展,特别是云计算的出现以及人工智能领域的研究成果将来在数字出版中的应用,数字出版中可能会出现更多的语言层面的服务形式。同时结合目前已经存在的一些自然语言处理在数字出版中的应用形式,如文版编辑与校对、词典编辑和文本难度等,才提出数字出版语言服务这一理念。......
2023-11-23
抽取的词汇形成词汇表提供给读者时,为了方便读者的查询或有利于记忆和学习词汇,显示属性设置是否合理非常重要。除了必须的词汇原型及释义外,对其他的显示属性也需要认真考虑。如英语中给出音标标注和发音,汉语中给出拼音标注和发音等。需要注意的是在词汇表显示属性设置相同的情况下,对于读者群不同的书籍,在具体的显示方式上,需要考虑学习对象的特点,提供不同的显示方式。......
2023-11-23
此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
相关推荐