此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
出版是人类社会的一种重要活动,是传播文化的渠道,而现代的信息技术、网络技术、多媒体技术等促生了数字出版这一文化与科技融合的产物出现。随着数字出版这一新生事物的出现和发展,人类的出版史进入了新的时代。数字出版涉及的已经不仅仅是内容的数字化,而是正在突破出版产品载体的形式,出版机构的界定等传统限制,使人们重新认识出版的本质和出版的形态问题。
1.数字出版的概念
数字出版是技术革新带给出版业的又一进步,是出版传播途径的扩大和延伸,大大提升了传统出版的传播力与影响力,延伸了整个产业链,但并不是一个新产业的诞生。数字出版的基础是传统出版,传统出版是数字出版的内容提供商,数字出版是传统出版传播介质的发展。
数字出版源于Digital Publishing一词,可译为数字资源的出版,也可译为出版的数字化。从广义来看,在出版的生产活动中任何环节都有数字技术的参与,都可看做是数字出版;从狭义来看,数字出版应该是特指具有合法出版资质的企业利用数字技术从事的出版生产活动。
2.数字出版的几种形式
人类的技术是在实际应用中发展起来的,数字出版也是从最初的光与电到0和1的技术革新中不断发展成熟的,在不同时期有不同的内涵,下面对几个了解数字出版的发展轨迹有重要意义的概念进行说明,如图3-13所示。
图3-13 数字出版相关概念
(1)电子出版
电子出版是出版数字化的早期概念,是利用计算机技术制作电子出版物的工艺过程,即在整个出版过程中,从编辑、制作到发行,所有信息都以统一的二进制代码的数字化形式存储于磁、光、电等介质中,是信息的处理与传递借助计算机或类似的设备来进行的一种出版形式。电子出版物是以数字代码形式存储的、借助电子设备阅读的大众传播媒体,编辑加工的信息内容具有一定的知识性和思想性,同时存储的介质具有固定的物理形态,包括光盘、磁盘、集成电路卡等产品形态。
(2)网络出版
网络出版,又称互联网出版,是指互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。这一新兴出版业因具有海量存储、搜索便捷、传输快速、成本低廉、互动性强、环保低碳等突出优势,发展迅猛,在出版业整体产值中的比重逐年上升。
网络出版类型大约有五种:
第一种模式是目前国外较为流行的自行出版,个人就是在线出版商。(www.chuimin.cn)
第二种模式是以网络公司为主体,谋求各种出版商服务或者代理权出版电子图书并进行销售,然后给出版商提成版税。
第三种模式是出版商自行出版发行电子图书。
第四种方式是按需出版,这种比较成熟的模式,在美国进行绝版书和小批量书的出版发行;作为数字出版的一种方式,按需印刷试图在传统出版和数字出版中间找到属于自己的发展空间。对于出版商来说,按需出版的内容多不适合大众出版,按需出版往往表现为小众出版。
第五种模式,以Microsoft公司开发的eBook软件为典型。目前,第三代电子书eBook3.0已经问世,与eBook1.0、eBook2.0相比,eBook3.0本质上是一种跨媒介、多媒介的新媒体,是“图书+影视+互动”的集合体。
(3)跨媒体出版
跨媒体出版是通过平面媒体、电子媒体、网络媒体和移动媒体等多种媒介提供文字、图片、音频和视频等多媒体信息,为受众提供多样性阅读视听服务。跨媒体出版(Cross-Media Publishing)是一份内容的多次使用和多次增值,即出版商在一定的版权许可条件下将相同的信息同时发布到不同媒体环境中,以适应多样性受众的不同需求的出版过程,跨媒体已成为出版传媒业的大势所趋。
(4)复合出版
复合出版是在双轨出版[2]、跨媒体出版等概念基础上发展起来的,三者都是以XML技术作为基础,强调内容与内容之间的关联,具备内容与形式分离的特点,其实质可以概括为“一份内容、结构化加工、分层次表达、全媒体发布、按需服务”。该形式的出版能够帮助出版单位缩短出版周期,降低运营成本,丰富出版产品和服务,为图书馆、出版发行单位等提供统一的业务数据,消除信息阻隔,避免重复性内容生产。
我国政府已将国家数字复合出版系统工程作为新时期振兴现代出版业的重点工作,明确列入《国家“十一五”时期文化发展规划纲要》和《新闻出版业“十一五”发展规划》,以落实出版体制改革,实现产业升级目标。
(5)手机出版
手机出版作为数字出版的一员,是近几年兴起正蓬勃发展的一种出版形式。据美国无线电协会统计,2010年美国有3.03亿人拥有手机,占总人口的96%,其中6000万拥有智能手机,Google的Android和Apple的iPhone是最流行的智能手机,手机阅读成为新的阅读形式并带动手机出版的发展。巨额的广告收入为手机出版带来极大动力,许多出版机构也瞄准了手机这一平台提供给用户在手机上阅读和订购电子书的服务。苹果推出的出版物订阅服务,包括报纸、杂志及其他内容应用程序,订阅收益苹果保留30%,出版商获得70%。
与传统出版方式相比,手机出版具有传播速度快、范围广、携带方便、不受地域限制等优势,并且通过移动通信技术,使手机成为移动互联网的终端,这样就可以将信息传送到每个用户的手中,实现了随时随地知晓天下事。
此外,通过自然语言理解的研究可以更好地了解人类大脑是如何工作的。5)统计学:给自然语言处理提供基于样本数据来预测统计事件的技术。7)生物学:给自然语言处理提供大脑中人类语言行为机制的理论。......
2023-11-23
2014年,新技术在我国数字出版中的应用将得到进一步发展。因此,数字出版的潮流势不可挡。韩国的数字出版产业政策对其数字出版产业发展起了极大的促进作用,其扶持政策值得我国借鉴。为了加强数字出版产业振兴政策的实施效果,韩国政府进一步明确了数字出版相关法律,培养专业性的数字出版人才顺应发展数字出版产业的趋势。......
2023-11-23
在自然语言处理中,无论是语音还是文本语言的处理,都要求具有丰富的词的知识。因此,自然语言处理要完成对一个语篇的处理,不仅需要句子的标注,还需要进行更深入复杂的工作。英语的自然语言处理水平处于世界先进水平,对英语实现词汇抽取服务很容易的。......
2023-11-23
科学技术正在以前所未有的速度在发展,“大数据”资源出现在每个行业中。技术的进步,由“大数据”分析产生的各种生产、管理和销售策略相互促进,为整个人类社会带来进一步变化。自然语言处理技术的发展将进一步改进文本编辑和校对技术效率,减少出版编辑人员的工作量。希望通过数字出版提供词汇和难句抽取服务,也能有助于世界上非主流语言的学习和保留。......
2023-11-23
所以外文数字出版中提供难句抽取服务具有积极的意义。实现外文数字出版中的难句抽取的完全自动化,从理论上说,需要涉及语篇的预处理、难句识别及抽取算法和机器翻译,而这在目前还存在一些困难。其次,除了语料的标注,难句抽取还需要根据高效准确的难句识别和抽取算法,开发相应的难句抽取软件工具。......
2023-11-23
在目前的数字出版服务中,人们主要关注的是疏通出版、消费渠道和丰富数字产品形式。但对数字出版为读者提供语言层面的服务,除了起源于美国的阅读分级服务,几十年来几乎没有新的进展。目前数字出版中的语言服务,有代表性的有以下几种:1)数字出版编辑中的语言服务:文字编辑与校对。3)数字出版面向读者的语言服务:文本难度。......
2023-11-23
外文原版教材具有篇幅长、语言正式、句式复杂、专业性强等特点。尽管一些优秀的外文原版教材一般语言简洁流畅,但由于专业知识的讲解涉及概念、相关理念、规律等,强调语言的缜密性、准确性,经常会使用长句和大量术语,较一般的文学读物等更不容易理解。我国目前的外文原版教材主要是纸制书形式,但将来以电子书形式的教材会增加。因此,对于原版教材阅读来说,无论是电子阅读还是纸质阅读,词汇问题是需要解决的关键问题。......
2023-11-23
数字出版提供词汇抽取服务主要是基于这样一个统计事实,一种成熟的语言,一般词汇量很大,但在人们的日常生活会话和书籍中,常用词占了绝大部分。在现代汉语文章中,2500个常用字的覆盖率达97.97%,3500个常用字的覆盖率达99.48%[4]。如果把一种语言的词汇按词频分段,语言水平高的读者,生词少且趋于低频词段,语言水平较低的读者,生词较多,生词词频段跨度会较大。......
2023-11-23
相关推荐