一切物体都是由大量原子构成的,而原子则是由带正电的原子核和带负电的电子构成。它是记载、传递信息的一种物质状态或方式,与电子计算机密切相关。电子计算机是一种能自动、高速、精确地进行算术计算和逻辑计算并具有存储记忆功能的电子设备。与甲骨、金石、竹木、缣帛、纸张相比,电子载体的一大特色就是“无形”。电子文献载体的另一大特色是“存储量大”。目前,电子图书的主要载体形式就是光盘书。......
2023-07-25
一般电子文献检索,只能是直接对应性的匹配检索,即只能检索与所输入的字词完全对应匹配的资料,或者说只能检索到包含有所输入字词的资料。如检索李白的资料,输入“李白”二字后,只能检索到含有“李白”二字的资料,而不能检索到与李白相关但没有“李白”二字的资料。为了尽可能检索到自己所需要的资料,要注意输入不同的字词句从不同的角度检索。
要检索人物资料,既可输入其名进行检索,也可输入其字号或别称甚至并称等进行检索。如在《四库全书》电子全文版中,输入“李白”二字,可检索到7024个匹配(即含“李白”二字),分布在4172卷的资料中;再输入“太白”二字,可检索到24613个匹配,分布在8302卷中;再输入“谪仙”和“李杜”二字,可分别检索到3261个和2509个匹配。这些资料,其中有些有重复,去其重复,就可以比较完整地搜罗到所需的李白资料。还要注意的是,这些含“太白”、“谪仙”二字的资料中,有些并不是指李白,而是指别的专名或他人,所以还需要对检索到的资料逐条识别,以确定其中哪些是属于自己需要的资料,哪些是“同名”而实不同的资料。同样的道理,要检索苏轼的资料,可分别输入“苏轼”、“东坡”、“子瞻”、“苏黄”等进行多角度的检索。
如检索作品资料,要注意从文题(诗题)和作品正文等不同角度进行多次检索。因为作品的题目常因版本不同而有差异,如果只输入一个题目,就无法检索到所有资料;又由于版本不同,作品的文字也有差异,所以要多次输入作品不同文句或字句进行检索。比如,晏殊的名诗《寓意》,一作《无题》,其中有名句“梨花院落溶溶月,柳絮池塘淡淡风”。要查这首诗前人有哪些评论资料,哪些典籍选录过,既可以分别输入“无题”和“寓意”进行检索,也可以输入“梨花院落溶溶月,柳絮池塘淡淡风”两句中任一词组进行检索。这里又有一个省时的技巧问题,应尽量避免检索字词的“重复率”。比如,“寓意”二字,重复率就可能比较高,晏殊有诗题《寓意》,其他作品中也有大量的“寓意”二字。如《四库全书》电子全文检索版中输入“寓意”二字,可检索到1525个匹配,这里绝大多数不是我们所要查询的晏殊的《寓意》,需要一条条点击原文阅读后进行识别,这样还是比较浪费时间。如果我们输入“梨花院落溶溶月”一句七字,就可以检索到29条直接的资料,即有《类说》、《事实类苑》、《青箱杂记》等29种著作选录或论及这首诗。再输“柳絮池塘淡淡风”一句,则只检索到28条匹配的资料,这表明有的书只提及上句而没有下句。如果只输入“柳絮池塘”四字,可检索到52条资料,其中有的并不是晏殊的诗句,而是别人相同的诗句。一般而言,如果是要精确检索,即检索的目标非常明确,那么输入的字串越多越好;如果是模糊检索,对检索的目标事先并不很清楚,输入的字串就越少越好。输入检索的字越少,检索的结果范围就越大,当然重复率就越高。如何处理好既要避免检索的结果有遗漏,又要减少重复率以省时间,这要根据具体情况而定。应注意不断摸索,随时总结经验并加以调整。
还需要特别提示的是,不论是检索光盘还是网络中的资料,如果要正式引用,务必要校核书籍的原文。因为电子版资料在录入时难免有错误,而版本的差异,各本文字原有异同。特别是《四库全书》检索版,原书中的随文夹注,拷贝进文档后,夹注中的文字自动移至文末,这就改变了原文的次序,需要校核改正,才能恢复原书面貌;有些手写体字形有变异,拷贝后如果识别不出来,常常会出现空白,这更需要校补。比如,《四库全书》本《玉海》卷五十二《庆历崇文总目》条,原文是:
慶曆元年十二月己丑,翰林學士王堯臣等上新修《崇文總目》六十卷(堯臣與聶冠卿、郭稹、吕公綽、王沫、歐陽修等撰,以四館書并合著録。《中興書目》云六十六卷,當考。《國史志》:《崇文總目》六十六卷,序録一卷,多所繆誤。《長編》云:總目亦有可取而誤棄不録者)。其書總數凡三萬六千六十九卷,自太祖平定四方,天下之書悉歸藏室。太宗、真宗訪求遺逸,小則償以金帛……
而从四库电子版中拷贝出来的结果却是:
慶曆元年十二月己丑翰林學士王堯臣等上新修崇文總目六十卷其書總數凡三萬六千六十九卷自太祖平定四方天下之書悉歸藏室太宗真宗訪求遺逸小則償以金帛堯臣與聶冠卿郭稹吕公綽王沫歐陽修等撰以四館書并合著録中興書目云六十六卷當考國史志崇文總目六十六卷序録一卷多所繆誤長編云總目亦有可取而誤棄不録者。
又如,从同卷拷贝出下列一段,即出现一个空白框:
辛酉命翰林學士張觀知制誥李淑宋祁將館閣正副本書□詳定其存廢偽謬重復并從删去内有差漏者令補寫校對。
其实这个空白框,原文作“看”,只因“看”字第二横写成了两点,故电脑无法识别,只好用空白框代替。如果拷贝后不予校核,就会出现不应有的错误。因此,无论引用什么来源的资料,都要养成核实原文的习惯。
有关中国古典文献学的文章
一切物体都是由大量原子构成的,而原子则是由带正电的原子核和带负电的电子构成。它是记载、传递信息的一种物质状态或方式,与电子计算机密切相关。电子计算机是一种能自动、高速、精确地进行算术计算和逻辑计算并具有存储记忆功能的电子设备。与甲骨、金石、竹木、缣帛、纸张相比,电子载体的一大特色就是“无形”。电子文献载体的另一大特色是“存储量大”。目前,电子图书的主要载体形式就是光盘书。......
2023-07-25
关于丛书的起源,说法不一。综合性丛书是指包罗各种各类著作的丛书,其中最引人注目的是大型丛书。所谓专科性丛书,是指专收某一学科、某一文体、某一类别的丛书。就涉及古典文学某一文体和类别的丛书而言,可以说诗、词、文、戏曲、小说等各种文体的丛书都有。这两部书是诗话方面的有代表性的丛书。要了解历代丛书的大致情况,可以通过阅读上海图书馆编的《中国丛书综录》、中华书局1983年出版的《丛书集成初编目录》等工具书。......
2023-07-25
有的文献同时出现两种错误或三种错误类型,我们称之为多重错误。多重错误有既讹且脱、既讹且衍、既讹且倒、既脱且衍、既脱且倒、既衍且倒、既讹且脱又衍、既讹且脱又倒、既脱且衍又倒等情况。三重错误的例子,如《淮南子·说林》篇:“屠者羹藿,为车者步行,陶者用缺盆,匠人处狭庐。”......
2023-07-25
审视以往的单位辑佚工作实现过程,其完全具备、符合上述程序和内容的也并不多。泛辑派,是广涉经、史、子、集四部之辑佚,如马国翰、黄奭及朱祖延的《北魏遗书考》。有仅据一书辑佚的,如陶栋的《辑佚丛刊》、栾贵明的《四库辑本别集拾遗》、傅朗云的《金史辑佚》等。七是辑佚成果处理的形式不同。此外,还有辑佚者的学识、工作态度、精力、物质条件等诸多因素,在不同程度上都会影响辑佚工作的程序和内容。......
2023-07-25
中国古代文献学家根据他们对古典文献内容及其学术性质的理解,进行了一些分类,形成了以《汉书·艺文志》为代表的六分法和以《隋书·经籍志》为代表的四分法。今天,随着古典文献学学科的发展以及相关学科的发展,学者们对古典文献的类型又产生了一些新的分类标准和分法。根据古典文学文献的编写体制、出版形式和流传方式的不同,兼顾中国古典文献的分类传统以及便于今天学习的实践原则,我们重点介绍以下几种类型的古典文献。......
2023-07-25
《中国丛书综录》是目前收录丛书最多、分类科学而又检索极其便捷的书名索引。“子目书名索引”是按书名来检索某书在哪些丛书中;“子目著者索引”是按作者名来检索他有哪些著作。举例来说,要查《渭南文集》收录在哪些丛书中,第一步查第三册的“子目书名索引”,其中第166页著录:“渭南文集1270左。”如果要想了解哪些图书馆收藏有这些丛书,那就进入第三步,查第一册的“丛书书名索引”。......
2023-07-25
目字的本义是指人的眼睛。人眼为双,故后世便以目来表示复数的事物,且引申为逐一称述的节目、条目、细目、项目、名目之义。因刻木要用刀,后来便加上一个“金”字偏旁。目、录这两个词用在目录学中,目是指书的篇目或书名;录即叙录,后世称为解题、提要等,是对书的内容、著者事迹及写作、出版等情况的概要说明。但是,录也可以作为包括目和叙录两个部分在内的简称。......
2023-07-25
相关推荐