首页 >> 文学 >> 学术资讯
古人的智慧,曾以文字的方式,被记录在甲骨、青铜器、竹简、线装书上。如今,这些智慧结晶凝结在比特(BIT)里,供世代镜鉴 让古籍不胫而走 中华书局古籍数字化侧记
2017年03月24日 08:59 来源:人民日报 作者:张稚丹 字号
2017年03月24日 08:59
来源:人民日报 作者:张稚丹
关键词:古籍;中华书局;古籍库;数据库;整理

内容摘要:古联公司还与其他古籍出版社洽谈业务,到2017年底,古籍库将收入古籍1000种、10亿字,古籍库会变得更为全面、权威,充分体现“古联”的内涵。通过古联,我们或者可以看到古籍数字化的宏大全景。

关键词:古籍;中华书局;古籍库;数据库;整理

作者简介:

  程毅中先生有些烦。

  这位中央文史馆馆员、中华书局前副总编,虽退休20多年,却仍然以整理古籍为业。最近他正校勘《大宋宣和遗事》(元代人根据多个笔记小说以说书形式连贯而成的话本,后成为《水浒传》的蓝本),需用笔记小说原文来对,但他用不惯手机上的数据库,打开慢不说,一不小心一碰就把页面弄丢了。

  现在好了,“中华经典古籍库”微信个人专业版上线了。用户可以在电脑端使用,古籍原书图像、页码都清晰在目。

  从对古籍简单的数字化处理,到产品化设计,再到互联网化……回顾一路摸索的曲曲折折,中华书局数字出版中心副主任、古联(北京)数字常务副总经理洪涛既感慨万千,又对未来充满期待。

  厚积终有薄发日

  洪涛是学历史的,因为喜欢计算机,2001年直接被招进中华书局信息中心。书局当时连电脑都没有,只好现买电脑,建局域网。2003年,中华书局成立了“古籍资源开发部”,建设“中华古籍语料库”。

  洪涛坦言,当时完全没有数字出版概念,只是对中华书局传统铅排古籍整理书籍进行数字化编辑加工。

  这一工作不仅为《史料笔记丛刊》《古典文学基本丛刊》、佛教道教典籍的出版提供了数字内容,也让书局借此建立了数字加工和流程管理的标准,造了3.1万个字符集以外的字,这些成果直到今天还在应用。

  2008年前后,已完成3亿字的数字化加工的中华书局并没开发产品,而是进入了对古籍知识库的研究。他们认为,以谷歌百度为代表的搜索引擎,有强大的资源索引、聚合功能,代表了从内容服务到知识服务的互联网方向。于是开始对《资治通鉴》《二十四史》进行分析系统建设,把书中相关知识信息标引、组织起来,形成以人物、时间、地点和事件为不同维度的知识网络,脱离了原书目录结构,相当于一个小世界。比如搜索张飞和关羽,系统会图形化给出两个人的关系图,包括他们共同参与的事件、接触的人物,甚至可以看到他俩在地域上的移动轨迹,文献变得可视、立体化了。

  事实证明,这个项目思维过于超前、工作量过于庞大,技术、知识和资金都严重不足。通常的用户群——普通读者、学生、教职、研究者,不知道该用这个知识库做什么;反倒是结构简单的数据库,在商业上容易成功。

  这段经历看似歧路,却为后续开发“中华经典古籍库”提供了重要思路。

作者简介

姓名:张稚丹 工作单位:

转载请注明来源:中国社会科学网 (责编:张雨楠)
W020180116412817190956.jpg

回到频道首页
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们