时间:2015-03-06 来源:杭州图书馆 作者:杭州图书馆 点击率:23098
传统的计算机二字节编码技术只能处理 2 万多个汉字,对大量的生僻字、俗体字、异体字、通假字、避讳字和多语种文字无能为力,并没有从根本上解决中国历代典籍数字化、网络化的问题。采用 Unicode 四字节编码技术的《瀚堂典藏》古籍数据库,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,完善了汉字信息网络化的平台,开创性地实现了所有汉字及多语种文献的单一数字化平台管理,从而结束了历史文献和出土文献研究手工抄写、图片替代、生硬造字的历史,也标志着计算机汉字处理开始进入到了四字节字符的领域。
《瀚堂典藏》古籍数据库是目前唯一采用基于七万汉字 Unicode 四字节编码和自然语言全文检索的通用浏览器模式的典籍数据库。《瀚堂典藏》古籍数据库以精准校对的小学工具(文字、音韵、训诂)、古代类书、出土文献类数据为基础,大量纳入包括经史子集,以及中医药典籍、古典戏曲、敦煌文献、儒、释、道等历代传世文献,以及大型丛书、史书、方志、民国报刊等,涵盖文史哲等专业的教学和研究工作中所应用到的专业古籍文献数据。至 2011 年底,《瀚堂典藏》精细加工入库的图书种类已达一万两千余种,图片数量 1500 多万张,文字总量超过 20 亿字,可在通用浏览器条件下,利用专利认证的超高速检索引擎全文跨库检索和连续图文对照阅读的记录条目数1800 万条以上,总量并持续定期增加中。使用说明: http://www.hytung.cn/Help.aspx
适用学科: 文字音韵、历史文献、文学戏曲、人文哲学等科学,以及经济学、地理学、医药学、政治学、社会学和古籍爱好者....
《瀚堂典藏》古籍数据库优势:
1. 海量典籍内容,字书、韵书、出土文献资源独步全球;
2. 出版多种纸质图书、光盘,数据专业校勘,高度精准;
3. 毫秒级高速自然语言检索,四字节检索荣获专利认证;
4. 检索管理七万多 Unicode 汉字,尤精生僻字加工管理;
5. 采用先进 B/S 技术,不需安装客户端软件,免除困扰;
6. 圖文皆可自由在 MS Office Word 复制、编辑再利用;
7. 内容存真性整理,定时大量新增,满足使用者的需求;
8. 灵活跨库、图文对照,研究学者最佳必备之典籍平台。