项目背景概述
我国数字图书馆研究始于上世纪90年代后期,信息产业部、科技部、文化部、教育部、中国科学院等率先进行了数字图书馆的研究和试验性开发建设,积累了不少成熟的技术和经验。中国数字图书馆工程、以中央党校图书馆为核心的中国数字图书馆示范工程、中科院图书馆、国家科技图书文献中心、中国高等教育文献保障系统等一批项目的实施树立了我国数字图书馆建设的典范。借助日益发展成熟的数字图书馆技术,各行业的文献信息管理系统工程建设均有长足的发展,对信息化建设起到了重要的支撑作用。
电子科技作为具有悠久历史和专业特色的行业,对信息化程度的要求更高。
为做好中电集团文献信息系统建设的前期工作,中电集团专门安排专项,由中电集团开展前期试验研究,其工作重点是对中电集团文献信息系统基本功能进行探索与试验研究,构筑一个技术先进、扩展性强、应用性好、布局合理、共建共享的应用系统基本框架,为全面启动中电集团文献信息系统工程做好前期准备。从试验研究的效果看,基本达到了上述目标,具备了中电集团文献信息系统正式启动的条件。
项目解决方案
电子科技数字图书馆一期工程尝试了数字图书馆的先进技术与电子科技特色信息系统的结合,为中电集团文献信息系统提供了可资借鉴的技术条件。一期工程试验开发了相关软件,构建了试验系统平台,建立了三个子系统,并初步实现了下列功能:数据采集加工,可按中图法自动分类,电子科技主题词表自动标引;数据存储管理,可基于元数据对存储信息进行管理调度,以支持后台发布;数据发布服务,可进行本地全文搜索(支持二次检索、逻辑检索和智能检索)、电子科技搜索引擎、在线咨询服务、最新信息报道及其它个性化服务等。
一期工程初步完成了系统基本平台的搭建,这在设计之初尚处较先进的水平。但近年来信息技术已有长足发展,这在技术条件上为电子科技文献信息系统的建设和发展提供了更高的起点,主要表现在:
(1)清华同方知网TPI文献资源加工技术。
(2)清华同方知网自然语言处理技术。
(3)数据远程自动更新技术。
(4)知识网络技术。
其中包含:
元数据链接技术,相似性文献链接技术,参考链接技术,读者行为挖掘技术等。目前这些技术已经在论坛、电子商务和各类数据库中得到广泛应用。
(5)清华同方知网GRID异构统一检索技术。
(6)清华同方知网智能信息处理技术。
系统功能特点
中电集团文献信息系统需要将分散无序、形式各异的文献信息资源进行采集、组织、加工、集成、整合,形成统一的文献信息服务体系。
资源加工包含对纸质、电子资源的加工和对网络资源的采集加工。
(1)纸质、电子资源加工。纸质和电子资源加工流程包括扫描、识别、著录、标引、分类、检查和存储,需要支持流水线的加工处理。
(2)互联网信息资源采集加工。互联网信息资源采集加工要求具有信息采集、过滤、自动分类、自动标引、自动排重的功能,并可将结果发布在互联网上,供浏览、检索和下载。
资源管理包括
(1)清华同方知网KBASE全文数据库管理系统
(2)清华同方知网KBASE内容管理系统
(3)数据远程自动更新系统
(4)资源调度
(5)KSpider网络信息资源采集系统