跨库检索系统技术层面的直观认识及思考

xtykc 07月 29th, 2008

如果叫我动手开发一个跨库检索系统,从技术上,首先想到的是哪些事情呢?

  1. 统一检索界面:
  2. 查询请求接收:将用户提交的查询请求拼成规范的查询语句,可以是XML格式的
  3. 查询请求处理:将2所得到的结果转换成各个异构资源库所能接受的查询语言,分别提交给不同的库(DBMS)
  4. 查询结果处理:将3所得到的查询结果集按照用户的要求(可以由用户选择或配置)合并,去重,排序

图书馆广泛使用的互操作协议Z39.50具体是怎么工作的呢?细想一下,这其实都是Z39.50所包含的内容,但具体在每一步如何遵循Z协议,我脑海中还没有概念。Z39.50其实可以这样简单地理解:它为异构系统提供一个参照的框架,每个系统都将自己的某些方面映射到该参照框架上,然后找到相互对应的点,以此达到互操作的目的。Z的一个重要应用是联合编目,一般只要安装一个Z客户端(有的编目系统集成了Z客户协议,Z客户端程序已经很成熟了,有很多免费的可供下载),就可以利用INTERNET上其它具有Z39.50协议的服务器上的书目信息。

这里找到找到了科技部科技基础条件平台重大项目研究成果:《数字资源检索与应用标准规范研究——Z39.50协议应用指南》,大致看了下,果然是一个大而全的东东,而且传统的Z是基于C/S的,用在大型系统上应该可以,但像我们现在要开发的这个系统,应该用不上。下一步,要看看Z的WEB版(ZING),看是否用得上。

跨库检索的各种说法

xtykc 07月 29th, 2008

这里比较全面地列出了跨库检索的各种说法:

跨库检索(Cross-Database Search)

联邦检索(Federated Search)

多数据库检索(Multi-DatabaseSearch)

集成检索(Integrated Access)

统一检索(Single Search)

一站式检索(One-Stop searching)

资源整合之跨库检索

xtykc 07月 28th, 2008

资源整合是目前工作中最主要的内容,这几天有一个相关的任务:对本馆外购的一些电子资源中涉及到跨库检索的数据库进行调研,从用户的角度对其用户界面、检索方式、功能设计方面做一个总结,给本部门最近要做的一个项目提供参考。

我选取了3个库:EBSCO学术期刊集成全文数据库美国商情信息(ABI清华同方期刊(全文)

自拟了以下指标:

案例

选库界面

选库位置

选库结果

检索方式

基本检索

高级检索

专业检索

二次检索

主题词检索

分级分类浏览检索

特色

分类法

限制条件

限制条件的方式

限制条件的内容

结果处理

排序方式

输出

是否有个性化配置

是否保留检索历史

先大致看了看,感觉这些跨库检索系统在检索方式方面十分强大,或者说十分繁杂,我作为一个普通的用户,经常使用的是清华同方期刊(全文),一般用最简单的基本搜索就可以搞定了,觉得那么多高级搜索的花头其实是一些唬头,不过这种说法未免显得太不专业了,先BS自己一下。也许作为一个商用检索系统总得要一些卖点吧,或者真正的领域专业人士需要这些也未可知。

让人比较欣慰的是国内的跨库检索系统在功能上已经和国外的没什么差距了,甚至更胜一筹,比如说清华同方期刊(全文)还提供一种“专业检索”,就是让用户直接输入SQL语句检索,这种方式对用户要求比较高,但具有更大的灵活性。而且还有中图法分级浏览检索,国外的这两个库就没有,看来中图法在国内还是有很大的市场,不知道这种方式的利用率到底有多高,反正我是不会去翻那么多层次的分类法,然后再去检索的。再次BS自己,连老祖宗都不想认了。

以上是以普通用户的角度来看的,要站在系统设计者的角度,还需要去补一些课。过两天还要拿出更详细的分析报告出来,先就写这么2点。

总之,资源整合这一块是自己目前主要学习的方面了,而且有机会学以致用。加油!fighting!!

PS:跨库检索系统比较的指标 :(来自吕瑞花, 崔宇红, 崔红伟, 吴克友,北京理工大学图书馆参考咨询部,《对4 种国际著名跨库检索系统的评价》科技导报2007 年第25 卷第16 期( 总第( 238期))

  1. 简单检索
  2. 高级检索
  3. 逻辑算符
  4. 位置算符
  5. 截词算符
  6. 词组检索
  7. 限制检索
  8. 二次检索
  9. 排序
  10. 去重
  11. 结果输出
  12. 结果查看
  13. 兼容文献管理软件
  14. 检索速度