什么是指南数据库
指南数据库是指存储关于某些机构、人物、出版物、项目、程序和活动等对象的简要描述,指引用户从其他有关信息源获得更相信的一类数据库,亦称指示性数据库。如机构名录数据库、人物传记数据库、产品数据库、基金数据库、软件数据库等。
指南数据库的特点
与其他数据库相比,指南数据库有以下特点:
1、存储的数据位非文献信息。也就是说,它为用户提供的是一些客观实体的指示性描述。
2、检索方式特别。在大多数数据库中,主题检索是一种非常有效的检索方式。而在指南数据库中,名称检索显得更为重要。
3、指南数据库生产者众多。不但包括各图书馆、信息服务机构,还包括政府机构、公司、行业组织、研究机构、出版机构等等。
4、就数据结构来说,通常指南数据库的记录比较长,字段数量多,还包括一些数值型字段。
5、排序性能好。指南数据库中的很多字段都可以按照数字或者字母的顺序进行排序。
6、内容广泛,类型多,这也是指南数据库的最大特点。
指南数据库的类型
指南数据库的类型很多。按使用范围可分为内部使用型和公用型或联机服务型。按信息类型划分,有以下几种类型:
(1)人物传记数据库:收录各种人物的传记信息,大多是传记词典的机读版。
(2)公司名录数据库:收录各种公司的生产与经营活动信息。较重要的有“电子黄页”、“TRINET机构数据库”、“DisclosureⅡ”等。
(3)基金指南库:存储各种基金信息,
(4)技术标准指南库:存储各种技术标准或规程的有关信息。
(5)软件数据库:存储各种计算机软件目录信息。
(6)产品指南库:存储各种产品或商品信息。
指南数据库的结构和使用
一、指南数据库的结构
它兼有文献数据库和数值数据库的特点。通常设有主文档、倒排档、索引文档和数据字典。
主文档可根据记录数量多少来决定是否加以划分。一般来说,对于涉及主题领域较多,内容综合性较强的指南数据库,主文档可采用多子库或多子文档的结构。对于单一主题领域和内容较专的,则采用单——主文档和不定长、多字段的记录格式为宜。
为了支持快速检索,一般都必须建立倒排档。
二、指南数据库的使用
指南数据库检索的一般过程是:用户键人要查询的人物、机构或事物名称,系统根据数据字典或机器词典,查找索引文档,然后进入倒排档中查得有关记录在主文档中的位置,最后得到有关的事实。
如前所述,主题检索在指南库中显得较为次要,但按行业分类检索还是用得较多的。所以,对国外生产的指南库,我们可能有必要了解它们的行业分类表。其中,(标准工业分类表)(Standard lndustrial Classification)用得较多。
其次,在检索过程中,有些指南库还可以支持简单的算术运算,即对记录中的数值字段进行运算比较。这种运算不同于文献数据库中范围检索。它真正把数值字段作为数值来处理,而不是作为字符串来处理。这种数值字段可以相加,排序或用于其他操作。
此外,它还可以支持检索的排序输出,或按升序输出(对字母型宇段最有用),或按降序输出(对数值字段最有用)。
目前,随着人工智能技术的进步,具有推理判断能力的指南数据库正在研制之中。这种指南库中通常含有知识库、规则库、推理机、智能接口等结构,并具有学习功能,可以在使用过程中扩充或更新原有的事实。
使用指南数据库应注意两点:一是它与传统检索工具的关系,二是它的内容完整性问题。有些指南库是以传统的指南性工具书为基础生产出来的;有些则没有传统的对应物,是单一的电子出版物。在内容方面,指南数据库(尤其是联机指南库)的更新速度比传统的工具书快得多,提供的数据内容也可能比传统的对应物更详细。另外,由于保密等方面的原因,许多数据库仅限于内部或有限范围内使用,即使是可供公众联机检索的有些指南库,也可能只公开一部分事实。对于某些涉及到敏感领域的事实或数据,一般用户很难通过联机指南库来解决问题。