什么是知识集成
知识集成是指将分散的知识元素依据一定的逻辑规则有机地结合在一起,使知识有序化、层次化,从而高效地利用信息资源,有利于知识创新。
知识集成的提出
知识集成最早是由Demsetz在1991年提出的,而正式提出知识集成的则是Grant,他认为企业的重要作用就是进行知识集成,知识集成为企业创造了优势。但迄今为止,知识集成还没有统一的概念。知识集成在不同的学科和语境中有不同定义。成思危从企业管理的角度指出:知识集成是为了在已有知识的基础上,通过有机的组织来产生自己的知识产权。顾新建指出:知识集成一方面是对分散在企业中,主要是存在于企业员工头脑中的意会性知识进行集成,另一方面是对分散在不同协作单位间的知识进行集成。王娟茹指出:知识集成就是运用科学的方法对企业不同来源、不同层次、不同结构、不同内容的知识进行综合,实施再建构,使单一知识、零散知识、已有知识、新获知识、显性知识和隐性知识经过综合形成新的知识体系,实现“1+1>2”的效果。倪益华在他的博士论文中指出:知识集成是指通过信息技术和业务过程的组合,以多种形式进行知识的表示、组织、获取、存储、使用和创新的过程。
本体在知识集成中的主要功能
本体是领域知识的逻辑抽象而构筑起来的体现概念及关系的概念模型,又是一种明确定义、规范描述和共享领域知识的方法和手段。基于本体的知识集成的主要功能表现为:
(1)本体构建为实现学科信息一体化的知识集成打造平台。基于本体的知识集成可应用于网络资源、异构数据库系统及电子出版物的资源整合等多种领域,其基本思路是在集成的上层构建一个反映学科知识结构的本体慨念模型。图书、情报和档案各领域的信息集合建立起相应的领域本体,在此基础上通过不同本体的语义映射实现语义联系,将各个相对独立的领域本体资源联系成一个可多本体管理的知识网络。
(2)本体构建为学科领域的知识复用和共享建立基础。共享是本体的重要特征,即指本体概念体现的是共同认可的知识。这如同美国哲学家托马斯-库恩提出的被某一科学共同体所公认的“范式”。可以说,本体概念体系是一种公约。由于本体反映的是相关领域中公认的概念,所以如果一个组织构建了专业领域本体,如法学本体、经济学本体等,其他组织可以共享和复用。基于本体的资源集成能够真正实现领域知识的共知、共识和共享。
(3)领域本体为实现基于语义的知识检索提供支撑。实现知识检索是本体的重要应用之一。本体作为领域知识的语义模型,其主要功能体现在知识集成中的知识组织和知识检索等方面。知识检索是知识组织的逆过程。实现基于概念语义的知识检索,必须有赖于知识组织体系的支撑。只有以基于本体的知识组织体系为基础,以领域本体的概念模型作为资源元数据的规范描述标准,才能真正实现基于语义的知识检索。
本体与其他的知识组织体系是有区别的。由于描述概念关系是本体的基本属性,所以学界有一种看法,即凡是有关联的概念集合都称为本体。如计算机界一般将词网当作典型的本体,图书情报界则多将分类表或主题词表作为简单的本体。虽然词网、分类主题词表都是包含词及词间关系的词表,特别是词网较重视词间关系的揭示,但它们与本体最大的区别在于:不能揭示更深、更广的语义关系,没有自身的知识表示语言,不能实现形式化编码,无法支持资源的知识标注和知识检索,所以在描述、处理知识方面具有很大的局限性。因此,本体与词网、分类主题词表等在性质和功能上有着本质差异,它们之间不能简单地画等号。但这并不意味着它们是相互排斥的,在应用目标一致的情况下它们可以相互补充、相互融合。因为,本体的基础是概念系统,而领域概念及关系的获取既是本体构建的关键,也是一个难点,分类表、主题词表、词汇表、术语词典等完全可以作为构建初始本体的基础。目前国内外已经关注分类、主题词表和本体的融合与转换。
知识集成与数据集成、信息集成的比较
表1-1 数据集成、信息集成与知识集成比较
知识集成 | 信息集成 | 数据集成 | ||
集成的目标 | 方法和技术创新 | 信息的有效利用 | 数据的合理存储 | |
集成的对象 | 知识(挖掘的信息) | 信息(加工的数据) | 数据 | |
集成的内容 | 对知识的挖掘、共享和集成;知识的外化、内化、中介和认知过程 | 对数据库信息的检索、排序、统计 | 对数据的表示、转换、拆并 | |
集成过程 | 性质 | 非确定 | 确定 | 确定 |
结构 | 非结构化过程 | 结构化过程 | 结构化过程 | |
重复性 | 很少或不可重复 | 可重复 | 可重复 | |
特征 | 知识密集 | 信息密集 | 数据密集 | |
集成的结果 | 集成的知识显性或隐性 | 集成的信息显性 | 集成的数据显性 | |
关键技术 | 语义网、元数据、本体、可拓数据挖掘等引擎、XML数据库等 | 数据仓库、中间件、搜索 | 数据库技术、集成平台、集成工具等 |
知识集成是在信息管理基础上的延伸和发展。信息管理是以息资源的有序化和结构化为目的,将各种信息以一定的方式进行采集、汇总、组织、存储和控制,方便人们利用计算机来查询和检索;而知识集成是在信息管理的基础上,对显性知识进行有效识别、获取、开发、使用和共享,同时尽量使隐性知识转化为显性知识。信息处理过程相对封闭和对立,比较注重信息外部形态的组织和整合;而知识集成是以知识共享和创新为主要目的,重点解决信息超载导致的知识匾乏问题,重视显性知识和隐性知识的交互作用。