什么是文档搜索引擎
文档搜索引擎是指根据一定的策略,运用计算机程序搜取网络上存在的文档资源,对文档信息进行组织和处理并将处理的信息显示给用户,是一种专门为用户提供文档检索服务的网络系统。
文档搜索引擎检索的对象为网络中广泛存在的、大量的文档资源,和学术搜索引擎的不同表现在:这些文档资源大部分来自网络用户的上传,在网络中可以开放获取,存储文档的格式更加丰富多样;从文档内容上看,文档搜索引擎是为了满足用户的实际需要,它不仅包括部分学术资源,还包括如商业模板、公文模板以及文学作品等实用性很强的文档资源。文档搜索引擎和商业数据库相比,它的优势表现在其大部分文档资源都可以免费获取。文档搜索引擎不需要独立开发网络资源,只是提供一个供用户共享资源的网络平台,这个平台的资源来自用户,最终受益的也是广大的网络用户。
文档搜索引擎发展的趋势
随着网络新技术的不断发展,技术的革新是搜索引擎发展的主要推动力之一。搜索引擎越来越贴近人们的具体需求,文档搜索引擎正是结合Web2.0技术新的互联网应用系统之一。由于网络新技术和文档搜索引擎的兼容和融合,文档搜索引擎发展的呈现出检索功能多样化、个性化、运营商业化和系统社会化等趋势。
1.检索功能多样化、个性化
Web2.0技术在文档搜索引擎中广泛应用,书签、API、RSS等技术在文档搜索引擎中得到应用,体现了Web2.0时代网络交互性的特点,为真正意义上的数字图书馆的发展带来了新的活力,个性化的检索服务使得文档搜索引擎更能满足普通用户的个性化的需求。
2.商业化趋势
从网络文档的来源来看,大多数文档来自网络用户的上传,由于文档涉及版权问题,商业化是文档搜索引擎发展必然的趋势。既有热心网络用户贡献的文档,也有商业机构等提供的文档,势必会出现共享和商业共存的模式。在这样的商业模式中收入主要有两个来源:植人广告获得收益和出售文档带来的收益。
3.社会化趋势
文档搜索引擎的融合性,势必会使更多的人参与到文档共享平台中来。根据Alexa排名,文档搜索引擎的访问量正在逐步上升,已经成为网络社会化的一个重要的组成部分,吸引了大量的用户。在网络时代里,用户才是网络存在的根本出发点和落脚点,文档搜索引擎的社会化趋势将会越来越明显。
孙良红,张玉祥.文档搜索引擎的解决方案及其检索功能比较分析(A).图书馆界.2013,5