Page 223 - 智慧图书馆发展与创新
P. 223
第五章 智慧图书馆发展与创新运用的新型技术
将互联网中海量的信息进行有序组织、管理、理解和检索而构建的大规模知识
库,其表现形式为知识的发展进程与结构关系图。知识图谱是人工智能在大数据
环境下的必然产物,其本质是一种结构化的语义关系网络,是一种由实体、实体
之间的关系及实体属性组成的数据结构图,是物理世界中的概念及相互关系的
勾勒。
知识图谱分类方式很多,一般按照知识服务对象的不同,可以将知识图谱
分为通用知识图谱和领域知识图谱。通用知识图谱相当于百科全书,服务对象是
各个领域,是汇集众多领域知识的知识库。例如,Navigli 等构建的 BabelNet 是
集成 WordNet 词典和 Wikipedia 百科词典的超大规模词典知识库。领域知识图谱
是汇聚某一特定行业领域知识的知识库,构建领域知识图谱对该领域的发展至关
重要。电商行业的领头羊阿里巴巴集团在建立和应用知识图谱方面做了大胆的尝
试,通过建立用户图谱、商品图谱和场景图谱并利用图谱感知用户需求,实现了
用户在特定场景对商品需求的关联。跟随知识图谱研究热潮,图情领域学者将知
识图谱应用在图书馆中,为智慧图书馆建设添砖加瓦,取得了一定的研究成果。
夏翠娟等利用知识图谱设计并构建的上海图书馆家谱服务平台,为家谱研究者和
爱好者提供古籍循证服务并获得了大量好评。
将知识图谱应用在智能搜索领域的最典型检索工具是百度搜索引擎。正是由
于百度百科有庞大且错综复杂的知识图谱作为后盾提供知识支撑,才使得该引擎
像人脑一样拥有智慧。作为向公众提供阅读服务的公共图书馆,更应建立丰富的
知识图谱,实现智慧化的社会化阅读检索服务。
2. 知识图谱构建
知识图谱的构建流程是信息抽取、知识存储。
①信息抽取是针对半结构化数据和非结构化数据,从中抽取实体、关系以
及实体属性等结构化信息。大体上来说信息抽取有知识表示、知识获取、关系抽
取、知识融合四个主要环节。信息抽取是构建知识图谱最重要的环节,直接影响
着知识图谱的质量。
②信息存储是解决知识图谱存储方式的问题,目前应用广泛的是基于三元组
格式存储和基于图数据库存储。基于三元组的存储是将知识图谱以表结构的形式
逐行存储在数据库中,这也就决定了此种存储方式搜索效率较低,但使用该存储
方式的检索系统具有较高的搜索准确性。基于图数据库存储是直接将实体、边以
·215·

