3.2 知识图谱研究现状
3.2.1 通用知识图谱案例
国外的 DBpedia [Auer et al,2007]使用固定的模式从维基百科中抽取信息实
体,当前拥有 127 种语言的超过两千八百万实体以及数亿 RDF 三元组;Yago
[Suchanek et al,2007]则整合维基百科与 WordNet 的大规模本体, 拥有 10 种语言
约 459 万个实体,2400 万个事实;Babelnet [Navigli et al,2012]则采用将 WordNet
词典与 Wikipedia 百科集成的方法,构建了一个目前最大规模的多语言词典知识
库,包含 271 种语言 1400 万同义词组、36.4 万词语关系和 3.8 亿链接关系。
国内的 Zhishi.me 从开放的百科数据中抽取结构化数据,当前已融合了包括
百度百科、互动百科、中文维基三大百科的数据,拥有 1000 万个实体数据、一
亿两千万个 RDF 三元组;以通用百科为主线,结合垂直领域的 CN-DBPedia [Xu
et al,2017],则从百科类网站的纯文本页面中提取信息,经过滤、融合、推断等操
作后形成高质量的结构化数据;XLore[Wang et al,2013]则是基于中文维基百科、
英文维基百科、百度百科、互动百科构建的大规模中英文知识平衡知识图谱。
3.2.2 领域知识图谱案例
领域知识图谱常常用来辅助各种复杂的分析应用或决策支持,如下图所示,
在多个领域均有应用,不同领域的构建方案与应用形式则有所不同,本文将以电
商、企业商业、图情、创投四个领域为例,从图谱构建与知识应用两个方面介绍
领域知识图谱的技术构建应用与研究现状。
图2 行业知识图谱应用一览15
15 引自 2017CCKS《行业知识图谱的构建与应用》
1