商业新闻知识库 通过阅读新闻文章并引用Wikidata来构建Spacy知识库(以及很快的知识图)。 用法 pip install -r requirements.txt python3 main.py 笔记 我们使用Spacy NER的来查询Wikidata以查找适当的实体匹配项,但是我意识到en_core_web_md模型的NER标记在商业新闻上并不理想(至少在Palantir文章中不是)。 该计划是在用户喜欢的地方添加一个“循环中的”组件,用户可以根据自己的喜好对文章进行注释,并使用其注释来更新Spacy知识库。 这应该使解决这些实体的后续冲突变得更加容易。 $ python3 main.py processing article " palantir says in updated filing it expects 42% revenue growth this year to
2023-05-15 21:44:08 4KB Python
1
Encoding Knowledge Graph Entity Aliases in Attentive Neural Network for Wikidata Entity Linking
和声2 Wikidata DP 门户原型 维基数据数字保存门户的原型。 先决条件 Git 或最新源代码的副本 MacOS 或 Linux。 抱歉,目前不支持 Windows。 Python 3。不支持 Python 2。 用于安装 Python 模块。 为 Python 使用虚拟环境将省去很多麻烦,并允许您和谐地运行 Python 3 和 Python 2 应用程序。 如果这听起来不错,那么请阅读。 快速开始 该门户是一个用 Python 编写的 Flask Web 应用程序。 只要您拥有 Python 3 环境,目前就可以轻松安装。 请注意,这是当前的本地开发安装,尚未准备好作为可靠的应用程序部署到服务器。 我们正在为此努力。 也就是说,有几个阶段可以开始: 获取代码。 设置 Python 3 virtualenv(可选但推荐)。 安装门户原型及其依赖项。 运行门户。 让我们更详细地看一下。 我们提供了一些用于 virtualenv 设置、部署和运行的帮助脚本,我们也会向您指出这些脚本。 获取代码 没有用于此的帮助脚本。 克隆这个存储库并移动到项目根目录: git clone htt
2021-07-01 17:04:25 294KB 系统开源
1
NYT-Wikidata数据集是远程监督关系抽取数据集,包含100个关系,882177个句子实例,来源于New York Times 和 Wikidata
2021-05-29 18:57:08 352.38MB 关系抽取
1
https://github.com/Samsung/KnowledgeSharingPlatform
2019-12-21 19:49:12 78.52MB wikidata freebase
1