商业新闻知识库
通过阅读新闻文章并引用Wikidata来构建Spacy知识库(以及很快的知识图)。
用法
pip install -r requirements.txt
python3 main.py
笔记
我们使用Spacy NER的来查询Wikidata以查找适当的实体匹配项,但是我意识到en_core_web_md模型的NER标记在商业新闻上并不理想(至少在Palantir文章中不是)。
该计划是在用户喜欢的地方添加一个“循环中的”组件,用户可以根据自己的喜好对文章进行注释,并使用其注释来更新Spacy知识库。 这应该使解决这些实体的后续冲突变得更加容易。
$ python3 main.py
processing article " palantir says in updated filing it expects 42% revenue growth this year to
2023-05-15 21:44:08
4KB
Python
1