上传者: 42160376
|
上传时间: 2021-10-27 18:31:34
|
文件大小: 79KB
|
文件类型: -
简单介绍
这里的代码主要是采用text-rank算法计算文本摘要,另外优势在于引入了词向量和权重倾斜
使得文章摘要提取效果得到了非常显著的提升。
注意
注意:由于github文件有大小限制,这里没有上传完整的词向量模型,所以无法直接运行,需要补充textrank4zh/word_model目录中的数据。
如果有需要,可在我的百度网盘下载,或者自己训练放入textrank4zh/word_model文件夹。
链接: https://pan.baidu.com/s/1o9RlASq 密码: 4kug
依赖
jieba >= 0.35
numpy >= 1.7.1
networkx >= 1.9.1
gensim
兼容性
适用于Python 2.7,已经测试过
原理
关于原理以及本代码实现的效果优化可见我上传的论文 《text-rank提取文章摘要与结果优化.doc》
阅读完对使用有很大