ROUGE 2.0 ROUGE 2.0是用于自动汇总任务的易于使用的评估工具包。 它使用度量标准系统,该系统通过将自动生成的摘要或翻译与一组参考摘要(通常是人为生成的)进行比较来工作。 ROUGE是计算自动生成的摘要的有效性的标准方法之一。 要了解ROUGE的工作原理,请。 产品特点 最新版本的ROUGE 2.0支持以下功能: 评估ROUGE-N(字母,二元组,三元组等) 评估ROUGE-L(总水平LCS) 对ROUGE-S和ROUGE-SU的评估(带有单字的跳字和跳字) 一次性评估多个ROUGE指标 不同语言的词干 使用可自定义的停用词删除停用词 unicode文本的评估(例如波斯
2022-03-05 10:40:09 226.81MB java nlp metrics evaluation
1
完整的LCSTS数据集,由于CSDN上传大小限制,里面是我的网盘下载链接。原文件内容是类似于XML格式的,关于原文件的解析与处理可以查看我的这篇博文:https://blog.csdn.net/u012495579/article/details/103697824
2022-02-26 22:19:51 75B LCSTS 摘要 自动摘要 NLP
1
hmm的matlab代码HanLP: Han Language Processing 汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-Bigram(速度与精度最佳平衡;一百兆内存) 、 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 、 词典分词(侧重速度,每秒数千万字符;省内存) 所有分词器都支持: 词性标注 (速度快) 、(精度高) 命名实体识别 基于HMM角色标注的命名实体识别(速度快) 、、、、 基于线性模型的命名实体识别(精度高) 、 关键词提取 自动摘要 短语提取 多音字、声母、韵母、声调 简繁分歧词(简体、繁体、台湾正体、香港繁体) 语义推荐、拼音推荐、字词推荐 依存句法分析 KMeans、Repeated Bisection、自动推断聚类数目k 词向量训练、加载、词语相似度计算、语义运算、查询、KMeans聚类 文档语义相似度计算 部分默认模型训练自小型
2021-12-02 20:45:43 21.43MB 系统开源
1
简易关键词提取,自动摘要代码,运行速度快
2021-11-13 14:02:12 24KB 关键词提取
1
基于文本事件网络自动摘要的抽取方法
2021-10-25 11:05:18 840KB 研究论文
1
自动汇总 新闻文本自动摘要,以Textrank为基础,合并标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要。 查看新闻摘要示例
2021-10-08 22:00:56 26KB JupyterNotebook
1
该数据集为教育培训行业抽象式自动摘要中文语料库。 chinese_abstractive_corpus_datasets.txt
2021-09-14 10:25:49 239B 数据集
1
第一章:引言(2学时) 第二章:文本特征提取技术(4学时) 第三章:文本检索技术(6学时) 第四章:文本自动分类技术(3学时) 第五章:文本自动聚类技术(3学时) 第六章:话题检测与追踪(3学时) 第七章:文本过滤技术(1.5学时) 第八章:关联分析技术(1.5学时) 第九章:文档自动摘要技术(3学时) 第十章:信息抽取(3学时) 第十一章:智能问答(QA)技术(1.5学时) 第十二章:Ontology(1.5学时) 第十三章:半结构化文本挖掘方法(1.5学时) 第十四章:文本挖掘工具与应用(1.5学时)
这项工作为一篇文章自动生成相关工作部分,通过对引用参考文献的引用句子和待生成参考文献文章的正文进行对比式摘要,提取参考文献和文章正文的不同点和相同点构成相关工作部分,结论证明了引用句子作为素材进行科技文献自动摘要生成的有效性。
2021-08-13 22:53:16 2.21MB 自动摘要
1
基于深度学习模型的自动摘要
2021-08-04 15:05:28 1.25MB 深度学习 自动摘要 摘要