本项目使用 GPT2-Chinese 的模型将wiki中文的数据导入模型训练了通用模型。 将GPT2-chitchat的对话任务稍作修改来适用于中文摘要任务。 将通用模型的权重应用在摘要问题上进行进一步训练的。 GPT2-Chinese 参考:https://github.com/Morizeyao/GPT2-Chinese GPT2-chitchat参考:https://link.zhihu.com/?target=https%3A//github.com/yangjianxin1/GPT2-chitchat 项目工作流程详见:https://zhuanlan.zhihu.com/p/113869509 本项目为GPT2-chitchat稍作修改的内容,在此也感谢大佬的分享。 由于NLPCC的摘要数据为新闻语料,涉及话题和内容较多,应用在垂直领域下效果会好一些。
2024-04-07 20:01:34 482KB gpt2 智能写作 NLP 自然语言处理
1
word2vec加textrank抽取文章摘要 使用word2vec计算句子间的相似度,然后使用PageRank计算句子分数,抽取前n个句子作为文本摘要。
2022-03-16 18:16:59 5KB Python
1
网上花店的文献综述,包括中文摘要、英文摘要和具体内容。
2021-12-06 14:42:23 90KB 网上花店
1
CNews_sum_train训练集,经过简单数据清洗
2021-11-11 16:13:39 556.62MB 中文摘要数据集
1
通过模板进行英文方面的写作,但是这种欧写法有一定的局限性。对于每个人来说,喜好不同,希望大家借鉴而不要盲目追捧。
2021-11-07 17:13:11 261KB 摘要 写作
1
2050年净零排放全球能源行业路线图中文摘要
2021-06-26 11:02:55 2.67MB 能源行业路线图 碳中和
Rouge没有提供中文的摘要的评估方法,通过将中文转为数字ID的形式实现中文摘要的评估
2021-03-16 19:07:20 2KB 中文摘要 评估 Rouge
1
中文概述文章列表(自然语言处理&机器学习) 在本项目中,我们整理了《中文信息学报》,《计算机学报》,《软件学报》,《自动化学报》,《电子学报》,《计算机研究与发展》,《中国科学:信息科学》论文在自然语言处理和机器学习领域的概述论文(共251篇),将其按照不同的研究领域进行分类,并提供了论文的获取网址。 类别索引 自然语言处理 机器学习 自然语言处理论文列表 跨语言词向量研究综述中文信息学报2020年彭晓娅,周栋 分布式单词表示概述计算机学报2019孙飞,郭嘉丰,兰艳艳,徐君,程学旗 词汇语义表示研究综述中文信息学报2016袁书寒,向阳 句法分析前沿动态概述中文信息学报2020年屠可伟,李俊 汉语介词垂直自动识别研究综述中文信息学报2017 李洪政,晋耀红 基于统计学习模型的句法分析方法综述中文信息学报2013 吴伟成,周俊生,曲维光 汉语组块分析研究综述中文信息学报2013 李业刚,黄河燕
2021-03-06 11:04:25 17KB
1
埃森哲:技术展望2021(中文摘要).pdf
2021-03-03 16:07:02 1.42MB 技术展望 埃森哲
1
技术展望2021(中文摘要).pdf.pdf
2021-02-23 20:02:46 2.97MB 技术展望