基于Pytorch的中文文本摘要生成 开这个仓库的主要目的是记录一下自己实验过程和数据。 参考文本摘要领域大佬写的两篇论文: and ,然后参考另一位大佬修改的代码. 另外,在这里还是要感谢一下。这里的所有内容基本上没做什么修改(python读取文件的时候出现编码问题,我的猜想是大佬用的mac系统,类linux,所以对编码不敏感,我用windows的话就报错了。),最多修改了一下超参数,刚开始在自己windows笔记本上跑的话,确实有点吃力,设置的batch_size=10,好像后来还直接报cuda错误,我的猜想就是设置过大了,显存承受不了。说多了。直接看训练和测试效果吧。 实验结果 指标 验证集 测试集 ROUGE-1 34.06 31.87 ROUGE-2 16.46 15.47 ROUGE-L 33.83 30.93 0. 数据预处理 下载(提取码:g8c6 ),下载完之后放在根目
2021-06-27 09:50:04 8.84MB Python
1
多年以来,Cadence 公司的 CAD 工具 一直是世界上使用最广泛,功能最强大的IC设计工具。而为了应对IC的复杂度越来越高, 设计的困难度也越来越高的情况,Cadence的CAD整合开发环境也越来越庞大,所提供的功能也日益强大,造成使用者在维护及管理上的一大负担。再则, 每一家的设计公司的在设计的流程中多多少少都会有一些小步骤,无法用 Cadence 工具提供的基本做法来达成; 或者是不同公司的工具之间资料转换的问题。工程师遇到此类问题可能需要通过人工的方式去完成连接设计流程中相连的两个步骤; 或是干脆去开发一些小软件来完成这些特定的工作,而此时使用者可能会面临如何将自己开发的软件的I/O 与Cadence 工具的整合环境相连结的问题。一般的做法是产生一些资料档来做资料交换的中介,这些资料档的格式可能是 Cadence 支持的一标准数据格式,也可以是使用者自订的数据格式。这样子是一种间接的做法,因为使用者无法直接去存取 Cadence 环境的内部资料,所以在处理上的弹性会小很多,也较不方便。 为了方便使用者使用整个 CADENCE tools 的整合开发环境,以解决上述的困扰,CADENCE 公司遂发展了 SKILL 语言。 SKILL 是一种高级的、交互式的语言,是用于 CADENCE tool 的整合开发环境内的命令语言(command language)。 SKILL 采用人工智能语言 LISP 的语法为蓝本,再加上常用的 C 语言的部份语法设计而成。 SKILL 语言提供许多的接口函数,能让使用者可以编程直接去存取CADENCE 整合环境内的电路资料内容; 也可以让使用者去开发将自己开发的应用程式并入CADENCE tool 的整合环境里。有了 SKILL 言,使用者可以让 CADENCE tool 更充份地融入整个设计流程之中,减少琐碎 的人工转换时间,提升公司的生产力。
2021-06-26 11:28:49 1.95MB cadence skill 语法
1
基于当前主流的ARM的变频方案文档,注意是原理性的文档,集成矢量变频,代码可以在其欧州网上下载,有需要的可以私信联系我。
2021-06-26 10:56:29 1.95MB 电磁学 c语言
1
idempiere 3.1 中文翻译版
2021-06-25 18:51:46 713KB idempiere 3.1 中文 中文版
1
完美解决jspdf的(表格)中文乱码,将页面上的表格或者后台返回的表格数据预览为pdf,并且可以导出为pdf文件
2021-06-25 14:33:49 7.82MB jspdf中文乱码 jspdf.autotable
1
“万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案 wodejiafeiyu|nano- nano- 康一帅 简介 环境 Tensorflow == 1.14.0 Keras == 2.3.1 bert4keras == 0.8.8 文件说明 EDA:用于探索性数据分析。 code/train.py:用于模型的训练。 code/infer.py:用于模型的推断(预测)。 code/utils.py:工具函数。 data:数据目录。 赛题背景分析及理解 赛题是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq
2021-06-24 20:03:44 10.89MB JupyterNotebook
1
前言 PyQt5中文教程,翻译自 ,GitBook 预览地址: 这个教程比较好的地方是,能讲解每一段代码的含义。 虽然PyQt的函数命名已经非常语义化了,但是对于新手来说,有这一步还是更好的。 所以我选择了翻译这篇教程,希望能给刚入门的你带来帮助。 翻译的水平有限(如有错误,请指出),而且有些地方是自己的理解,也加入了自己的提示在里面(并没有标注出来),所以并不完全等于原文。 我尽量让翻译不带英语腔,做到即使一个完全不懂编程的人来看,虽然不知道说的啥,但是最起码语句通顺,不会读着别扭。也算是对老师的一点敬意吧~~ 翻译吐槽: label 这个词好难翻译,有时候就是个占位符的意思,说是文字说明吧,有专门的词 caption,但是像 checkbox 的名称这种的,不是文字说明又是啥...,但是居然还用 label 说图标这种事情,也是醉了。 源文档更新了,但是没有更新日志,只能一段段的比对…
2021-06-23 17:39:44 833KB tutorial pyqt5 python3 chinese-translation
1
CMADSV1.0 系列数据集空间覆盖整个东亚,时间分辨率:逐 日。空间覆盖范围:东亚(0°N-65°N,60°E-160°E)。站点数量: 58500 站。提供要素: 日平均温度,日最高\低温度,日累计 24 时降水量,日平均太阳辐射,日平均气压,日 比湿度,日相对湿度,日平均风速。适用于SWAT模型使用者,模型构建,模拟
2021-06-23 17:04:47 4.44MB arcgis swat CMADS
1
The_Zynq_Book_ebook_chinese zynq官方教学书籍以及官方实例附源码 亲测可用
2021-06-23 13:28:33 42.88MB zedboard zynq7000
1
sonar-javascript-plugin JavaScript代码检查 sonar-python-plugin Python代码检查 sonar-web-plugin Web页面检查(HTML、JSP、JSF、Ruby、PHP等) sonar-xml-plugin XML文件检查 sonar-scm-stats-plugin SCM源码库统计分析 sonar-metrics-plugin 文件度量 sonar-chinese-pack-plugin 中文语言包 sonar-timeline-plugin 时间表显示度量结果 sonar-motion-chart-plugin 度量结果演进图
2021-06-21 16:03:13 36KB java sonar Chinese pack
1