zn 指针生成网络,中文数据集下生成摘要, 详情 改动的地方 原论文的指针生成网络,对于正文和摘要的特征抽取是采用单层(双向)的LSTM进行抽取的,我将其变为Bert的embedding的结构。模型的整体框架没有变动,但是工程上的处理进行了微调。(并非使用了Bert) 中文数据: 250万篇新闻( 原始数据9G,压缩文件3.6G;新闻内容跨度:2014-2016年) 或,密码:k265 tokenizer 新闻数据集的分词代码 new-point-generate-zh 指针生成网络在新闻数据集下的应用 运行 先是tokenizer python main.py --original_data_dir E:\0000_python\point-genge\point-generate\zh\data --tokenized_dir ./tokenized_single E:\0000_py
2021-10-20 13:19:16 42KB Python
1
深度强化学习,用于具有多样性代表奖赏的无监督视频摘要。 使用python = 3.x实现 要求 python = 3.x 火炬 显卡 制表 开始吧 git clone https://github.com/TorRient/Video-Summarization-Pytorch cd Video-Summarization-Pytorch mkdir dataset 准备数据集 将视频放入文件夹数据集中 python create_data.py --input dataset --output dataset/data.h5 分割 python create_split.py -d dataset/data.h5 --save-dir dataset --save-name splits --num-splits 5 如何训练 python train_video_summar
1
文件2 动机 给定两个具有相同行数的文件, files2rouge计算每个序列(=行)的平均ROUGE得分。 每个序列可以包含多个句子。 在这种情况下,必须使用--eos标志(默认值:“。”)传递句子字符串的结尾。 使用错误的eos分隔符运行files2rouge可能会导致ROUGE-L得分不正确。 您可能还对Python实现(而不是包装器)感兴趣: : 。 $ files2rouge --help usage: files2rouge [-h] [-v] [-a ARGS] [-s SAVETO] [-e EOS] [-m] [-i] refer
1
萨德网 用于视频摘要的Selft和差异注意网络 SADNet体系结构概述 数据集和预训练模型 您可以通过运行以下命令来下载预处理数据集TVSum,SumMe,YouTube和OVP以及VASNet预训练的模型: ./download.sh datasets_models_urls.txt 数据集将存储在./datasets目录和模型中,并带有相应的拆分文件,分别存储在./data/models和./data/splits中。 可以从或下载数据集的原始版本。 。 训练 要在./splits目录中的所有拆分文件上训练SADNet,请运行以下命令: python3 main.py --train 结果(包括split和python文件的副本)将存储在./data目录中。 您可以使用参数-o 指定其他目录。 最终结果将与./data/models目录中的相
1
抽象文本摘要 使用RNN和KG进行有关抽象文本摘要的RnD项目
2021-03-05 18:07:52 26KB JupyterNotebook
1
这是一个视频的字幕,使用方法见这里:https://blog.csdn.net/yj13811596648/article/details/89354314
2019-12-21 22:12:00 51KB attent abstra
1