gpt-2-keyword-generation:为GPT-2编码文本以基于提供的关键字生成文本的方法-源码

上传者: 42166105 | 上传时间: 2021-12-15 12:52:36 | 文件大小: 215KB | 文件类型: -
gpt-2-关键字生成 一种将文本文档数据集编码为某种形式的方法,当使用的进行时,网络将能够生成与指定关键字有关的文本(尽管从理论上讲,编码后的文本可以与任何类型的文本一起使用,基于神经网络的生成,它利用了GPT-2的长远视野和强大的上下文能力)。 您可以使用example文件夹演示如何使用example文件夹中的脚本的结果。 此外,您可以自己使用 ( )来使用关键字,或者在/ r / legaladvice上阅读该基于关键字的模型的。 使用对编码进行标记化,以实现更健壮的关键字标记化,并使用并行化,以大幅提高大型数据集的编码速度(使用32个vCPU /线程与单线程相比,编码速度提高了约11倍,CPU利用率为70%) 用法 此仓库包含一个keyword_encode.py脚本,该脚本尝试以无监督的方式提取关键字(尽管您可以提供自己的关键字,如果有的话)。 每个文本文档的方法如下:

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明