文本生成 只需几行代码,即可在任何文本数据集上轻松训练您自己的任意大小和复杂度的文本生成神经网络,或使用预先训练的模型快速训练文本。 textgenrnn是上的顶部一个Python 3模块 / 用于创建 S,与许多凉爽特性: 一种现代神经网络体系结构,利用新技术进行注意力加权和跳过嵌入,以加快训练速度并提高模型质量。 在字符级别或单词级别上训练并生成文本。 配置RNN大小,RNN层数以及是否使用双向RNN。 训练任何通用输入文本文件,包括大文件。 在GPU上训练模型,然后使用它们与CPU生成文本。 在GPU上进行训练时,利用功能强大的RNN的CuDNN实现,与典型的LSTM实现相比,可大大缩短训练时间。 使用上下文标签训练模型,从而使其在某些情况下可以更快地学习并产生更好的结果。 您可以在此免费玩textgenrnn并使用GPU训练任何文本文件! 阅读或以获取更多信息!
2023-01-11 15:20:49 9.42MB Python
1
医学文本数据集-癌症文档分类数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。 医学文本数据集-癌症文档分类数据集,该数据集集中于页面大小超过6页的长研究论文,分类为3类,“甲状腺癌”,“结肠癌”,“肺癌”。
2022-12-23 11:26:22 55.93MB 医学 文本 癌症 文档
2002-2018PJM每小时功率消耗文本数据集(145366行数据,具有明显的季节特性,单位为MW)
1
变压器油温预测文本数据集
1
电机异响智能诊断文本数据集(1000个电机数据)
1
电表电压电流数据集(某用户2年的电流表记录)
1
截至2020年,澳大利亚人口第二大州维多利亚州居住着670万人。 date:日期时间,记录的日期 需求:浮动,每日总电力需求(兆瓦时) RRP:浮动,建议零售价为AUD $ / MWh
1
2002~2018PJM每小时功率消耗文本数据集(145366行数据,具有明显的季节特性,单位为MW) 数据集没有显示特定的趋势,但具有季节性。
2022-05-30 17:05:28 1.16MB 文档资料 2002~2018PJM每小时功
必看: 因涉及到敏感词,标题不够展现数据集内容 1. 数据集主要是按照印章标准生成企业名称 2. 数据集内的标注采用labelme进行标注 ,json的格式哦,需要转换成ocr常用的格式标准可在进行交流沟通 3. 不仅有文本区域的标注点,并且还有文字字符标注哦,一个字一个字标注真是累死人。 3.标注的细粒度按照字符级进行标注,标注点个数根据文字数决定,是不是很省事,很贴心 4. 主要用于印章文字检测方面的深度学习,简单修改脚本,让你的炼丹之路更加顺畅。 -------------------------------------------------------------------------- 因涉及一些敏感信息,或有涉及侵权,请及时联系,我将立刻下架。 另外,需要的同行朋友尽快下载,这东西开放的资源不多,且行且珍惜吧
2022-05-26 09:11:46 52.9MB 深度学习 文档资料 人工智能 OCR
表格字段及含义如下: ID:当前记录条数; 板温:光伏电池板背测温度; 现场温度:光伏电站现场温度; 转换效率:为计算得到的平均转换效率; 转换效率A:数据采集点A处的光伏板转换效率; 转换效率B:数据采集点B处的光伏板转换效率; 转换效率C:数据采集点C处的光伏板转换效率; 转换效率D:数据采集点D处的光伏板转换效率; 电压A:为数据采集点A处汇流箱电压值; 电压B:为数据采集点B处汇流箱电压值; 电压C:为数据采集点C处汇流箱电压值; 电压D:为数据采集点D处汇流箱电压值; 电流A:为采集点A处汇流箱电流值; 电流B:为采集点B处汇流箱电流值; 电流C:为采集点C处汇流箱电流值; 电流D:为采集点D处汇流箱电流值; 功率A:为采集点A处的功率Pa,P=UI; 功率B:为采集点B处的功率Pb,P=UI; 功率C:为采集点C处的功率Pc,P=UI; 功率D:为采集点D处的功率Pd,P=UI; 平均功率:为A、B、C三点功率的平均值 风速:为光伏电厂现场风速测量值; 风向:为光伏电厂现场风