来源于 Tomas Mikolov 网站上的 PTB 数据集http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz。 该数据集已经预先处理过并且包含了全部的 10000 个不同的词语,其中包括语句结束标记符,以及标记稀有词语的特殊符号 () 。我们在 reader.py 中转换所有的词语,让他们各自有唯一的整型标识符,便于神经网络处理。
2021-05-31 16:30:08 93.28MB tensorflow RNN PTB
1
数据来源于http://www.pss-system.gov.cn/sipopublicsearch/portal/uiIndex.shtml
2021-05-24 11:29:57 24.23MB 专利文本数据
1
中文情感分类文本数据,为正负二分类数据,包括pad,水果,洗发水,酒店等评论。每个场景正负样本共1万,共5个场景。同时还包含不分场景的数据6万多(不重复)
2021-05-17 13:43:42 14.84MB 情感分类 正负二分类 商品评价
1
应用本程序可以轻松提取txt文本数据,主要应用的是matlab的按行提取函数,
2021-05-14 17:43:01 1KB matlab txt
1
适合做文本分类,软件杯
2021-05-13 22:06:00 8KB npl 软件杯
1
本人自己做的,在做单片机开发摄像头时,很有用的小工具!可将单片机采集的十六进制代码变成jpg图片!
2021-05-09 15:15:39 8KB 16 to jpg 单片机
1
数据集是清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史数据筛选过滤生成。数据集一共包括10类新闻,每类新闻65000条文本数据,训练集50000条,测试集10000条,验证集5000条。
2021-04-28 20:49:58 61.06MB 文本分类
1
5000条新闻中文文本数据,可用于文本分类任务
2021-04-15 03:49:07 4.08MB 数据集
1
JAVA文本数据IO操作.mp4
2021-04-12 20:01:32 188.14MB JAVA47
1
JAVA文本数据IO操作.mp4
2021-04-12 20:01:31 230.40MB JAVA48