只为小站
首页
域名查询
文件下载
登录
中文
文本分类语料
(由复旦大学李荣陆提供)(附停用词).rar
1、资源中有语料,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。 2、资源中还附有一份停用词。
2021-06-14 10:38:46
86.75MB
中文文本分类
文本分类
语料
停用词
1
复旦大学
文本分类语料
[完整版 训练集+测试集]
answer文件夹为测试语料,共9833篇文档;train文件夹为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试集压缩包各50多兆)
2021-06-01 19:28:39
105.93MB
机器学习
文本分类
分类语料
中文语料库
1
谭松波文
文本分类语料
(复旦)(无需积分)
复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来划分。 数据来源 复旦大学计算机信息与技术系国际数据库中心自然语言处理小组 问题描述 适合NLP学习使用
2021-04-13 18:43:26
230.73MB
谭松波中文文本分类
1
复旦大学中文
文本分类语料
.xlsx
复旦大学中文
文本分类语料
.xlsx
2021-03-16 15:24:30
50.67MB
语料
NLP
1
中文新闻类分类语料,共4个类别,分别文化,财经,军事,运动
文本分训练和测试集,每个类别2000条新闻,简单做分类,测试效果 是足够了
2020-02-04 03:16:52
8.3MB
文本分类语料
1
中文
文本分类语料
(复旦)(完整版)
中文
文本分类语料
(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21
101.81MB
文本分类
数据集
复旦
中文
1
复旦
文本分类语料
数据集 包含训练集和测试集和全集
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文
文本分类语料
无法下载,网上找到了训练集和测试集,4积分,良心价
2019-12-21 18:58:39
105.99MB
复旦文本分类
文本分类
中文数据集
1
中文
文本分类语料
(复旦)训练集+测试集(100M)完整版
中文
文本分类语料
(复旦)训练集+测试集(100M)完整版
2019-12-21 18:58:20
103.25MB
中文文本分类
分类语料
训练集
测试集
1
1998年1月-6月人民日报语料库
1998年1月-6月人民日报语料库,已做词性标记,适用于自然语言处理序列标注等任务,如命名实体识别等,里面包含6个月份
2019-12-21 18:58:10
11.5MB
文本分类语料
1
中文
文本分类语料
-测试集
本语料库由复旦大学李荣陆提供。训练语料和测试语料两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)
2019-12-21 18:51:02
111.24MB
文本分类
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MPC 模型预测控制matlab仿真程序
空间谱估计理论与算法------程序.rar
麻雀搜索算法(SSA)优化bp网络
多目标微粒子群算法MOPSO MATLAB代码
中小型企业网络建设.pkt
夏天IC助手1.8你们懂的
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
android开发期末大作业.zip
Python+OpenCV实现行人检测(含配置说明)
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
simulink仿真实现光伏发电MPPT+能量管理
matpower5.0b1.zip
科研伦理与学术规范 期末考试2 (40题).pdf
中国地面气候资料日值数据集(V3.0)-201001201912.rar
最新下载
Neuro Theta计算.rar
SVN1.13.0安装包.zip
王道408 计算机组成原理课件 2024新版ppt课件
基于Resnet,VGG,GoogLeNet的海面舰船图像分类,pytorch实现
UPD720201 固件
基于LabVIEW在局域网内使用TCP/IP协议传送文件
Unity插件——Odin V3.5下载
NOIP2005-2018年普及组复赛题目及完整测试数据,附赠cena测评软件。
千分频秒脉冲产生电路图
Python淘宝、京东、拼多多、京喜自动化爬虫实战代码,完整代码可以直接使用.rar
其他资源
checkit3.0
基于socket套接字的VC6.0聊天程序
Matlab常微分方程的解法
GJB5000A标准
matlab扭振程序
HCSA培训教材5.0
matlab+yalmip+cplex综合能源及微电网优化运行研究相关论文,供研究学习参考。.zip
MDK525 keil5.25 jlinkV8可以正常使用的dll
C# 扫码枪代码 包括USB和串口两种方式
sql注入实战网站源码
codewarrior 6.3 licence
HCIA华为认证网络工程师入门培训教材V2.2.rar
asp.net 学生管理系统
javaJSP音乐网站论文
获取鼠标单击处图像的灰度值以及坐标
中间代码生成器
CRM管理系统、教育后台、试听课、教师、学生、客户、学员、科目、优惠券、完课回访、客户管理系统、收费、退费、回访、账号权限、订单流水.rp
虚拟摄像头(共享桌面版)
android-studio-ide-201.7042882-windows.zip
Xilinx spratan3 xcs100E(VGA PS2).7z
美赛论文详细要求及排版格式.pdf
unity太空飞船小游戏的制作
C 经典100例 C语言的经典小程序,100个经典的小程序
mcgs定时器操作函数设置方法
基于深度学习的航空传感器故障诊断方法