只为小站
首页
域名查询
文件下载
登录
中文文本分类
语料
-测试集下载
中文文本分类
语料
-测试集下载 是测试集,训练集请见我的资源 本
语料
库由复旦大学李荣陆提供。test_corpus.rar为测试
语料
,共9833篇文档;train_corpus.rar为训练
语料
,共9804篇文档,两个预料各分为20个相同类别。训练
语料
和测试
语料
基本按照1:1的比例来划分。
2022-07-21 10:16:29
52.72MB
大数据
文本分析
文本训练
机器学习
1
中英平行
语料
50000句.rar
语料
来源为WMT18,本资源包含中英文的平行
语料
50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
2022-07-06 19:41:24
7.59MB
机器翻译
神经网络
机器学习
1
500万微博
语料
.7z
500万微博
语料
.7z
2022-06-17 16:03:55
408.3MB
数据集
人民日报1998年1月份的
语料
人民日报的1998年1月份的标注过的
语料
。
2022-06-01 08:47:04
2.12MB
人民日报
语料
1
维基百科英文
语料
文档out_wiki.en.txt
维基百科英文
语料
文档out_wiki.en.txt
2022-05-31 12:13:01
282.97MB
NLP
语料
维基
1
Python-人民日报
语料
处理工具集ToolsforCorpusofPeoplesDaily
人民日报
语料
处理工具集 | Tools for Corpus of People's Daily
2022-05-27 18:05:52
2.53MB
Python开发-自然语言处理
1
文本分类
语料
包括十个类,环境,计算机,交通,教育,经济,军事,体育,医药,艺术,政治
2022-05-21 17:10:32
2.55MB
文本分类语料
1
文本分类
语料
库(复旦)-测试
语料
本
语料
库由复旦大学李荣陆提供。test_corpus.rar为测试
语料
,共9833篇文档;train_corpus.rar为训练
语料
,共9804篇文档,两个预料各分为20个相同类别。训练
语料
和测试
语料
基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
2022-05-21 16:37:46
51.14MB
语料库
复旦
测试
1
COAE2015_task1.zip
数据集是COAE2015评测中的任务:关于中文情感倾向型分析, 适合用于训练情感分析的模型。比如针对博文:哇塞,这里有好多绝版的照片,简直太赞了! 带有标签信息 positive
2022-05-14 11:19:57
1.97MB
情感倾向性分析
情绪分析
语料
1
中英文
语料
训练CBOW模型获得词向量(pytorch实现)
自然语言处理第二次作业: data文件夹中存储
语料
(中文
语料
以及英文
语料
由老师提供,另一份为中文停用词
语料
) output文件夹中存储输出的词向量文件 script文件夹中为CBOW的脚本,同时处理中文
语料
与英文
语料
运行步骤:在脚本中确定训练中文或者是英语后,直接运行即可
2022-05-11 10:42:22
13.58MB
nlp
pytorch
cbow
词向量
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
opcua服务器模拟器+opcua客户端工具.rar
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
拾荒者扫描器.rar
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
空间谱估计理论与算法------程序.rar
YOLOv5 人脸口罩图片数据集
知网情感词典(HOWNET)
狂神说全部笔记内容.zip
科研伦理与学术规范 期末考试2 (40题).pdf
MPC 模型预测控制matlab仿真程序
中国地面气象站观测数据2000-2021
基于STM32的FFT频谱分析+波形识别
鲸鱼优化算法 WOA matlab源代码(详细注释)
Python+OpenCV实现行人检测(含配置说明)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
最新下载
驱动qualcomm cdma technologies msm
verilog 编写TCA6416的程序
逸雨清风读秀批量下载 V5.20
ADS1115 STM32驱动程序
ZYNQ PL+PS双核AMP模式裸机烧写启动例程
超级漂亮的EasyUI框架皮肤源码
CDR电路结构图总结
StarDict-editor
ADX345加速度传感器.zip
西南科技大学电工电子技术期末考试试卷
其他资源
EP4CE6E22C8N 原理图 PCB
Codewarrior HCS12 V5.1 license
SIMATIC S7-1500与TIA博途软件使用指南.pdf
《MySQL 从入门到项目实践》.txt
量子计算和量子信息-量子计算部分
EasyRecovery.zip
MFC API方式串口程序
自适应模糊PID
微信小程序登录流程图
C# 抓取IP TCP UDP 等网络数据包
数据结构教学计划编制问题
全国计算机二级c语言历年真题完整版
华为实验拓扑图
学习AD10多层板设计很好的学习资料,
YDT 1260-2003 基于端口的虚拟局域网(VLAN)技术要求和测试方法.pdf
OpenGL小车 带碰撞检测
Communications Receivers(4th) azw3
全栈性能测试宝典jmeter
一键安装php+mysql+apache
hive-exec-2.1.0.jar
2010年湖北省统计年鉴
axis2生成客户端代码 (带jar包)
头像上传裁剪整合php
运动目标检测的背景建模
MSP430元器件库
基于MSP430芯片的密码锁软件设计
会员注册、登录等gif素材各种登陆的小图标