只为小站
首页
域名查询
文件下载
登录
首页
人工智能
机器学习
维基百科中文语料(已分词)
维基百科中文语料(已分词)
上传者:
mike07026
|
上传时间: 2019-12-21 20:19:24
|
文件大小: 650B
|
文件类型: zip
维基
中文语料
word2vec
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。 共包含3273626个段落的文本(一个段落包含了多个语句)。 处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 650B ) 维基百科中文语料(已分词)","children":[{"title":"6b70e51288d443548fbe3654f309914b","children":[{"title":"维基中文语料.txt <span style='color:#111;'> 300B </span>","children":null,"spread":false}],"spread":true}],"spread":true}]
评论信息
骁骑校尉 :
请问大佬split文件如何打开,尝试了几款网上推荐的软件效果不是很好
2021-07-26
桂子-- :
可以用来做实验
2020-10-29
AI文艺猫 :
2017年的语料
2019-09-05
其他资源
多元线性回归完美C语言模型
安川机器人FS100中文版使用说明书.rar
VBA 7.1 FOR WPS 2019
wap 文字游戏
JAVA EE MVC架构餐饮管理系统源码
基于小波变换的人脸识别
小米(绿米)网关局域网通信(设备控制)
指南针源代码
最优化方法及其matlab程序设计课后答案 马昌凤
《射频通信电路》陈邦媛 PDF
Git详解之六Git工具
navicatpromium安装加破解包64位
entity framework code first增删改查(包含批量操作)
基于VHDL的AES加密算法的实现
gltools/freeglut
Git思维导图
RapidIO Specification 3.2
opencv人脸识别源码
winForm中使用MQTT收发消息
基于WSN的PM2.5环境监测系统
XmlSpy 真正汉化破解版
C# NPOI导入与导出EXCEL
UE4全景插件导出2
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
机器学习
深度学习
搜索引擎
计算广告
VR
热门下载
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
2020年数学建模国赛C题论文
空间谱估计理论与算法------程序.rar
科研伦理与学术规范 期末考试2 (40题).pdf
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
上帝之眼和拾荒者.rar
C4.5决策树算法的Python代码和数据样本
大唐杯资料+题库(移动通信)
Alternative A2DP Driver 1.0.5.1 无限制版
校园网规划与设计(报告和pkt文件)
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
voc车辆检测数据集(已处理好,可直接训练)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
token登录器.rar
基于MQ2烟雾传感器的STM32F103程序
最新下载
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
STM32G4 参考手册 中文版
ACIS CAD开发类库
ACIS--CAD开发类库
ACIS--CAD开发类库7
ACIS--CAD开发类库4
ACIS--CAD开发类库6
ACIS--CAD开发类库3
ACIS CAD开发类库2
ACIS CAD开发类库8