只为小站
首页
域名查询
文件下载
登录
中文文本
分类数据集.zip
新闻栏目
中文文本
分类,新闻栏目一共有: 体育 5000 时政 5000 房产 5000 家居 5000 财经 5000 时尚 5000 科技 5000 教育 5000 娱乐 5000 游戏 5000 每个新闻栏目拥有5000条新闻,通过对新闻内容作为样本训练模型,使得该模型能够预测出该条新闻所属的栏目。
2019-12-21 20:19:49
66.03MB
文本分类数据集
1
中文文本
自动分词和标注
本书介绍了信息处理用现代汉语分词词表的收词原则和方法,《信息处理用现代汉语分词规范》设计原则及规范内容,
中文文本
歧义切分技术等内容。
2019-12-21 20:06:49
3.02MB
文本挖掘
文本标注
自然语言处理
分词
1
中文文本
分类停用词表
中文文本
分类,停用词表
2019-12-21 20:05:36
3KB
停用词表
1
kmeans
中文文本
聚类java源码(包括对文本tf,idf的计算,文本相似度计算)
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37
9KB
kmeans
中文
文本聚类
tf
1
中文文本
预处理;k-means聚类
课程作业,是对
中文文本
的获取、删除特殊符号、删除停用词、分词、最后计算文本之间的相似度、降维、Kmeans聚类以及可是化等
2019-12-21 19:51:50
12KB
文本预处理
1
中文文本
停用词表
中文文本
停用词表
2019-12-21 19:47:42
6KB
中文停用词
1
word2vec词向量训练及
中文文本
相似度计算 【源码+语料】
该资源主要参考我的博客:word2vec词向量训练及
中文文本
相似度计算 http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。 同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。 国家包括了Python的Jieba分词代码,详见博客。 免费资源希望对你有所帮助~
2019-12-21 19:41:38
142.09MB
word2vec
源码
中文预料
词向量
1
十六进制转换中文、文本、字符串工具,抓包分析工具。16年7月更新。
2016年7月21日更新,修改了碰到换行、回车、00字符会中止转换的问题。 可以把十六进制转换成中文、文本、字符串,也可以把中文、文本、字符串转换成十六进制,同时生成十六进制与字符的对照表,主要用于对抓包的十六进制数据进行分析,也适用网络通信程序的开发和调试。 注意,如果十六进制数据是压缩或加密了的,生成的结果会是乱码,这不是程序的问题。
2019-12-21 19:37:48
161KB
十六进制
转换
中文
抓包
1
word2vec词向量训练及
中文文本
相似度计算
用来得到TXT文本中词语的相关性的深度学习模型,需要分词,text8为样例,运行脚本可以直接开始训练。最后得到.bin模型
2019-12-21 18:59:02
31.81MB
word2vec
深度学习
1
中文文本
分类语料(复旦)训练集+测试集(100M)完整版
中文文本
分类语料(复旦)训练集+测试集(100M)完整版
2019-12-21 18:58:20
103.25MB
中文文本分类
分类语料
训练集
测试集
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
鲸鱼优化算法 WOA matlab源代码(详细注释)
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
基于matlab的车牌识别系统设计
多目标优化算法(四)NSGA3的代码(python3.6)
EasyMedia-ui.zip
华为OD机试真题.pdf
基于STM32的电子时钟设计
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
多目标优化算法(四)NSGA3的代码(MATLAB)
商用密码应用与安全性评估——霍炜.pdf
2020年数学建模B题(国二)论文.pdf
EEupdate_5.35.12.0 win10下修改intel网卡mac
基于STM32的FFT频谱分析+波形识别
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
Alternative A2DP Driver 1.0.5.1 无限制版
最新下载
test_pcl.zip
【SHP文件-2022.07】江西省行政区划(省、市、县)+道路网+公路网
School Days HQ GPK文件解包工具
国科大模式识别期末考试题 2016.pdf
运算放大器基本仿真实例
国科大模式识别历年期末试题
牟乃夏-ArcGIS Engine地理信息系统开发教程(基于C#.NET)
东南Dx7多媒体系统升级包
红外星人win10主题
江西省乡镇级区划图 shp格式
其他资源
Cyclone V最全的中文手册
软件测试复习题.pdf
机器学习与数据挖掘实验报告.zip
直流电机转速闭环PI调节电机模型matlab仿真
12864显示程序,经典!
BTC比特币近一年的历史交易数据
Android联系人经典案例
ca6140车床拨叉831005课程设计(夹具,毛坯图、装配图)
Matlab英文词汇大全
3-8译码器verilog 代码
一次Linux下ARP欺骗嗅探公司邮箱密码的内部渗透测试.pdf
PostgreSQL并行管理
共情-源码
北京理工大学《复变函数与积分变换》历年多套期末考试试卷(部分有答案).pdf
OpenCore.Repository,Net5搭载Nhibernate5.4操作数据库示例源码
Datasetette.io:Datasette的官方项目网站-源码
RDLC在winfrom报错解决办法.rar
oracle监控.txt
2012-2018年南京航空航天大学211翻译硕士英语考研真题
asp.net网上商城系统(原创)(数据库课程设计)
win10+vs2013x64+opencv3.2+opencv3.2_contrib+cmake3.13编译好的库
国内外虚拟仿真实验室网站
mysql-connector-java-5.0.4-bin.jar