只为小站
首页
域名查询
文件下载
登录
kmeans中文文本聚类java源码(包括对文本tf,idf的计算,
文本相似度计算
)
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37
9KB
kmeans
中文
文本聚类
tf
1
word2vec词向量训练及中文
文本相似度计算
【源码+语料】
该资源主要参考我的博客:word2vec词向量训练及中文
文本相似度计算
http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。 同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。 国家包括了Python的Jieba分词代码,详见博客。 免费资源希望对你有所帮助~
2019-12-21 19:41:38
142.09MB
word2vec
源码
中文预料
词向量
1
word2vec词向量训练及中文
文本相似度计算
用来得到TXT文本中词语的相关性的深度学习模型,需要分词,text8为样例,运行脚本可以直接开始训练。最后得到.bin模型
2019-12-21 18:59:02
31.81MB
word2vec
深度学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
EEMD算法应用于信号去噪.rar
Vivado license 永久
多智能体的编队控制程序的补充(之前上传少了一个文件)
云视通扫描工具.zip
DBSCAN算法Matlab实现
人体姿态检测
2021华为芯片研发岗位笔试题
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
非线性本构关系在ABAQUS中的实现.pdf
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
基于hadoop商品推荐系统课程设计
simulink仿真实现光伏发电MPPT+能量管理
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
最新下载
Virtual Audio Cable 4.10破解版(完美去除“trail”女声)+安装设置说明
python草莓熊代码.txt
国科大模式识别与机器学习2015-2019试卷答案--郭立东.zip
Serial to Ethernet Connector 7.1 Build (7.1.876) 破解版
中国地面气候资料日值数据集(V3.0)2014-2019.zip
stm32cubemx-win-v6-12-1
18位8通道AD7608驱动程序.rar
中科院考博英语2009-2018年试题及答案解析(十五套436面).pdf
KittiSeg_pretrained.zip下载地址
IEEE全文导入飞书/Word
其他资源
社会科学相关自定义词典
IXYS公司SPICE模型库
java项目—银行管理系统
从视差图重建3D点云MATLAB
unity框选demo
Microsoft .NET Framework 4.0.30319.
吴恩达机器学习视频百度网盘(视频+PPT+个人笔记+作业)
MyEclipse CI 2019.4月最新破解文件,内含破解教程,亲测可用,可破解任意版本
python + opencv 人脸识别代码(可以跨平台运行,linux windows均可以)
c# 招聘系统代码,初学者可看
Data_Mining_with_R__Learning_with_Case_Studies
LSI SAS1068 SCSI驱动
YaHei.Consolas (1.12版) 中文雅黑,英文Consolas 适用于编程的美化等宽字体
am5728.pdf
SNMP4J远程获取设备信息案例
接电话瞬间没有声音,尝试勾选这个选项.doc
mongodb 官方资料
ibm_data_server_client_win32_v11.5.part3.rar
大一课程设计[小学生数学测试软件]
Sublime Text 3
财政与金融形考作业一.docx
汽修汽配通2.1(网络版) 算法注册机