只为小站
首页
域名查询
文件下载
登录
中文句子
相似度计算算法
中文句子
相似度计算算法
计算句子的相似度
2022-03-19 17:23:08
277KB
中文句子
相似度计算算法
1
simhash:一种有效的文本
相似度计算算法
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
2022-03-16 16:35:17
2.05MB
Java
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
PSO-LSSVM的MATLAB代码.rar
多机器人编队及避障仿真算法.zip
DBSCAN算法Matlab实现
人体姿态检测
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
离散时间信号处理第三版课后习题答案
芯片验证漫游指南以及源代码.zip
matpower5.0b1.zip
simulink仿真实现光伏发电MPPT+能量管理
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
基于VMD算法的信号降噪.rar
基于matlab的车牌识别系统设计
基于OpenCV的车牌号码识别的Python代码(可直接运行)
ChinaMeteorologicalDataHandler.R
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
最新下载
AppleConfigurator2.dmg
小纸片全套网络验证源码(包含脱壳)
开源电商平台源码smartShop
k210视频循迹的一种方法
COMDLG32.OCX
振弦传感器监测装置设计及原理解析.zip
kodexplorer4.4版本完美修改版.zip
BMP图像文件读写操作类,C++实现,支持24位位图
傻瓜进销存完美破解
ds180_7Series_Overview.pdf
其他资源
MK检验及方法
8位16进制与浮点double的转换工具
PDG格式转换工具
华为USB SER驱动
tensorflow models安装
java虚拟机JVM详解ppt
纯C语言实现工资管理系统
mybatis-generator,一对一,一对多,批量更新插入2
中央广播电视大学《建筑材料》期末总复习资料(含答案).pdf
人大金仓SQL和PLSQL速查手册.pdf
基于C#的GPS数据采集源码
7-29专业级回忆.docx
超薄智能手机按键设计标准.ppt(60页).ppt
Circle.zip
Struts + Hibernate 分页实现
5053 vcds 17.1.3 修复固件
Apache Tomcat 6
自己开发的风资源分析工具包WindAnalysis-WindAnalysis1-V1.4.1.zip
专业人声后期处理各步骤(超级详细)
抓取国家统计局2017年的省市区街道数据