只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
simhash:一种有效的文本相似度计算算法
simhash:一种有效的文本相似度计算算法
上传者:
42144199
|
上传时间: 2022-03-16 16:35:17
|
文件大小: 2.05MB
|
文件类型: -
Java
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
文件下载
立即下载
评论信息
其他资源
gis在水利行业中的应用
ARM板上实现打地鼠.zip
通信原理樊昌信第7版
象棋小虫引擎
静态小波变换swt去噪matlab编程
数学建模竞赛——获奖论文精选与点评 (第二卷)_13217605
苏州科技学院《高数》多套期末练习卷(含答案) .pdf
具有恒定时滞的TS模糊系统的新的时滞相关镇定条件
lykos:狼人,流行的侦探社交游戏(黑手党的主题)-源码
lua热更模型.rar
matlab开发-Parrotminirones的模拟支持包
微信抽奖源码PHP前后台+转盘+数据库完整示例
2018年umap期刊美赛mcm
MPlayer64bit
12位AD转换器TLC2543与51系列单片机接口技术.rar
带音乐的FLASH转盘程序源码
PPT动画大师@新春版_公测
编译原理实验:词法分析,语法分析和中间代码生成及优化
运输问题西北角法
Android横向滑动的listview
c1130-rcvk9w8-tar.124-10b.JA3.tar
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
DBSCAN算法Matlab实现
西门子逻辑控制设计开发_3部10层
python大作业--爬虫(完美应付大作业).zip
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
transformer_pytorch_inCV.rar
voc车辆检测数据集(已处理好,可直接训练)
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
Alternative A2DP Driver 1.0.5.1 无限制版
Keil5安装包
Vivado license 永久
MPC 模型预测控制matlab仿真程序
Python+OpenCV实现行人检测(含配置说明)
Android大作业——网上购物APP(一定是你想要的)
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
最新下载
Wyse-USB-Imaging-Tool
天津商业大学数字化作业中心作业客户端 v3.1.1908.B26110022.B21091809 2022-10-19 12357 1.exe
雷赛smc-6480资料
人工智能课程设计——钉子跳智能游戏
arm编译器6.16(适用于Windows 64位)
CST仿真设计理论与实践-彩pdf完整电子版+案例详解+工程应用张晓主编
V带设计实用程序
基于Multisim10的MC1496调幅电路仿真及分析.pdf
帝国CMS百度主动/自动推送插件(ZLPlugin-BDPush Pro)
Romax行星轮系统培训教程