只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
simhash:一种有效的文本相似度计算算法
simhash:一种有效的文本相似度计算算法
上传者:
42144199
|
上传时间: 2022-03-16 16:35:17
|
文件大小: 2.05MB
|
文件类型: -
Java
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
文件下载
立即下载
评论信息
其他资源
坦克大战C语言(easyx图形插件)源代码
工业以太网现场总线EtherCAT驱动程序设计及应用
ISO 11270-2014 Intelligent transport systems)
Android小游戏---打地鼠
2000张微信qq头像打包下载
servlet+jsp实现上课点名系统
高频小信号放大器
信息检索大作业
weather channel api(最准的天气没有之一)
FPGA_veriog_Quartus_DDS
信息学奥赛一本通-教程PPT课件(第五版)第5章 数组(C++版).ppt
数据库基础-练习.docx
雷霆战机-家家.sb3
note_on_dso.pdf
《信息安全技术 网络安全等级保护测评要求 第5部分:工业控制安全扩展测评要求》标准征求意见稿.pdf
基于高维云RBF神经网络的混凝土强度预测
基于Android手机蓝牙的实时通信
Android 新手引导页
狼人杀游戏源码
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
计算机专业实习日记+实习周记+实习总结
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
鲸鱼优化算法 WOA matlab源代码(详细注释)
基于蒙特卡洛生成电动汽车充电负荷曲线程序
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
基于ray filter的雷达点云地面过滤ROS节点
得到品控手册7.0.pdf
夏天IC助手1.8你们懂的
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
云视通端口扫描器.rar
基于MATLAB的水果图像识别
知网情感词典(HOWNET)
EBSD分析软件——Channel5下载安装教程
最新下载
JiYuTrainer.rar
安卓14使用Android/data(无需shizuku,无需授权)
毕业设计基于SpringBoot+Vue 的校园在线拍卖系统【源码+演示视频+包运行成功】
计算机操作系统(第四版),高清扫描版,汤小丹,梁红兵,哲凤屏,汤子瀛编著
基于单片机的毕业设计合集.doc
抽象代数 [王颖,南基洙 编著] 2013年版
Word2007SP1简体中文绿色便携版[139MB]
MT4指标EA反编译工具
yolo格式的密集行人检测数据集WiderPerson
412747752909824前三后四归属地查全号软件V3.0-增强版Demo.zip