只为小站
首页
域名查询
文件下载
登录
中文句子
相似度计算算法
中文句子
相似度计算算法
计算句子的相似度
2022-03-19 17:23:08
277KB
中文句子
相似度计算算法
1
simhash:一种有效的文本
相似度计算算法
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
2022-03-16 16:35:17
2.05MB
Java
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
EEupdate_5.35.12.0 win10下修改intel网卡mac
Elsevier爱思唯尔的word模板.zip
2019综合测评仿真.zip
copula程序及算法.zip
EasyMedia-ui.zip
华为OD机试真题.pdf
基于Python网络爬虫毕业论文.doc
多目标微粒子群算法MOPSO MATLAB代码
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
基于yolov4-keras的抽烟检测(源码+数据集)
SSM外文文献和翻译(毕设论文精品).doc
基于LSTM模型的股票预测模型_python
大学生网页设计大作业-5个网页设计制作作品自己任选
2019年秋招—华为硬件工程师笔试题目.pdf
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
最新下载
stm32f405.rar
武汉大学夏令营自我展示PPT
ML程序设计教程(原书第二版)中英文对照答案
ML程序设计教程 第二版 (扫描识别带书签)
UV-5R说明书.pdf
基于QT实现的植物大战僵尸游戏.7z
Qt版本的植物大战僵尸源码
TrebleCheck-v3.0.2-检测你的手机是否支持A/B分区
C++实现的植物大战僵尸Qt版源码.zip
led.rar_流水灯电路图
其他资源
模拟电子技术基础(第五版)童诗白、华成英
信道模型matlab代码
联想H61主板升级BIOS支持22NM I5 I7 E3系列
《EMC电磁兼容设计与测试案例分析》PDF-郑军奇
51单片机中文数据手册资料
libclntsh.so.11.1
android 传感器之 光线传感器
完整版 Photoshop教程(完整版).ppt
【国外电子与通信教材系列】电路原理(第7版) (可编辑版)
spring-orm最新jar包
newProvidance-源码
AltiumDesigner中文帮助手册.pdf
DASSIDirect3.0_jb51.rar
iOSApp中数据加载的6种方式
CollaRobots_ArcWelding.MPG
MySQL练习数据create.txt
PL2303串口驱动.7z
语音识别系统设计
CentOS7系统管理与运维实战(带书签高清文字版)-Linux文档类资源
数字时钟课程设计报告
Programming 3D Applications with HTML5 and WebGL