只为小站
首页
域名查询
文件下载
登录
simhash:一种有效的
文本相似度计算
算法
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
2022-03-16 16:35:17
2.05MB
Java
1
基于WMF_LDA主题模型的
文本相似度计算
基于WMF_LDA主题模型的
文本相似度计算
2022-02-28 21:08:43
1.17MB
研究论文
1
kmeans算法
文本相似度计算
(可控制台手动输入数据)
kmeans算法
文本相似度计算
(可控制台手动输入数据)
2022-02-25 14:03:28
16KB
kmeans
相似度计算
1
基于汉明距离的
文本相似度计算
传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来 反映文本之间的相互关系。该文则首先建立文本集与码字集之间的1-1对应关系,然后借用编码理论中汉明距离的概 念,由汉明距离的计算公式,得到了一种全新的文本相似度的计算方法,与传统的方法相比较,它具有简便,快速等优点。
2022-02-09 15:53:54
98KB
文本相似度
1
基于Hadoop的
文本相似度计算
基于Hadoop的
文本相似度计算
的代码 是用TFIDF 和向量空间模型,IKAnlayze来弄的 有代码,只是用来参考的 只是一个算法的演示,用于保存,以后查看的
2021-12-29 16:06:19
2.02MB
Hadoop
文本相似度
TFIDF
向量空间莫新
1
领域
文本相似度计算
方法研究.pdf
领域
文本相似度计算
方法研究.pdf
2021-12-14 12:01:49
12.88MB
资料
文本相似度计算
的简单实例超详细代码解释(附代码,文件)-附件资源
文本相似度计算
的简单实例超详细代码解释(附代码,文件)-附件资源
2021-12-07 23:42:51
106B
1
Python-对四种句子
文本相似度计算
方法进行实验与比较
对四种句子/
文本相似度计算
方法进行实验与比较
2021-09-30 14:27:36
51.25MB
Python开发-自然语言处理
1
word2vec词向量训练及中文
文本相似度计算
word2vec词向量训练及中文
文本相似度计算
。 word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。虽然源码是开源的,但是谷歌的代码库国内无法访问,因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。
2021-07-25 22:32:13
2.83MB
自然语言处理
1
一行代码使用BERT生成句向量,BERT做文本分类、
文本相似度计算
一行代码使用BERT生成句向量,BERT做文本分类、
文本相似度计算
2021-06-03 21:39:07
2.97MB
BERT
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
C4.5决策树算法的Python代码和数据样本
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
Android大作业——网上购物APP(一定是你想要的)
RentingSystem.rar
BP_PID控制仿真.rar
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
中国地面气候资料日值数据集(V3.0)2014-2019.zip
Plex v7.12电视端app
MVDR,Capon波束形成DO估计.zip
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
Elsevier爱思唯尔的word模板.zip
simulink仿真实现光伏发电MPPT+能量管理
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
Spring相关的外文文献和翻译(含出处).zip
DBSCAN算法Matlab实现
最新下载
ISO26262汽车功能安全学习笔记(纯手绘版-思维导图).pdf
区块链身份认证授权系统毕设源码
3518_full_evb3561sv_w_65_m0-ota-20190117.zip
最新英皇cms影视网站系统源码 多种模板 自带采集 支持APP【源码+教程】
国嵌课件
Filter-Solutions教程【非常好的资料】
人脸识别英文课件(各种算法的介绍)
电力电子技术(第5版)【王兆安】.zip
卫星对地定向动力学模型控制器建模仿真MATLAB SIMULINK
航天器轨道动力学模型求解matlab
其他资源
AC300调试软件
MOSI DATASET
PROFINET TPS-1 Development Toolkit
ULN2003驱动28BYJ-48步进电机STM32F103库函数版
RIP协议的OPNET仿真
inquisit 5.0
迫零波束成形,MMSE波束成形代码
基于Logistic系统的图像加密(MATLAB版)
Digital Communication Receivers.pdf
Open+Inventor程序设计从入门到精通电子版
智能车MT9V034摄像头调试上位机.zip
灰色预测GM(1,1)带后验差检验
IBMSystemx3850x6和x3890x6安装和维护指南
AMBA3-AHBLite中文协议
C课程设计--吃豆人.doc
仿互站网php源码.txt
标准正交基应用于通信原理课程的教学研究
2015年美赛O奖特等奖官方原版论文(20篇).zip
lammps命令解读
ecstore架构之数据库(Ecstore数据库字典)
遗传算法c++源程序
Spy++AccEvent+AccExplorer32+Inspect+UISpy五个工具大集合
hadoop2.5.0 snappy编译jar包
图像加密算法与实践
微机测控系统设计
JAVA 权限管理系统源码