只为小站
首页
域名查询
文件下载
登录
simhash:一种有效的
文本相似度计算
算法
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
2022-03-16 16:35:17
2.05MB
Java
1
基于WMF_LDA主题模型的
文本相似度计算
基于WMF_LDA主题模型的
文本相似度计算
2022-02-28 21:08:43
1.17MB
研究论文
1
kmeans算法
文本相似度计算
(可控制台手动输入数据)
kmeans算法
文本相似度计算
(可控制台手动输入数据)
2022-02-25 14:03:28
16KB
kmeans
相似度计算
1
基于汉明距离的
文本相似度计算
传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来 反映文本之间的相互关系。该文则首先建立文本集与码字集之间的1-1对应关系,然后借用编码理论中汉明距离的概 念,由汉明距离的计算公式,得到了一种全新的文本相似度的计算方法,与传统的方法相比较,它具有简便,快速等优点。
2022-02-09 15:53:54
98KB
文本相似度
1
基于Hadoop的
文本相似度计算
基于Hadoop的
文本相似度计算
的代码 是用TFIDF 和向量空间模型,IKAnlayze来弄的 有代码,只是用来参考的 只是一个算法的演示,用于保存,以后查看的
2021-12-29 16:06:19
2.02MB
Hadoop
文本相似度
TFIDF
向量空间莫新
1
领域
文本相似度计算
方法研究.pdf
领域
文本相似度计算
方法研究.pdf
2021-12-14 12:01:49
12.88MB
资料
文本相似度计算
的简单实例超详细代码解释(附代码,文件)-附件资源
文本相似度计算
的简单实例超详细代码解释(附代码,文件)-附件资源
2021-12-07 23:42:51
106B
1
Python-对四种句子
文本相似度计算
方法进行实验与比较
对四种句子/
文本相似度计算
方法进行实验与比较
2021-09-30 14:27:36
51.25MB
Python开发-自然语言处理
1
word2vec词向量训练及中文
文本相似度计算
word2vec词向量训练及中文
文本相似度计算
。 word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。虽然源码是开源的,但是谷歌的代码库国内无法访问,因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。
2021-07-25 22:32:13
2.83MB
自然语言处理
1
一行代码使用BERT生成句向量,BERT做文本分类、
文本相似度计算
一行代码使用BERT生成句向量,BERT做文本分类、
文本相似度计算
2021-06-03 21:39:07
2.97MB
BERT
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
IBM CPLEX 12.10 学术版 mac操作系统安装包
IEEE ENDNOTE 模板【更新】
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
Android大作业——网上购物APP(一定是你想要的)
DS证据理论的MATLAB案例程序源代码
大学生网页设计大作业-5个网页设计制作作品自己任选
基于yolov4-keras的抽烟检测(源码+数据集)
全国道路网SHP数据.zip
空间谱估计理论与算法------程序.rar
MPC 模型预测控制matlab仿真程序
航迹融合算法MATLAB仿真程序
计算机专业实习日记+实习周记+实习总结
鲸鱼优化算法 WOA matlab源代码(详细注释)
银行笔试 信息科技岗部分真题
基于LSTM模型的股票预测模型_python
最新下载
高通9008模式刷机救砖/固件提取备份所需的Firehose文件合集,已经包括华为,小米,vivo等大厂
OLED驱动源文件和头文件.zip
雅思词汇8000英语(Excel).xls
Springboot+Vue+Mysql实现模拟汽车保养系统(附源码)
KViewer专业医学病理切片查看软件(K-Viewer),适用于医学生不知道怎么打开KFB格式文件
MATLAB_SIMULINK与液压控制系统仿真_宋志安_等_著
汽轮机设备及系统动画汇总
学生成绩管理系统VC++
计算机组织与结构:性能设计 william stalling 东南大学信息学院 课件
图书管理系统(java+mysql).zip
其他资源
去哪网旅游景点数据集合
app inventor 打地鼠aia格式文件
C语言实现matlab的butter函数
G120C操作说明书及参数手册.rar
MIPI DSI摄像头 芯片资料(IMX225、IMX290、IMX291、OV2775)
UDP客户端demo
逻辑与计算机设计基础第五版(数电) 答案
基于NLM的MMC模型
ANSYS Workbench 14.0建模仿真技术及实例详解[扫描版PDF电子书]
OpenVINO运行Tensorflow模型
分布式算法导论
数据结构 银行排号问题
ImageFusion.zip
Echarts+ajax+java+mysql实现饼图+折线图+柱状图
Jquery仿163收件人效果+邮箱验证
51最小系统PCB,带简单外设
信号与系统分析及MATLAB实现 梁虹编
hill密码加密和解密.rar
OpenCV初学英文文献
基于MCGS的电梯监控系统设计毕业设计
C#图片匹配坐标
毫米波FMCW雷达中射频对消技术研究_李成虎
汽车数据流故障案例分析
【C++】OpenCV调整图片对比度&亮度 示例程序 by浅墨