本文实例讲述了Python实现简单的文本相似度分析操作。分享给大家供大家参考,具体如下: 学习目标: 1.利用gensim包分析文档相似度 2.使用jieba进行中文分词 3.了解TF-IDF模型 环境: Python 3.6.0 |Anaconda 4.3.1 (64-bit) 工具: jupyter notebook 注:为了简化问题,本文没有剔除停用词“stop-word”。实际应用中应该要剔除停用词。 首先引入分词API库jieba、文本相似度库gensim import jieba from gensim import corpora,models,similarities 以下
2022-05-30 21:44:42 70KB python python函数 python实例
1
最小生成树问题的算法实现及复杂度分析—天津大学计算机科学与技术学院(算法设计与分析).doc
2022-05-30 14:06:05 78KB 文档资料
为简化B3模式基本徐变的计算,收集了国内20座已建成的钢管混凝土拱桥核心混凝土的配合比资料,并对其进行统计分析,在此基础上提出了钢管混凝土的一种标准配合比?采用拉丁超立方抽样法,以通径系数和偏相关系数为指标对徐变各计算参数进行敏感性分析?结果表明,各计算参数对B3模式基本徐变度影响的大小顺序为:强度-骨灰比-水泥含量-水灰比?将变异性较小的计算参数按常数处理,从而得到钢管混凝土徐变系数计算的实用公式?该公式只与加载龄期和计算龄期有关,大大简化了相关参数的计算?
2022-05-30 13:53:58 1.07MB 工程技术 论文
1
线性规划的matlab代码 RecommenderSystems 主要是对推荐系统常用算法 matlab 代码版的编写。 包括了Pearson相似度算法,基于用户的UserCF算法,基于物品的ItemCF算法,slope one算法,TopN推荐,MAE,RMSE,topN推荐准确度,覆盖率计算等常用算法 实验代码有些是两年前写的,编写有些不太规范,且个别程序时间复杂度上较高,先存在这上面,供以后自己有需要时能够方便温故、翻新。 关于编写协同过滤推荐算法代码中的一些需要注意的参数细节: 由于推荐系统方面学术研究方面大多是是离线实验,且实验参数较多,每个学者改进的点不一样各固定参数可能与别的学者很少出现全部一直,所有完全复制一篇论文中的实验结果是极其困难的。且很多学者在文章中并没有交代,比如数据集中测试集和训练集的划分比例、实验次数、随机划分策略、目标用户和目标项目的占项目的比例、由于传统公式的缺陷性各种为出现无穷大和为1或者为0时的处理、近邻数量的设置、推荐列表长度的设置等等,所有的这些,有一个参数不一样,实验数据都会发生很大的变化。 那些曾经踩过的坑,待续……
2022-05-30 10:37:57 14.54MB 系统开源
1
低复杂度SM4加密算法IP核设计.doc
2022-05-29 19:06:39 1.67MB tcp/ip 文档资料 网络协议 网络
提出了一种基于MSP430单片机的三相不平衡度的数字检测系统。在滤波器的设计中采用了硬件模拟滤波器和软件数字滤波器共同组成,硬件滤波器采用开关电容型低通滤波器,软件滤波采用加海明窗函数的线性相位FIR数字滤波器。系统的算法实现主要采用三相不平衡度的定义,通过交流采样值分别求出正序分量和负序分量的采样值,正序分量和负序分量的均方根值的比值便是三相不平衡度。较之纯硬件滤波或纯软件滤波系统,整个系统的响应速度快。通过实验证明了该系统具有较高的可行性和实用性。
2022-05-29 16:12:51 619KB 三相不平衡度 滤波器 FIR 序分量 采样值
1
人工智能大作业_基于同义词林的语义相似度计算 词义相似度计算在很多领域中都有广泛的应用,例如信息检索、 信息抽取、文本分类、词义排歧、基于实例的机器翻译等等。国内很 多论文主要是基于同义词林和知网来计算的。本文的词语相似度计算 是基于《同义词词林》的。 为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点.该算法同时考虑了词语的相似性,和词语的相关性.进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性.
2022-05-29 09:08:28 35.79MB 人工智能 文档资料 大作业
1
Android加速度传感器,记录数据保存成文本。
2022-05-29 00:59:04 153KB Android 加速度传感器
1
内容概要: 《低代码指南 》这本书深入分析低代码100问,系统讲解低代码应用开发100课程,100解决方案,十大行业3000模板,应用参谋全面助力企业数字化转型。 适合人群: 开发工程师、应用工程师、业务人员、企业管理者和决策者等。 使用场景: 我曾经坚定地认为:“用低代码平台搭建的应用在体验上远远落后于专业的工具,低代码平台难成大器。”《低代码指南 》这本书让我重新认识到低代码平台的价值:缺乏编程基础能力的业务人员也能根据自身业务需求快速完应用的开发。强烈推荐大家阅读本书,跟随作者的专业视角全面学习低代码,拥抱数字化时代! 推荐理由: (1)作者资深:六位低代码专家联合撰写。 (2)专家好评:语雀社区,钉钉搭负责人,CSDN社区,CSDN CTO ,低代码内参专家一致推荐。 (3)内容干货:深入分析低代码100问,系统讲解低代码应用开发课程100节,十大行业3000模板,应用参谋全面助力企业数字化转型 精彩书评: 低代码平台从数字化、可视化、自动化、智能化四个方面赋能业务人员,让他们快速建立应用,敏捷响应市场变化,让他们在安全可控的范围内开发强大的应用。《低代码指南 》这本书让我重