线性规划的matlab代码 RecommenderSystems 主要是对推荐系统常用算法 matlab 代码版的编写。 包括了Pearson相似度算法,基于用户的UserCF算法,基于物品的ItemCF算法,slope one算法,TopN推荐,MAE,RMSE,topN推荐准确度,覆盖率计算等常用算法 实验代码有些是两年前写的,编写有些不太规范,且个别程序时间复杂度上较高,先存在这上面,供以后自己有需要时能够方便温故、翻新。 关于编写协同过滤推荐算法代码中的一些需要注意的参数细节: 由于推荐系统方面学术研究方面大多是是离线实验,且实验参数较多,每个学者改进的点不一样各固定参数可能与别的学者很少出现全部一直,所有完全复制一篇论文中的实验结果是极其困难的。且很多学者在文章中并没有交代,比如数据集中测试集和训练集的划分比例、实验次数、随机划分策略、目标用户和目标项目的占项目的比例、由于传统公式的缺陷性各种为出现无穷大和为1或者为0时的处理、近邻数量的设置、推荐列表长度的设置等等,所有的这些,有一个参数不一样,实验数据都会发生很大的变化。 那些曾经踩过的坑,待续……
2022-05-30 10:37:57 14.54MB 系统开源
1
人工智能大作业_基于同义词林的语义相似度计算 词义相似度计算在很多领域中都有广泛的应用,例如信息检索、 信息抽取、文本分类、词义排歧、基于实例的机器翻译等等。国内很 多论文主要是基于同义词林和知网来计算的。本文的词语相似度计算 是基于《同义词词林》的。 为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点.该算法同时考虑了词语的相似性,和词语的相关性.进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性.
2022-05-29 09:08:28 35.79MB 人工智能 文档资料 大作业
1
本文提出了结合主题和各主题下关键特征的文本相似度算法,目的在于更准确的挖掘被描述对象的近邻对象集。本文首先介绍卡方统检验特征统计法,并利用改进的卡方检验,计算训练集中已知主题的文本的特征;而后介绍了最小编辑距离算法、余弦相似度算法和杰卡德相似系数,在论证了主题对文本相似度的重要性后,又针对难提取主题的文本加以改进,最终提出了基于主题和特征的文本相似度算法;然后对各个算法在测试集上的相似度计算结果进行分析,证明本文提出的算法在速度和精确度上明显优于其他算法;最后将该算法应用于股票的概念股题材标注上,分析结果
2022-05-28 10:41:26 1MB 工程技术 论文
1
字符串相似度的计算及算法实现.doc
2022-05-26 14:07:36 126KB 算法 文档资料
一种相似度矩阵的社团挖掘算法.doc
2022-05-25 19:06:41 178KB 矩阵 算法 文档资料 线性代数
基于内容的电影推荐系统 基于余弦相似度的基于内容的电影推荐系统 使用Jupyter Notebook的余弦相似度创建基于内容的电影推荐系统
2022-05-23 17:09:15 153KB JupyterNotebook
1
人工智能-机器学习-融合多元信息的句子相似度计算研究.pdf
2022-05-22 10:05:52 2.94MB 人工智能 文档资料 机器学习
1
图像相似度 使用几种技术的Python图像相似度比较 要求: sudo apt-get install -y python-pip sudo pip install PIL numpy 用法 将脚本保存到与主脚本相同的文件夹中 从脚本导入功能 from image_similarity import similarity_bands_via_numpy from image_similarity import similarity_histogram_via_pil from image_similarity import similarity_vectors_via_numpy from image_similarity import similarity_greyscale_hash_code 从主脚本调用功能 similarity_bands_via_numpy, sim
2022-05-20 17:39:22 4KB Python
1
常规相似度测量方法的性能受到高维数据维数诅咒的严重影响,原因是稀疏维数和噪声维数之间的数据差异占据了很大一部分相似度,从而导致任何结果之间的差异。提出了一种基于归一化净格子空间的高维数据测量方法,将每个维的数据范围划分为几个区间,将不同维的分量映射到对应的区间上,只有相同或相邻区间的分量为了验证该方法,为验证该方法,使用了三种数据类型,并比较了七种常见的相似性测量方法。 实验结果表明,该方法的相对差异随维数的增加而增加,比常规方法高出约两个或三个数量级。此外,该方法在不同维度上的相似范围为[0,1 ],适合进行降维后的相似性分析。
2022-05-16 13:24:21 1.75MB high-dimensional data the curse of
1
问题句子相似度计算,即给定客服里用户描述的两句话,用算法来判断是否表示了相同的语义
2022-05-15 11:46:33 7.98MB Python开发-自然语言处理
1