kmeans和dbscan的聚类算法的matlab实现
2022-11-02 16:22:47 5KB Kmeans DBSCAN matlab 聚类算法
1
Kmeans聚类分析+python代码
2022-10-19 19:08:20 647KB Kmeans K均值聚类 python
1
列联表的作用是分析定类变量和定类变量之间有无关系; 优点:不需要确定因变量和自变量; 缺点:卡法检验对三维和三维以上列联表资料的分析有一定的困难,即对混杂变量的控制较为困难。 此篇文章具体讲述了如何对四维、多维与更高维度列联表进行降维处理。
2022-09-26 18:07:06 2.28MB 聚类分析 回归分析 数学建模 机器学习
1
包括最长、最短欧式距离法、重心法(标准欧式、平方欧式、精度加权)、平均法、权重法等等
聚类分析代码(可直接运行)
2022-09-17 10:25:38 3KB matlab 数学建模 聚类分析
1
根据方差分析理论,提出应用混合F统计量来确定最佳分类数,并应用模糊划分熵来验证最佳分类数的正确性,综合运用上述两个指标可以准确确定最佳聚类数。通过实际算例说明这两个指标的有效性。
1
主要技术:Python / jieba / TF-IDF / MultinomialNB / KMeans / editdistance / TopN 项目简介:通过分析不同机构发布的文章,判断是否有文章抄袭的情况,并找到原文和抄袭的文章,以及具体相似的句子。可以应用于毕业论文查重,IP作品及文本抄袭检测。 主要工作:对采集的文档进行数据清洗,采用TF-IDF提取文本特征,使用朴素贝叶斯分类器进行写作风格分类,并针对模仿自己写作风格的文章进行抄袭检测。先采用聚类算法对文档进行聚类降维,针对预测写作风格一致的作品,进行相似度检测及编辑距离检测。
2022-07-26 17:06:53 2.27MB 文本抄袭 python 机器学习 聚类分析
1
专题资料(2021-2022年)ArcGIS应用之基于密度的聚类分析.docx
2022-07-19 12:01:35 1006KB 互联网
1
随着第三产业旅游业在中国的不断发展,人们越来越关注旅游业所带来的机会和商机,这也就必然会出现激烈竞争的现象。想要在旅游业合理获得最大的利益,不容置疑要准确把握旅游消费的特点。旅游消费的差异主要来源于地区经济发展的不衡以及人民消费理念和文化的差异。不仅如此,旅游者的所在地区、年龄以及收入水平也影响着国内旅游的消费。 按照以上分析,本文要按照的不同指标对全国各地的人均消费支出来进行聚类分析, 这样能通过量的分析来确定不同性质的人民旅游的消费支出。 本文使用了K均值聚类和系统聚类按照年龄性别、旅游消费者的文化水平、旅游消费的旅游目的这三个指标对22个城镇居民旅游出游人均消费进行了分类分析。在年龄性别指标下对22个不同城镇进行分类,由聚类分析结果可分得三类,其中第一类的城市特点是无论男女老少旅游平均消费想水平都很高,处于全国高档水平上;而第三类的城市无论男女老少旅游平均消费水平都不高,处于全国低档水平上;苏州独成一类,没有显著特点,但可得出男性旅行者占旅游人均消费的主导地位,并且年龄在25~44之间的居民占旅游人均消费的主导地位,这两特点的显著性明显远强于其他类中的人均消费支出特点。在文化水平以及旅游目的指标也同上进行了分类。
2022-07-14 10:18:28 346KB 聚类分析;
1
k均值聚类分析举例.pdf 学习资料 复习资料 教学资源
2022-07-11 14:06:41 345KB 计算机