使用python对51job的招聘信息进行爬虫,使用python对职位信息输出词云,词频统计图,使用jieba库进行分词,然后使用gensim的word2vec进行词向量训练,然后使用sklearn的k-means算法进行聚类。压缩包内有代码,数据,简单的小论文文档,代码来源于网络,论文自己写的,水平一般。代码在anaconda的spyder开发环境可以正常运行。
2022-02-19 21:55:10 2.02MB python爬虫 词云 词向量 K-means文本聚类
1
[IDX,C,SUMD,K] = best_kmeans(X) 划分 N×P 数据矩阵 X 中的点成 K 个簇。 X 的行对应点,列对应变量。 IDX 包含每个点的集群索引。 C 是 K×P 矩阵 C 中的 K 个簇质心位置。 SUMD 是 1×K 向量中点到质心距离的总和。 K 是使用 ELBOW 方法确定的聚类质心数。 ELBOW方法:计算从1到n,并且K是对应于90%百分比的簇数方差解释,这是组间方差与总方差。 见 找到最好的K个簇后,使用kmeans确定IDX,C,SUMD matlab中的函数。
2022-02-13 21:21:12 2KB matlab
1
辍学学生的预测 该项目的目标是确定有辍学风险的学生 介绍 从一组包含有关1000名学生的前两个学期的信息的文件中,必须将它们集成到一个文件中以进行后续分析,最后的文件必须分为三组: 100名学生进行测试 200名学生评估模型 700名学生训练模型。 学生没有被标记,因此需要对数据进行描述性分析,一旦标记了学生,就必须使用kmeans才能基于聚类分析来标记数据。 必须使用人工神经网络来训练模型,以预测哪些学生会辍学。 建立模型后,必须使用100名学生的测试数据集来了解其中哪些人会辍学,因此它将使用一种遗传算法来优化大学的资源,以便为学生提供机会,从而避免辍学。 方法 发展 变量选择和特征工程 性别:男性或女性(0或1) admision.letras :十进制数字,代表学生在高中入学考试中的成绩。 admision.numeros :小数,表示学生在高中入学考试中的成绩。 prom
2022-02-12 10:23:16 16.41MB r genetic-algorithm neural-networks k-means
1
k-mens算法c++源码实现,样本数据,代码实现,实验结果
2022-02-10 14:15:50 52KB k-means C++ 源码
1
【程序老媛出品,必属精品,亲测校正,质量保证】 资源名:matlab k-means算法 程序源码.zip 资源类型:程序源代码 源码说明: matlab实现 k-means算法 程序 包含完整代码 非常适合借鉴学习 适合人群:新手及有一定经验的开发人员
2022-02-05 14:09:41 2KB kmeans matlab matlab实现k-means 程序源码
一个简单的K-means文本聚类Java实现,可以让你了解怎样去实现一个自己的文本聚类方法
2022-02-01 11:36:44 9KB K-means 文本聚类 Java实现
1
基于半监督K-means的主动学习聚类算法 ,孙凯,孟祥武,针对K-means算法对初始聚类中心敏感,针对不规则聚类簇效果较差的缺点,提出了一种基于半监督K-means的主动学习算法。为了针对指定的k
1
这个资源是一个拥有完整代码与测试数据的k-means算法文件。距离计算方式中,欧式距离、余弦距离均实现了,且可作为程序参数供用户自由选择;两份数据集均进行了聚类,聚类结果由程序自动保存到txt文件中;聚类结果中包含SSE值。
2022-01-25 18:25:48 1.03MB k means machin learnin
1
简单的实现了K_means算法的可视化,这里分析的主要是坐标信息,数据源是文本信息txt文件。数据源大家可以修改
2022-01-23 19:12:16 1KB kmeans算法
1