程序员角度解析data mining的算法,对data mining的算法做了有趣的描述。
2024-05-25 17:40:38 63.55MB data mining
1
学习数据挖掘和机器学习的一本非常著名的书。是第二版。不太完美的地方是,本书是英文版。
2024-01-26 20:45:02 9.08MB 数据挖掘 data mining Morgan.Kaufmann
1
Web DataMining:Exploring Hyperlinks,Contents, and Usage Data 这本经典教材的讲义。
2023-09-21 10:16:14 19.54MB Ming the web
1
Encyclopedia of Machine Learning and Data Mining(2nd) 英文无水印pdf 第2版 pdf所有页面使用FoxitReader和PDF-XChangeViewer测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 本资源转载自网络,如有侵权,请联系上传者或csdn删除
2023-05-15 15:47:50 30.15MB Encyclopedia Machine Learning Data
1
Tan, Pang-Ning_ Steinbach, Michael_ Kumar, Vipin-Introduction To Data Mining Instructors Solution Manual-Pearson Addison Wesley (2005)
2023-04-27 22:07:39 1.3MB Data Mining
1
2016-ccf-data-mining-competition text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880 2016-ccf-data-mining-competition 大数据精准营销中搜狗用户画像挖掘 竞赛简介 在现代广告投放系统中,多层级成体系的用户画像构建算法是实现精准广告投放的基础技术之一。其中,基于人口属性的广告定向技术是普遍适用于品牌展示广告和精准竞价广告的关键性技术。人口属性包括自然人的性别、年龄、学历等基本属性。 在搜索竞价广告系统中,用户通过在搜索引擎输入具体的查询词来获取相关信息。因此,用户的历史查询词与用户的基本属性及潜在需求有密切的关系。 举例如下: 1、 年龄在19岁至23岁区间的自然人会有较多的搜索行为与大学生活、社交等主题有关 2、 男性相比女性会在军事、汽车等主题有更多的搜索行为 3、 高学历人群会更
2023-04-05 15:30:47 1.88MB Python
1
Data-Mining-Project-2014- 这个存储库包含我的学术课程“数据挖掘”项目的文件。 该项目涉及使用 K-Means 聚类算法进行聚类。 该项目的主要目的是了解聚类并应用 K-Means 聚类算法对数据进行聚类。 数据包括主要赛事的各种网球比赛的结果。 首先,我们应用特征减少来减少数据的字段,然后应用 K-Means 算法。 程序运行的先决条件是: Hadoop 2.3.0 所有节点上的多节点集群设置 程序运行并相应地将数据集划分为 3 个集群:- 低获胜机会 中奖机会 高获胜机会
2023-04-02 20:44:04 55KB Java
1
本实验采用的数据集使用了 Jester 数据集作为所有算法的训练和测试数据集。Jester是一个为研究而开发的笑话推荐系统,使用的数据集中的数据则是次系统获取的真实用户数据。 数据集包含 3 个文件,共包含 73421 个用户对于 100 个笑话的评分数据。数据为 xls 格式,每一行有 101 个数据,第一个为用户评价过的笑话个数,剩下的 100 个为用户对于 100 个笑话的评分,评分为 -10~10 之间的实数,99 表示 “null”,即未打分。数据集的 5, 7, 8, 13, 15, 16, 17, 18, 19, 20 是密集的,几乎所用的用户都给这些笑话打分过。
2023-03-28 15:07:15 6.24MB python
1
GKT 本文。 GKT的体系结构如下: 设置 要运行此代码,您需要以下内容: 配备GPU的机器 python3 numpy,pandas,scipy,scikit-learn和火炬程序包: pip3 install numpy==1.17.4 pandas==1.1.2 scipy==1.5.2 scikit-learn==0.23.2 torch==1.4.0 请注意,不要使用0.23.4版本的熊猫,因为在processing.py文件中执行以下命令时,它将导致错误。 df.groupby('user_id', axis=0).apply(get_data) 如果您使用“ assistment_test15.csv”文件进行测试,则在pandas 0.23.4版本中,经过groupby用户后,它将返回16名学生。 但是,如果您在1.x版本中使用熊猫,它将返回15名学生。 (此
1
Data Mining concepts and techniques
2023-03-14 10:26:15 1.83MB 数据挖掘
1