基于50万亚马逊美食评论数据集的评论分类系统 Review classification system based on 500 thousand Amazon gourmet review data 数据集下载地址Data set download address: 1.http://download.csdn.net/download/huangyueranbbc/9935028 2.https://www.kaggle.com/snap/amazon-fine-food-reviews 需要更多资源请关注。 Github: https://github.com/huangyueranbbc
2022-05-29 21:11:41 73B 决策树 逻辑回归 分类 spark
1
Spark环境测试
2022-05-28 09:05:03 13KB spark 综合资源 大数据 big
1
基于Hadoop、Spark的大数据金融信贷风险控系统源码.zip
2022-05-27 19:07:49 72KB big data 源码软件 hadoop
hadoop、spark、NoSQL实战,全版本,高清晰pdf,要的拿走
2022-05-27 17:56:23 34.38MB hadoop spark
1
项目Steam游戏推荐系统 1概述 关键字:推荐系统,协作过滤,Spark,Hive,Flask,Web爬网程序,AWS EC2,AWS RDS 1.1引言 推荐系统在最近几年变得越来越流行,并且广泛用于电影,音乐,新闻,书籍,研究文章,搜索查询,社交标签和产品等各个领域。 推荐系统或推荐系统是信息过滤系统的子类,其试图预测用户将给予商品的“等级”或“偏好”。 在这个项目中,我通过Spark的ALS(交替最小二乘)API(pyspark.mllib.recommendation.ALS)在Spark上使用协作过滤算法,实现了游戏推荐系统。 协作过滤方法是基于收集和分析有关用户的行为,活动或偏好的大量信息,并基于与其他用户的相似性来预测用户的喜好。 1.2架构 整个项目分为三个阶段: 通过Web爬网程序收集数据 Spark上的游戏推荐引擎 Web UI实施 该项目的体系结构如下所示:
2022-05-27 01:11:18 9.52MB 系统开源
1
提供在Spark上跑Xgboost模型需要的 Jar包及Python接口文件
2022-05-26 19:07:32 3.51MB python spark jar 开发语言
1
分享课程——Spark 2.x + Python 大数据机器学习实战课程,完整版视频课程下载。 本课程系统讲解如何在Spark2.0上高效运用Python来处理数据并建立机器学习模型,帮助读者开发并部署高效可拓展的实时Spark解决方案。 本课程从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分析、分类、训练、建模、预测、推荐引擎、二元分类、多元分类、回归分析和Pipeline等;为降低学习大数据技术的门槛,提供了丰富的案例实践操作和范例程序编码,展示了如何在单机Windows系统上建立Spark 2.x + Python开发环境; 适合于学习大数据基础知识的初学者,更适合正在使用机器学习想结合大数据技术的人员;
2022-05-26 19:07:31 739B spark Python 大数据 机器学习
1
实验 Spark ML Bisecting k-means聚类算法使用,实验文档
2022-05-26 14:39:08 30KB spark ml kmeans
1
Spark2.0+ElasticSearch开发用户画像实战笔记:(1) Spark2.0+ElasticSearch开发用户画像实战笔记:(2) 配套资源 https://blog.csdn.net/lm19770429/article/details/124981430?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22124981430%22%2C%22source%22%3A%22lm19770429%22%7D&ctrtid=RGJIg
2022-05-26 14:06:21 17.26MB spark docker
1
包含各个版本的hadoop的winutils 可执行文件。
2022-05-26 14:06:18 5.09MB spark 大数据 big data
1