这是包含肺腺癌单细胞数据集分析的存储库 入门 克隆 repo 从下面的链接下载 Data_input 文件夹到 repo: ://drive.google.com/drive/folders/1sDzO0WOD4rnGC7QfTKwdcQTx3L36PFwX?usp=sharing 脚本 导入和创建 Seurat 对象 01_Import_data_and_metadata.Rmd :导入原始数据和元数据。 此 scipt 的输出保存为"S01_Data_and_metadata.RData" 。 02_Create_Seurat_object.Rmd :从脚本 01 导入 .RData 对象。创建初始 Seurat 对象并执行初始质量控制。 最终输出对象保存为"S02_Main_Seurat_object_filtered.RData" 。 02.1_Create_Seurat_o
2021-12-18 23:09:30 34.59MB HTML
1
星巴克分析:预测某人是否会响应报价。 目录 项目动机 我很好奇如何通过使用星巴克数据集找到客户想要的首选商品。 描述 公司向客户发送要约时面临的主要问题之一是公司不知道客户会优先选择哪个要约。 因此,公司发出报价时不知道客户想要什么报价。 该项目预测报价是否由单个客户响应。 这意味着公司可以实施此预测,以帮助公司找到单个客户首选的报价并正确发送报价。 该项目实现了XGBoost分类器和星巴克数据集来训练模型。 该项目实现了XGBoost分类器和星巴克数据集。 星巴克数据集包括投资组合,配置文件和成绩单数据集。 这些数据集用于训练XGBoost模型。 安装 XGBoost需要安装。 conda install -c conda-forge xgboost 在读取文件之前,请运行命令conda update pandas 。 为了使熊猫正确读取transcript.json文件。 并
2021-12-17 10:40:28 7.3MB JupyterNotebook
1
1039组-美国婴儿名字趋势 大事记 里程碑的详细信息可在Canvas(左侧的侧边栏,Course Project)上或。 用大约150-200个字词描述您的主题/兴趣 我们选择此美国婴儿名字数据集,是因为有趣的是在整个100年中看到了特定区域的命名趋势。 该数据集收集了1990年代至2014年美国各州和国家/地区的婴儿名字。我们将分析州/州/地区数据集,并比较各州之间最受欢迎和最不受欢迎的婴儿名字,以通过地理位置了解相似之处。 还将分析国家一级的数据集,以查看100年来是否存在总体命名趋势。 可以通过比较给定时间段内最受欢迎的男孩/女孩的名字来完成。 最终,我们可以比较州和国家级数据集,并查看哪个州的命名趋势与国家趋势最相似。 当然,从分析中可以回答许多有趣的问题。 我们期待着通过查看近年来和各性别的命名趋势来预测新生儿的名字是否可能。 通过仪表板工具构建GUI,可以公开查看我们从该数
2021-12-09 23:13:50 1.98MB dataset trend baby-naming JupyterNotebook
1
titanic大数据数据分析案例,jupyter notebook 原码说明非常详细,带有数据集,代码,分析图表,特征工程分析
学生成绩分析 学生成绩数据集分析 FCC-BUAP数据集的基础数据分析。 优胜劣汰的案例研究,综合实绩研究,学生表现分析.pdf Nombre del数据集:学生成绩数据集 说明:此数据用于评估两所葡萄牙学校的中等学生的学习成绩。 数据属性包括学生成绩,人口统计学,社会和学校相关特征,并通过使用学校报告和调查表进行收集。 提供了两个有关两个不同学科表现的数据集:数学(mat)和葡萄牙语(por)。 在[Cortez and Silva,2008]中,两个数据集是在二进制/五级分类和回归任务下建模的。 重要说明:目标属性G3与属性G2和G1具有很强的相关性。 链接del数据集: :
2021-10-05 14:03:07 272KB R
1
足球数据集分析:足球数据集分析小组项目
1
R语言之科比数据 期末结业报告
2021-07-26 10:03:56 700KB r语言 科比数据集
基于Python语言Kaggle的数据集分析.pdf
2021-06-28 20:04:26 1.12MB Python 程序 软件开发 论文期刊
对GDT全球反恐数据集进行分析和数据挖掘,挖掘和分析哪些攻击是经常发生的,在哪些地方发生。
2021-05-20 16:23:28 5.64MB 数据分析
1
adult数据集数据挖掘,基于python语言的决策树算法,源码+数据
1