空气质量 商业数据科学挑战 UCI空气质量数据集上的数据科学练习-清洁,解析数据+一些相关分析和线性回归。
2021-05-13 11:28:50 2.92MB JupyterNotebook
1
《Python大战机器学习-数据科学家的第一个小目标》代码
2021-05-12 16:05:06 728KB Python 机器学习 数据科学
《The Data Science Design Manual》by Steven Skiena。数据科学课程的教材。非常棒的教材,通俗易懂,把道理讲的非常清晰。广泛涉及了数据科学的方方面面,可读性非常强。
2021-05-11 12:13:19 20.38MB 数据科学教材 Data Science Skiena
1
迅游关于数据化运营的分享材料,介绍迅游产品,数据化运营思路,AARRR模型提升用户留存。通过用户分群提高营收增长
2021-05-09 22:12:04 1.41MB 迅游 数据化运营 数据科学 大数据
1
matlab开发-dijkstrashortestpath路由。该函数和实例展示了基于Dijkstra算法的最短路径路由。
2021-04-24 14:55:07 1KB 人工智能、数据科学和统计
1
主要讲解未来40年都会有用的数据科学,如数据分析、机器学习、深度学习、数据挖掘等相关方面,最重要的基础理论。涉及高维空间、最佳拟合子空间和奇异值分解( SVD )、随机游走和马尔可夫链、机器学习、海量数据问题相关的算法:Streaming,Sketching,Sampling、聚类、Random Graph、主题模型、非负矩阵分解、隐马尔可夫模型和图形模型等12个主题。
2021-04-22 11:21:08 2.34MB 数据科学 算法设计 理论计算机科 基础
1
北航数据科学基础课件.7z
2021-04-22 09:01:32 7.35MB 北航数据科学基础课件.7z
数据科学技术与应用——库函数快速索引表
2021-04-21 09:03:20 32KB python
1
Regen_Models 为2020年数据科学案例竞赛创建的模型 RStudio分析 RStudio用于清理和生成类列的列值,这些值再次经过标准化处理以产生更好的调整结果。 Python分析 使用Python对数据集的规范化版本执行模型开发,在其中使用并比较了诸如adaboost,Randomforest,RandomTree等算法。 Python在确定哪些输入和输出提供最大的相关值以及变量的功能重要性方面起着决定性的作用。 使用PCA来显示使用这些模型时可以达到的最大方差进一步证明了这一点。 相关图,特征重要性图,PCA图和混淆矩阵图是使用Python生成的。 WEKA分析 使用常规算法执行以产生最佳值,我们得出的一般算法产生的精度远高于80%。 这里的目的是更好地解释输入和输出之间的关系。 通过WEKA创建的最佳模型文件与缓冲区一起存储在模型文件中,该缓冲区显示了所生成模型的统计信
2021-04-09 09:05:47 1.73MB JupyterNotebook
1
This is a textbook in probability in high dimensions with a view toward applications in data sciences. It is intended for doctoral and advanced masters students and beginning researchers in mathematics, statistics, electrical engineering, computer science, computational biology and related areas, who are looking to expand their knowledge of theoretical methods used in modern research in data sciences.
2021-04-08 13:10:02 3.98MB 机器学习 数据科学 概率论
1