数据科学是一门内涵很广的学科,它涉及到统计分析、机器学习以及计算机科学三方面的知识和技能。本课程将深入浅出、全面系统地介绍了这门学科的内容。通过这门课程,同学可以了解并熟悉如下的开源工具:scikit-learn、statsmodels、TensorFlow、Pyspark等。 本课程分为4个部分,18个章节。 ·????????????第一部分是最初的3章,主要介绍数据科学想要解决的问题、常用的IT工具Python以及这门学科所涉及的数学基础。 ·????????????第二部分是第4-7章,主要讨论数据模型,主要包含三方面的内容:一是统计中最经典的线性回归和逻辑回归模型;二是计算机估算模型参数的随机梯度下降法,这是模型工程实现的基础;三是来自计量经济学的启示,主要涉及特征提取的方法以及模型的稳定性。 ·????????????第三部分是接下来的8-15章,主要讨论算法模型,也就是机器学习领域比较经典的模型。这三章依次讨论了监督式学习、生成式模型以及非监督式学习。 ·????????????第四部分将覆盖目前数据科学最前沿的两个领域分别是大数据和人工智能。具体来说,第11章将介绍大数
1
2.15 智能用电系统 智能用电是构建坚强智能电网的重要支柱和六大环节之一,是实现坚强智能电网各项功 能的基础核物理载体,是建设坚强智能电网的着力点和落脚点。依托坚强电网和现代管理理 念,利用高级量测、高效控制、高速通信、快速储能等技术,实现市场响应迅速、计量公正 准确、数据采集实时、收费方式多样、服务高效便捷,构建电网与客户能量流、信息流、业 务流实时互动的新型供用电关系。通俗地说,就是通过智慧地掌控和支配电力,令您的用电 生活变得灵动、聪明,让您成为用电生活的主人,成为节能减排、低碳生活的参与者和建设 者。 智能电网的建设,将推动智能小区、智能城市的发展,提升人们的生活品质,让生活更
2021-10-28 17:02:52 9.65MB 智慧社区 智慧小区 云对讲 对门禁
1
根据课件内容完成课后作业之代码
2021-10-25 18:02:26 362KB 数据科学
1
数据科学作业之总结报告
2021-10-25 18:02:25 13KB 数据科学
1
数据科学作业之代码
2021-10-25 18:02:25 18KB 数据科学
1
2020年东北大学大数据科学课程pptz主要是绪论、集成学习、聚类算法、支持向量机这即部分,还有一些课后习题和答案,包括期末习题。
2021-10-25 10:24:42 18.81MB 大数据 人工智能 机器学习
1
新工科背景下数据科学与大数据技术专业应用型人才培养的思考与改革.zip
2021-10-19 09:02:33 1.25MB
《大数据分析 数据科学应用场景与实践精髓》是一本讨论大数据理论及应用实践的专著,从讨论理论界的前沿观点开始,之后转向讨论这些理论在日常商业活动中的实践应用。 《大数据分析 数据科学应用场景与实践精髓》首先介绍了大数据分析的业务应用场景、分析建模过程和主要任务,以及模型商用的关键点;接着讲述了数据收集、抽样和预处理的实施要点;之后系统性地讨论了各种模型技术及其应用,包括预测分析、描述分析、生存分析、社交网络分析等。在完成了这些理论知识和模型技术方法铺垫之后,就进入到实践应用部分,包括把分析活动转化为生产力的关键事项,以及各种应用实例。 《大数据分析 数据科学应用场景与实践精髓》帮助读者系统地梳理了各类模型方法的技术要点和应用要点,包括线性回归、Logistic回归、决策树、聚类、关联规则、序列规则、神经网络、支持向量机、套袋算法、Boosting算法、*森林算法、生存分析等;本书还介绍了大量的应用实例,如信用风险建模、欺诈检测、营销响应提升模型、客户流失预测、自动推荐、网页分析、社交媒体分析,以及业务流程分析等。因此,对于从事大数据分析相关工作的人士来说,本书是一本难得的实务指南;对于高等院校相关专业的师生来说,本书是一本非常好的课外阅读材料,特别是书中关于如何把分析变成生产力的章节部分,相信一定能给他们很多的启发和思考
2021-10-18 21:28:20 27.84MB 大数据分析 数据科学应用场景 bart
1
课堂项目 一个包含数据科学本科专业课作业的项目文件夹目前包括的课程有 一,操作系统 (四个项目) 【一个简易的shell&三个修改minix实现内存管理和I / O子系统(ram盘管理)&chrt调用的相关修改】 二,计算机网络 (Java多线程&Java RPI&最终项目) 三,专业英语 (1.蘑菇二分类BP神经网络(训练30次准确率达到100%) (2.基于PHP的小型网址文件夹(支持增删改查等基本操作)) 四,概率论 卷积图像平滑模拟poker计算同花顺概率等 五,数据科学的数学基础 课程python程序(图像压缩欧式距离旋转图片谱图聚类LU分解SVD分解等) 六,计算机系统与云计算 CMU中的slab 七,数据库 寻宝小游戏(postgresql版&mongodb版) 八,算法 1.图片PCA压缩2.基于爬山算法的抽取式文档摘要 九,统计 1.蒙特卡洛求样本偏度峰度度2.区间估计3
2021-10-17 09:53:55 58.16MB 系统开源
1
数据科学迷你项目 决策树回归,随机森林和多元线性回归的精度比较 风险资本家雇用您来预测一家初创公司的利润。 因此,您必须处理一个数据集,该数据集包含50个创业公司的详细信息,并根据某些功能预测新创业公司的利润。 根据您的决定和预测,是否应该投资特定的创业公司。 数据集包含以下字段:研究与发展趋势-研发管理支出总额-行政管理支出支出总额-营销市场支出总额-创业公司运营的州利润-获利启动 在应用机器学习算法之前,您必须执行以下任务:1)处理缺失值2)准备数据进行训练和测试3)应用决策树算法训练模型4)应用随机森林回归算法训练模型5)比较线性回归的精度。
2021-10-16 01:04:32 65KB JupyterNotebook
1