365数据科学 此回购包含365 Datascience的Data Science课程的所有练习文件。 仓库被分成相关的文件夹,还有一个练习文件夹,其中包含该课程的所有文件。 跟我来了解更多Python / ML资源。 别忘了给它加注星:D
2021-07-10 15:02:24 1.06GB JupyterNotebook
1
neo4j-graph-data-science-1.6.1-standalone.zip
2021-07-06 17:08:10 29.29MB gds
1
中国科学技术大学 研究生课程 数据科学导论 Introduction to Data Science 课件PPT 主讲 刘琪
2021-07-02 11:28:31 82.08MB 数据科学
1
质子交换膜(PEM)燃料电池数据集 概述 该数据集是关于在各种操作条件下对PEM燃料电池进行的Nafion 112膜标准测试和MEA活化测试。 数据集包括两种通用的电化学分析方法:极化和阻抗曲线。 在该数据集中,考虑了H2 / O2气体的不同压力,不同的电压和不同的湿度条件在几个步骤中的影响。 可以从数据中得出PEM燃料电池在不同运行条件测试,激活程序以及激活分析前后不同运行条件期间的行为。 在极化曲线中,电压和功率密度随H2 / O2流量和相对湿度的变化而变化。 燃料电池使用的等效电路的电阻可以根据阻抗数据来计算。 因此,在给出的数据中该电池的实验响应是显而易见的,这对于PEM燃料电池研究中的深度分析,模拟和材料性能研究很有用。 有关MEA(膜电极组件)激活程序的更多信息,请访问 测验 笔记本电脑 我们提供了一些Jupyter笔记本来可视化数据,请访问此处 引用 如果您在研究中使用此
2021-07-01 10:34:50 3.24MB open-source science data-science data
1
纽约市-Airbnb-数据产品 纽约市Airbnb数据的数据分析,可视化和预测 描述 该项目分析了2019年从纽约市地区收集的Airbnb数据,该数据的列表范围从私人住宅到房间,邻里,邻里群体,价格等。该项目的目标是创建一个可以预测的模型未来的AirBnb价格以及城市中哪些街区最有利可图。 数据源 该公开数据集是Airbnb的一部分,其原始资源可在此上。 它包含定性和定量数据的混合,有48,895个条目和16列。 我们的模型将包括34,218个培训条目和14,666个测试目标标签PRICE的条目。 结果 模型 RSME平均值 RSME平均10倍 线性回归 0.495 0.498 随机森林回归 0.493 0.509 XgBoost 0.473 N 套索回归 0.693 0.698 模型 准确性 随机森林分类器 83.4% 逻辑回归 84.5% (整体最佳) 决策树 8
2021-06-29 10:48:00 2.51MB python data-science numpy pandas
1
A comprehensive overview of data science covering the analytics, programming, and business skills necessary to master the discipline Finding a good data scientist has been likened to hunting for a unicorn: the required combination of technical skills is simply very hard to find in one person. In addition, good data science is not just rote application of trainable skill sets; it requires the ability to think flexibly about all these areas and understand the connections between them. This book provides a crash course in data science, combining all the necessary skills into a unified discipline. Unlike many analytics books, computer science and software engineering are given extensive coverage since they play such a central role in the daily work of a data scientist. The author also describes classic machine learning algorithms, from their mathematical foundations to real-world applications. Visualization tools are reviewed, and their central importance in data science is highlighted. Classical statistics is addressed to help readers think critically about the interpretation of data and its common pitfalls. The clear communication of technical results, which is perhaps the most undertrained of data science skills, is given its own chapter, and all topics are explained in the context of solving real-world data problems. The book also features: Extensive sample code and tutorials using Python™ along with its technical libraries Core technologies of “Big Data,” including their strengths and limitations and how they can be used to solve real-world problems Coverage of the practical realities of the tools, keeping theory to a minimum; however, when theory is presented, it is done in an intuitive way to encourage critical thinking and creativity A wide variety of case studies from industry Practical advice on the realities of being a data scientist today, including the overall workflow, where time is spent, the types of datasets worked on, and the skill sets needed The D
2021-06-28 12:26:33 5.86MB Data Science Handbook
1
基于语音的性别识别 基于语音的性别识别,使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。 使用三角形重叠窗口,将以上获得的光谱的功率映射到mel刻度上。 记录每个梅尔频率下的功率对数。
2021-06-26 02:16:54 18.1MB data-science machine-learning scikit-learn voice
1
使用机器学习和图形用户界面在泰坦尼克号上的乘客的生存 该项目包含一个干净优美的图形用户界面(GUI),该界面通过使用不同的Python库与8种机器学习模型和数据可视化工具进行交互。 在Rutgers,我们了解到Python是一种很棒的通用语言,它为所有专业的开发人员提供了极大的通用性。 因此,我们决定利用Python对GUI开发的强大支持以及其数据科学和机器学习功能。 使用复杂的RMS Titanic数据集,其中包括有关每个乘客命运(幸存/死者)的信息(根据其经济状况,公平,机舱,社会阶层,亲戚,性别,登船口岸和年龄),我们创建了8种不同的机器学习模型他们从数据集中学习,然后对用户提供的测试数
2021-06-22 21:05:24 1.23MB data-science machine-learning gui numpy
1
R for data science习题答案..................................................................
2021-06-17 08:27:05 19.43MB R学习 R for data
1
分类问题:分类模型
2021-06-13 12:49:36 3.59MB classifier data-science machine-learning random
1