概率流 ProbFlow是一个Python软件包,用于使用或构建概率贝叶斯模型,对这些模型执行随机变异推理,并评估模型的推理。 它提供了用于构建贝叶斯神经网络的高级模块,以及用于构建定制贝叶斯模型的低级参数和分布。 这项工作仍在进行中。 Git存储库: : 文档: : 错误报告: : 入门 ProbFlow使您可以快速轻松地构建,拟合和评估在和或之上运行的自定义贝叶斯模型(或模型!)。 使用ProbFlow,贝叶斯模型的核心构建块是参数和概率分布(当然还有输入数据)。 参数定义自变量(特征)如何预测因变量(目标)的概率分布。 例如,简单的贝叶斯线性回归 可以通过创建ProbFlow模型来构建。 这只是一个继承pf.Model (或pf.ContinuousModel或pf.CategoricalModel取决于目标类型)的类。 __init__方法设置参数,而__call
2021-11-29 20:56:31 1.21MB python data-science machine-learning statistics
1
如何赢得数据科学竞赛 向顶尖的慢跑者学习 此仓库也将作为优质机器学习笔记本的转储。 该课程由德米特里·乌里扬诺夫(Dmitry Ulyanov),亚历山大·古钦(Alexander Guschin),米哈伊尔·特罗菲莫夫(Mikhail Trofimov),德米特里·阿尔图霍夫(Dmitry Altukhov)和马里奥斯·米恰利迪斯(Marios Michailidis)主持
2021-11-28 18:22:21 1KB
1
语音性别 语音和语音分析中的性别识别 阅读完整的。 该项目训练一种计算机程序,根据语音和语音的声学特性,将语音识别为男性还是女性。 该模型在包含3168个记录的语音样本的数据集中进行了训练,这些样本是从男性和女性说话者那里收集的。 语音样本在R中通过声学分析进行预处理,然后通过人工智能/机器学习算法进行处理,以学习特定于性别的特征,从而将语音分为男性或女性。 最好的模型在训练集上达到100%的精度,在测试集上达到89%的精度。 更新:通过将分析的频率范围缩小到0hz-280hz(),可以将最佳精度提高到100%/ 99%。 数据集 将预处理的下载为CSV文件。 CSV文件包含以下字段: “ meanfreq”,“ sd”,“ median”,“ Q25”,“ Q75”,“ IQR”,“ skew”,“ kurt”,“ sp.ent”,“ sfm”,“ mode”,“ centro
2021-11-26 14:38:35 2.98MB data-science machine-learning ai neural-network
1
跪着 Python中的拐点检测 该存储库是尝试实现下跪算法的尝试,发布。 给定一组x和y值, kneed将返回函数的拐点。 拐点是最大曲率的点。 目录 交互的 贡献 引文 安装 kneed已通过Python kneed和3.8进行了测试。 水蟒 $ conda install -c conda-forge kneed 点子 $ pip install kneed 从GitHub克隆 $ git clone https://github.com/arvkevi/kneed.git $ python setup.py install 用法 这些步骤通过从手稿中复制图2来介绍如何使用kneed 。 输入数据 DataGenerator类仅作为生成样本数据集的实用程序而包括在内。 注意: x和y必须为等长数组。 from kneed import DataGenerator ,
2021-11-26 10:35:08 11.7MB python data-science systems scientific-computing
1
Introduction to Datascience 有很多数据,事实上我们创造了数据爆炸这个术语,很多时候我们意识不到这些数据表明了一些有价值的东西。有了数据,人们成为了伟大的股票交易员,他们让机器赢得了原本以为只有人类才能赢得的比赛。 事实证明,如果我们能用聪明的计算机科学对大量数据进行数学运算,我们就能做以前认为不可能的事情,而且有大量的数据。 数据科学是一个我们利用计算机科学来理解我们身边大量数据的领域。我们试图让人们理解它,我们试图预测一些事情即使我们可能不明白为什么会发生。这是科学数据。 这可能是超级智能的顶点,当然这是一个新的数据时代。欢迎来到这个奇妙的宇宙!
2021-11-24 13:07:12 9.83MB 数据科学
1
Kaggle数据集工作 我的项目正在处理各种Kaggle数据集 专案 从胸部X光照片进行肺炎分类(2021年2月12日-至今) 使用 看到当前和了解更多详情。 Spotify歌曲人气回归(2021年2月8日-2021年2月12日) 使用 经过训练的RandomForest,DNN,LinearRegression和LinearSVR可以预测歌曲的流行程度。 获得了12.300的RMSE错误,其准确度比猜测的平均受欢迎程度高近2倍。 见和了解更多详情。
2021-11-22 23:07:48 19.44MB data-science machine-learning JupyterNotebook
1
IE598金融学机器学习,2018秋季,伊利诺伊大学香槟分校 马克最终小组项目 作者:约瑟夫·洛斯(Joseph Loss),杨若中,徐凤凯,冯彪和段玉辰 型号概要: 探索性数据分析 预处理,特征提取,特征选择 模型拟合和评估,(您至少应拟合3种不同的机器学习模型) 超参数调整 组装 IE598金融学机器学习,2018年秋季最终小组项目 作者:约瑟夫·洛斯(Joseph Loss),杨若中,徐凤凯,冯彪和段玉辰
2021-11-21 09:50:16 6.12MB python data-science machine-learning scikit-learn
1
用于将python脚本保存为永久D-Tale启动点的接口。 入门 安装 $ pip install dtaledesktop 从命令行运行它: $ dtaledesktop 从python脚本运行它: import dtale_desktop dtale_desktop.run() 动机 是用于对熊猫数据进行探索性分析的功能极其强大且用途广泛的工具。 D-Tale Desktop在此基础上提供了一个界面,该界面简化了获取数据,清理/转换数据然后将其输入D-Tale的过程。 您可以将用于获取/转换数据的任意python代码片段保存为永久性的“条目”,然后就可以执行该代码并随时通过单击按钮打
2021-11-18 09:52:13 671KB react visualization python data-science
1
kaggle数据集 可供所有人使用的Kaggle数据集集合 系统 Python 3.5 Python 3.6 Python 3.7 Linux 苹果系统 视窗 有关Kaggle数据集的更多信息 import kaggledatasets as kd heart_disease = kd . structured . HeartDiseaseUCI ( download = True ) # Returns the pandas data frame to be used in Scikit Learn or any other framework df = heart_disease . data_frame () # Returns the tensorflow dataset type compatible with TF 2.0 dataset = heart_disease . load () for batch , label in dataset . take ( 1 ): for key , value in batch . items ():
1
使用Python负责任的机器学习 训练可解释机器学习(ML)模型,解释ML模型以及调试ML模型的准确性,辨别力和安全性的技术示例。 概述 随着越来越多的经济体接受自动化和数据驱动的决策,使用人工智能(AI)和ML模型可能会变得越来越普遍。 尽管这些预测系统可能非常准确,但它们常常是难以理解且不受欢迎的黑匣子,它们仅产生数字预测,而没有附带的解释。 不幸的是,最近的研究和最近的事件引起了人们对脆弱的AI和ML系统中数学和社会学缺陷的关注,但是从业人员通常没有正确的工具来撬开ML模型并对其进行调试。 本系列笔记本介绍了几种方法,这些方法可以提高ML模型的透明度,责任感和可信赖性。 如果您是数据科学家或分析师,并且想要训练准确,可解释的ML模型,向您的客户或经理解释ML模型,测试这些模型的安全漏洞或社会歧视,或者您担心文档,验证或法规方面的问题要求,那么本系列Jupyter笔记本非常适合您! (
2021-11-16 23:21:24 10.74MB python data-science machine-learning data-mining
1