用于单层前馈神经网络(SLFN)的极限学习机(ELM)是一种强大的机器学习技术,并且以其快速的学习速度和良好的泛化性能而受到关注。 最近,提出了加权ELM来处理具有不平衡类分布的数据。 加权ELM的关键本质是为每个训练样本分配了额外的权重。 尽管提供了一些经验加权方案,但是如何确定更好的样本权重仍然是一个悬而未决的问题。 在本文中,我们提出了一种Boosting加权ELM,它将加权ELM无缝地嵌入到经过修改的AdaBoost框架中,以解决上述问题。 直观地,反映训练样本重要性的AdaBoost框架中的分布权重被输入到加权ELM中作为训练样本权重。 此外,在两个方面对AdaBoost进行了修改,以更有效地实现不平衡学习:(i)初始分布权重设置为不对称,以便AdaBoost以更快的速度收敛; (ii)针对不同类别分别更新分配权重,以避免破坏分配权重的不对称性。 对KEEL存储库中的16个二进制数据集和5个多类数据集的实验结果表明,与加权ELM相比,该方法可以实现更均衡的结果。
2021-12-28 15:24:50 559KB Extreme learning machine; Weighted
1
帕金森病数据分析 介绍: 说明和文献: 在这项研究中,我们将分析被诊断出患有这种疾病的患者数据。 期望使用来自受试者的语音数据有助于无创诊断的发展。 帕金森氏症(PWP)的人会遭受言语障碍,例如语音障碍(声音使用不良),低音障碍(音量减小),单调(音调范围减小)和构音障碍(声音或音节发音困难)。 因此,我们在此项目中的分析将基于受影响的语音参数。 数据: 该数据集由牛津大学的Athanasios Tsanas和Max Little与美国的10个医疗中心以及英特尔公司合作开发,后者开发了远程监控设备来记录语音信号。 该数据集由一系列生物医学语音测量组成,从42名帕金森氏症早期患者中招募,到远程症状进展监测的远程监测设备的为期六个月的试验。 这些记录会自动记录在患者家中。 数据集中的列包含受试者编号,受试者年龄,受试者性别,自基线募集日期起的时间间隔,运动UPDRS,总UPDRS和16
2021-12-28 13:43:56 317KB data-science machine-learning cfa clustering
1
The goal of building systems that can adapt to their environments and learn from their experience has attracted researchers from many fields, including com- puter science, engineering, mathematics, physics, neuroscience, and cognitive science. Out of this research has come a wide variety of learning techniques that have the potential to transform many scientific and industrial fields. Recently, several research communities have converged on a common set of issues sur- rounding supervised, unsupervised, and reinforcement learning problems. The MIT Press series on Adaptive Computation and Machine Learning seeks to unify the many diverse strands of machine learning research and to foster high quality research and innovative applications.
2021-12-28 11:42:56 3.86MB Machine Learning
1
矩阵图像直接作为数据而不需要向量化。Twin和STM技术都可以加快计算速度。
2021-12-28 11:12:06 3.22MB Twin STM;matrix
1
Viola-Jones检测框架 这是Viola-Jones检测框架的实现,用于人脸检测。 要求 Viola-Jones Framework的此实现需要python版本3.5.2,并取决于以下模块: 模块 版本 评论 麻木 1.13.3 科学的 1.0.0 的OpenCVPython的 3.4.0.14 用于捕获图像 scikit学习 0.19.1 用于改组数据 用法 运行以下命令以开始人脸检测: python detect.py 主要概念 类似Haar的功能 Viola和Jones提出了类似Haar的特征,以适应使用Haar小波的想法(来自Papageoriou等人)。 在此工具中,使用了五种类似Haar的特征。 它们是:左右,上下,水平居中,垂直居中,对角线。 整体形象 为了加快特征提取过程,使用了称为积分图像的图像中间表示。 AdaBoost AdaBoost是Adap
1
GluonTS-Python中的概率时间序列建模 GluonTS是一个用于概率时间序列建模的Python工具包,它围绕构建。 GluonTS提供了用于加载和迭代时间序列数据集,准备好进行培训的最新模型以及用于定义自己的模型并快速尝试不同解决方案的构建基块的实用程序。 安装 GluonTS需要Python 3.6,最简单的安装方法是通过pip : pip install --upgrade mxnet~=1.7 gluonts Dockerfiles 可以在文件夹中找到与Amazon Sagemaker兼容的 。 快速入门指南 这个简单的示例说明了如何从GluonTS训练一些数据的模型,然后使用它进行预测。 第一步,我们需要收集一些数据:在本示例中,我们将使用提及AMZN标记符号的大量推文。 import pandas as pd url = "https://raw.githubusercontent.com/numenta/NAB/master/data/realTweets/Twitter_volume_AMZN.csv" df = pd . read_csv ( url
2021-12-27 18:58:29 1.38MB machine-learning deep-learning time-series mxnet
1
Python Machine Learning(2nd)Python Machine Learning(2nd)Python Machine Learning(2nd)
2021-12-27 10:11:06 20.41MB Python
1
Using machine learning to gain deeper insights from data is a key skill required by modern application developers and analysts alike. Python is a wonderful language to develop machine learning applications. As a dynamic language, it allows for fast exploration and experimentation. With its excellent collection of open source machine learning libraries you can focus on the task at hand while being able to quickly try out many ideas. This book shows you exactly how to find patterns in your raw data. You will start by brushing up on your Python machine learning knowledge and introducing libraries. You'll quickly get to grips with serious, real-world projects on datasets, using modeling, creating recommendation systems. Later on, the book covers advanced topics such as topic modeling, basket analysis, and cloud computing. These will extend your abilities and enable you to create large complex systems. With this book, you gain the tools and understanding required to build your own systems, tailored to solve your real-world data analysis problems.
2021-12-27 06:58:17 6.02MB Python
1
支持向量机 无需sklearn即可从头开始进行教育性SVM实现。 CVXOPT用作方程式求解器。 对于二进制分类器,标签应为[-1,1]。 multi_SVM.py是使用OneVsRest策略的多类SVM。 支持自定义内核,实现了线性和rbf内核。
2021-12-26 22:28:38 19KB support python learning machine-learning
1
使用机器学习预测寿命 一个典型的回归机器学习项目利用历史数据来预测对未来的见解。 该问题陈述旨在通过给定各种特征来预测一个国家的预期寿命。 预期寿命是对人的平均预期寿命的统计量度,预期寿命取决于多种因素:地区差异,经济状况,性别差异,心理疾病,身体疾病,教育程度,出生年份和其他人口统计因素。 该问题陈述提供了一种预测生活在该国的人的平均预期寿命的方法,该因素包括以下因素:年份,GDP,教育程度,该国人的饮酒量,医疗保健系统的支出以及在该国发生的某些与特定疾病相关的死亡。国家。
2021-12-26 15:08:04 14.74MB
1