吃豆子RL 应用于 Pacman 游戏的强化学习算法。 Pacman 游戏是为 Udacity 类 ud820的结果。 可以在qlearningAgents.py文件中找到学习器。 跑步 python pacman.py -p PacmanQAgent -x 800 -n 810 -l smallGrid -l参数可以更改为使用其他地图(在布局文件夹中可用)。 -p参数可以更改为使用其他类型的 q-learner。 -x设置训练示例的数量。 -n设置示例总数(训练 + 测试) 学习者 PacmanQAgent:基本的 Q 学习代理。 它使用完整状态(整个地图),因此在使用大地图时不会缩放。 运行: python pacman.py -g DirectionalGhost -p PacmanQAgent -x 800 -n 810 -l smallGrid Approxi
2022-04-11 10:00:26 83KB Python
1

针对离散Hopfield 神经网络(DHNN) 的权值设计问题, 提出一种改进型学习算法, 并在DHNN动力学分析的基础上设计该学习算法. 利用矩阵分解的方法(MD) 得到正交矩阵, 并采用得到的正交矩阵直接计算DHNN的权值矩阵. 通过该学习算法得到的权值矩阵, 可以很好地存储训练样本的信息, 使测试样本收敛到稳定点. 该学习算法不需要进行分块计算, 减少了计算步骤和计算量, 降低了网络的迭代次数, 从而提高了网络运行速度. 最后, 将该学习算法应用于水质评价, 验证了其有效性和可行性.

1
采用LSTM模型,训练一个能够识别文本postive, neutral, negative三种情感的分类器。
2022-04-09 17:57:42 11.63MB LSTM 文本情感分析
1
对于学习机器学习算法中的半监督学习算法有一定的帮助。
2022-04-08 10:04:33 2.91MB 半监督学习
1
该资源为人工智能-机器学习相关算法详细讲解,包括K-近邻算法、线性回归、逻辑回归、决策树算法、集成学习、聚类算法以及拓展的理论和实践案例。
2022-04-06 19:06:33 46.82MB 算法 机器学习 人工智能 近邻算法
该资源为机器学习算法2详细讲解,包括朴素贝叶斯、支持向量机、EM算法、HMM模型、集成学习进阶以及拓展理论和实践案例等详细讲解。
2022-04-06 19:06:32 30.48MB 算法 机器学习 支持向量机 集成学习
计算机视觉-流形学习算法MATLAB源码 流形学习是一类借鉴了拓扑流形概念的降维方法,与核PCA的目的一样,它想要在低维空间中尽量保持在高维空间中的结构。一个形象的流形降维过程如下图,我们有一块卷起来的布,我们希望将其展开到一个二维平面,我们希望展开后的布能够在局部保持布结构的特征,其实也就是将其展开的过程,就像两个人将其拉开一样。 流形学习方法有很多种,但是他们具有一些共同的特征:首先构造流形上样本点的局部邻域结构,然后用这些局部邻域结构来将样本点全局的映射到一个低维空间。它们之间的不同之处主要是在于构造的局部邻域结构不同,以及利用这些局部邻域结构来构造全局的低维嵌入方法的不同。  
2022-04-06 14:09:03 23KB matlab 计算机视觉 算法 流形学习
1
里面是我自己的强化学习笔记。参考自刘建平老师的强化学习博客,再加上自己的理解,通俗易懂。里面包含了强化学习model-free的经典论文(Q-learning、SARSA、TD(lambda)、DQN、DDQN、prioritized replay DQN、Dueling DQN、policy gradient、AC、A2C、A3C、DDPG、TD3、TRPO、PPO),能帮助你快速入门强化学习。除了有算法的公式,还有我自己的理解,以及要理解算法所需要的一些基础知识,算法的流程图,都写在了里面,绝对生动形象,通俗易懂。
2022-04-06 14:08:57 102.54MB 算法 强化学习 机器学习 最优控制
1
研一机器学习作业SVM分类器
2022-04-06 09:42:35 39.07MB 支持向量机 机器学习 算法 人工智能
本文件规定了机器学习算法在设计开发、验证测试、部署运行、维护升级、退役下线等阶段的安全 要求和证实方法,以及机器学习算法的安全评估实施。 本文件适用于对机器学习系统中的算法进行安全评估,也适用于机器学习系统开发者和运营者在算 法开发运营过程中进行自评估和改进安全措施。 机器学习算法machine learning algorithm 采用机器学习技术理论求解问题,明确界定的有限且有序的规则集合,并基于输入数据生成分类、推理、预测等的算法。 机器学习算法生命周期machine learning algorithm lifecycle 机器学习系统的算法从起始到退役的整个演进过程,包括设计开发、验证测试、部署运行、维护升 级、退役下线。 注:在机器学习算法生存周期中,某些活动可出现在不同的过程中,个别过程可重复出现。例如为了修复错误和更 新,需要反复实施开发和部署过程。
2022-04-06 00:16:31 496KB 算法 机器学习 安全 人工智能
1