深度SARSA和深度Q学习-LunarLander-v2 环境 在这个项目中,我试图从OpenAI体育馆解决Lunar Lander环境。这是一个二维环境,其目的是教导登月舱模块安全地着陆在固定在点(0,0)的着陆垫上。该代理具有3个推进器:一个在模块的底部,另一个在模块的每一侧。因此,代理人在每个时间步长都有4种可能的动作可供选择:发射每个推进器或什么也不做。给予坐席的奖励取决于许多因素:发射底部推进器会产生-0.3的奖励,而发射侧面推进器会产生-0.03的奖励。如果探员安全地降落在着陆垫上,将获得+100分的奖励,此外,与地面接触的模块的每条腿都将获得+10分的奖励。当代理程序着陆或崩溃时,已达到终端状态。为了检测终端状态,可以提取一个状态向量,该状态向量指示代理的位置,其当前速度和环境着陆标志,以指示腿是否与地面接触。还可以提取代表环境中代理图片的RGB阵列。最后,要解决此问题并确定
1
Grok 使用的机器学习算法是 Hawkins 创造的,叫做脑皮质学习算法,或简称为 CLA。CLA 试图模仿人脑的结构,特别是负责处理高级认知功能的新皮质部分。
2021-11-28 14:22:43 1.87MB HTM 人工智能 机器学习
1
经过算法改进,实现了比Q学习更快的收敛速度,可以快速的找到最短路径,程序使用了matlab语言,适合初学者,也适合科研硕士研究。
2021-11-28 12:07:36 49KB matlab 路径规划 人工智能 强化学习
【案例描述】 海伦使用约会网站寻找约会对象。经过一段时间之后,她发现曾交往过三种类型的人: 不喜欢的人 魅力一般的人 极具魅力的人 她希望: 工作日与魅力一般的人约会 周末与极具魅力的人约会 不喜欢的人则直接排除掉 现在她收集到了一些约会网站未曾记录的数据信息,这更有助于匹配对象的归类。 【开发步骤】 收集数据: 提供文本文件 准备数据: 使用 Python 解析文本文件 分析数据: 使用 Matplotlib 画二维散点图 训练算法: 此步骤不适用于 k-近邻算法 测试算法: 使用海伦提供的部分数据作为测试样本。 使用算法: 产生简单的命令行程序,然后海伦可以输入一些特征数据以判断对方是否为自己喜欢的类型。 【注】本实例对于每步都有详细讲解,若有不理解部分,可私信解答。
2021-11-28 09:14:38 105KB 机器学习 k近邻算法 算法实例
1
新莫扎特 用于学习和再生音乐序列的 HTM 学习算法实现 该项目正在尝试创建 HMT 学习算法的实现(参见 ),该算法能够识别和建模给定音乐数据集中常见的、重复出现的模式或结构。 然后,通过以新的方式组合学习的模式,这可以用来“重写”可比较的音乐序列。 通过这种方式,人们可以通过 HTM 学习和建模他/她最喜欢的所有音乐(具有相似的属性),并让它重新生成重新组合自己最喜欢的音乐。 音乐。 这就是我们都喜欢和享受的:但是一些最受欢迎的作曲家已经不在人世了。 在从各种在线资源提供的数百万音乐数据文件中,我们仍然拥有他们的作品、数据和音乐模式。 一旦可以做到这一点,它就可以扩展到针对每个用户最喜欢的播放列表进行训练,然后按需生成结构相似的歌曲。 这是这个项目的目标:使用数据分析工具和框架,我想从音乐中提取精髓,从单音钢琴序列开始,伟大的作曲家——比如莫扎特——然后用这些学习的模式创作新的音乐
2021-11-27 18:51:21 5.37MB Python
1
关于集成学习算法解释较为清晰明了的PPT与代码,非常适合小白入门,以及作为面试的准备,有助于快速提升机器学习基础算法
2021-11-27 11:16:20 2.36MB 集成学习 算法 随机森林 代码及PPT
1
这是对Res2Net的介绍PPT可供下载。 首先介绍了Resnet ResNeXt 等等时下比较流行的模型,然后对本文提出的Res2Net的结构,功能,特点(尤其是①计算负载不变但是性能提升②强大的集成能力与集成后效果的明显提升),广泛应用等等进行介绍。
1
CSCI-567:各种机器学习算法
2021-11-24 19:40:37 9.3MB JupyterNotebook
1
这算是一份手册或者是快速学习的一种方式,里面涵盖基本的机器学习和深度学习算法,从基本介绍,到特征工程,从基本的机器学习算法(决策树,贝叶斯,线性回归,支持向量机,KNN,聚合算法,GBDT,xgb,lightbgm等, 无监督算法pca,聚类等), 到深度学习算法(CNN,RNN)基本上全覆盖。所以有了这一个,能够在应用中快速的查看。希望在自学深度学习和机器学习的路上帮助到大家。
1
很好的基于蚁群优化的DBN转移网络结构学习算法,算法描述很详细,特别适合初学者
2021-11-23 16:13:51 259KB 蚁群优化 DBN 网络结构
1