当前版本: 请参阅以获取补丁说明 可从和获得 加入 Slack频道中的讨论! 阅读有关开发的博客文章 提交问题这里或请求功能在这里 在这里找到我的游戏 关于思想 什么是蠕虫? Screeps是面向程序员的MMO策略游戏。 核心目标是在此过程中扩大您的殖民地,收集资源并与其他玩家作战。 要控制您的单位,您可以使用JavaScript编写AI。 从移动,挖掘,建造,战斗到交易的所有一切都完全由您的代码驱动。 因为Screeps是MMO,所以它发生在运行24/7的一台服务器上,该服务器由其他所有玩家及其小兵组成。 当您注销时,无论设置什么任务,您的人群都会继续嗡嗡作响。 漫长的时间让您的编程技巧与其他人并肩作战,以了解谁能想到完成任务的最有效方法或想像出击败敌人的新方法。 什么是主宰? Overmind是我在公共服务器上运行的个人代码库。 AI的结构以星际争霸(Starcraft
2022-05-12 09:55:17 6.39MB game ai screeps strategy-game
1
排序算法中的分治策略.doc
2022-05-12 09:10:19 397KB 排序算法 文档资料 算法
网络技术-综合布线-基于广域测量信号的直流输电系统非线性调制策略研究.pdf
2022-05-12 09:05:30 4.62MB 文档资料
农村垃圾回收物流策略的实证研究.doc
2022-05-12 09:02:23 760KB app
华为交换机策略路由配置,适合旁挂路由器,安全网关等设备。
2022-05-11 20:36:38 167KB 网络技术
1
产品策略产品生命周期与新产品开发
企业信息化的实现策略
2022-05-11 19:04:06 759KB 文档资料 企业信息化的实现策略
增强Learning_(ML)_PPO_Microwave滤波器调谐 制造的RF滤波器需要经过滤波器调谐过程,以保证性能而不影响性能 有许多因素,例如繁琐/困难的手动调整过程和过滤器特性,使过滤器调整过程更加复杂 机器学习方法用于缩短滤波器调优过程所花费的时间,提高调优结果的准确性 选择强化学习算法中的近端策略优化(PPO)作为其连续动作空间和连续控制任务中突出的发散速度 强化学习环境:HFSS(由PyCharm中的Python和IronPython脚本自动化) 应用操作后,状态(S 参数的距离)和奖励(距离之和)作为对代理的反馈 强化学习代理:PPO 代理(根据稳定基线 3 文档源代码修改) 代理学习并更新策略以提供要在环境中执行的最佳操作(HFSS 中的筛选器调整过程)
2022-05-11 09:04:20 370KB 算法 源码软件
PyTorch实现软演员- 评论家(SAC),双胞胎延迟DDPG(TD3),演员评论家(AC / A2C),近端策略优化(PPO),QT-Opt,PointNet 流行的无模型强化学习算法 PyTorch 和 Tensorflow 2.0 在 Openai 健身房环境和自我实现的 Reacher 环境中实现了最先进的无模型强化学习算法。 算法包括: 演员兼评论家 (AC/A2C); 软演员-评论家 (SAC); 深度确定性策略梯度 (DDPG); 双延迟 DDPG (TD3); 近端策略优化; QT-Opt(包括交叉熵(CE)方法); 点网; 运输机; 经常性政策梯度; 软决策树; 概率专家混合; QMIX Actor-Critic (AC/A2C); Soft Actor-Critic (SAC); Deep Deterministic Policy Gradient (DDPG); Twin Delayed DDPG (TD3); Proximal Policy Optimization (PPO); QT-Opt (including Cross-entropy (CE)
2022-05-11 09:04:15 2.46MB pytorch 文档资料 人工智能 python
算法设计与分析实验报告,附已通过源码,供学习参考,共勉♪ 目录摘要如下: 1.问题描述 2.实验目的 3.实验原理 4.实验设计 (包括输入格式、算法、输出格式) 5.实验结果与分析 (除了截图外,实验结果还用图表进行了分析) 6.结论 7.程序源码
1