强化学习 the 10-armed bandit问题仿真,e-greedy算法,梯度上升算法 matlab代码
2021-02-25 21:11:33 22KB the 10-armed ban e-greedy
1
贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。   贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是:   1、已知类条件概率密度参数表达式和先验概率。   2、利用贝叶斯公式转换成后验概率。   3、根据后验概率大小进行决策分类。
2019-12-21 18:48:12 67KB visualc++Bayesian1
1