R的SARSOP
library( sarsop )
library( tidyverse ) # for plotting
问题定义
我们的问题是状态空间,定义的states ,代表着真正的鱼类种群大小(以任意单位),以及动作空间, actions表示一定会有所收获(或试图收获)鱼的数量。 为简单起见,我们将允许从0收获到最大可能状态大小的任何操作。
库存招聘函数f描述了给定当前状态下的预期未来状态。 真正的未来状态将是随机抽取。
奖励函数确定当种群数量为x条鱼时捕集h条鱼的行动值; 为简单起见,本示例假定每单位收成的价格固定,而收割工作没有成本。 未来的奖励被打折。
states <- seq( 0 , 1 , length = 50 )
actions <- states
observations <- states
sigma_g <- 0.1
sigma_m <- 0.2
1