传统的强化学习(RL)使用回报(也称为累积随机奖励的期望值)来训练代理学习最佳策略。 但是,最近的研究表明,学习学习收益的分布要比学习其预期价值具有不同的优势,如在不同的RL任务中所见。 从使用传统RL的收益期望到分配RL收益分配的转变,为RL的动力学提供了新见解。 本文基于我们最近的研究RL量子方法的工作。 我们的工作使用量子神经网络实现了分位数回归(QR)分布Q学习。 该量子网络在具有不同分位数的网格世界环境中进行了评估,说明了其对算法学习的详细影响。 还将其与马尔可夫决策过程(MDP)链中的标准量子Q学习进行了比较,这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的主要挑战是有效的勘探以及开发与勘探的平衡。 先前的工作表明,可以从分布的角度采取更多有益的措施。 我们的研究结果表明了其成功的另一个原因:分布式RL的性能增强可以部分归因于其有效探索环境的卓越能力。
1
评述量子计算的历史、研究现状以及进一步发展的方向。着重论述量子算法的机理,对已知量子算法特征进行总结分析;归纳量子计算与经典智能计算的结合模式,比较其与传统智能计算的异同。在总结量子计算存在问题的基础上,探讨了今后的研究方向。
1
量子神经网络启发的改进Shor算法,吴宇森,秦素娟,Shor算法是著名的量子大数因子分解算法,对经典密码带来了严峻挑战。分析表明在量子计算机上执行Shor算法需要应用到多项式级别的基�
2021-12-09 19:27:34 639KB 首发论文
1
其使用量子信息中的 冯 诺 依 曼 熵,来 替 换 经 典 信 息 中的香农熵,通过计算其期望值,进而计算特征值. 3.2.4 量子神经网络 人工神经网络是一种仿生计算模型,通过模拟 生物神经网络的结构和功能而得名[82].人工神经网 络也是一种非线性的数据建模工具.该模型由大量 节点构成,这些节点也称为神经元.层与层之间神经 元根据不同的权重相连接,形成网状结构的模型,每 层的神经元都含有一个激活函数.网络的第一层为 输入层,最后一层为输出层,中间层为隐含层. 如图7所示,该图为神经网络的一部分,是第i 层节点到第i+1层第j个节点的连接示意图,网络 中其他点的连接情况类似.图7中左侧节点{xij} n j=1 为第i层的神经 元,它 们 通 过 权 重{wikj} n k=1与i+1 层的第j个节点相连,且xi+1j =∑ n k=1 wikjx i k.f为激活 函数,通 常 为 非 线 性 函 数,例 如 常 见 的Sigmoid函 数.图7的输出函数可表示为式(28). xi+1j =f(wijx i+b) (28) 图7 神经网络示意图 神经网络的训练过程是,将特征向量输入网络, 根据网络 处 理 后 的 输 出 结 果,优 化 以 网 络 权 重 为 参数的损失函数.其 目 的 是,经 过 训 练 网 络 输 出 结 果与标签 的 误 差 最 小.神 经 网 络 常 使 用 反 向 传 播 (Backpropagation,BP)算 法 进 行 训 练.该 方 法 主 要 包含两个阶 段:(1)前 向 传 播.根 据 式(28)计 算 规 则,由输入层向输出层逐层计 算;(2)反 向 传 播.计 算输出层与标签的误差,对损失函数使用梯度下降 进行最优化,从输出层向输入层反向更新网络中各 层权值.每一个训练样本均进行一次向前计算和反 向更新的操作,最终至网络收敛. 相关研究指出,人脑的信息处理过程与量子效 应相关,并且生物神经网络的动力学特征与量子系 统的动力学特征相似,故产生了量子理论与生物神 经网络相结合的研究[83].Kak于1995年,将神经网 络和量子计算的概念相结合,首次提出量子神经网 络计算[10].同 年,Menneer等 人 提 出 了 量 子 衍 生 神 经网络,传统神经网络需使用数据集对同一网络进 行训练,从而找到适合不同模式的网络参数.而他则 利用量子叠加性原理,对同一模式训练多个同构网 络,得到不同 模 式 对 应 的 同 构 网 络 的 量 子 叠 加[84]. Behrman等人于1996年,首先从数学形式上提出了 量子点神经网络的概念[11].他们发现基于量子点的 时间演化模型能够完成神经网络中的前向或反向计 算,之后他们从不同方面对量子神经网络做了一系 列研究[85-88].同年,Toth等人提出了量子细胞神 经 网络,其将网络中每个细胞视为一个量子系统,并使 451 计  算  机  学  报 2018年
2021-11-16 19:58:38 2.12MB 机器学习 量子机器学习算法
1
量子计算机相对于传统计算机的优势推动了在量子计算机上开发机器学习算法的最新趋势,这有可能导致该领域的突破和新的学习模型。 我们研究的目的是探索光子量子计算机上的深度量子强化学习(RL),该技术可以处理存储在光量子态中的信息。 这些量子计算机可以自然地表示连续变量,使其成为创建神经网络的量子版本的理想平台。 我们使用量子光子电路,通过多层量子神经网络实现Q学习和行为准则算法,并在网格世界环境中对其进行测试。 我们的实验表明,1)这些量子算法可以解决RL问题,以及2)与一层相比,使用三层量子网络可以改善两种算法在所获得奖励方面的学习。 总而言之,我们的研究结果表明,在深度量子RL中具有更多的层可以增强学习效果。
1
提出一种量子神经网络模型及算法. 该模型为一组量子门线路. 输入信息用量子位表示, 经量子旋转门进行 相位旋转后作为控制位, 控制隐层量子位的翻转; 隐层量子位经量子旋转门进行相位旋转后作为控制位, 控制输出层 量子位的翻转. 以输出层量子位中激发态的概率幅作为网络输出, 基于梯度下降法构造了该模型的学习算法. 仿真结 果表明, 该模型及算法在收敛能力和鲁棒性方面均优于普通BP 网络.
1
量子神经网络 Qiskit Hackathon Korea 2021:具有PyTorch和Qiskit的混合量子经典神经网络
2021-09-17 14:13:27 33KB JupyterNotebook
1
提出一种量子神经网络模型及学习算法.首先基于生物神经元信息处理机制和量子计算原理构造出一种 量子神经元,该神经元由加权、聚合、活化、激励四部分组成.然后由量子神经元构造出三层量子神经网络模型,其输入和输出为实值向量,权值和活性值为量子比特.基于梯度下降法构造了该模型的超线性收敛学习算法.通过模 式识别和函数逼近两种仿真结果表明该模型及算法是有效的.
2021-07-24 17:10:28 433KB 工程技术 论文
1
本科生论文:带有数据重载的量子图像分类器设计量子卷积和数据重载分类器方案 一个用于完成我的大学论文的资料库,该资料库是带有数据重新上传的量子图像分类器设计,量子卷积和数据重新上传分类器方案。 顾问: 和 抽象的 随着工业和学术界的问题越来越难解决,对计算能力的需求不断增长。 诸如分子等大型量子系统的仿真或求解大型线性系统之类的应用程序的计算成本可能非常昂贵。 这已经成为量子计算发展的原因之一,量子计算是一种利用量子系统的特性和理论进行信息处理的计算方法。 量子计算机向我们保证,这类问题将以指数级的速度提高。 尽管近年来量子计算机的发展Swift发展,但是理论和技术挑战仍然是大规模量子计算机的障碍。 当今存在的量子计算机具有严格的限制,例如由于过程中的噪声而导致量子位有限和门操作受限。 变分量子算法(VQA)已经成为解决这些局限性的有前途的策略之一。 已经提出了采用该策略的各个领域的应用
1
基于量子神经网络的道路交通事故预测,孙棣华,付青松,道路交通事故预测是道路交通安全研究的一项重要内容。针对BP神经网络在道路交通事故预测中精度不足及收敛速度慢的问题,提出基于�
2021-01-14 16:07:21 773KB 道路交通事故
1