快讯
这个连续两年蝉联“天猫蛋白粉榜首”的新西特做对了什么?
2小时前
16.28万起售620km超长续航荣威R标新旗舰轿车ER6上市
15小时前
新宝骏RC-5/RC-5W上市:售价5.98-11.28万元
16小时前
中兴通讯5GATG地空互联方案,打造千兆航空互联网高速公路
18小时前
深圳移动携手华为专属辅载波方案解决网络干扰,4G&5G协同提升网络性能
19小时前
2020年人力资源必备管理软件排行榜
19小时前
广东移动蔡伟文:粤港澳大湾区全光网创新之路
19小时前
2年7折回购无门槛返现,几何C北京上市当日狂澜128订单
19小时前
爆款不断、新星辈出,QQ音乐有机扶持生态成音乐人首选
19小时前
政企数字化转型,不可不知的安全内容分发网络实践指南
19小时前
中兴通讯王继刚:保护核心资产,是5G行业应用获得成功的关键
19小时前
战酷暑优网络——苏州移动积极优化网络迎接高校开学季
19小时前
家电全渠道老大京东加速布局:与国美联合签300亿大单、全资控股五星
20小时前
上汽布局汽车电商直营荣威R标新车选定天猫首发
20小时前
雅迪冠能系列表现如何?听听吉尼斯世界纪录骑行第一人怎么说
20小时前
网易游戏、乐元素、小牛互娱,谁更能代表中国游戏的未来?
20小时前
深圳电信开通“超级上行”助力“智慧警务”新发展
20小时前
工作、生活效率提升法宝讯飞消费者产品暑促正当时
21小时前
书法小程序「墨池」二次重生
21小时前
维谛技术(Vertiv)2020关键基础设施巡展
21小时前
打通中小企业的“任督二脉”京东创新企业租赁模式让企业“活”起来
21小时前
云上锦江,如何赢在起跑线?
21小时前
Avaya最新品牌架构发布,三大核心类别为企业搭建“云梯”
21小时前
智联时代已来,苏宁5G实践构建智慧零售“五新全景图”
22小时前
江贤8.13现货黄金白银早间行情分析及独家操作建议
23小时前
阿里88vip的十年长跑终点在何方?
23小时前

下围棋so easy ,AlphaZero开始玩量子计算!

新智元 2020-04-14 09:30:28

文章经授权转自公众号:新智元(ID:AI_era),来源:nature

在过去的几十年里量子物理技术的探索中,最引人注目的就是量子计算机。

微信图片_20200413153529.jpg

量子计算机的能力,是所有现有的计算机组合加起来都无法匹敌。但到目前为止还没有人能够制造出一台功能齐全的量子计算机。这就需要我们在控制量子系统的能力上向前跨一步。

为什么 AlphaZero 能快人一步“预知未来”?AlphaZero一开始是专门用来下围棋的。围棋的落子位置太多了大约有种。相比之下,国际象棋只有种可能的走位。

所以AlphaZero使用了一个深层的神经网络,它学会了从一个特定的位置开始评估它获胜的可能性。为了获胜,AlphaZero有一个功能叫做蒙特卡洛树搜索,这种方法能够帮助它在游戏中“预知未来”。

 微信图片_20200413153531.jpg

由于在所有可能策略中抽样的可能性比较小,而且神经网络只能近似估计,所以特别是在其训练阶段,蒙特卡洛树搜索能够极大地提高游戏的准确性以及训练效率。这类似于职业棋手在下棋时能够提前想几步棋。训练结果是相当惊人的,AlphaZero 很快就摧毁了专业游戏软件和人类玩家。例如,经过仅仅四个小时的自我对弈练习,AlphaZero 就在国际象棋中击败了领先的棋类软件 Stockfish。而且这完全都是从零开始,一开始AlphaZero根本不知道游戏规则。丹麦国际象棋大师Peter Heine Nielsen将其比作一个访问过地球的高级外星物种。目前AlphaZero 已经有效地在围棋,国际象棋和星际争霸中战胜对手。AlphaZero成功的关键是将蒙特卡罗树搜索和具有前瞻性的深度神经网络结合起来。结果表明,从树下方延展出来的预测信息极大地提高了深度神经网络的精度,使预测结果更加准确集中,而非试探性的探索。

AlphaZero后发制人:30小时性能提高一个数量级

与普通计算机类似,量子计算机使用门操作(gate operations)来操纵其量子位。我们试图通过构建分段恒定的脉冲序列来实现特定的门操作,即AlphaZero必须为每个时间步长(time-step)选择一个脉冲幅度。物理系统在每个时间步长tj上都由一个4x4复杂的矩阵U(tj)进行数学描述,我们将其折叠成一个长度为32的向量。这是神经网络的输入,如图1所示。脉冲序列完成后,就可以将复数矩阵U(T)映射为一个实数,称为仿真逼真度(fidelity)F,该实数的取值在0到1之间。从本质上讲,仿真逼真度是一种概率度量,其中1表示100%成功。

 微信图片_20200413153536.jpg

图1.AlphaZero使用的MCTS(左)和深度神经网络(右)的图示

左图和右图分别演示了 AlphaZero 的树搜索和神经网络。利用树搜索中统一的搜索结果作为神经网络的输入项。神经网络的上限输出接近给定输入状态的现行策略,即 p a ∼ a pa ∼ a。同时,下限输出提供了一个能够预估期望最终报酬的值函数,即 v (s t)∼(t) v (st)∼ f (t)。在我们的工作中,我们发现以一致的形式向 AlphaZero 提供物理系统的完整信息,有利于提升它的性能,尽管这种方式可能比较难以调整以适应具有较大希尔伯特空间的系统。神经网络输出一个值,该值是对最终仿真逼真度v≈F和一些移动概率p=(p1, p2, ...)的估计。两者都在蒙特卡洛树搜索中使用。树由节点(状态)和边(状态-动作对)组成。树搜索从根节点开始,并通过在每个步骤中选择动作来贯穿树。选择哪种行动,是通过比较每一个边缘的内在属性,以平衡勘探和开发的方式进行的。一旦探索到了边缘,其内在属性将根据搜索结果进行更新。树中的正向搜索将继续,直到遇到一个以前未访问过的节点,然后将该节点添加到树中,并使用p初始化其边缘。搜索中的所有访问过的边都将使用v在反向过程中更新。一旦执行了多次此类搜索,AlphaZero将确定一个操作并更新根节点,而丢弃树的其余部分。最后,基于树搜索产生的数据对神经网络进行更新,使得v接近保真度,并且移动概率增加了选择更有希望动作的机会。简言之:蒙特卡洛树搜索允许AlphaZero向前看几步,从而可以在解决方案空间中进行更全面的搜索。这使得AlphaZero在长期策略至关重要的复杂任务中比大多数其他强化学习方法更具优势。成功实现AlphaZero之后,我们使用相同的算法超参数将其用于三个不同的量子控制问题。对于每个问题,我们将AlphaZero与更常规的算法进行了比较。例如,在图2中,我们比较了AlphaZero和遗传算法在50小时运行期间创建二进制脉冲的任务。在y轴上,我们绘制infidelity 1-F,这实际上是错误率(即越低越好)。最初,AlphaZero在学习量子力学关联时表现不如遗传算法,但是这个学习阶段相当短。在30小时内,我们发现AlphaZero的性能比遗传算法提高了一个数量级,并且具有大量独特的高保真脉冲序列。

 微信图片_20200413153603.jpg

图2.遗传算法和AlphaZero在50小时运行期间的比较。在y轴上绘制了infidelity (1-F),这实际上是一个错误率

混合了AlphaZero的量子计算,搜索速度提升500倍

AlphaZero会输给物理学家在过去15年不断完善的高度量子化的优化算法并不奇怪。但是,如果AlphaZero死在这里,会留下很多遗憾。由于梯度优化算法没有学习功能,意味着训练过程中其性能没有逐步提高,并且所有生成的数据都将被丢弃,而不是用于后续学习。奥胡斯大学的团队开始寻求一种混合算法:AlphaZero通过广泛的探索生成了高可用的种子对象,随后通过基于梯度的方法对它们进行优化,这种方法使解决方案的数量和质量都得到了极大的提高。实际上,AlphaZero和梯度优化解决了不同的问题:AlphaZero能学习到解决方案的基础结构,梯度优化在种子解决方案周围的局部空间中进行优化。如果仅使用梯度优化,经过50小时的模拟,我们可能有两个或三个有前途的解决方案,但通过我们的混合算法,可以获得一千个。将功能强大的通用领域机器学习方法与人类专业知识、特定领域的蛮力计算相结合的结果令人振奋。国际象棋已经迈出了第一步,混合型人机团队将专家知识和Stockfish引擎结合起来,可以同时胜过人类和算法。最近Gary Marcus和Ernest David在他们的新书《重新启动AI:构建我们可以信赖的人工智能》中提出,将领域特定方法和领域通用方法与分层的受人类启发的决策过程相结合,是未来构建强大的AI方法的核心元素之一。这可能会解决AlphaZero方法最直接的弊端之一:超参数很多,但仅在有限的范围内有用。在一些案例中,相同的超参数集在三种量子情况下均能很好地工作,当改变问题的设定,AlphaZero将无法解决。量子计算机利用量子并行性大幅提高了计速度,但是问题再次出现:搜索空间的控制参数成指数级增长。AlphaZero实验证明,神经网络提供的近似和不完善的解决方案可以充当本地蛮力启发式算法的强大种子生成器。除了算法方面的优化设计,量子计算本身的性能也在飞速提升。

金子表面发现马约拉纳费米子,量子计算机时代要来了?

最近量子计算捷报频传。

丹麦、德国科学家奇思妙想用AlphaZero解决量子计算问题,MIT等科学家则在金子的表面,观测到了马约拉纳费米子,从而在将粒子分离为稳定的、防错的量子比特进行量子计算领域迈出了重要的一步,该结果发表在《美国国家科学院院刊》上。在粒子物理学中,马约拉纳费米子是一类基本粒子,包括电子,质子,中子和夸克,它的反粒子就是它本身。由意大利理论物理学家Ettore Majorana在1937年首次提出。

 微信图片_20200413153607.jpg

马约拉纳费米子

然而不幸的是,这位物理学家提出该理论后不到一年时间,就在一次神秘的意大利海岸渡轮旅行中失踪了。从此,大家就一直在寻找马约拉纳和他的马约拉纳费米子。最终,大家放弃了寻找马约拉纳,但却从未停止寻找他的费米子。

微信图片_20200413153608.jpg

现在,由MIT领导的团队制造了在超导材料钒上生长的金纳米线组成的材料表面,发现了接近零能量的特征信号尖峰。显然,根据目前的理论物理学来看,除了马约拉那费米子对,没有其他可能。马约拉纳费米子将是理想的量子比特或量子计算机的单个计算单位,一个量子位将由成对的马约拉那费米子组成,这是科学家长期以来,一直梦寐以求的材料!如果该马约拉纳费米子被彻底证实,我们将提前步入量子计算时代!

特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)

相关文章

正在加载......