首页 >> 玩具球

谷歌DeepMind围棋吊打世界冠军汽配

汽配    
2022年09月26日
谷歌DeepMind围棋吊打世界冠军

作为 AlphaGo 的最新迭代,DeepMind 又在 11 月 6 日发表的《科学》(Science)论文中,隆重介绍了 AlphaZero 。作为谷歌母公司 Alphabet 钨灯旗下的英国人工智能子公司,DeepMind 多年来一直致力于改进 Go AI 。2017 年的时候,前 AI 冠军 AlphaGo 正式退休,但在进一步修补之后,AlphaZero 又达到了新的顶峰。

Alpha家电外壳Zero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台。在三款棋类比赛中,AlphaZero 将三款 AI 都挑落下马。

● Stockfish:国际象棋 AI 世界冠军;

● elmo:2017 年度世界计算机将棋锦标赛冠军;

● AlphaGo Zero:DeepMind 自家的围棋 AI,被誉为史上最强选手。

在仅仅获知有关游戏基本规则的情况下,AlphaZero 在成为人工智能大师之前,会先自己机型数百万场的对抗练习。

该 AI 初期会实施随机战术来取得胜利,但后续会通过‘强化学习’来试错,以逐步了解哪些策略是最有效的。

实测国际象棋需要 9 小时、将棋 12 小时、围棋 13 天,涉及 5000 个张量处理单元(TPU)。

作为参考,一套 TPU 每天可以处理超过 Google Photos 中的 1 亿+照片,所以 AlphaZero 对硬件处理性能的要求还是比较高的。

闭关学习结束后,AlphaZero 就可以大杀四方了

这项研究的独特之处在于,研究团队将机器学习算法、与蒙特卡罗树(MCTS)的“搜索方法”结合到了一块。

印前服务

这是 Go 围棋 AI 决定下一步行动所采用的方式,这次 DeepMind 团队在国际象棋和将棋 AI 上也套用了同样的机制,首次展示了该方法适用于其它复杂的游戏测试。

对于人类国际象棋选手来说,AlphaZero 是极具吸引力的。你可以在与机器对战时,见识到此前从未遇到过的策略、以及一些新颖的想法。

其咄薄膜电容咄逼人的风格、以及高度动态的应变策略,足以让 Matthew Sadler 之类的国际象棋大师感到惊讶(其在 DeepMind 博客上有所表述)。

有关这项研究的详情,已经发表在近日出版的《科学》(Science)期刊上。原标题为:《A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play》《一种通用的强化学习算法,可自学成为国际象棋、将棋、围棋大师》。

谷歌
相关阅读
金光盐城纤维素纤维一体化产业基地奠基烟台输送机曲线锯制动液蒸汽锅炉Trp

金光盐城纤维素纤维一体化产业基地奠基发布日期: 来源:纸业联讯金光盐...

2024-04-18
方圆塔机参建保定市颐和雅园被动房项目能谱仪抗氧化剂流化床钢琴木偶Trp

方圆塔机参建保定市颐和雅园陶瓷绝缘“被动房”项目近日,多台方圆TC5510型...

2024-04-18
2010年包装油墨市场概况分析拉丝模量仪电工面板豆腐机移动插座Trp

2010年包装油墨市场概况分析包装油墨领域在2010年取得了明显增长,而油墨制...

2024-04-18
10月12日山东地区三氯甲烷价格进口蔬菜PVC板家具套UPS电器回收Trp

10月12日山东地区三氯甲烷价格10月12日山东地区三氯甲烷价未来将有更多的厂...

2024-04-18
FAGORCNC8055数控系统在高速加铅合金诸城石材吧台复合垫片剑道Trp

FAGORCNC8055数控系统在高速加工机床上的应用目前,在金属切削领域里正在孕育...

2024-04-18
河钢宣工召开产品技术提升及质量改进专题会运动护膝邵阳测试笔特殊衡器温控器Trp

河钢宣工召开产品技术提升及质量改进专题会河钢宣工召开产品技术提升及质...

2024-04-18
友情链接