Alphago:谷歌阿尔法围棋官网:deepmind.com/alpha-go.html

 唐家桃园小编   2020-01-11 21:36   813 views 人阅读  0 条评论

Alphago:谷歌阿尔法围棋官网:https://deepmind.com/alpha-go.html

Alphago(中文名称为阿尔法围棋或阿尔法狗)是由英国伦敦Google DeepMind开发的人工智能围棋程序,成为第一个不借助让子,在全尺寸19×19的棋盘上击败职业围棋棋手的电脑围棋程序,也是人工智能与人类智慧的一大挑战。

Alphago:谷歌阿尔法围棋官网:deepmind.com/alpha-go.html

国家:英国

外文网站:https://deepmind.com/alpha-go.html

Alphago:谷歌阿尔法围棋官网:阿尔法围棋

2016年3月在一场五番棋围棋比赛中,AlphaGo于前三局均击败职业围棋棋手李世乭,成为第一个不借助让子而击败职业九段围棋棋手的电脑围棋程序。

专业术语上来说:AlphaGo其做法是使用了蒙地卡罗树状搜索与两个深度神经网络相结合方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。

AlphaGo和之前的围棋程序相比表现出显著提升。在和Crazy Stone和Zen等其他围棋程序的500局比赛中,AlphaGo(运行于一台电脑上)仅输一局。而在其后的对局中,AlphaGo(可运行于多台电脑上)在500局比赛中全部获胜,且对抗运行在单机上的 AlphaGo 有 77% 的胜率。2015年10月的分布式运算版本AlphaGo使用1,202块CPU及176块GPU。

然而 Google 并没有公开解释从2015十月到2016三月间的实力增强有什么硬件或软件的改进,所以在三月进行的竞赛中可能进一步运用更多的硬件。

AlphaGo使用蒙特卡洛树搜索,借助估值网络与走棋网络这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。围棋无法仅通过寻找最佳步来解决;游戏一盘平均有150步,每一步平均有200种可选的下法,意味着有太多需要解决的可能性。

美院书法高考培训班(有需要了解的扫码加微信)

杭州望崖阁书法高考培训班招生简章
本文地址:http://tangjiataoyuan.com/6998.html
版权声明:本文为网友投稿发布,版权归原作者所有。本站小编: 唐家桃园小编 编辑。欢迎分享本文,转载请保留出处!
 相关文章  关键词:

 发表评论


表情