Alphago:谷歌阿尔法围棋官网:https://deepmind.com/alpha-go.html
Alphago(中文名称为阿尔法围棋或阿尔法狗)是由英国伦敦Google DeepMind开发的人工智能围棋程序,成为第一个不借助让子,在全尺寸19×19的棋盘上击败职业围棋棋手的电脑围棋程序,也是人工智能与人类智慧的一大挑战。
国家:英国
外文网站:https://deepmind.com/alpha-go.html
Alphago:谷歌阿尔法围棋官网:阿尔法围棋
2016年3月在一场五番棋围棋比赛中,AlphaGo于前三局均击败职业围棋棋手李世乭,成为第一个不借助让子而击败职业九段围棋棋手的电脑围棋程序。
专业术语上来说:AlphaGo其做法是使用了蒙地卡罗树状搜索与两个深度神经网络相结合方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。
AlphaGo和之前的围棋程序相比表现出显著提升。在和Crazy Stone和Zen等其他围棋程序的500局比赛中,AlphaGo(运行于一台电脑上)仅输一局。而在其后的对局中,AlphaGo(可运行于多台电脑上)在500局比赛中全部获胜,且对抗运行在单机上的 AlphaGo 有 77% 的胜率。2015年10月的分布式运算版本AlphaGo使用1,202块CPU及176块GPU。
然而 Google 并没有公开解释从2015十月到2016三月间的实力增强有什么硬件或软件的改进,所以在三月进行的竞赛中可能进一步运用更多的硬件。
AlphaGo使用蒙特卡洛树搜索,借助估值网络与走棋网络这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。围棋无法仅通过寻找最佳步来解决;游戏一盘平均有150步,每一步平均有200种可选的下法,意味着有太多需要解决的可能性。