人物档案
中文名:樊麾
国籍:中国
出生地:中国
职业:围棋手
相关人物:时越、周睿羊、唐韦星
主要事项
与“AlphaGo”一较高下的棋手是2013年至2015年的欧洲围棋冠军、生于中国的樊麾。2015年10月,双方以正式比赛中使用的十九路棋盘进行了无让子的5局较量,“AlphaGo”赢得满堂红。
2016国际智力运动联盟智力运动精英赛,欧洲围棋冠军樊麾现身围棋赛场。当樊麾领衔的欧洲围棋队遇上3位世界冠军时越、周睿羊与唐韦星组成的中国男队,0比3的结果并不意外,但第三台樊麾与唐韦星的对局颇受关注。
相关资讯
机器人又赢了!去年与Alphago秘密决战的欧洲围棋冠军樊麾深度剖...
搜狐 2016-03-10
举世瞩目的围棋人机世纪大战——谷歌人工智能系统“阿尔法围棋”(AlphaGo)对决韩国高手李世石(五番赛第二回合)刚刚结束。拥有众多国际冠军头衔的9段高手李世石再次不敌AlphaGo。
本次对战具有重要的意义,是首次人工智能在人类最复杂的博弈游戏中挑战最高级别的人类选手,而拉开这一帷幕的是去年欧洲围棋冠军樊麾与 AlphaGo的对战。樊麾老师还作为裁判长现场督战「AlphaGo VS 李世石」。
本文是机器之心对樊麾老师的专访,樊麾老师详细回顾了他与 AlphaGo 交战的精彩故事,畅谈了他对人工智能技术的感触,以及对围棋与人生的哲学思考。相信这篇精彩分享一定可以给大家带来超越比赛本身的启迪,关乎机器与人类、科技与文化、围棋与哲学、历史与未来。
2016年4月17日,第8届应氏杯世界职业围棋锦标赛名单公布,樊麾代表欧洲队。
程序原理
阿尔法围棋(AlphaGo)是一款围棋人工智能程序。这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。
深度学习
阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
两个大脑
阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第一大脑:落子选择器 (Move Picker)
阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑:棋局评估器 (Position Evaluator)
阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。
相关知识
阿尔法围棋是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾。2016年3月9日,AlphaGo对战围棋冠军李世石,最终李世石投子认输;3月10日,“围棋人机大战”第二局在韩国首尔的四季酒店开赛,结果阿尔法电脑执黑战胜李世石,五番棋2-0领先;3月12日,阿尔法电脑执白再次战胜李世石,五番棋3-0领先;3月13日,李世石战胜阿尔法电脑,比分扳成1-3。