首页 理论教育围棋人机大战:柯洁挑战阿尔法围棋

围棋人机大战:柯洁挑战阿尔法围棋

【摘要】:然而,人工智能的发展极为迅速,很快就出现了引起社会大众非常关注而且影响巨大的围棋人机大战。第二次著名的人机大战是中国九段棋手柯洁与人工智能阿尔法围棋升级版之间的比赛。柯洁与阿尔法围棋人机大战之后,围棋界公认阿尔法围棋在围棋领域已经远远超过人类棋手的棋力,是人类难以企及的新高度,已经不能被人类所击败。

当国际象棋人工智能程序战胜国际象棋世界冠军的时候,围棋人工智能程序的研发已经开始。21世纪初,围棋人工智能程序的棋艺总体不高。在我国进行的人脑和电脑围棋比赛中,有不少三段棋手败在电脑手下,然而,电脑却常常败在水平不高的业余棋手手下,如著名相声演员姜昆就战胜过电脑,因为姜昆使用的是类似约翰逊的“模糊战术”,电脑特别不适应。然而,人工智能的发展极为迅速,很快就出现了引起社会大众非常关注而且影响巨大的围棋人机大战。

1.AlphaGo对战韩国九段棋手李世石

所谓围棋人机大战,就是指人类顶尖围棋手与围棋人工智能顶级程序之间的对局。最早的人机大战是2015年10月围棋人工智能程序AlphaGo以5∶0的绝对优势击败曾经三度蝉联欧洲围棋冠军、职业二段的樊麾。AlphaGo,中译名“阿尔法围棋”或“阿尔法狗”,是由谷歌旗下的人工智能公司Deep Mind开发的一款人工智能围棋程序,是当时人工智能围棋程序的杰出代表。“阿尔法狗”获胜,是人类历史上人工智能围棋程序首次在公平比赛中战胜职业棋手,打破了人工智能围棋程序无法与人脑抗衡的说法。

第一次著名的人机大战是韩国九段围棋手李世石与人工智能阿尔法围棋(AlphaGo)之间的比赛。

2016年3月9日至15日,韩国围棋九段棋手李世石与人工智能阿尔法围棋(AlphaGo)在韩国首尔四季酒店进行五番棋比赛。五局比赛分别于3月9日、10日、12日、13日、15日进行,无论比分如何都要下满五局,每局各方用时为2小时,3次60秒的读秒机会。总比分胜者获奖金100万美元(约11亿韩元)。若阿尔法围棋(AlphaGo)获胜,奖金将捐赠给联合国儿童基金会、STEM教育以及围棋慈善机构,李世石则可获得15万美元的出场费,每胜一局还有2万美元胜局奖金。前三局李世石三连败,第四局到180手,阿尔法围棋(Alpha-Go)中盘认输,第五局到280手,李世石投子认输。最终比分定格为1∶4,李世石1胜4负。

2.AlphaGo升级版对战围棋世界冠军柯洁

2016年12月29日,在知名的网络围棋某对战平台上,一位围棋棋手的账号由“Magister”更名为“Master”,并开启了其横扫世界顶尖围棋高手的对局。Master不断寻找平台上的高手进行挑战,而且只下30秒内落子的“快棋”。在第一天战胜了几位四段到六段的中、韩围棋选手后,从12月30日开始挑战顶尖围棋高手,对战“持续37个月韩国排名第一”的九段选手朴廷桓时,以2∶0取胜,并速胜“中国围棋名人战”冠军、七段连笑。

2017年1月4日下午,中国著名围棋职业棋手聂卫平也在与Master对战中不幸落败,而此时的Master已经取得51连胜。当天晚上Master在完胜第59盘棋的时候,突然发声表明:“我是AlphaGo的黄博士”。原来,Master就是AlphaGo的升级版人工智能软件。最后,获得多次世界冠军的中国九段棋手古力也败下阵来,Master以60胜0败宣告挑战暂时结束。随后,AlphaGo之父——谷歌Deep Mind创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis)发表声明称,Master就是AlphaGo,正式宣布升级版的AlphaGo问世。

第二次著名的人机大战是中国九段棋手柯洁与人工智能阿尔法围棋(AlphaGo)升级版之间的比赛。(www.chuimin.cn)

2017年5月23日至27日,谷歌用阿尔法围棋(AlphaGo)升级版邀请围棋世界冠军、中国九段棋手柯洁在中国嘉兴乌镇进行三番棋大战。比赛无论比分如何都要下满三局,每局各方用时为3小时,另外保留5次1分钟读秒机会。三局比赛分别于5月23日、25日、27日在浙江嘉兴的“中国乌镇围棋峰会”上进行。比赛奖金为总比分胜者150万美元(约1000万元人民币),负者可以获得30万美元的出场费。最终比分定格为0∶3,柯洁连输三局。输棋的柯洁一度落泪哽咽,并表示这是自己最后一次与人工智能围棋对决。

然而,2018年4月27日,柯洁却现身“第一届‘吴清源杯’世界女子围棋赛暨贝瑞基因杯2018世界人工智能围棋大赛”,挑战我国研制的人工智能围棋程序“星阵”,遗憾的是,仍然以执白中盘告负。人工智能围棋再次取得胜利。

柯洁与阿尔法围棋(AlphaGo)人机大战之后,围棋界公认阿尔法围棋(AlphaGo)在围棋领域已经远远超过人类棋手的棋力,是人类难以企及的新高度,已经不能被人类所击败。

被阿尔法围棋(AlphaGo)击败的世界冠军、九段棋手柯洁后来说:“Alpha-Go带给围棋界的震撼是从来没有过的,它有一条更快捷、更有效的方法,颠覆了传统的下法和认知,这是以前完全不可想象的一件事情。”柯洁还表示:最开始,棋手是把人工智能当作一个对手,因为那时候并不相信人工智能能够战胜人类;而现在,棋手只能将人工智能作为“学习的榜样”。柯洁认识到:通过向人工智能学习,人类的棋艺会比过去更强大一些,理论会比过去更先进一些;人工智能不会取代棋手,而是帮助棋手越来越强,这将是棋手和人工智能的相处之道。

3.AlphaGo运用的新型人工智能学习模式AlphaGo之所以能够战胜人类的围棋世界冠军、顶级棋手,是因为它集成了深度学习、强化学习和蒙特卡洛树搜索,具有强大的应变能力和处理能力。

深度学习和强化学习是新型人工智能学习模式。深度学习是指通过合适的矩阵数量,将多层组织链接一起形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。强化学习则是通过不断反复试验,将变化无常的动态情况与对应动作相匹配。AlphaGo会通过上百万盘的棋盘对战来获取经验教训,多次高强度对战将不断优化AlphaGo的策略判断能力。AlphaGo通过深度学习技术学习、记忆了大量的人类围棋对局,接着应用强化学习通过与自己对弈获得了更多的棋局,然后用深度学习技术评估每一个格局的输赢率(即价值网络),最后通过蒙特卡洛树搜索(策略网络和数值网络)决定最优落子。

AlphaGo是目前人工智能杰出的代表作之一,AlphaGo的胜利代表着人工智能发展史上又一重大里程碑。AlphaGo利用“价值网络”去计算局面,用“策略网络”去选择下子,高度模拟了人类神经网络思维模式,并具有自我学习能力,完全具备一名职业选手的下棋水准。

围棋人机大战,实质上还是人与人的对战,胜负的历史就是科技进步的轨迹。说到底,人工智能战胜人类,依然是人类的胜利。科技是人类文化的重要组成部分,人工智能棋手或者机器棋手,也必然是围棋文化的一个部分。在未来的围棋活动中,人工智能应该会推动围棋的发展和进步。