最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

首页

政治

国际

军事

财经

科技

TMT

汽车

智库前沿

视频

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

分享到：

2017-10-19 15:27:06 字号：A- A A+ 来源：bt36综合

关键字: 阿法狗新版发布新版阿法狗远胜旧版柯洁：人类太多余

北京时间今天（10月19日）凌晨，谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ，代号AlphaGo Zero。AlphaGo曾打败了中国顶尖棋手柯洁，而AlphaGo Zero经过3天的训练，就以100：0的比分完胜AlphaGo。这条消息点燃了中国围棋界，连柯洁也发微博感叹：对于AlphaGo的自我进步来讲，人类太多余了……

谷歌今天发布的这款名为AlphaGo Zero有多厉害？据“快科技”网站文章的介绍，它的系统可以通过自我对弈进行学习，它利用了一种名为强化学习的技术。在不断训练的过程中，这套系统开始靠自己的能力学会围棋中的一些高级概念。

经过3天的训练后，这套系统已经可以击败AlphaGo Lee，也就是去年击败韩国顶尖棋手李世石的那套系统，而且比分高达100比0。经过40天训练后，它总计运行了大约2900万次自我对弈，使得AlphaGo Zero得以击败AlphaGo Master（今年早些时候击败世界冠军柯洁的系统），比分为89比11。

AlphaGo之父戴密斯·哈萨比斯（Demis Hassabis）

与学习大量人类棋谱起步的前代AlphaGo不同，AlphaGo Zero是从“婴儿般的白纸”开始，通过3天数百万盘自我对弈，走完了人类千年的围棋历史，并探索出了不少横空出世的招法。

值得注意的是，虽然AlphaGo Zero在几周的训练期间学会了一些关键概念，但该系统学习的方法与人类有所不同。另外，AlphaGo Zero也比前几代系统更加节能，AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

DeepMind团队创始人David Silver介绍AlphaGo Zero说，这款程序超越了过去所有的AlphaGo版本，目前是世界上最大强大的围棋程序。

（视频截图，下同）

它的学习不使用人类数据，而是自我学习，完全从零开始。之所以它能比向人类数据学习的程序效果更好，是因为它每次对弈的“陪练”都被校准为与它持平的水平，它的“陪练”从非常基础的水平开始，逐渐上升为非常高的水平。

David Silver还说，人们一般认为机器学习就是大数据和海量计算，但是他们在AlphaGo Zero的研究中发现，算法比所谓计算或数据可用性更重要。

以下是完整视频：

DeepMind联合创始人和总裁David Silver介绍新版阿法狗。（视频自腾讯）

1 2 下一页余下全文



标签人工智能谷歌围棋
- 原标题：柯洁：对于AlphaGo的自我进步来讲人类太多余
- 请支持独立网站，转发请注明本文链接：
- 责任编辑:魏其濛
人工智能

柯洁又输给电脑了，这次是国产AI

“中国仍然是好的学习者，但不是好的创新者”

日防卫省引入人工智能强化网军

人工智能让人类进入第三轴心时代？
搜索
快讯
最新闻 Hot

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余

人工智能

关门第二天特朗普急了

大陆会“武统”？蔡英文这回改口了

计时开始：美国政府关门第一天

普通话考试不及格港生冲进办公室恐吓老师

特朗普帮中俄成为世界领袖？纽约时报怕是又砸了自己的脚

万豪“痛定思痛”，竟把台湾划到了日本…

雪乡导游被指一天打四人旅行社：游客问题，他怎么不打别人？

这波电梯壁咚让不少家长愤怒了…

喂派出所吗？救人的民警结婚了吗？

任天堂重新定义游戏，童年梦想要实现了……

央视体坛风云人物颁奖延期，刘国梁又躺枪了…

看完这部国产剧再也没脸笑话印度神剧了

特朗普“假新闻”奖终于公布了

“严惩中国剽窃知识产权，罚款大到超乎想象”

“诶，谁砸我？”

这幅抽象派作品让人想起了中国男篮的“热血”时刻...

最强“新狗”AlphaGo Zero发布 柯洁：对于它的自我进步来讲，人类太多余

最强“新狗”AlphaGo Zero发布柯洁：对于它的自我进步来讲，人类太多余