打开

“人类代表”李世石先输一盘 Alpha Go比深蓝强在哪?

时讯

看看新闻Knews综合

2016-03-09 17:21

李世石

纵观全盘,计算机Alpha Go出现了两次较小的失误,最终没有影响大局;而李世石却犯下了一个重大失误,直接导致最后丢掉了比赛。


之后的比赛李世石能否捍卫人类尊严?这台在第一盘击败了韩国棋王李世石的Alpha Go到底是一台怎样的超级计算机?

据谷歌旗下DeepMind公司CEO兼谷歌副总裁戴密斯-哈萨比斯透露,DeepMind为AlphaGo输入了海量的职业棋手对局,其自我演绎的对局数更是达到了3000万局,相当于人类1000年的学习量。


Alpha Go的核心是两种不同的深度神经网络——“策略网络”(Policy network)和“价值网络”(Value network)。

“策略网络”负责减少搜索宽度,排除明显错误的着法;“值网络”负责减少搜索深度,通过对局势的判断,在明显劣势下果断抛弃某些路线,不用每条道算到黑。

通过这两个网络分析局面,Alpha Go会更像一个人类棋手,通过对当前局面的判断和对未来局面的推演,根据不同权重,在函数中算出一种赢的概率最高的着法。


看到这里不少对于人工智能不甚了解的文科生可能已经晕了——什么策略、价值,什么宽度、深度,光是这么解释完全抓不到要点!说到底这Alpha Go和十多年前的深蓝相比有哪些突破性的进步?这人工智能下围棋到底又比下象棋难在哪?且听小编来给你讲讲人话。

为什么计算机挑战国际象棋10多年前就成功,围棋却不行?

国际象棋每回合有35种可能,一盘象棋可达80回合,在计算方面,国际象棋最多会有10的47次方局面;而围棋每回合有250种可能,一盘棋可长达150回 合。对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种,其合法的 组合超过170位数。

170位数是什么概念呢?如果有这个数量级的水分子,将足以填满整个宇宙!


在十多年前,深蓝在国际象棋上战胜了当时的国际象棋棋王卡斯帕罗夫,其原理其实是让人工智能在计算上穷尽了所有的可能,但如果挑战项目换成围棋,170位数的可能性,无论在当时还是现在,都远远超过了计算机的计算能力。

因此,在Alpha Go每下一步围棋的时候,并不能计算尽所有的可能性下一招“必胜之棋”,而是通过上面提到的“策略网络”和“价值网络”的分析,做出一种获胜概率更高的选择。

这种从深蓝到Alpha Go的深度神经网络运用的变化,恰恰使得Alpha Go的运行方式更像人类——也就是说要进行“取舍”。

另外,除了深度神经网络算法之外,Alpha Go还通过蒙特卡罗树搜索吸收以往棋局的经验,同时另一边进行着自我对局。

蒙特卡罗树搜索是把预测走棋、采样走棋、提升速度、预测局面 的各部分连起来,组成了一个完整的系统。

下面这个是国际象棋的。

国际象棋蒙特卡洛树


这个是围棋的。


围棋蒙特卡洛树

同样,这种从局部到整体,对知识进行分层的结构计算方式与之前相比更加统一,从人类思维的角度来看,其获得的知识也就更接近围棋的本质。这也就是为什么圈内人士都认为,如果人工智能能够在围棋上战胜人类,将代表人工智能进入了一个新阶段。

最后,这个内行看门道,外行就凑个热闹。讲道理的话,小编其实还是支持我们的人类代表李世石的。


(看看新闻网记者:杨城)

相关推荐 更多精彩内容

暂无列表

APP 内打开
打开看看新闻参与讨论