打开

“人类代表”李世石先输一盘 Alpha Go比深蓝强在哪？

时讯

看看新闻Knews综合

2016-03-09 17:21

李世石

纵观全盘，计算机Alpha Go出现了两次较小的失误，最终没有影响大局；而李世石却犯下了一个重大失误，直接导致最后丢掉了比赛。

之后的比赛李世石能否捍卫人类尊严？这台在第一盘击败了韩国棋王李世石的Alpha Go到底是一台怎样的超级计算机？

据谷歌旗下DeepMind公司CEO兼谷歌副总裁戴密斯-哈萨比斯透露，DeepMind为AlphaGo输入了海量的职业棋手对局，其自我演绎的对局数更是达到了3000万局，相当于人类1000年的学习量。

Alpha Go的核心是两种不同的深度神经网络——“策略网络”（Policy network）和“价值网络”（Value network）。

“策略网络”负责减少搜索宽度，排除明显错误的着法；“值网络”负责减少搜索深度，通过对局势的判断，在明显劣势下果断抛弃某些路线，不用每条道算到黑。

通过这两个网络分析局面，Alpha Go会更像一个人类棋手，通过对当前局面的判断和对未来局面的推演，根据不同权重，在函数中算出一种赢的概率最高的着法。

看到这里不少对于人工智能不甚了解的文科生可能已经晕了——什么策略、价值，什么宽度、深度，光是这么解释完全抓不到要点！说到底这Alpha Go和十多年前的深蓝相比有哪些突破性的进步？这人工智能下围棋到底又比下象棋难在哪？且听小编来给你讲讲人话。

为什么计算机挑战国际象棋10多年前就成功，围棋却不行？

国际象棋每回合有35种可能，一盘象棋可达80回合，在计算方面，国际象棋最多会有10的47次方局面；而围棋每回合有250种可能，一盘棋可长达150回合。对于一个19x19的围棋棋盘而言，一共有361个位置，而每个位置可以单独放置黑棋、白棋或者留空，理论上所有的可能组合是3^361种，其合法的组合超过170位数。

170位数是什么概念呢？如果有这个数量级的水分子，将足以填满整个宇宙！

在十多年前，深蓝在国际象棋上战胜了当时的国际象棋棋王卡斯帕罗夫，其原理其实是让人工智能在计算上穷尽了所有的可能，但如果挑战项目换成围棋，170位数的可能性，无论在当时还是现在，都远远超过了计算机的计算能力。

因此，在Alpha Go每下一步围棋的时候，并不能计算尽所有的可能性下一招“必胜之棋”，而是通过上面提到的“策略网络”和“价值网络”的分析，做出一种获胜概率更高的选择。

这种从深蓝到Alpha Go的深度神经网络运用的变化，恰恰使得Alpha Go的运行方式更像人类——也就是说要进行“取舍”。

另外，除了深度神经网络算法之外，Alpha Go还通过蒙特卡罗树搜索吸收以往棋局的经验，同时另一边进行着自我对局。

蒙特卡罗树搜索是把预测走棋、采样走棋、提升速度、预测局面的各部分连起来，组成了一个完整的系统。

下面这个是国际象棋的。

国际象棋蒙特卡洛树

这个是围棋的。

围棋蒙特卡洛树

同样，这种从局部到整体，对知识进行分层的结构计算方式与之前相比更加统一，从人类思维的角度来看，其获得的知识也就更接近围棋的本质。这也就是为什么圈内人士都认为，如果人工智能能够在围棋上战胜人类，将代表人工智能进入了一个新阶段。

最后，这个内行看门道，外行就凑个热闹。讲道理的话，小编其实还是支持我们的人类代表李世石的。

（看看新闻网记者：杨城）

APP 内打开

打开看看新闻参与讨论