圍觀人機(jī)世紀(jì)大戰(zhàn) 人工智能首場(chǎng)告捷是運(yùn)氣還是實(shí)力？

2016-03-09 16:56:11來(lái)源：中國(guó)智能制造網(wǎng) 關(guān)鍵詞：人工智能深度學(xué)習(xí)閱讀量：60557

導(dǎo)讀：人機(jī)世紀(jì)大戰(zhàn)今日首場(chǎng)結(jié)果已經(jīng)公布，谷歌人工智能系統(tǒng)AlphaGo挑戰(zhàn)圍棋李世石成功，李世石認(rèn)輸。

　　【中國(guó)智能制造網(wǎng) 編輯視點(diǎn)】近幾日引發(fā)科技界高度關(guān)注的人機(jī)世紀(jì)大戰(zhàn)今日首場(chǎng)結(jié)果已經(jīng)公布，谷歌人工智能系統(tǒng)AlphaGo挑戰(zhàn)世界圍棋李世石成功，李世石認(rèn)輸。對(duì)于結(jié)果，你預(yù)想到了嗎？人工智能首場(chǎng)告捷，是運(yùn)氣還是實(shí)力呢？
　　

　
　人機(jī)大賽現(xiàn)場(chǎng)，比賽即將開(kāi)始

　　　　
　　首先小編要告訴大家，這并不是谷歌人工智能系統(tǒng)AlphaGo“阿爾法狗”次向“人腦”示威，在一個(gè)多月前，AlphaGo就與歐洲圍棋樊麾對(duì)戰(zhàn)，結(jié)果是以5：0的戰(zhàn)績(jī)大獲全勝，這是計(jì)算機(jī)程序擊敗專(zhuān)業(yè)圍棋選手。
　　
　　所以，AlphaGo與李世石的決斗是人工智能向“人腦”挑戰(zhàn)的升級(jí)版。今天（3月9日）的下午3點(diǎn)30分，人機(jī)世紀(jì)大戰(zhàn)場(chǎng)結(jié)果公布，谷歌人工智能系統(tǒng)“阿爾法狗”挑戰(zhàn)圍棋李世石成功，李世石認(rèn)輸。在賽前，李世石曾自信表示自己能夠贏滿5盤(pán)。
　　
　　李世石是韓國(guó)超的職業(yè)圍棋選手，曾收獲多個(gè)大賽的，并在2003年7月獲第16屆富士通杯后直接升為九段?？梢赃@樣說(shuō)，他的實(shí)力可以代表整個(gè)韓國(guó)圍棋界。然而，就是這樣一個(gè)傳奇的選手，在此次對(duì)弈中淪為了配角，而人工智能機(jī)器人“阿爾法狗”成為真正的主角。

　
　DeepMindCEO和李世石在開(kāi)賽前握手。
　　
　　比賽正在緊張進(jìn)行。

　　“阿爾法狗”與圍棋對(duì)弈的資本
　　
　　相關(guān)資料上顯示：有別于傳統(tǒng)計(jì)算機(jī)窮舉計(jì)算方式，“阿爾法狗”采用的是利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面，用“策略網(wǎng)絡(luò)”去選擇下子。
　　
　　要知道，圍棋每回合的可能性可達(dá)250種，一盤(pán)棋可以長(zhǎng)達(dá)150回，總共有3-361種局面，而我們目前可觀測(cè)到的宇宙，原子數(shù)量才10-80，所以根本不可能逆推計(jì)算。如果按照窮舉法來(lái)下，憑借現(xiàn)在計(jì)算機(jī)的計(jì)算能力，是完全比不過(guò)人腦的，甚至連一般的圍棋選手都下不過(guò)。但是“阿爾法狗”人工智能程序結(jié)合了深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法和樹(shù)搜索算法。簡(jiǎn)單來(lái)說(shuō)，就是先讓“阿爾法狗”觀察人類(lèi)下圍棋，然后通過(guò)將不同決策進(jìn)行比較來(lái)提升技能，這一過(guò)程被叫做強(qiáng)化學(xué)習(xí)。經(jīng)上百萬(wàn)次重復(fù)后，它就可以進(jìn)行對(duì)戰(zhàn)了。
　　
　　谷歌DeepMind CEO Hassabis表示，用強(qiáng)化學(xué)習(xí)技術(shù)“教”機(jī)器下圍棋，就如同教小孩子一樣，不是讓程序員添一段代碼就完事，而是要給程序看足夠多的案例，讓機(jī)器自己“領(lǐng)悟”到正確的下法。所以這就是“阿爾法狗”機(jī)器人厲害的地方，他不是一個(gè)機(jī)械的編碼程序，他有一個(gè)“監(jiān)督預(yù)判機(jī)制”，每走一步，他會(huì)考慮這種走法是不是更有前途，這是一種類(lèi)似“想象力”的能力。這種思維模式，幾乎和人類(lèi)的直覺(jué)類(lèi)似，使得他地更加像人類(lèi)。