人機(jī)大賽現(xiàn)場(chǎng),比賽即將開(kāi)始
首先小編要告訴大家,這并不是谷歌人工智能系統(tǒng)AlphaGo“阿爾法狗”次向“人腦”示威,在一個(gè)多月前,AlphaGo就與歐洲圍棋樊麾對(duì)戰(zhàn),結(jié)果是以5:0的戰(zhàn)績(jī)大獲全勝,這是計(jì)算機(jī)程序擊敗專(zhuān)業(yè)圍棋選手。
所以,AlphaGo與李世石的決斗是人工智能向“人腦”挑戰(zhàn)的升級(jí)版。今天(3月9日)的下午3點(diǎn)30分,人機(jī)世紀(jì)大戰(zhàn)場(chǎng)結(jié)果公布,谷歌人工智能系統(tǒng)“阿爾法狗”挑戰(zhàn)圍棋李世石成功,李世石認(rèn)輸。在賽前,李世石曾自信表示自己能夠贏滿5盤(pán)。
李世石是韓國(guó)超的職業(yè)圍棋選手,曾收獲多個(gè)大賽的,并在2003年7月獲第16屆富士通杯后直接升為九段??梢赃@樣說(shuō),他的實(shí)力可以代表整個(gè)韓國(guó)圍棋界。然而,就是這樣一個(gè)傳奇的選手,在此次對(duì)弈中淪為了配角,而人工智能機(jī)器人“阿爾法狗”成為真正的主角。
DeepMindCEO和李世石在開(kāi)賽前握手。
比賽正在緊張進(jìn)行。
相關(guān)資料上顯示:有別于傳統(tǒng)計(jì)算機(jī)窮舉計(jì)算方式,“阿爾法狗”采用的是利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。
要知道,圍棋每回合的可能性可達(dá)250種,一盤(pán)棋可以長(zhǎng)達(dá)150回,總共有3-361種局面,而我們目前可觀測(cè)到的宇宙,原子數(shù)量才10-80,所以根本不可能逆推計(jì)算。如果按照窮舉法來(lái)下,憑借現(xiàn)在計(jì)算機(jī)的計(jì)算能力,是完全比不過(guò)人腦的,甚至連一般的圍棋選手都下不過(guò)。但是“阿爾法狗”人工智能程序結(jié)合了深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法和樹(shù)搜索算法。簡(jiǎn)單來(lái)說(shuō),就是先讓“阿爾法狗”觀察人類(lèi)下圍棋,然后通過(guò)將不同決策進(jìn)行比較來(lái)提升技能,這一過(guò)程被叫做強(qiáng)化學(xué)習(xí)。經(jīng)上百萬(wàn)次重復(fù)后,它就可以進(jìn)行對(duì)戰(zhàn)了。
谷歌DeepMind CEO Hassabis表示,用強(qiáng)化學(xué)習(xí)技術(shù)“教”機(jī)器下圍棋,就如同教小孩子一樣,不是讓程序員添一段代碼就完事,而是要給程序看足夠多的案例,讓機(jī)器自己“領(lǐng)悟”到正確的下法。所以這就是“阿爾法狗”機(jī)器人厲害的地方,他不是一個(gè)機(jī)械的編碼程序,他有一個(gè)“監(jiān)督預(yù)判機(jī)制”,每走一步,他會(huì)考慮這種走法是不是更有前途,這是一種類(lèi)似“想象力”的能力。這種思維模式,幾乎和人類(lèi)的直覺(jué)類(lèi)似,使得他地更加像人類(lèi)。
圍觀人機(jī)世紀(jì)大戰(zhàn) 人工智能首場(chǎng)告捷是運(yùn)氣還是實(shí)力?