智能制造網(wǎng)訊 人工智能技術進步的速度越來越快,每種細分技術所創(chuàng)造的價值正日益得到展現(xiàn)。
2013年,DeepMind發(fā)明了DQN算法,成功將深度學習和強化學習結合起來,開啟了深度強化學習的新紀元。此后數(shù)年,強化學習的成果日新月異,很多非常困難的問題都被深度強化學習算法解決。
2016年,谷歌阿爾法圍棋以4:1戰(zhàn)勝圍棋世界、職業(yè)九段棋手李世石,不僅讓深度學習為人們所知,而且掀起了人工智能的“大眾熱”,大家由此更加關注強化學習這一技術要點。
使用強化學習的一個很好的例子是讓機器人學習如何走路。機器人首先向前邁出一大步然后跌倒。這一大步和摔倒是強化學習系統(tǒng)關注的響應點。由于反饋是負面的,所以繼續(xù)調整,系統(tǒng)會根據(jù)多個負反饋的比對終確定機器人應該把步子邁的小一點,不停地小,直到機器人走路不會摔倒為止。
通過強化學習,Boston Dynamics公司的機器人已經(jīng)掌握了托舉、后空翻、跳上窗臺的要點。而迪斯尼幻想工程已經(jīng)把這一點帶到了一個新的層面,那就是讓人形機器人來執(zhí)行玩命的特技。
有業(yè)內人士指出,強化學習和其他的人工智能技術有一個很大的差異,那就是它的學習范式和其它技術不太一樣。它不需要我們去收集數(shù)據(jù),也不需要我們去做任何標記,而是我們把稱之為智能體(Agent),放在一個環(huán)境里,就像動物或者我們自己生存的一個環(huán)境里,它會和環(huán)境自己打交道,自己學會在環(huán)境里如何完成一個任務,解決一個問題。
強化學習主要由智能體(Agent)、環(huán)境(Environment)、狀態(tài)(State)和動作(Action)、獎勵(Reward)組成。智能體將在環(huán)境的當前狀態(tài)下,根據(jù)獎勵信號做出動作,從而達到環(huán)境中的不同狀態(tài)并得到獎勵。
除了強化學習外,機器學習也備受關注。機器學習是AI的一個子集,是通過不同場景中的經(jīng)驗來訓練系統(tǒng)的能力。隨著車輛變得越來越自動化,開發(fā)人員可以使用機器學習訓練系統(tǒng)來識別對象,并用更少的數(shù)據(jù)更好地解釋其環(huán)境。
再來看一下深度學習。深度學習就是從有限樣例中通過算法總結出一般性的規(guī)律,并可以應用到新的未知數(shù)據(jù)上。例如,我們可以從一些歷史病例的集合中總結出癥狀和疾病之間的規(guī)律。這樣,當有新的病人到來時,我們可以利用總結出來的規(guī)律來判斷這個病人得了什么疾病。
那么,強化學習、機器學習、深度學習三者的區(qū)別是什么?簡單說,人工智能范圍大,涵蓋機器學習、深度學習和強化學習。如果把人工智能比喻成孩子大腦,那么機器學習是讓孩子去掌握認知能力的過程,而深度學習是這種過程中很有效率的一種教學體系。
由強化學習、機器學習等技術構成的人工智能,其良好的發(fā)展前景引人期待。從全國來看,據(jù)艾瑞咨詢測算,2022年國內人工智能核心產業(yè)規(guī)模有望達到1573億元,復合增速達58%,產業(yè)將持續(xù)快速增長。如此廣闊的市場空間,吸引著社會各界投資者的關注。
值得一提的是,發(fā)展“以人為本”的人工智能是全社會的課題,需要政府、商界、學界及所有利益相關方共擔責任,協(xié)力推動。作為技術應用與推廣的主體,企業(yè)負有不可推卸的社會責任。在研究強化學習相關技術時,企業(yè)要自覺遵守法規(guī)制度和社會公約,以此促進其有序、可持續(xù)應用。
未來,的可持續(xù)發(fā)展越來越依賴于數(shù)據(jù)創(chuàng)造的價值,而人工智能是數(shù)字經(jīng)濟中應用十分廣泛的技術之一?;蛟S再過幾年,AI將在精準農業(yè)、智能家居、遠程醫(yī)療、自動駕駛等領域發(fā)揮更加重要的作用。
版權與免責聲明:
凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-智能制造網(wǎng)合法擁有版權或有權使用的作品,未經(jīng)本站授權不得轉載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內容、版權等問題,請與本站聯(lián)系并提供相關證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。