您現(xiàn)在的位置:智能制造網(wǎng)>新聞首頁>人物故事
谷歌Jeff Dean:快15年實現(xiàn)通用人工智能
High:你和你的團隊取得的一些進展似乎已經(jīng)用于谷歌的各種產(chǎn)品:谷歌助理——谷歌新的虛擬語音助手;GoogleHome——你們對亞馬遜Echo的回應;還有Allo——一款提供獲取谷歌服務的對話接口的消息應用。你怎么看待這些近發(fā)布的新產(chǎn)品和谷歌內(nèi)部的試用產(chǎn)品?
Dean:我那時領導的研究團隊叫做谷歌大腦。我們專注于構(gòu)建大規(guī)模的機器學習計算系統(tǒng)和研究的機器學習技術(shù)。有這兩種不同技能的人們聚集在一起共同解決難題,取得了明顯的進步,而只具有機器學習技能或大規(guī)模計算技能的人通常不能獨自獲此成就。在我們能將這些問題在多大程度上扔給計算機程序和我們?nèi)绾斡柧毘鰪姶蟮哪P徒鉀Q我們關(guān)心的問題上,我認為這是讓我們團隊在兩個領域內(nèi)都取得相當大的成功并推動了技術(shù)向前發(fā)展的其中一個原因。
在做長期研究時我們一直是相當機會主義的,我們懂得什么時候我們的一些研究成果可以用于改善谷歌現(xiàn)在的產(chǎn)品。我們將和產(chǎn)品團隊一起工作,我們會說:‘嘿,我們認為這項機器學習研究在你的產(chǎn)品中是有用的。’有時這是一個完全不能干涉的事情。而有時我們這個團隊和產(chǎn)品團隊又會深度合作,讓研究成果在產(chǎn)品中實現(xiàn)其價值。
我們團隊中的一些研究人員開發(fā)了一個模型,叫‘序列到序列學習’。這個模型的核心想法是你用一個輸入序列來預測某些輸出結(jié)果序列。聽起來有點抽象,但可以映射到許多你想要解決的真正問題。他們發(fā)表的這個研究論文初是語言翻譯背景下的應用。輸入序列可以是一個句子的英文單詞,一次一個。該模型被訓練去輸出對應的法國單詞來創(chuàng)建一個法語句子,意思與輸入的英語句子相同。這不同于其他機器翻譯系統(tǒng),別的機器翻譯系統(tǒng)往往是代碼和子件的問題——也許使用了機器學習或統(tǒng)計模型將它拼接在一起。相比之下,這個系統(tǒng)是一個完全的機器學習的端到端系統(tǒng),在這個系統(tǒng)中你投進成對的在不同語言中表達同一個意思的句子,然后系統(tǒng)就能學會將一種語言翻譯另一種語言。
這個通用模型在其他環(huán)境中也很有用。Gmail團隊將它用作了一個名叫‘智能回復’的功能的基礎,這里面的輸入序列是一個傳入的電子郵件,生成序列是根據(jù)這個郵件的內(nèi)容預測出的可能回復。比如,你收到一封這樣的郵件:‘嗨,我們想邀請你來吃感恩節(jié)晚餐。請告訴我們你能不能來。’這個生成的回復可能是‘好的,我們會來。我們能帶點什么過來嗎?’或者是‘對不起,我們來不了了,’或者是其他對應語境的類似回復。用的是相同的基本模型,只是訓練的數(shù)據(jù)集不同。
High:谷歌大腦的這個研究在谷歌其他更多的傳統(tǒng)產(chǎn)品分支中有什么潛在的應用和突破?
Dean:我們已經(jīng)開始將這個流程變得規(guī)范一點。五年前,當我們初創(chuàng)建機器學習研究團隊以調(diào)查海量計算和深度神經(jīng)網(wǎng)絡如何解決問題時,公司里還沒有太多人使用這些方法。我們發(fā)現(xiàn)了一些用它們可以有效處理的領域,包括語音識別系統(tǒng),所以我們與語音識別團隊的人密切協(xié)作,從而將深度神經(jīng)網(wǎng)絡配置為了語音識別系統(tǒng)的一部分,并且在識別準確率上取得了實質(zhì)性進展。然后我們和各種計算機視覺相關(guān)團隊合作,比如圖片搜索和一些街景服務團隊,從而訓練模型在給定的各種圖片的原始像素下做有趣的事情——從圖片中提取文本或者理解圖片內(nèi)容是什么(美洲豹、垃圾車等等)。
有趣的是,隨著時間的推移,越來越多的團隊開始采用這些方法,因為他們總會聽說另一個團隊用這些方法取得了好結(jié)果。我們會幫助這樣兩種團隊建立聯(lián)系,或者,提供一些關(guān)于在特定的問題情境中如何使用這些方法的基本建議。后來我們將此流程規(guī)范了一些,所以現(xiàn)在我們有一個專門的團隊負責外聯(lián)。這是為正在產(chǎn)品中嘗試這些機器學習模型的團隊建立聯(lián)系的點。他們會描述他們的問題,然后外聯(lián)團隊會告訴他們:‘噢,聽起來很像另外這個團隊的問題,這個解決方案會幫到您,試試并記得給我們反饋哦。’這種外聯(lián)團隊的數(shù)量正在急劇增長——從2011年、2012年的幾個團隊增長到現(xiàn)在的200多個團隊,并且可能已有幾千人用我們團隊的軟件訓練過這種模型了。
High:你也是谷歌開源機器學習庫——TensorFlow的創(chuàng)始人之一。像其他幾家公司一樣,谷歌正關(guān)注開源人工智能技術(shù)的開發(fā)。請談談你對使用開源人工智能技術(shù)的理論基礎及優(yōu)勢的看法。
Dean:有許多不同的構(gòu)架來表達不同的開源機器學習算法。我認為有更多的選擇總是好的,但如果我們可以開發(fā)出能獲得機器學習社區(qū)支持,大家一起來改進的東西的話,也很好。其他許多人都在嘗試著相似的工作,所以如果我們能將重復工作的成果放在一起,構(gòu)成一個許多人都會采用的庫就會非常方便。原因是這會使機器學習想法的表達變得更簡單。傳統(tǒng)的方式是人們寫一篇論文,談談他們有了一個想法,然后開始探索,做一些實驗,但通常他們并不會公開代碼,其他人便沒法重復這些實驗。作為一個研究者,你正在看某人的論文,并嘗試將你自己的技術(shù)與其對比。通常,因為論文中沒有代碼,你只能猜測那些代碼會是什么。并不是作者有意隱瞞,而是論文的屬性決定了其會省略大量細節(jié)。論文中可能會有像‘我們使用了低的學習率’一樣的描述,然而你關(guān)心的可能是他們是否使用了。0001的學習率,在一萬步后將其降低到更小值。所以建立一個軟件架構(gòu),讓人們可以以代碼的形式表達機器學習想法并將這些研究模型和想法以可執(zhí)行形式發(fā)布到這個構(gòu)架中,這使得想法的交流更加通暢。
對于我們自己而言,這也使得我們與谷歌公司以外的人的合作更簡單。通常我們會招暑期實習生,在過去,他們幾乎快完成實習項目的時候,仍然在寫關(guān)于他們工作的論文。但后來他們離開了谷歌,沒法再接入谷歌的電腦了,這使得他們很難繼續(xù)完成他們的論文或者進行更多的實驗?,F(xiàn)在他們可以辦到了,只需要使用開放源或者TensorFlow,然后熟悉如何用TensorFlow表達機器學習想法的人就可能會過來幫忙。TensorFlow正作為基礎教學工具,幫助我們教授許多谷歌工程師機器學習的知識。
2015年11月9日,倫敦時任市長BorisJohnson在探訪谷歌位于以色列特拉維夫市的辦公室期間佩戴虛擬現(xiàn)實眼鏡。
High:谷歌的一個優(yōu)勢是在人工智能和機器學習上擁有大量人才。你們的研究部門負責人PeterNorvig曾估計說谷歌在機器學習領域擁有世界上5%的專家。谷歌是如何變得對人才有如此吸引力的?而鑒于人工智能位于許多不同學科(計算機科學、工程學、神經(jīng)科學、生物學、數(shù)學等)的交叉領域,你認為應該怎樣將人才和技能組合到一起,以確保你能在正確的位置上安置合適的人才?
Dean:因為我們涉足的領域很多,所以我們需要擁有多種專業(yè)知識的人。我發(fā)現(xiàn),當你把具有不同專業(yè)知識的人聚在一起去解決問題時,你會發(fā)現(xiàn)終得到結(jié)果比那些只具備一種專業(yè)知識的一大群人一起做出來的要好??偟膩碚f,你終做的事情,沒有人可以單獨做出來。我們的機器學習團隊是一個很好的例子。我們有像我一樣在建設大規(guī)模計算系統(tǒng)方面有很多的經(jīng)驗人,然后我們也有的機器學習研究人員。把這些類型的人結(jié)合起來是一個非常強大的團隊。機器學習正在接觸很多不同的領域。我們正在做的工作涉及醫(yī)療、機器人和計算機科學里的一大堆領域,這非常的好。在我們團隊中有數(shù)位神經(jīng)科學專家。
很快我們將開始一個有趣的實驗,它被稱為‘谷歌大腦培訓項目’。我們正在招人到谷歌和我們的團隊一起工作一年,基本上是學習如何做機器學習研究。我們有大量的申請者,這個項目終會留下28個人。他們來自不同的背景,處在事業(yè)生涯的不同階段,有人剛剛完成本科學習,有些人則讀完了博士,還有些人剛要結(jié)束他們的博士后階段,另一些人已經(jīng)在不同的行業(yè)干一段時間工作。但他們也帶來了計算機科學、統(tǒng)計學、數(shù)學、生物學、物理學的背景。我認為這將會是一個很好的組合,在解決很多問題時都有綜合不同的觀點。
High:我很好奇,有很多不以技術(shù)為中心的傳統(tǒng)公司也會使用人工智能和機器學習,你會在多大程度上與更多傳統(tǒng)公司工作和交流嗎?你如何看待公司對人工智能技術(shù)的采納曲線?顯然這涉及了不同公司甚至是不同行業(yè)。但也有一些領先的傳統(tǒng)行業(yè)開始利用人工智能,包括醫(yī)療、金融服務公司、有大量非結(jié)構(gòu)化數(shù)據(jù)需要處理的公司。你是否曾經(jīng)有機會與傳統(tǒng)行業(yè)的公司互動或者談論他們在更加傳統(tǒng)的環(huán)境中走向人工智能的過程?
Dean:其他行業(yè)的大多數(shù)公司可能沒有像谷歌或者其他技術(shù)公司那樣應用機器學習。我認為,隨著時間的推移,終大多數(shù)公司將采用越來越多的機器學習。因為機器學習會逐漸強大到為他們的業(yè)務帶來革新。我們已經(jīng)與一些大型的醫(yī)療機構(gòu)討論了建立合作伙伴關(guān)系,看看什么機器學習可以為該領域的特定類型的問題做些什么。我們近推出了一個云機器學習產(chǎn)品,可以讓人們在谷歌的云基礎設施上運行機器學習算法,顯然有許多公司有興趣了解在他們的業(yè)務的環(huán)境中怎么使用該產(chǎn)品。
我認為這種轉(zhuǎn)變會發(fā)生的途徑之一是通過幾個層次,在這些層次中,你可以使用人工智能技術(shù)和機器學習的方法來解決問題。在一些領域,了解圖像中有什么東西對很多行業(yè)來說是普遍有用的。谷歌和其他公司正在提供使用起來比較簡單的接口,在那里你不需要知道任何機器學習。你可以只給出一個圖像,然后說‘跟我說說這個圖像’,并且任何沒有機器學習專業(yè)知識的軟件工程師都可以使用,他們得到的信息會像是‘照片上有個體育場,人們在那里打棒球,而且圖像中還有一堆文字,文字是。。。。。。’即使沒有應用機器學習,這也會是非常有用的。
然后將會有已經(jīng)開發(fā)好的模型,可以用公司的數(shù)據(jù)重復訓練這個模型來得到一個定制化的解決方案,而無需做核心機器學習研究來開發(fā)一個全新的模型。一個很好的例子是序列到序列的工作,現(xiàn)在已經(jīng)應用到谷歌的六七個不同的問題中。另一個很好的例子是一個采集圖像的模型,它能發(fā)現(xiàn)該圖像中有趣的部分。這個通用模型的一個應用是檢測街道視野圖像中的文本在什么位置。你想能閱讀所有的文本,但是首先你必須能在店面前,路牌上等這類地方找到它們。這種通用模型在醫(yī)療環(huán)境中也有用,比如在診斷糖尿病性視網(wǎng)膜病變時,你有一個視網(wǎng)膜的掃描圖像,你想找到該掃描圖像上的疾病指標,這時你就能用上這個模型了。用的是相同的模型結(jié)構(gòu),你只不過是在不同的數(shù)據(jù)中指出病變。你不是在用文本高亮顯示的街道視圖圖像,而是在醫(yī)生已經(jīng)圈好病變部位的視網(wǎng)膜圖像上指出它。我認為通用模型的方法能很好地解決很多不同類型的問題。
High:在3月份,你至少是看到了AlphaGo在韓國取得的首場勝利。親身見證取得如此進展感覺如何?對此次如同世界博覽會一樣的展示你有什么看法?在人工智能廣泛應用于日常生活上,這對抓住人們的想象力、激起好奇心方面又什么更廣泛的影響?
Dean:首場比賽我在現(xiàn)場,比賽日程中的一半時間我也一直在韓國。難以相信當時是多么的激動。當時,中國有3億人觀看了首場比賽直播,他們有18個頻道在播送這場比賽,每個頻道都有不同的專業(yè)評論員。韓國也有類似的興奮。就像馬戲團一樣。
我認為這種高調(diào)的事件展示了在人工智能相關(guān)的各類問題上取得的重大進展。我需要指出的是,AlphaGo的大部分工作是由DeepMind團隊在倫敦完成的。在項目的初始階段我們給了他們一些協(xié)助,他們也使用了我們的機器學習軟件訓練AlphaGo的一些模型。他們也使用了一個Tensor處理單元,這是谷歌設計的定制版機器學習硬件芯片,在某種程度上它也是這場比賽的‘秘密武器’。人們正在注意到這樣一個事實,計算機有著它們四五年前還不具備的能力,這讓人很激動。全球入學計算機科學系,學習機器學習課程的學生人數(shù)也在突飛猛漲。我認為這是一件偉大的事,它不僅影響了計算機科學,還有公司以及產(chǎn)業(yè)內(nèi)的所有事。有越多聰明的人思考這類問題,社會就會得到進步。
High:有一些人高調(diào)地發(fā)出關(guān)于人工智能安全憂慮的警告,比如ElonMusk、比爾蓋茨、霍金。你如何看待這種風險?當你繼續(xù)思考人工智能相關(guān)進程時,你如何將此考慮到你的規(guī)劃中?
Dean:我想我不太深信你提到的那些人擔心的末日情境。我不認為這會成為現(xiàn)實。我認為人工智能會導致社會變遷,這是之前難以實現(xiàn)的自動化中的大的一個方面,這關(guān)乎到大量的勞動力。這些事情中有一些將被自動化,即使可能不是完全的自動化。計算機將能夠以各種方式提供協(xié)助,比如閱讀醫(yī)療圖像數(shù)據(jù),這是一個非常狹窄卻需要高技能的領域。我認為計算機在不久之后會非常擅長做這個,更不要說是計算機做自動駕駛的能力了。我不確定政府是否正在謹慎的考慮這些技術(shù)帶來的影響,以及大體上它們對社會意味著什么。我想這才是更為急切的憂慮。確認政策制定者正在認真考慮這些問題是非常重要的一步。
- 凡本網(wǎng)注明"來源:智能制造網(wǎng)"的所有作品,版權(quán)均屬于智能制造網(wǎng),轉(zhuǎn)載請必須注明智能制造網(wǎng),http://www.caslcampaign.com。違反者本網(wǎng)將追究相關(guān)法律責任。
- 本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品來源,并自負版權(quán)等法律責任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 01日盈電子擬6373萬元收購惠昌傳感器20%
經(jīng)過數(shù)次股權(quán)調(diào)整,至2024年,日盈電子持有惠昌傳感器80%的[詳細]
- 02從美企到奇瑞,LG新能源六年8GWh訂單落
46系大圓柱是LG新能源研發(fā)的新一代圓柱形電池,包含4680、46[詳細]
- 03正式發(fā)布本土化戰(zhàn)略,英飛凌猛攻中國市
2025年6月,德國芯片企業(yè)英飛凌在進入中國市場三十周年之際[詳細]
- 04宇樹科技增資至288.9萬,增幅約11%
近日,杭州宇樹科技有限公司申請的“一種表演機器人和機器人[詳細]
- 05科德寶:再度加大投資,看好中國市場
中國新能源汽車的快速發(fā)展,以及中國車市的向上發(fā)展,使得外[詳細]
- 06海南今年度第一批先進裝備制造首臺套獎勵資金擬支持項目
經(jīng)企業(yè)申報、市縣初審推薦、實地查驗、專家評審、財務審查等[詳細]
- 07香港,內(nèi)地新能源汽車出海“橋頭堡”?
對于內(nèi)地車企來說,香港市場的重要性主要體現(xiàn)在哪?香港乘用[詳細]
- 08國軒高科又獲電池大訂單!累計容量超過
在SNEC2025的簽約儀式現(xiàn)場,20MWh儲能電池系統(tǒng)收到了多家客[詳細]
- 01工業(yè)和信息化部:到2027年突破100+關(guān)鍵計量校準技術(shù)
到2027年,制造業(yè)計量發(fā)展取得積極進展,突破100項以上關(guān)鍵[詳細]
- 02當造紙遇上智能搬運:徐工叉車如何打造
造紙作業(yè)工況復雜、作業(yè)持續(xù)時間長、強度大。徐工針對造紙工[詳細]
- 03多地政策加碼,具身智能產(chǎn)業(yè)發(fā)展進入快
截至2025年6月12日,北京、上海、江蘇、四川等多個地區(qū)已相[詳細]
- 04物聯(lián)網(wǎng)和人工智能融合塑造嵌入式系統(tǒng)的
物聯(lián)網(wǎng)包括傳感器和執(zhí)行器等設備。AI涉及編程,構(gòu)建模型以及[詳細]
- 05寧德時代換電將落地中國香港,明年年底
寧德時代、一汽紅旗與龍昇新能源聯(lián)合宣布,香港首座巧克力換[詳細]
- 06信通電子首發(fā)擬募資4.75億用于輸電線路立體化巡檢等項目
報告期內(nèi)(2022年至2024年),公司營業(yè)收入分別為7.82億元、[詳細]
- 07物聯(lián)網(wǎng):未來十年的爆發(fā)式增長與全球需
物聯(lián)網(wǎng)是指通過互聯(lián)網(wǎng)將各種設備、傳感器、系統(tǒng)等連接起來,[詳細]
- 08西門子與NVIDIA深化合作,進一步提升制
西門子與NVIDIA的合作將助力工業(yè)企業(yè)在從產(chǎn)品設計到生產(chǎn)執(zhí)行[詳細]
- 01《人臉識別技術(shù)應用安全管理辦法》正式實施
《人臉識別技術(shù)應用安全管理辦法》經(jīng)2024年9月30日國家互聯(lián)[詳細]
- 02京東集團與華潤集團簽署戰(zhàn)略合作 拓展
6月6日,京東集團與華潤集團戰(zhàn)略合作協(xié)議簽約儀式在華潤集團[詳細]
- 03BOE(京東方)越南智慧終端二期項目提前量產(chǎn)
BOE(京東方)越南智慧終端二期項目總投資20.2億元人民幣,主[詳細]
- 04機器人在智慧城市中的作用:未來趨勢
機器人在智慧城市建設中發(fā)揮著重要作用,其應用場景廣泛,包[詳細]
- 05四巨頭啟動戰(zhàn)略合作!共筑新能源產(chǎn)業(yè)鏈
儲能系統(tǒng)研發(fā)、新型電池材料應用、儲能項目商業(yè)化推廣及綠色[詳細]
- 06將物聯(lián)網(wǎng)與傳統(tǒng)設備集成:為現(xiàn)有機器進
物聯(lián)網(wǎng)與傳統(tǒng)設備的集成是未來數(shù)字化發(fā)展的重要趨勢。本文將[詳細]
- 07九聯(lián)科技:在研發(fā)新一代AI智能家庭清潔
九聯(lián)科技公開表示,將持續(xù)投入儲能產(chǎn)品和新能源系統(tǒng)開發(fā)應用[詳細]
- 082025年人工智能突破:技術(shù)創(chuàng)新躍升與應
人工智能通過深度學習、機器視覺等技術(shù),能夠?qū)ιa(chǎn)流程進行[詳細]