免费看aⅴ,天天插天天干天天射,呦女网,入逼逼

正在閱讀:512顆GPU、10萬億參數(shù)!阿里達(dá)摩院發(fā)布全球最大AI預(yù)訓(xùn)練模型

512顆GPU、10萬億參數(shù)!阿里達(dá)摩院發(fā)布全球最大AI預(yù)訓(xùn)練模型

2021-11-09 09:13:35來源:快科技 關(guān)鍵詞:人工智能閱讀量:22340

導(dǎo)讀:11月8日,阿里巴巴達(dá)摩院公布了多模態(tài)大模型“M6”的最新進(jìn)展,其參數(shù)已從萬億躍遷至10萬億,成為全球最大的AI預(yù)訓(xùn)練模型。
  11月8日,阿里巴巴達(dá)摩院公布了多模態(tài)大模型“M6”的最新進(jìn)展,其參數(shù)已從萬億躍遷至10萬億,成為全球最大的AI預(yù)訓(xùn)練模型。
 
  作為通用性AI大模型,M6擁有多模態(tài)、多任務(wù)能力,尤其擅長設(shè)計(jì)、寫作、問答,在電商、制造業(yè)、文學(xué)藝術(shù)、科學(xué)研究等領(lǐng)域有廣泛應(yīng)用前景。
 
  與傳統(tǒng)AI相比,大模型擁有成百上千倍“神經(jīng)元”數(shù)量,認(rèn)知和創(chuàng)造能力也更勝一籌,被普遍認(rèn)為是未來的“基礎(chǔ)模型”。
 
  但是,大模型的算力成本相當(dāng)高昂,比如訓(xùn)練1750億參數(shù)語言大模型GPT-3所需能耗,能讓一輛汽車在地月之間往返一趟。
 
  今年5月,通過專家并行策略及優(yōu)化技術(shù),達(dá)摩院M6團(tuán)隊(duì)將萬億模型能耗降低超過80%,效率提升近11倍。
 
  10月,M6再次突破業(yè)界極限,使用512顆GPU,在10天內(nèi)就訓(xùn)練出了具有可用水平的10萬億模型,相比去年發(fā)布的大模型GPT-3,M6實(shí)現(xiàn)了同等參數(shù)規(guī)模,能耗卻只有1%。
 
  另一方面,AI大模型擴(kuò)展到千億及以上參數(shù)的超大規(guī)模時,很難放在一臺機(jī)器上,為此達(dá)摩院在阿里云PAI自研Whale框架上搭建了MoE模型,并通過更細(xì)粒度的CPU offload技術(shù),最終實(shí)現(xiàn)將10萬億參數(shù)放進(jìn)512張GPU:
 
  自研Whale框架:
 
  自研Whale分布式深度學(xué)習(xí)訓(xùn)練框架,針對數(shù)據(jù)并行、模型并行、流水并行、混合并行等多種并行模型進(jìn)行了統(tǒng)一架構(gòu)設(shè)計(jì),讓用戶在僅僅添加幾行API調(diào)用的情況下就可以實(shí)現(xiàn)豐富的分布式并行策略。
 
  MoE專家并行策略:
 
  在Whale架構(gòu)中實(shí)現(xiàn)Mixture-of-Experts(MoE)專家并行策略,在擴(kuò)展模型容量、提升模型效果的基礎(chǔ)上,不顯著增加運(yùn)算FLOPs(每秒所執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)),從而實(shí)現(xiàn)高效訓(xùn)練大規(guī)模模型的目的。
 
  CPU offload創(chuàng)新技術(shù):
 
  在自研的分布式框架Whale中通過更細(xì)粒度的CPU offload,解決了有限資源放下極限規(guī)模的難題,并通過靈活地選擇offload的模型層,進(jìn)一步地提高GPU利用率。
 
  此外,針對訓(xùn)練效率問題,M6團(tuán)隊(duì)設(shè)計(jì)了Pseudo-to-Real(共享解除)機(jī)制,即利用訓(xùn)練好的共享參數(shù)模型初始化大模型,讓收斂效率進(jìn)一步提升7倍,解決大模型訓(xùn)練速度慢的問題。
 
  對比不使用該機(jī)制,預(yù)訓(xùn)練達(dá)到同樣loss用時僅需6%;和此前萬億模型相比,訓(xùn)練樣本量僅需40%。
 
  作為國內(nèi)首個商業(yè)化落地的多模態(tài)大模型,M6已在超40個場景中應(yīng)用,日調(diào)用量上億。
 
  今年,大模型首次支持雙11,應(yīng)用包括但不限于:
 
  - M6在犀牛智造為品牌設(shè)計(jì)的服飾已在淘寶上線;
 
  - 憑借流暢的寫作能力,M6正為天貓?zhí)摂M主播創(chuàng)作劇本;
 
  - 依靠多模態(tài)理解能力,M6正在增進(jìn)淘寶、支付寶等平臺的搜索及內(nèi)容認(rèn)知精度。
 
  未來,M6將積極探索與科學(xué)應(yīng)用的結(jié)合,通過AI for science讓大模型的潛力充分發(fā)揮,并加強(qiáng)M6與國產(chǎn)芯片的軟硬一體化研究。
 
  目前,達(dá)摩院聯(lián)合阿里云已推出M6服務(wù)化平臺,為大模型訓(xùn)練及應(yīng)用提供完備工具,首次讓大模型實(shí)現(xiàn)“開箱即用”,算法人員及普通用戶均可方便地使用平臺。
我要評論
文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)。

  • 物聯(lián)網(wǎng)和人工智能融合塑造嵌入式系統(tǒng)的未來

    物聯(lián)網(wǎng)包括傳感器和執(zhí)行器等設(shè)備。 AI涉及編程,構(gòu)建模型以及使用其他各種算法。兩者單獨(dú)都有其局限性。將這兩個集成到一個系統(tǒng)中肯定會帶來巨大的結(jié)果。
    物聯(lián)網(wǎng)人工智能嵌入式系統(tǒng)
    2025-06-16 09:37:53
  • 多地政策加碼,具身智能產(chǎn)業(yè)發(fā)展進(jìn)入快車道

    截至2025年6月12日,北京、上海、江蘇、四川等多個地區(qū)已相繼出臺專項(xiàng)政策,形成覆蓋技術(shù)研發(fā)、場景開放、生態(tài)建設(shè)的系統(tǒng)性產(chǎn)業(yè)支持體系。
    具身智能人工智能
    2025-06-16 10:36:20
  • 人工智能如何重塑交通運(yùn)輸:從交通管理到自動駕駛的七大變革

    隨著城市規(guī)模的不斷擴(kuò)大和人們出行需求的日益增加,智能交通系統(tǒng)的重要性愈發(fā)凸顯。未來,隨著人工智能技術(shù)在預(yù)測交通需求、優(yōu)化路線規(guī)劃和保障行車安全等方面的應(yīng)用不斷深化,道路將不再僅僅是車輛通行的場所,而是一個充滿智慧的交通生態(tài)系統(tǒng)。
    人工智能智能交通自動駕駛
    2025-06-13 10:00:36
  • 人工智能或是人類社會最后一次技術(shù)革命,中國優(yōu)勢凸顯

    目前,中國在5G、云計(jì)算等基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)先地位,也為人工智能(AI)發(fā)展提供了堅(jiān)實(shí)基礎(chǔ)。未來,我們需要保持開放合作的態(tài)度,加強(qiáng)基礎(chǔ)研究,同時注重倫理規(guī)范,讓人工智能(AI)真正造福全人類。
    華為人工智能5G
    2025-06-11 16:41:35
  • 第6屆電力人工智能大會暨第4屆電力行業(yè)數(shù)字化轉(zhuǎn)型大會將于10月盛大啟幕!

    第6屆電力人工智能大會暨第4屆電力行業(yè)數(shù)字化轉(zhuǎn)型大會將于2025年10月30-31日在青島召開。
    電力人工智能數(shù)字化轉(zhuǎn)型
    2025-06-11 13:25:16
  • 如何利用人工智能為企業(yè)提供更智能的決策?

    隨著人工智能技術(shù)的不斷發(fā)展與創(chuàng)新,決策智能的未來發(fā)展前景令人矚目。人工智能作為決策智能的核心驅(qū)動力,正以其強(qiáng)大的數(shù)據(jù)分析能力、精準(zhǔn)的預(yù)測性能以及高效決策支持為企業(yè)帶來前所未有的機(jī)遇。
    人工智能決策智能
    2025-06-11 10:07:46
版權(quán)與免責(zé)聲明:

凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)或和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業(yè)資訊?

訂閱 智能制造網(wǎng)APP

一鍵篩選來訂閱

信息更豐富

推薦產(chǎn)品/PRODUCT 更多
智造商城:

PLC工控機(jī)嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機(jī)械包裝機(jī)械工程機(jī)械倉儲物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機(jī)器人3D打印設(shè)備生物識別傳感器電機(jī)電線電纜輸配電設(shè)備電子元器件更多

我要投稿
  • 投稿請發(fā)送郵件至:(郵件標(biāo)題請備注“投稿”)1271141964.qq.com
  • 聯(lián)系電話0571-89719789
工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺
智能制造網(wǎng)APP

功能豐富 實(shí)時交流

智能制造網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號

關(guān)注我們

抖音

智能制造網(wǎng)

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網(wǎng)

公眾號:智能制造網(wǎng)

打開微信掃碼關(guān)注視頻號

快手

智能制造網(wǎng)

快手ID:gkzhan2006

打開快手 掃一掃關(guān)注
意見反饋
我要投稿
我知道了