阿里巴巴達摩院公布M6最新進展參數已從萬億躍遷至10萬億

發布時間：2021-11-09 09:49:42來源：驅動之家

　　在人工智能前沿領域，中國 AI 實現突破。

　　11 月 8 日，阿里巴巴達摩院公布多模態大模型 M6 最新進展，其參數已從萬億躍遷至 10 萬億，規模遠超谷歌、微軟此前發布的萬億級模型，成為全球最大的 AI 預訓練模型。

　　同時，M6 做到了業內極致的低碳高效，使用 512 GPU 在 10 天內即訓練出具有可用水平的 10 萬億模型。

　　相比去年發布的大模型 GPT-3，M6 實現同等參數規模，能耗僅為其1%。

　　M6 是達摩院研發的通用性人工智能大模型，擁有多模態、多任務能力，其認知和創造能力超越傳統 AI，尤其擅長設計、寫作、問答，在電商、制造業、文學藝術、科學研究等領域有廣泛應用前景。

　　與傳統 AI 相比，大模型擁有成百上千倍“神經元”數量，且預先學習過海量知識，表現出像人類一樣“舉一反三”的學習能力。

　　因此，大模型被普遍認為是未來的“基礎模型”，將成下一代 AI 基礎設施。然而，其算力成本相當高昂，訓練 1750 億參數語言大模型 GPT-3 所需能耗，相當于汽車行駛地月往返距離。

　　今年 5 月，通過專家并行策略及優化技術，達摩院 M6 團隊將萬億模型能耗降低超八成、效率提升近 11 倍。

　　10 月，M6 再次突破業界極限，通過更細粒度的 CPU offload、共享-解除算法等創新技術，讓收斂效率進一步提升 7 倍，這使得模型規模擴大 10 倍的情況下，能耗未顯著增加。

　　這一系列突破極大降低了大模型研究門檻，讓一臺機器訓練出一個千億模型成為可能。

　　同時，達摩院聯合阿里云推出了 M6 服務化平臺，為大模型訓練及應用提供完備工具，首次讓大模型實現“開箱即用”，算法人員及普通用戶均可方便地使用平臺。

　　達摩院還推出了當前最大規模的中文多模態評測數據集 MUGE，覆蓋圖文描述、文本生成圖像、跨模態檢索任務，填補了缺少中文多模態權威評測基準的空白。

　　作為國內首個商業化落地的多模態大模型，M6 已在超 40 個場景中應用，日調用量上億。

　　今年，大模型首次支持雙 11。M6 在犀牛智造為品牌設計的服飾已在淘寶上線;憑借流暢的寫作能力，M6 正為天貓虛擬主播創作劇本;依靠多模態理解能力，M6 正在增進淘寶、支付寶等平臺的搜索及內容認知精度。

M6 生成的未來感汽車圖

　　達摩院智能計算實驗室負責人周靖人表示，“接下來，我們將深入研究大腦認知機理，致力于將 M6 的認知力提升至接近人類的水平，比如，通過模擬人類跨模態的知識抽取和理解方式，構建通用的人工智能算法底層框架;另一方面，不斷增強 M6 在不同場景中的創造力，產生出色的應用價值。”

　　據了解，達摩院語言大模型 PLUG 近期也已升級至 2 萬億參數，成為全球最大中文語言模型，其所屬 AliceMind 語言模型體系同樣推出了服務化平臺。
　　（邯鄲網站建設）

熱點推薦

日韩欧美中国a v-日韩欧美在线综合网高清-日韩欧美在线中文字幕-日韩欧美在线视频观看-国产人妖系列在线精品-国产人妖视频一区在线观看