7月27日的世界人工智能大會(WAIC)上,燧原科技和沐曦這兩家頭部國產AI芯片廠商首發各自新一代的主力AI芯片。
燧原科技新發布的L600芯片歷時兩年半開發,采用訓推一體的架構,亦即可用于大模型訓練和推理。L600配備144GB的存儲容量,存儲帶寬為3.6TB/s,支持DeepSeek模型在訓練過程中使用的FP8(8位浮點數)低精度——低精度可提升訓練速度和降低計算成本。
L600是燧原科技第四代芯片,上一代產品為2024年6月量產的S60推理芯片,面向大語言模型、多模態大模型、搜索廣告推薦、傳統AI模型等場景。在S60的基礎上,燧原科技還推出DeepSeek一體機,可運行滿血版、蒸餾版不同尺寸的模型。
南都記者了解到,S60芯片目前已出貨7萬顆,在國產卡落地規模上進入前列,且覆蓋到國內五大智算集群。其中,2024年12月,燧原科技在甘肅慶陽建成萬卡推理集群,使用了10016張S60算力卡。
燧原科技創始人兼首席運營官張亞林介紹,公司的算力已支持騰訊諸多的互聯網應用場景,并通過智算集群支撐騰訊產業生態客戶的業務拓展。
天眼查顯示,騰訊自2018年以來參與了燧原科技6輪融資,是其重要產業投資方。
WAIC2025的燧原科技展廳。圖:楊柳
沐曦新推出的曦云C600延續了訓推一體的方案,具備多精度的混合算力,同樣支持FP8精度。C600采用HBM3e顯存(第五代高帶寬內存),數據存儲容量從上一代C500的64GB提升至144GB。值得一提的是,HBM3e是當前市場上較先進的高帶寬內存產品,僅次于最新的HBM4,英偉達旗下H100等芯片也搭載HBM3e。
沐曦聯合創始人、首席技術官彭莉稱,曦云C600實現芯片研發制造全技術流程的國產自主可控。但她同時表示:“如何打造基于國產供應鏈的可持續供給,是公司面臨的挑戰。”
招股書顯示,C600項目于2024年2月立項,投資總額約13.7億元。2024年10月,C600交付流片(芯片設計完成后、規模化制造前的關鍵環節),并于2025年5月完成回片,預計今年第四季度小批次量產。2025年4月,沐曦已啟動了下一代的C700系列研發,投資總額約20.4億元,預計2026年第二季度開始進入流片測試階段。
WAIC2025沐曦展廳內展示的曦云C600 GPU芯片。圖:楊柳
目前,沐曦的產品結構涵蓋三大類別:訓推一體的曦云C系列、面向傳統人工智能場景的推理GPU曦思N系列、用于圖形渲染的曦彩G系列。曦云C系列是其中的主力產品。根據沐曦的招股書,2024年度和2025年前三月,曦云的C500芯片的收入占比分別高達97.28%和 97.87%。南都記者了解到,沐曦正在基于C500系列建設萬卡集群。
招股書顯示,截至今年3月,沐曦的GPU產品累計銷量超過2.5萬顆。上海證券交易所官網顯示,沐曦的IPO進程已于7月19日進入受理后的問詢階段。
采寫:南都N視頻記者 楊柳 王子黎 樊文揚 發自上海