Arm全新Lumex CSS平臺實現兩位數性能提升
新聞重點:
● Arm Lumex CSS平臺支持實時端側AI用例,覆蓋智能助手、語音翻譯及個性化服務;依托搭載全新SME2技術的 Arm CPU,該平臺可實現高達五倍的AI性能提升。
● 開發者可借助KleidiAI調用SME2技術帶來的性能優勢;目前KleidiAI已集成至所有主流移動操作系統及AI框架中,包括PyTorch ExecuTorch、谷歌LiteRT、阿里巴巴MNN及微軟ONNX Runtime。
● 針對旗艦級設備,Arm Lumex CSS平臺創造了前所未有的成就——連續六年締造兩位數的每時鐘周期指令數 (IPC) 性能提升。
● 全新Mali G1-Ultra專為游戲玩家設計,可帶來兩倍的光線追蹤性能提升,重新定義移動娛樂體驗。
Arm 控股有限公司(以下簡稱 Arm)近日宣布推出全新 Arm? Lumex? 計算子系統 (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機及下一代個人電腦加速其人工智能 (AI) 體驗的先進計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴展 (SME2) 技術的最高性能 Arm CPU、GPU 及系統 IP,不僅能助力生態伙伴更快將 AI 設備推向市場,還可支持桌面級移動游戲、實時翻譯、智能助手及個性化應用等多樣的豐富體驗。
Arm高級副總裁兼終端事業部總經理Chris Bergey表示:“AI 已不再僅僅是一項技術功能,它已成為下一代移動與消費技術的支撐底座。依托 Arm Lumex 平臺,我們持續提升端側 AI 體驗,以滿足用戶日益增長的需求與期待。為此,我們正積極將 SME2 技術擴展至每一個 CPU 平臺。預計到 2030 年,SME 與 SME2 技術將為超過 30 億臺設備新增超 100 億TOPS 的計算能力,為端側 AI 性能帶來指數級躍升。”
合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統級芯片 (SoCs)。例如,他們可直接采用 Arm 交付的平臺,并借助為其需求定制的先進物理實現方案,從而獲得縮短產品上市時間和快速兌現性能價值等雙重優勢;或者,合作伙伴也可根據他們的目標市場,對平臺寄存器傳輸級 (RTL) 設計進行配置,并自行完成核心模塊的硬化工作。
全新 Arm Lumex 平臺包含以下核心組件:
● 新一代搭載SME2技術的Armv9.3 CPU集群:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦設備提供支持
● Arm C1-Premium:專為次旗艦市場打造,可提供一流的面積效率
● Arm Mali? G1-Ultra GPU:配備新一代光線追蹤技術,在實現先進的圖形和游戲體驗同時,還可提升整體 AI 性能
● Arm C1-DSU:Arm迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit (DSU)
● 針對三納米工藝節點優化的物理實現
● 跨軟件棧的深度集成,為使用 KleidiAI 軟件庫的開發者提供無縫的 AI 加速體驗
搭載SME2技術的CPU:助力實現全場景AI加速
搭載SME2的Arm C1 CPU集群,為實際場景中的AI驅動型任務帶來了顯著的AI性能提升,包括:
● AI性能提升高達五倍
● 語音類工作負載延遲降低4.7倍
● 音頻生成速度提升2.8倍
全新的 Arm CPU 在 AI 計算能力上的飛躍,讓實時的端側 AI 推理成為現實,為用戶在音頻生成、計算機視覺及情境助手等多種交互場景中帶來更流暢、更快速的體驗。
在實際場景中,SME2 技術將響應速度與運行效率提升至全新水平。例如,在“智能瑜伽教練”演示應用中,得益于 SME2 技術,該應用的文本轉語音生成速度提升了 2.4 倍,這意味著用戶能即時獲得姿勢反饋與指導,且全程不用擔心設備的電池續航問題。此外,通過 Arm、支付寶與 vivo 的三方合作下,將大語言模型 (LLM) 的交互響應時間縮短了多達 40%,充分證明了 SME2 可為終端設備帶來更快速的實時生成式 AI 體驗。
SME2 技術的價值不僅在于速度的提升,更在于釋放出傳統 CPU 無法企及的 AI 驅動功能。例如,在搭載 SME2 的單個核心上運行神經攝像頭降噪功能,可以在 1080P 分辨率下實現幀率超 120 幀/秒 (fps),或在 4K 分辨率下實現幀率達 30fps。這使得智能手機用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進而在日常設備上獲得更流暢的操作交互與更豐富的使用體驗。
不同于受到延遲、成本及隱私問題等挑戰的云優先 AI,Lumex 將智能引入設備端,能夠在本地實現更快、更安全且隨時可用的智能體驗。SME2 已經廣受業界領先生態伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全線產品層級賦予架構自由
Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機、PC 到新興 AI 優先設備的各類產品中,實現峰值性能、持續能效與芯片面積之間的靈活平衡。
CPU | 主要優勢 | 性能與能效提升 | 理想應用場景 |
Arm C1-Ultra | 旗艦級峰值性能 | 單線程性能提升 25%,IPC 性能同比實現兩位數增長 | 大模型推理、計算攝影、內容創作、生成 式 AI |
Arm C1-Premium | 兼具 C1-Ultra 性能且面積效率更優 | 相較于 C1-Ultra 面積縮減 35% | 次旗艦移動設備市場、語音助手、多任務處理 |
Arm C1-Pro | 持久高能效 | 持續性能提升 16% | 視頻播放、流式推理 |
Arm C1-Nano | 極致能效 | 效率提升 26%,面積更小 | 可穿戴設備、超小型設備 |
Mali GPU:實現桌面級游戲體驗和更快的AI推理
隨著搭載 Arm GPU 的芯片累計出貨量突破 120 億顆,Arm 持續穩居手游體驗領域的核心地位。全新的 Arm Mali G1-Ultra GPU 進一步突破移動游戲的性能邊界,為手游玩家帶來高保真、主機級畫質。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術,該技術顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強各類實時應用的響應速度。
在各類圖形基準測試中,Mali G1-Ultra 較前代產品實現了 20% 的性能提升,為《暗區突圍:無限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來了全面的性能增強。同時,Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設備提供了更出色的性能與能效表現。
開發者友好的端側AI解決方案
開發者可在 Arm Lumex 平臺上獲取開機即用的 AI 開發體驗。通過 KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開發者無需修改任何代碼,即可自動取得 SME2 的加速能力。
對于需要構建跨平臺應用的開發者而言,Lumex 帶來了全新的可遷移性:
● Gmail、YouTube和Google Photos等Google應用現已全面支持SME2 ,搭載Lumex的設備一經上市即可無縫運行
● 跨平臺可遷移性意味著針對安卓構建的優化功能可無縫擴展至采用Arm架構的Windows及其他操作系統
● 支付寶等合作伙伴已成功驗證:依托 SME2 技術,終端設備上的大語言模型 (LLM) 可實現高效運行。
Apple、三星和 MediaTek 等科技領軍企業,正積極集成 AI 加速功能,推動端側 AI 向更快速、更高效的方向發展。其中,Apple 正憑借該能力為“蘋果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個人助手等實時 AI 應用的響應速度與運行效率。
Arm Lumex:AI時代的平臺級智能
Arm Lumex 不僅是 Arm 面向消費計算市場的最先進 CSS 平臺,更是開啟新時代智能 AI 體驗的基石。無論是 OEM 廠商還是開發者,Lumex 均可提供所需工具,助力其在關鍵端側場景實現兼具個性化、隱私保障與高性能的 AI 體驗。作為專為 AI 時代打造平臺, Arm Lumex 將成為未來移動創新的全新起點。
合作伙伴證言:
“通過與 SME2 的深度集成,MNN 現已能在智能手機端,為通義千問等十億參數級的大模型提供低延遲的量化推理能力。這一成果充分體現了 Arm 與阿里巴巴在共同推動下一代可擴展移動 AI 技術發展中的創新實力。”
阿里巴巴淘天集團業務技術 MNN 負責人 姜霄棠
“在 Arm、支付寶與 vivo 的三方密切協作下,支付寶已在 vivo 新一代旗艦智能手機上完成了基于 Arm SME2 技術的大語言模型推理驗證。結果顯示,在預填充 (prefill) 與解碼 (decode) 階段,性能分別實現了超過 40% 和 25% 的提升。這標志著 CPU 后端能力的重大突破。我們對迄今為止所取得的成果倍感鼓舞。我們相信,隨著 xNN 的持續演進,以及與 SME2 的深度融合,支付寶有望在更多場景進一步發揮 AI的 潛能,構建更智能、更安全、更個性化的服務生態。”
支付寶終端技術負責人 翁欣旦
“得益于 SME2 技術增強的硬件,像 Gemma 3 這樣更先進的 AI 模型能夠直接在各類設備上運行。隨著 SME2 的持續擴展,移動開發者將能在整個生態系統中無縫部署新一代 AI 功能,最終讓終端用戶在他們智能手機上隨時享受低延遲的 AI 體驗。”
Google 安卓平臺杰出軟件工程師 Iliyan Malchev
“AI 正在重塑我們與設備、與周圍世界的互動方式,而 Arm 生態系統正推動該領域的關鍵技術突破。在 Meta,我們對 Arm Kleidi 與 PyTorch 框架下 ExecuTorch 工具的集成感到興奮,這一集成將讓我們的應用得以在下一代技術平臺上無縫運行,進而為終端用戶帶來體驗的顯著加速。”
Meta 人工智能合作部總監 Sy Choudhury
“在三星,我們很高興能繼續與 Arm 合作,基于 Arm Lumex CSS 平臺開發下一代旗艦移動產品。這一合作使我們能夠持續突破端側 AI 的邊界,為用戶帶來更智能、更迅捷、更高效的體驗。”
三星電子副總裁兼 SOC IP 開發團隊負責人 Nak Hee Seong
“SME2 技術通過突破關鍵性能瓶頸,高效助力大語言模型在移動端落地部署,如騰訊混元大模型,為端側大語言模型提供強勁加速,最終帶來更優質的用戶體驗。”
騰訊機器學習平臺專家 楊曉峰
評論