<li id="00i08"><input id="00i08"></input></li>

<sup id="00i08"><tbody id="00i08"></tbody></sup>

<abbr id="00i08"></abbr>

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > 英偉達推出開源推理軟件Dynamo 為AI工廠降本增效

英偉達推出開源推理軟件Dynamo 為AI工廠降本增效

作者：時間：2025-03-19 來源：網易科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

3月19日消息，英偉達在2025GTC大會上推出了開源 推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

據介紹，NVIDIA Dynamo 是一款全新的 AI 推理服務軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協調并加速數千個 GPU 之間的推理通信，并使用分離服務將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優化，并確保更大程度地利用 GPU 資源。

“全世界各行業都在訓練 AI 模型以不同的方式進行思考和學習，從而使模型復雜度持續升級。”NVIDIA 創始人兼首席執行官黃仁勛表示，“為了實現自定義推理 AI 的未來，NVIDIA Dynamo 可以在這些模型上進行規模化部署，從而為 AI 工廠實現降本增效”。

在 GPU 數量相同的情況下，Dynamo 可將 NVIDIA Hopper? 平臺上運行 Llama 模型的 AI 工廠性能和收益翻倍。在由 GB200 NVL72機架組成的大型集群上運行 DeepSeek-R1模型時，NVIDIA Dynamo 的智能推理優化也可將每個 GPU 生成的 token 數量提高30倍以上。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT?-LLM 和 vLLM，使企業、初創公司和研究人員能夠開發和優化在分離推理時部署 AI 模型的方法。

這將使用戶加速采用 AI 推理，包括亞馬遜云科技、Cohere、CoreWeave、戴爾科技、Fireworks、谷歌云、Lambda、Meta、微軟 Azure、Nebius、NetApp、OCI、Perplexity、Together AI 和 VAST。

關鍵詞： 英偉達 開源 推理軟件 Dynamo AI工廠 NVIDIA Dynamo GTC

評論

相關推薦

英偉達新款中國特供芯片B30A曝光：性能或達H20六倍

智能計算英偉達 B30A H20 | 2025-09-05

NVIDIA發布超級手機基于Tegra平臺

視頻 NVIDIA 手機 | 2011-01-20

告別銅纜，英偉達CPO光互連明年落地

智能計算英偉達 | 2025-09-08

美國或將再立AI GAIN法案，要求本國AI芯片制造商向海外供貨前先滿足國內需求

AI 芯片英偉達 | 2025-09-11

開源1000款嵌入開發板資料光盤免費下載地址---非常難得

資源下載開源嵌入光盤免費下載地址 | 2013-10-03

一個自己制作u盤的開源項目 - www.lumit.org

lumit | 2004-08-27

大嘴業話——英偉達宣布進軍CPU市場

視頻英偉達 AI CPU | 2023-11-10

阿里巴巴測試新的人工智能芯片以替代英偉達

智能計算阿里巴巴人工智能芯片英偉達 | 2025-09-02

開源的 JAIN-SLEE SIP 軟交換 -- Mobic...

資源下載開源 JAIN-SLEE 軟交 Mobicents | 2013-09-18

大嘴業話——ARM再次上市，究竟7年時間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

ARM.新聞稿

資源下載 Zilog ARM 32位微控制器嵌入式 MCU SoC Cortex-M3 多核處理器消費電子 Mali-400 MP NVIDIA Tegra 高度優化下一代機頂盒納米片上系統 | 2009-04-12

一個自己制作u盤的開源項目 - www.lumit.org

lumit | 2004-08-27

Nvidia MCP55P Desige guide

資源下載 Nvidia MCP55P Desige guide | 2013-09-18

NVIDIA再掀AI散熱革命！散熱大廠送樣微通道蓋4Q開獎

網絡與存儲 NVIDIA AI散熱 | 2025-09-14

[開源] UML State machine Wizard 6.1

stan2005 | 2005-08-14

開源小四軸資料.zip

資源下載開源四軸資料 | 2013-09-23

NVIDIA獲ARM授權，為圖形處理器增添應用處理功能

xiaosongs | 2005-10-19

2005中國軟件技術大會

麥莎就是我 | 2005-11-18

集成QNX OS for Safety的NVIDIA DRIVE AGX Thor開發套件現已全面上市

汽車電子 QNX NVIDIA DRIVE AGX Thor BlackBerry | 2025-09-05

超過50%的英偉達數據中心收入來自三家客戶

智能計算英偉達數據中心 | 2025-09-01

英偉達表示，盡管詹森在財報電話會議中暗示了相反的情況，但它的 H100/H200 GPU 并沒有售罄

智能計算 GPU 英偉達 H200 | 2025-09-04

大嘴業話——ARM再次上市，究竟7年時間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

Arm與NVIDIA攜手驅動智能汽車及機器人領域創新

汽車電子 Arm NVIDIA 智能汽車機器人 | 2025-09-02

Nvidia DRIVE AGX Xavier上的ADI成像雷達

視頻 ADI Nvidia DRIVE AGX | 2020-06-12

臺積電否認英偉達CEO8月訪問是為了傳遞特朗普信息

智能計算臺積電英偉達 | 2025-09-03

焦點

推薦視頻

技術專區

關閉

主站蜘蛛池模板：济阳县| 克东县| 红安县| 龙泉市| 定远县| 平顺县| 永定县| 宜君县| 马边| 东至县| 滕州市| 贵港市| 韶山市| 伊吾县| 桐庐县| 曲沃县| 武邑县| 甘孜| 星子县| 巴青县| 濉溪县| 浦北县| 湘乡市| 梁平县| 韩城市| 宁城县| 金华市| 垦利县| 济源市| 都江堰市| 璧山县| 东安县| 禄丰县| 岳西县| 阜新| 遂川县| 青铜峡市| 江山市| 商城县| 石柱| 泾川县|