英特爾可變顯存技術讓32GB內存筆記本流暢運行Qwen 30B參數大模型
近日,阿里通義千問發布了兩款新版本30B(300億參數)MoE大模型——Qwen3-30B-A3B-Instruct-2507 和 Qwen3-Coder-30B-A3B-Instruct。在搭載英特爾? 酷睿? Ultra 200H處理器和32GB內存的AI PC上,英特爾可變顯存技術(Intel Variable VRAM Technology)可以將VRAM分配比例從57%提升到87%1,從而更加流暢地運行這兩款大模型,為本地部署注入新活力的同時,帶來“更聰明”的AI應用體驗。AI PC智能助手Flowy AI率先實現了這兩款模型的適配并開放下載,用戶可即刻下載體驗。
智能內存管理,動態按需分配
英特爾可變顯存技術適配了 MoE 架構模型在專家節點切換時的顯存波動特點,通過在軟件層面的調優,實現了突破性的高顯存分配率。該技術的核心在于其深度優化的、基于預留內存的動態調度機制,它打破了傳統核顯顯存固定分配的限制,實現了VRAM(顯存)的動態調節和高效利用。在搭載英特爾酷睿Ultra 200H處理器和32GB內存的AI PC上,用戶只需簡單操作,即可將系統內存的默認VRAM分配比例從57%提升到87%1。這意味著,一臺配備 32GB 內存的筆記本設備,可使用的VRAM能夠從目前市面通用的18GB提升到27GB。這一顯著提升,進一步拓寬了PC端運行大模型的能力邊界,讓超過20B參數的大模型和復雜的AI應用也能順暢運行,為用戶帶來更強大的AI體驗。
用戶可以在英特爾官網下載并安裝最新版的顯卡驅動程序( 32.0.101.6972 或以上版本),再通過 Intel Graphics Software 控制面板自定義設定顯存比例,實現VRAM的動態調節。同時,該技術還針對酷睿Ultra 200H平臺的硬件特性,對預留內存的讀寫路徑進行了深度優化,通過提升內存帶寬利用率和減少數據交換延遲,確保大模型在高占比預留內存調用時仍能保持流暢運行。
30B參數大模型輕松“裝進口袋”,Flowy率先適配
目前,英特爾生態合作伙伴 Flowy AI 已率先完成英特爾可變顯存技術的驗證,在其 Flowy AI PC 軟件中集成了 Qwen3-30B-2507 和 Qwen3-Coder-30B 兩款模型。得益于英特爾可變顯存技術,現在用戶僅憑一臺輕薄本,就能將 30B參數大模型 “裝進口袋”,隨時隨地享受高效的本地 AI 服務。實際測試結果顯示,在搭載英特爾酷睿Ultra 9 285H 處理器及 32GB 內存PC上,這兩款 30B 參數大模型均可流暢運行,不僅支持 Q4、Q5、Q6 等更高精度的量化版本,還能實現毫秒級響應的離線交互,讓用戶無需再依賴高性能獨顯或云端算力,即可實現隨時互聯的移動辦公和離線創作等豐富應用,以更低的成本部署成本,享受本地AI帶來的精彩體驗。
注釋:
1. 數據來源于英特爾支持可變顯存的顯卡驅動32.0.101.6972注釋https://downloadmirror.intel.com/861295/ReleaseNotes_101.6972.pdf
評論