91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾可變顯存技術(shù)讓32GB內(nèi)存筆記本流暢運(yùn)行Qwen 30B大模型

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2025-08-14 15:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,阿里通義千問發(fā)布了兩款新版本30B(300億參數(shù))MoE大模型——Qwen3-30B-A3B-Instruct-2507 和 Qwen3-Coder-30B-A3B-Instruct。在搭載英特爾? 酷睿? Ultra 200H處理器和32GB內(nèi)存的AI PC上,英特爾可變顯存技術(shù)(Intel Variable VRAM Technology)可以將VRAM分配比例從57%提升到87%1,從而更加流暢地運(yùn)行這兩款大模型,為本地部署注入新活力的同時(shí),帶來“更聰明”的AI應(yīng)用體驗(yàn)。AI PC智能助手Flowy AI率先實(shí)現(xiàn)了這兩款模型的適配并開放下載,用戶可即刻下載體驗(yàn)。

智能內(nèi)存管理,動(dòng)態(tài)按需分配

英特爾可變顯存技術(shù)適配了 MoE 架構(gòu)模型在專家節(jié)點(diǎn)切換時(shí)的顯存波動(dòng)特點(diǎn),通過在軟件層面的調(diào)優(yōu),實(shí)現(xiàn)了突破性的高顯存分配率。該技術(shù)的核心在于其深度優(yōu)化的、基于預(yù)留內(nèi)存的動(dòng)態(tài)調(diào)度機(jī)制,它打破了傳統(tǒng)核顯顯存固定分配的限制,實(shí)現(xiàn)了VRAM(顯存)的動(dòng)態(tài)調(diào)節(jié)和高效利用。在搭載英特爾酷睿Ultra 200H處理器和32GB內(nèi)存的AI PC上,用戶只需簡(jiǎn)單操作,即可將系統(tǒng)內(nèi)存的默認(rèn)VRAM分配比例從57%提升到87%1。這意味著,一臺(tái)配備 32GB 內(nèi)存的筆記本設(shè)備,可使用的VRAM能夠從目前市面通用的18GB提升到27GB。這一顯著提升,進(jìn)一步拓寬了PC端運(yùn)行大模型的能力邊界,讓超過20B參數(shù)的大模型和復(fù)雜的AI應(yīng)用也能順暢運(yùn)行,為用戶帶來更強(qiáng)大的AI體驗(yàn)。

用戶可以在英特爾官網(wǎng)下載并安裝最新版的顯卡驅(qū)動(dòng)程序( 32.0.101.6972 或以上版本),再通過 Intel Graphics Software 控制面板自定義設(shè)定顯存比例,實(shí)現(xiàn)VRAM的動(dòng)態(tài)調(diào)節(jié)。同時(shí),該技術(shù)還針對(duì)酷睿Ultra 200H平臺(tái)的硬件特性,對(duì)預(yù)留內(nèi)存的讀寫路徑進(jìn)行了深度優(yōu)化,通過提升內(nèi)存帶寬利用率和減少數(shù)據(jù)交換延遲,確保大模型在高占比預(yù)留內(nèi)存調(diào)用時(shí)仍能保持流暢運(yùn)行。

30B參數(shù)大模型輕松“裝進(jìn)口袋”,F(xiàn)lowy率先適配

目前,英特爾生態(tài)合作伙伴 Flowy AI 已率先完成英特爾可變顯存技術(shù)的驗(yàn)證,在其 Flowy AI PC 軟件中集成了 Qwen3-30B-2507 和 Qwen3-Coder-30B 兩款模型。得益于英特爾可變顯存技術(shù),現(xiàn)在用戶僅憑一臺(tái)輕薄本,就能將 30B參數(shù)大模型 “裝進(jìn)口袋”,隨時(shí)隨地享受高效的本地 AI 服務(wù)。實(shí)際測(cè)試結(jié)果顯示,在搭載英特爾酷睿Ultra 9 285H 處理器及 32GB 內(nèi)存PC上,這兩款 30B 參數(shù)大模型均可流暢運(yùn)行,不僅支持 Q4、Q5、Q6 等更高精度的量化版本,還能實(shí)現(xiàn)毫秒級(jí)響應(yīng)的離線交互,讓用戶無需再依賴高性能獨(dú)顯或云端算力,即可實(shí)現(xiàn)隨時(shí)互聯(lián)的移動(dòng)辦公和離線創(chuàng)作等豐富應(yīng)用,以更低的成本部署成本,享受本地AI帶來的精彩體驗(yàn)。

立刻體驗(yàn):

英特爾支持可變顯存的顯卡驅(qū)動(dòng),32.0.101.6972 或以上版本:https://www.intel.cn/content/www/cn/zh/download/785597/intel-arc-iris-xe-graphics-windows.html

Flowy AI PC version:https://www.flowyaipc.com/download

注釋:

1. 數(shù)據(jù)來源于英特爾支持可變顯存的顯卡驅(qū)動(dòng)32.0.101.6972注釋https://downloadmirror.intel.com/861295/ReleaseNotes_101.6972.pdf

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10301

    瀏覽量

    180481
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5189
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    不同于HBM垂直堆疊,英特爾新型內(nèi)存ZAM技術(shù)采用交錯(cuò)互連拓?fù)浣Y(jié)構(gòu)

    不同于HBM垂直堆疊,英特爾新型內(nèi)存ZAM技術(shù)采用交錯(cuò)互連拓?fù)浣Y(jié)構(gòu) ? 據(jù)日本媒體PCWatch報(bào)道,英特爾在2026年日
    的頭像 發(fā)表于 02-11 11:31 ?698次閱讀
    不同于HBM垂直堆疊,<b class='flag-5'>英特爾</b>新型<b class='flag-5'>內(nèi)存</b>ZAM<b class='flag-5'>技術(shù)</b>采用交錯(cuò)互連拓?fù)浣Y(jié)構(gòu)

    【CIE全國RISC-V創(chuàng)新應(yīng)用大賽】基于 K1 AI CPU 的大模型部署落地

    8GB 物理內(nèi)存 (且操作系統(tǒng)還要占用約 500MB+)。 結(jié)論 :如果直接照搬官方文檔下載 Q4 模型, 100% 會(huì)因?yàn)?b class='flag-5'>內(nèi)存不足(OOM)而無法
    發(fā)表于 11-27 14:43

    顯存突破!解鎖120B MoE大模型,英特爾酷睿Ultra 285H拓展AI新應(yīng)用

    一段時(shí)間,但是我們給它帶來了全新的能力,通過軟件和配置的升級(jí),它們做到以前做不到的新的應(yīng)用場(chǎng)景。 這次重磅官宣的核心亮點(diǎn)在于,大顯存跑贏大模型??犷ltra9 285H高達(dá)128GB
    的頭像 發(fā)表于 11-23 08:00 ?9509次閱讀
    大<b class='flag-5'>顯存</b>突破!解鎖120<b class='flag-5'>B</b> MoE大<b class='flag-5'>模型</b>,<b class='flag-5'>英特爾</b>酷睿Ultra 285H拓展AI新應(yīng)用

    京東方攜手英特爾推出首款A(yù)I驅(qū)動(dòng)多頻顯示解決方案

    近日,BOE(京東方)與英特爾共同宣布,雙方將攜手推出基于人工智能技術(shù)筆記本電腦顯示屏節(jié)能解決方案。該方案融合AI多頻顯示(MFD)、1Hz超低刷新率及SmartPower HDR等多項(xiàng)創(chuàng)新
    的頭像 發(fā)表于 11-11 10:13 ?3927次閱讀

    發(fā)力圖形工作站和AI推理市場(chǎng),英特爾顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢(shì)?在支持AI推理工作站和大模型部署上,
    的頭像 發(fā)表于 10-22 13:40 ?1.1w次閱讀
    發(fā)力圖形工作站和AI推理市場(chǎng),<b class='flag-5'>英特爾</b>大<b class='flag-5'>顯存</b>GPU亮相灣芯展

    基于米爾瑞芯微RK3576開發(fā)板的Qwen2-VL-3B模型NPU多模態(tài)部署評(píng)測(cè)

    ,RKLLM 通過量化優(yōu)化、多模態(tài)支持等降低模型內(nèi)存占用與推理延遲。實(shí)測(cè)中,RK3576 運(yùn)行 Qwen2-VL-3B 模型時(shí),純文字交互
    發(fā)表于 08-29 18:08

    阿里通義千問發(fā)布小尺寸模型Qwen3-4B,手機(jī)也能跑

    Qwen3-30B-A3B(thinking)。官方表示,2507版Qwen3-4B模型對(duì)手機(jī)等端側(cè)硬件部署尤為友好。 ? ? 隨著AI技術(shù)
    的頭像 發(fā)表于 08-12 17:15 ?6721次閱讀
    阿里通義千問發(fā)布小尺寸<b class='flag-5'>模型</b><b class='flag-5'>Qwen3-4B</b>,手機(jī)也能跑

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺(tái)上完成針對(duì)該模型
    的頭像 發(fā)表于 08-07 14:42 ?1372次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時(shí)出現(xiàn)錯(cuò)誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應(yīng)用程序 使用英特爾? NPU 插件運(yùn)行了 C++ 應(yīng)用程序 遇到的錯(cuò)誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動(dòng)的“實(shí)時(shí)響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計(jì)算事
    的頭像 發(fā)表于 06-20 17:32 ?897次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro <b class='flag-5'>B</b>系列,邊緣AI的“智能引擎”

    Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署

    本文將以 Qwen3-8B 為例,介紹如何利用 OpenVINO 的 Python API 在英特爾平臺(tái)(GPU, NPU)Qwen3 系列模型
    的頭像 發(fā)表于 05-11 11:36 ?1721次閱讀
    Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 <b class='flag-5'>Qwen</b>3 快速部署

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源模型系列包含兩款混合專家模型 (MoE
    的頭像 發(fā)表于 05-08 11:45 ?2999次閱讀
    NVIDIA使用<b class='flag-5'>Qwen</b>3系列<b class='flag-5'>模型</b>的最佳實(shí)踐

    壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持

    Qwen3部署成本大幅下降 Qwen3包括兩款混合專家(MoE)模型Qwen3-235B-A22BQwen3-30B-A3B;同時(shí)還包括
    的頭像 發(fā)表于 04-30 15:19 ?1593次閱讀

    筆記本聲音問題

    各位大佬,我來求助一下:我的筆記本電腦,win10系統(tǒng),之前的聲卡就是英特爾智音技術(shù),但是因?yàn)榇嬖谕桃舻膯栴},我更新了兩次,結(jié)果現(xiàn)在外放沒聲音了,插入耳機(jī)不識(shí)別耳機(jī)但是外放有聲音,連接藍(lán)牙藍(lán)牙聲音正常。我嘗試過更新驅(qū)動(dòng),也沒用。
    發(fā)表于 04-22 11:38

    利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL系列模型

    近期阿里通義實(shí)驗(yàn)室在 Hugging Face 和 ModelScope 上開源了 Qwen2.5-VL 的 Base 和 Instruct 模型,包含 3B、7B 和 72
    的頭像 發(fā)表于 03-12 13:42 ?2612次閱讀
    利用<b class='flag-5'>英特爾</b>OpenVINO在本地<b class='flag-5'>運(yùn)行</b><b class='flag-5'>Qwen</b>2.5-VL系列<b class='flag-5'>模型</b>