91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm率先適配騰訊混元HY-1.8B-2Bit模型

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-02-10 17:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能 (AI) 加速向智能手機、PC 與物聯(lián)網(wǎng)終端等滲透,如何在邊緣設(shè)備上實現(xiàn)高性能、低功耗的智能體驗,已成為行業(yè)共同關(guān)注的核心議題。

騰訊混元今日發(fā)布了 HY-1.8B-2Bit,這是一款等效參數(shù)量僅有 0.3B 的極低比特壓縮模型,有助于移動設(shè)備廠商和開發(fā)者加速實現(xiàn)生成式 AI 的創(chuàng)新落地。作為全球應(yīng)用最為廣泛的高性能、高能效計算平臺,Arm 率先完成了對該模型的成功適配。HY-1.8B-2Bit 現(xiàn)已能夠在搭載啟用第二代可伸縮矩陣擴展 (SME2) 技術(shù)的 Armv9 計算平臺的移動設(shè)備上實現(xiàn)高效運行。

在資源受限的邊緣設(shè)備上部署與運行生成式 AI,普遍面臨性能、能效、內(nèi)存等諸多挑戰(zhàn)。通過有效縮減模型規(guī)模,是將生成式 AI 用例拓展至更廣泛設(shè)備的行之有效的方法之一。規(guī)模更小的模型在與原始模型保持相近推理精度的前提下,能在端側(cè)實現(xiàn)更出色的性能表現(xiàn)與能效水平,進而在兼顧設(shè)備續(xù)航表現(xiàn)的同時,為用戶帶來響應(yīng)更迅捷、運行更流暢的端側(cè) AI 體驗。

騰訊混元此次推出的 HY-1.8B-2Bit 通過對 HY?1.8B?Instruct 模型進行 2 比特量化感知訓(xùn)練 (QAT) 產(chǎn)出,對比原始精度模型等效參數(shù)量降低了 6 倍,可以在邊緣設(shè)備上靈活部署,并保持了與 INT4-PTQ 方法相當?shù)哪P托阅?。同時,該模型沿用了 HY-1.8B-Instruct 的全思考能力,用戶可以根據(jù)其應(yīng)用的復(fù)雜性和資源限制,靈活地選擇推理模式。得益于上述優(yōu)勢,HY-1.8B-2Bit 在實時性要求高、資源受限的場景中依然能夠提供快速且可靠的推理表現(xiàn)。

而在此基礎(chǔ)上,Arm SME2 技術(shù)使得移動端開發(fā)者能更輕松獲取端側(cè) AI 加速功能。SME2 是 Armv9 架構(gòu)中的高級 CPU 指令,能夠在 AI 異構(gòu)計算框架下,高效支持各類實時移動端推理任務(wù)。實際測試結(jié)果顯示,HY-1.8B-2Bit 運行在啟用 SME2 技術(shù)的移動設(shè)備上時,對比 HY-1.8B-Q4 模型,在不同窗口大小下的首詞元延遲 (TTFT) 和生成速度均實現(xiàn)了顯著提升。這將有助于在資源受限的場景中,實現(xiàn)更卓越、流暢、智能的使用體驗。例如,通用聊天機器人和 AI 助手能夠在端側(cè)實現(xiàn)更復(fù)雜、自然的語言處理能力。與此同時,SME2 已被集成至多個主流框架中,深度嵌入軟件棧。開發(fā)者可通過 llama.cpp 直接在啟用 SME2 技術(shù)的硬件上部署 HY-1.8B-2Bit 模型,加速實現(xiàn)生成式 AI 應(yīng)用的性能躍升。

模型地址:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit

https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF

各位開發(fā)者們,也可點擊閱讀原文,跳轉(zhuǎn)模型地址,了解更多關(guān)于 HY-1.8B-2Bit 的信息及如何部署!

SME2 技術(shù)已獲得業(yè)界領(lǐng)先生態(tài)伙伴的廣泛采用與認可。vivo、OPPO 等手機廠商已推出集成啟用 SME2 的 Arm C1 CPU 與 Mali G1-Ultra GPU 的旗艦智能手機,為端側(cè) AI 帶來了實際的體驗提升;此外,SME2 也已在 iOS 中大幅啟用。而開發(fā)者們正借助 SME2 技術(shù),加速語言模型推理、圖像處理、音頻生成等核心能力,為各類主流應(yīng)用打造出更迅捷的實時體驗。與此同時,Arm 也正積極將 SME2 技術(shù)擴展至更廣泛的 CPU 平臺。預(yù)計到 2030 年,SME 與 SME2 技術(shù)將為超過 30 億臺設(shè)備新增超 100 億 TOPS 的計算能力,持續(xù)降低端側(cè) AI 的部署成本與隱私風(fēng)險。

Arm 與騰訊混元持續(xù)依托技術(shù)創(chuàng)新,攜手推動端側(cè)應(yīng)用功能與用戶體驗的優(yōu)化升級,助力本土開發(fā)者更高效、順暢地開展端側(cè) AI 創(chuàng)新開發(fā)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9552

    瀏覽量

    391836
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1684

    瀏覽量

    50908
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52099

原文標題:SME2 技術(shù)加持,Arm 率先適配騰訊混元 HY-1.8B-2Bit 模型,為端側(cè) AI 帶來卓越體驗

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    燧原科技訓(xùn)推一體芯片L600適配階躍星辰基座模型Step 3.5 Flash

    ”的 Agent 底層模型選項,從而真正融入日常開發(fā)。燧原科技的新一代訓(xùn)推一體芯片L600已率先完成適配,成為國內(nèi)首批適配模型的國產(chǎn)算力。
    的頭像 發(fā)表于 02-02 17:50 ?1254次閱讀
    燧原科技訓(xùn)推一體芯片L600<b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊圖像3.0圖生圖模型

    近日,騰訊團隊宣布開源圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 2
    的頭像 發(fā)表于 02-02 14:43 ?369次閱讀

    沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊開源翻譯模型1.5版本

    12月30日,騰訊宣布推出并開源翻譯模型1.5,共包含兩個模型:Tencent-HY-MT1.5-1
    的頭像 發(fā)表于 01-06 14:13 ?369次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    壁仞科技壁礪166M產(chǎn)品適配騰訊開源翻譯模型1.5版本

    中文、英語、日語等常見語種,也包含捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。目前兩個模型均已在騰訊官網(wǎng)上線,在Github和Huggingface等開源社區(qū)也可直接下載使用。壁
    的頭像 發(fā)表于 01-05 15:39 ?298次閱讀
    壁仞科技壁礪166M產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    愛芯智邊緣AI芯片AX8850完成CosyVoice2模型適配

    今年下半年,隨著業(yè)務(wù)推廣需求增加,我們的大模型適配工作也有了新方向:不再只追求前沿模型的快速適配,而是更聚焦為銷售團隊提供“能打”的實戰(zhàn)“彈藥”——也就是貼近客戶剛需的、可快速落地的大
    的頭像 發(fā)表于 12-11 10:35 ?5233次閱讀
    愛芯<b class='flag-5'>元</b>智邊緣AI芯片AX8850完成CosyVoice<b class='flag-5'>2</b>大<b class='flag-5'>模型</b><b class='flag-5'>適配</b>

    騰訊地圖推出全新時空智能開放平臺“蓋亞”

    )。 該平臺基于騰訊位置服務(wù)開放平臺與位置大數(shù)據(jù)平臺的底層能力,深度融合騰訊模型與時空動態(tài)大模型
    的頭像 發(fā)表于 09-18 10:26 ?2023次閱讀

    Arm率先適配騰訊開源模型,助力端側(cè)AI創(chuàng)新開發(fā)

    本周初,騰訊宣布開源四款小尺寸模型(參數(shù)分別為 0.5B、1.8B、4
    的頭像 發(fā)表于 08-08 09:16 ?1384次閱讀
    <b class='flag-5'>Arm</b><b class='flag-5'>率先</b><b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源<b class='flag-5'>模型</b>,助力端側(cè)AI創(chuàng)新開發(fā)

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源模型

    于OpenVINO? 構(gòu)建的 AI 軟件平臺的可擴展性,英特爾助力ISV生態(tài)伙伴率先實現(xiàn)應(yīng)用端Day 0 模型適配,大幅加速了新模型的落地進程,彰顯了 “硬件 +
    的頭像 發(fā)表于 08-07 14:42 ?1365次閱讀
    硬件與應(yīng)用同頻共振,英特爾Day 0<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b>開源<b class='flag-5'>混</b><b class='flag-5'>元</b>大<b class='flag-5'>模型</b>

    萬億參數(shù)!腦企智一體機率先支持Kimi K2模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布腦企智一體機已率先完成對Kimi K2 萬億參數(shù)大模型適配支持,并實現(xiàn)單用戶70
    的頭像 發(fā)表于 07-22 09:27 ?557次閱讀
    萬億參數(shù)!<b class='flag-5'>元</b>腦企智一體機<b class='flag-5'>率先</b>支持Kimi K<b class='flag-5'>2</b>大<b class='flag-5'>模型</b>

    摩爾線程率先支持騰訊-A13B模型

    近日,騰訊正式開源基于專家混合(MoE)架構(gòu)的大語言模型-A13B。同日,摩爾線程團隊憑借技術(shù)前瞻性,
    的頭像 發(fā)表于 07-04 14:10 ?895次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練適配和優(yōu)化。由此,壁仞科技已實現(xiàn)Qw
    的頭像 發(fā)表于 05-16 16:23 ?978次閱讀

    Arm CPU適配通義千問Qwen3系列模型

    近日,阿里巴巴開源了新一代通義千問模型 Qwen3,Arm 率先成為首批成功適配模型的計算平臺廠商。與此同時,
    的頭像 發(fā)表于 05-12 16:37 ?1444次閱讀

    如何賦能醫(yī)療AI大模型應(yīng)用?

    引言自ChatGPT掀起熱潮以來,眾多AI大模型如雨后春筍般涌現(xiàn),其中包括百度科技的文心一言、科大訊飛的訊飛星火、華為的盤古AI大模型騰訊
    的頭像 發(fā)表于 05-07 09:36 ?681次閱讀
    如何賦能醫(yī)療AI大<b class='flag-5'>模型</b>應(yīng)用?

    愛芯通NPU適配Qwen2.5-VL-3B視覺多模態(tài)大模型

    熟悉愛芯通NPU的網(wǎng)友很清楚,從去年開始我們在端側(cè)多模態(tài)大模型適配上一直處于主動緊跟的節(jié)奏。先后適配了國內(nèi)最早開源的多模態(tài)大模MiniCPM V 2.0,上海人工智能實驗室的書生多模
    的頭像 發(fā)表于 04-21 10:56 ?3144次閱讀
    愛芯通<b class='flag-5'>元</b>NPU<b class='flag-5'>適配</b>Qwen2.5-VL-3<b class='flag-5'>B</b>視覺多模態(tài)大<b class='flag-5'>模型</b>

    銷售易在騰訊云城市峰會上發(fā)布中國首款A(yù)I CRM

    騰訊模型+DeepSeek開源模型”多模解決方案,通過整合
    的頭像 發(fā)表于 03-24 11:16 ?689次閱讀