91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

登臨科技KS系列GPU產(chǎn)品全面適配MiniMax M2.5模型

登臨科技 DenglinAI ? 來源:登臨科技 DenglinAI ? 2026-03-04 17:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,蘇州登臨科技股份有限公司(以下簡(jiǎn)稱“登臨科技”)自主研發(fā)的KS系列高性能通用GPU已全面完成對(duì)最新一代大模型MiniMax M2.5的深度適配與優(yōu)化。通過創(chuàng)新的GPU+架構(gòu),登臨科技不僅實(shí)現(xiàn)了對(duì)MiniMax M2.5模型的高效支持,更依托KS38/ KS58云端推理卡——單卡最高配備128GB顯存,推出僅需2卡即可部署MiniMax M2.5的突破性方案,大幅降低整體部署成本。將大模型部署的硬件門檻與成本降至行業(yè)新低,為企業(yè)級(jí)AI應(yīng)用的規(guī)模化落地注入強(qiáng)勁動(dòng)力。

MiniMax M2.5 深度適配

提供超低成本部署方案

MiniMax M2.5作為MiniMax M2.x系列發(fā)布的最新版本模型,在代碼編寫、智能體工具使用與搜索、辦公任務(wù)以及一系列其他具有經(jīng)濟(jì)價(jià)值的任務(wù)上達(dá)到當(dāng)前最先進(jìn)(SOTA)水平,在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp(含上下文管理)等評(píng)測(cè)中分別取得了 80.2%、51.3% 和 76.3% 的高分。隨著OpenClaw的爆火,全球API調(diào)用token數(shù)量暴增,據(jù)全球最大LLM API聚合平臺(tái)OpenRouter 2月24日數(shù)據(jù),中國(guó)AI模型Token消耗量占平臺(tái)前十總量的61%,前三名全部來自中國(guó)實(shí)驗(yàn)室。MiniMax M2.5以單周2.45萬億Token登頂榜首,環(huán)比暴漲197%。

目前登臨的KS38/ KS58云端推理卡,單卡最高配備128GB顯存,2卡即可部署MiniMax M2.5,極大降低綜合部署成本。并提供單服務(wù)器內(nèi)模型全上下文長(zhǎng)度推理,釋放MiniMax M2.5完整能力。

03281b50-175f-11f1-90a1-92fbcf53809c.png

GPU+架構(gòu):效率與通用的完美融合

重新定義算力效能

登臨科技的GPU+架構(gòu)是其核心技術(shù)優(yōu)勢(shì)所在,它巧妙地融合了傳統(tǒng) GPU 的通用性與 ASIC 的高效率,為大模型推理等 AI 應(yīng)用提供了從算力到能效的全面解決方案。

卓越能效比,降本增效的關(guān)鍵登臨 GPU+架構(gòu)通過創(chuàng)新的可擴(kuò)展、軟件定義的片內(nèi)異構(gòu)體系結(jié)構(gòu),實(shí)現(xiàn)了能效比的大幅提升,在算力需求暴漲的今天,能源消耗成為算力擴(kuò)展瓶頸的趨勢(shì)愈發(fā)明顯,GPU+架構(gòu)正是解決這一困境的鑰匙。

高度生態(tài)兼容性,降低遷移門檻登臨硬件兼容 CUDA/OpenCL 等現(xiàn)有軟件生態(tài),算法模型可平滑遷移,極大節(jié)約了企業(yè)的移植成本和開發(fā)周期。在大模型領(lǐng)域,登臨軟件棧更是在Day0適配了DeepSeek、GLM、MiniMax、Kimi、GPT-OSS等國(guó)內(nèi)外主流大模型。

強(qiáng)大算力與內(nèi)存支持,超長(zhǎng)上下文處理登臨納適II 系列加速卡提供了高達(dá)560 TOPS 的云端有效AI算力,以及 128GB 的大顯存配置,為大模型推理和超長(zhǎng)上下文提供基礎(chǔ)支撐。

全棧國(guó)產(chǎn)化與自主可控,保障供應(yīng)鏈安全登臨堅(jiān)持自主創(chuàng)新,核心IP(架構(gòu)/微架構(gòu)/算術(shù)單元等)全自研,已申請(qǐng)國(guó)內(nèi)外各類知識(shí)產(chǎn)權(quán) 200 余項(xiàng)。其產(chǎn)品支持 Windows10、Linux、麒麟等系統(tǒng),并兼容各類國(guó)產(chǎn) CPU,確保了從硬件到軟件的全國(guó)產(chǎn)化能力,為客戶提供了安全可靠的算力底座。

行業(yè)價(jià)值與未來展望

登臨科技 KS 系列對(duì) MiniMax M2.5 的支持,以及 KS38/KS58 兩卡部署方案的推出,不僅為企業(yè)提供了高性能、低成本的大模型運(yùn)行平臺(tái),更在多個(gè)層面創(chuàng)造了顯著的行業(yè)價(jià)值:

降低 AI 應(yīng)用門檻 :使更多中小企業(yè)能夠負(fù)擔(dān)得起先進(jìn)的大模型技術(shù),加速 AI 技術(shù)的普及和應(yīng)用。

提升業(yè)務(wù)處理效率 :在內(nèi)容審核、智能客服、數(shù)據(jù)分析等場(chǎng)景中,提供更快、更準(zhǔn)確的處理能力,提升業(yè)務(wù)效率和用戶體驗(yàn)。

推動(dòng)國(guó)產(chǎn)算力發(fā)展 :作為國(guó)產(chǎn)高性能通用 GPU 的領(lǐng)先企業(yè),登臨科技通過實(shí)際應(yīng)用驗(yàn)證了國(guó)產(chǎn)算力的可靠性和先進(jìn)性,為構(gòu)建自主可控的 AI 算力生態(tài)貢獻(xiàn)力量。

展望未來,登臨科技將持續(xù)深化在大模型領(lǐng)域的技術(shù)創(chuàng)新與行業(yè)應(yīng)用,致力于推動(dòng) AI 視覺與大模型的深度融合,優(yōu)化 AI 模型部署與優(yōu)化門檻,拓展全場(chǎng)景 AI 應(yīng)用,為各行業(yè)的智能化升級(jí)提供更高效、更智能、更安全的算力解決方案。

關(guān)于登臨

蘇州登臨科技股份有限公司是一家專注于高性能通用 GPU 設(shè)計(jì)與研發(fā)的創(chuàng)新型企業(yè),致力于為 AI 計(jì)算、圖形渲染、高性能計(jì)算等領(lǐng)域提供自主可控、高效能的算力解決方案。公司以“技術(shù)賦能行業(yè)革新”為理念,通過自主研發(fā)的GPU+架構(gòu),在多個(gè)行業(yè)實(shí)現(xiàn)了規(guī)?;虡I(yè)落地,成為推動(dòng)國(guó)產(chǎn)算力發(fā)展的關(guān)鍵力量。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135427
  • 登臨科技
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    826

原文標(biāo)題:登臨科技KS系列全面適配MiniMax M2.5,GPU+架構(gòu)驅(qū)動(dòng)大模型部署成本革命

文章出處:【微信號(hào):gh_313558c425fe,微信公眾號(hào):登臨科技 DenglinAI】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團(tuán)隊(duì)正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個(gè)版本。沐曦股份旗下曦云C系列
    的頭像 發(fā)表于 02-28 10:05 ?386次閱讀
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>全面</b><b class='flag-5'>適配</b>通義千問Qwen3.5三款新<b class='flag-5'>模型</b>

    摩爾線程業(yè)績(jī)快報(bào):2025年?duì)I收同比增長(zhǎng)243.37%,S5000全棧適配SOTA大模型加速釋放商業(yè)潛能

    S5000實(shí)現(xiàn)規(guī)模化量產(chǎn),單卡AI稠密算力達(dá)1000 TFLOPS,居行業(yè)前列。 ·生態(tài)加速:率先完成GLM-5、MiniMax M2.5、Kimi K2.5、Qwen3.5等SOTA大模型
    發(fā)表于 02-27 19:47 ?97次閱讀

    壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型

    2月13日晚,MiniMax正式開源了最新旗艦模型M2.5。壁仞科技(06082.HK)旗艦產(chǎn)品壁礪166系列率先完成
    的頭像 發(fā)表于 02-26 14:31 ?453次閱讀
    壁仞科技壁礪166<b class='flag-5'>系列產(chǎn)品</b>深度<b class='flag-5'>適配</b><b class='flag-5'>MiniMax</b> <b class='flag-5'>M2.5</b>和智譜GLM-5<b class='flag-5'>模型</b>

    沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權(quán)重版本。沐曦股份曦云C系列GPU 完成對(duì)Qwen 3.5
    的頭像 發(fā)表于 02-26 14:26 ?413次閱讀
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b>深度<b class='flag-5'>適配</b>通義千問Qwen3.5<b class='flag-5'>模型</b>

    沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。沐曦技術(shù)團(tuán)隊(duì)依托MXMACA軟件棧,在24小時(shí)內(nèi)完成曦云C500/C550 對(duì)該
    的頭像 發(fā)表于 02-26 14:19 ?582次閱讀

    登臨科技基于納適系列國(guó)產(chǎn)化GPU推出文檔PDF解析行業(yè)解決方案

    企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)入2.0階段,海量PDF文件作為核心信息載體,卻因掃描干擾、圖文混雜等解析痛點(diǎn)難以復(fù)用,成為大模型項(xiàng)目交付的阻礙。登臨科技攜納適系列PDF解析解決方案,為數(shù)字化轉(zhuǎn)型破局賦能。
    的頭像 發(fā)表于 02-24 10:42 ?577次閱讀
    <b class='flag-5'>登臨</b>科技基于納適<b class='flag-5'>系列</b>國(guó)產(chǎn)化<b class='flag-5'>GPU</b>推出文檔PDF解析行業(yè)解決方案

    模型 ai coding 比較

    > MiniMax M2.5 > DeepSeek V2備注 :?為實(shí)測(cè)數(shù)據(jù),其余為公開第三方權(quán)威測(cè)評(píng)數(shù)據(jù)(MMLU/CMMLU/SuperCLUE) 模型名稱 綜合能力
    發(fā)表于 02-19 13:43

    Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配

    2月14日,摩爾線程在其旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,成功實(shí)現(xiàn)了對(duì)MiniMax新一代大模型MiniMax M2.5
    發(fā)表于 02-15 08:01 ?639次閱讀

    曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    GLM-4.6V系列多模態(tài)大模型及GLM-OCR,沐曦股份均在第一時(shí)間完成全面適配。 此次高效適配依托于沐曦股份全棧自研的MXMACA軟件棧
    的頭像 發(fā)表于 02-12 10:53 ?796次閱讀
    曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b> Day 0 <b class='flag-5'>適配</b>智譜全新一代大<b class='flag-5'>模型</b>GLM-5

    壁仞科技壁礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型

    2月10日,由上海創(chuàng)智學(xué)院孵化的模思智能及OpenMOSS團(tuán)隊(duì)正式發(fā)布并開源了MOSS-TTS Family。模型發(fā)布后,壁仞科技(06082.HK)旗艦產(chǎn)品壁礪 166M率先完成其中語音生成基座
    的頭像 發(fā)表于 02-11 16:54 ?1201次閱讀

    塔力科技與登臨科技達(dá)成戰(zhàn)略合作

    近日,塔力科技與國(guó)內(nèi)通用GPU領(lǐng)軍企業(yè)登臨科技展開合作,雙方依托塔力科技自主研發(fā)的智能輔助決策系統(tǒng)SIDSS,基于登臨新一代國(guó)產(chǎn)化GPU ,共同打造 AI 軟硬協(xié)同
    的頭像 發(fā)表于 01-28 14:11 ?511次閱讀

    沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,沐曦股份曦云C系列GPU完成Day 0適配。
    的頭像 發(fā)表于 12-17 14:28 ?617次閱讀
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b> Day 0<b class='flag-5'>適配</b>智譜GLM-4.6V多模態(tài)大<b class='flag-5'>模型</b>

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練適配和優(yōu)化。由此,壁仞科技已實(shí)現(xiàn)Qw
    的頭像 發(fā)表于 05-16 16:23 ?978次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺多模態(tài)大模型

    InternVL2.5-1B/8B/MPO,Huggingface推出的全球最小多模態(tài)大模型SmloVLM-256M。為工業(yè)界提供了離線部署多模態(tài)大模型(VLM)實(shí)現(xiàn)圖片本地高效率理
    的頭像 發(fā)表于 04-21 10:56 ?3144次閱讀
    愛芯通元NPU<b class='flag-5'>適配</b>Qwen<b class='flag-5'>2.5</b>-VL-3B視覺多模態(tài)大<b class='flag-5'>模型</b>

    登臨科技與元石智算達(dá)成戰(zhàn)略合作

    近日,登臨科技與元石智算達(dá)成重要戰(zhàn)略合作,成功實(shí)現(xiàn)元石智算平臺(tái)在登臨Goldwasser推理集群的部署,并完成多款主流大模型的全功能適配,即將正式對(duì)外開放服務(wù)。雙方聚焦企業(yè)級(jí)AI私有化
    的頭像 發(fā)表于 04-01 17:40 ?1726次閱讀