91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

壁仞科技順利部署DeepSeek R1千問蒸餾模型

OSC開源社區(qū) ? 來源:Gitee AI ? 2025-02-08 16:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于Gitee AI,作者馬建倉

DeepSeek 的國內(nèi)算力支持隊(duì)伍進(jìn)一步壯大:來自上海的壁仞科技順利部署DeepSeek-R1-Distill千問蒸餾模型(1.5B/7B/14B/32B),并已上線 Gitee AI 免費(fèi)使用。

蒸餾小模型超越 OpenAI o1-mini

通過 DeepSeek-R1 的輸出,DeepSeek 團(tuán)隊(duì)蒸餾并開源了 6 個(gè)小模型,其中 32B 和 70B 參數(shù)的模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo) OpenAI o1-mini 的效果。

本次壁仞科技共部署了1.5B/7B/14B/32B四個(gè)不同參數(shù)的千問蒸餾模型,其中 32B 參數(shù)模型在輸出質(zhì)量和資源占用中取得了較好的平衡,更推薦開發(fā)者們使用。

32B參數(shù)模型使用壁仞算力的推理速度

壁仞科技聯(lián)合科華數(shù)據(jù),加速國產(chǎn)算力再升級(jí)

壁仞科技成立于 2019 年,致力于開發(fā)原創(chuàng)性的通用計(jì)算體系,建立高效的軟硬件平臺(tái),同時(shí)在智能計(jì)算領(lǐng)域提供一體化的解決方案。從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計(jì)算,逐步在人工智能訓(xùn)練和推理等多個(gè)領(lǐng)域趕超現(xiàn)有解決方案,實(shí)現(xiàn)國產(chǎn)高端通用智能計(jì)算芯片的突破。

基于壁礪TM系列訓(xùn)推產(chǎn)品 106M、106B、106E、110E,憑借先進(jìn)的芯片架構(gòu)、高效的多模型適配能力、廣泛的數(shù)據(jù)精度支持以及強(qiáng)大的解碼能力,配合算力集群供應(yīng)商科華數(shù)據(jù)的強(qiáng)力支撐,僅用數(shù)小時(shí)即完成對(duì) DeepSeek R1 全系列蒸餾模型的支持。

科華數(shù)據(jù)全國智算中心具備極致可靠、超高密度、彈性預(yù)制、綠色低碳、多樣算力等特性。在智算中心的發(fā)展中融合「算網(wǎng)」、「算液」、「算效」,讓算力從「用得了」、「用得起」到「用的好」。始終堅(jiān)守以客戶需求為導(dǎo)向,融合多行業(yè)場景解決方案和科華數(shù)據(jù)豐富的產(chǎn)品矩陣及技術(shù)底蘊(yùn)來幫助客戶實(shí)現(xiàn)價(jià)值。

100%國內(nèi)AI新添強(qiáng)援

壁仞科技的加入,為 DeepSeek R1 千問蒸餾模型帶來了又一個(gè)國內(nèi)算力強(qiáng)援,也為開發(fā)者提供了新的國內(nèi)算力選擇。

同樣,Gitee AI 壁仞科技算力資源包中的DeepSeek-R1-Distill-Qwen系列模型依然面向全體開發(fā)者免費(fèi)使用!

點(diǎn)擊文末閱讀原文,免費(fèi)使用壁仞算力感受DeepSeek-R1-Distill-Qwen系列模型的出色表現(xiàn)吧!

更多國產(chǎn)算力與 DeepSeek 和 Gitee AI 的對(duì)接工作也正在緊鑼密鼓進(jìn)行中,努力為開發(fā)者提供更高效、更靈活的 AI 應(yīng)用解決方案。

除了國產(chǎn) GPU 芯片外,Gitee AI 也正在聯(lián)合國產(chǎn)生態(tài)廠商探索更多形態(tài)、更多平臺(tái)的 AI 模型適配,并將于近期正式上線,各位開發(fā)者敬請(qǐng)期待。

Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識(shí)別、語音生成、向量與重排模型、代碼生成等 9 種類型共 54 個(gè)大模型的 API 使用。通過購買模型資源包,即可通過極低的價(jià)格即可盡享眾多主流模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1532

    瀏覽量

    16742
  • 壁仞科技
    +關(guān)注

    關(guān)注

    1

    文章

    83

    瀏覽量

    4014
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    835

    瀏覽量

    3265

原文標(biāo)題:100%國產(chǎn)AI新成員:壁仞科技成功適配DeepSeek R1千問蒸餾模型

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    科技礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型

    MOSS-TTS模型的高性能推理部署。作為國內(nèi)領(lǐng)軍的通用GPU芯片企業(yè),科技成為首家完成MOSS-TTS模型適配的國產(chǎn)算力廠商。
    的頭像 發(fā)表于 02-11 16:54 ?1213次閱讀

    如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量

    開源 DeepSeek R1 模型的創(chuàng)新架構(gòu)包含多頭潛在注意力機(jī)制 (MLA) 和大型稀疏混合專家模型 (MoE),其顯著提升了大語言模型
    的頭像 發(fā)表于 08-12 15:19 ?4266次閱讀
    如何在NVIDIA Blackwell GPU上優(yōu)化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你離線部署Deepseek R1模型

    1.Deepseek簡介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的推理模型。DeepSeek-R1采用
    的頭像 發(fā)表于 07-25 15:22 ?1375次閱讀
    速看!EASY-EAI教你離線<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    DeepSeek開源新版R1 媲美OpenAI o3

    ;還有一些網(wǎng)友的實(shí)測評(píng)價(jià)都顯示,?DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性價(jià)比的平替。 此外,關(guān)于DeepSeek
    的頭像 發(fā)表于 05-29 11:23 ?1111次閱讀

    科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練適配和優(yōu)化。由此,
    的頭像 發(fā)表于 05-16 16:23 ?991次閱讀

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型
    的頭像 發(fā)表于 05-13 17:07 ?1646次閱讀
    瑞薩RZ/V2H平臺(tái)支持<b class='flag-5'>部署</b>離線版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大語言<b class='flag-5'>模型</b>

    科技完成阿里巴巴通義Qwen3全系列模型支持

    4月29日,阿里巴巴通義發(fā)布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時(shí)內(nèi),科技完成全
    的頭像 發(fā)表于 04-30 15:19 ?1586次閱讀

    DeepSeek R1模型本地部署與產(chǎn)品接入實(shí)操

    針對(duì)VS680/SL1680系列大算力芯片,我們的研發(fā)團(tuán)隊(duì)正在研究將蒸餾后的輕量級(jí)DeepSeek模型DeepSeek-R1-Distill-Qwen-1.5B)
    的頭像 發(fā)表于 04-19 16:32 ?761次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>本地<b class='flag-5'>部署</b>與產(chǎn)品接入實(shí)操

    SL1680 SoC本地運(yùn)行DeepSeek R1 1.5B大模型

    深蕾半導(dǎo)體SL1680 SoC本地成功運(yùn)行DeepSeek R1 Distill Qwen2.5 1.5B大模型,展示了執(zhí)行過程及本地小參數(shù)大模型與云端大
    的頭像 發(fā)表于 04-17 17:09 ?935次閱讀
    SL1680 SoC本地運(yùn)行<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 1.5B大<b class='flag-5'>模型</b>

    ORinNano離線部署Deepseek R1模型教程

    ORinNano離線部署Deepseek R1模型教程
    的頭像 發(fā)表于 04-10 15:32 ?1353次閱讀
    ORinNano離線<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    香橙派發(fā)布OrangePi RV2本地部署Deepseek-R1蒸餾模型指南

    繼香橙派昇騰系列產(chǎn)品、OrangePi5系列產(chǎn)品完成與DeepSeek模型的深度適配之后,香橙派日前官方發(fā)布OrangePiRV2運(yùn)行Deepseek-R1蒸餾
    的頭像 發(fā)表于 03-28 11:55 ?1700次閱讀
    香橙派發(fā)布OrangePi RV2本地<b class='flag-5'>部署</b><b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>指南

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】DeepSeek 部署及測試

    和強(qiáng)大的多場景適應(yīng)能力受到廣泛關(guān)注。業(yè)務(wù)范圍包括為用戶提供智能對(duì)話、推理、AI搜索、文件處理、翻譯、解題、創(chuàng)意寫作、編程等多種服務(wù)。 最新發(fā)布的 DeepSeek R1 大型語言模型可提供流暢精準(zhǔn)
    發(fā)表于 03-21 19:31

    顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗(yàn)

    今年春節(jié)后,DeepSeek R1 風(fēng)暴般地席卷全國,小到手機(jī) App,大到新能源汽車,似乎一夜間所有產(chǎn)品都接入了 DeepSeek R1。不得不說
    的頭像 發(fā)表于 03-18 12:06 ?1981次閱讀
    顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本<b class='flag-5'>部署</b> <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 32B <b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>體驗(yàn)

    如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理、數(shù)學(xué)問題解決和實(shí)時(shí)決策的任務(wù)。
    的頭像 發(fā)表于 03-12 13:45 ?2385次閱讀
    如何使用OpenVINO運(yùn)行<b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>

    科技推出阿里QWQ-32B大模型一體機(jī)

    3月6日,國產(chǎn)大模型領(lǐng)域再次迎來重大突破:阿里正式發(fā)布 32B 推理模型 QwQ-32B,根據(jù)Qwen公布的基準(zhǔn)測試數(shù)據(jù),QwQ-32B性能可媲美DeepSeek-R1,在數(shù)學(xué)推理、編程能力和通用
    的頭像 發(fā)表于 03-10 09:05 ?1863次閱讀
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技推出阿里QWQ-32B大<b class='flag-5'>模型</b>一體機(jī)