91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hugging Face科技公司推出SmolLM系列語(yǔ)言模型

要長(zhǎng)高 ? 2024-07-23 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

7月22日最新資訊,Hugging Face科技公司在語(yǔ)言模型領(lǐng)域再創(chuàng)新高,正式推出了SmolLM系列——一款專為適應(yīng)多樣計(jì)算資源而設(shè)計(jì)的緊湊型語(yǔ)言模型家族。該系列包含三個(gè)版本,分別搭載了1.35億、3.6億及17億參數(shù),旨在以高效能應(yīng)對(duì)不同應(yīng)用場(chǎng)景。

據(jù)Hugging Face SmolLM項(xiàng)目的首席機(jī)器學(xué)習(xí)工程師Loubna Ben Allal介紹:“我們認(rèn)識(shí)到,并非每項(xiàng)任務(wù)都需要龐大的模型來(lái)支撐,正如鉆孔無(wú)需重型破碎球一樣。專為特定任務(wù)定制的小型模型,同樣能夠勝任繁重的工作?!?/p>

尤為引人注目的是,即便是家族中最小的成員SmolLM-135M,在訓(xùn)練數(shù)據(jù)相對(duì)有限的情況下,其性能仍超越了Meta的MobileLM-125M模型,展現(xiàn)出非凡的潛力。而SmolLM-360M則自豪地宣稱,在性能上已凌駕于所有參數(shù)少于5億的模型之上。至于旗艦產(chǎn)品SmolLM-1.7B,更是在一系列基準(zhǔn)測(cè)試中力壓群雄,包括微軟的Phi-1.5和Meta的MobileLM-1.5B等強(qiáng)勁對(duì)手。

Hugging Face不僅在技術(shù)上追求卓越,更在開(kāi)放共享上樹(shù)立了典范。公司決定將SmolLM的整個(gè)開(kāi)發(fā)流程,從數(shù)據(jù)管理到訓(xùn)練步驟,全部對(duì)外開(kāi)源。這一舉措不僅彰顯了公司對(duì)開(kāi)源文化的堅(jiān)定支持,也體現(xiàn)了對(duì)可重復(fù)研究的高度重視,為行業(yè)內(nèi)的科研人員提供了寶貴的資源。

SmolLM系列的卓越表現(xiàn),離不開(kāi)其背后精心策劃的高質(zhì)量訓(xùn)練數(shù)據(jù)。這些模型依托于Cosmo語(yǔ)料庫(kù)構(gòu)建,該語(yǔ)料庫(kù)融合了Cosmopedia v2(包含合成教科書與故事)、Python Edu(教育導(dǎo)向的Python示例)以及FineWeb Edu(精選教育網(wǎng)絡(luò)內(nèi)容)等多維度資源,確保了模型學(xué)習(xí)內(nèi)容的豐富性與準(zhǔn)確性。

Loubna Ben Allal強(qiáng)調(diào):“SmolLM系列的成功,是對(duì)數(shù)據(jù)質(zhì)量重要性的有力證明。我們創(chuàng)新性地結(jié)合了網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù),通過(guò)精心策劃,打造出了這些性能卓越的小型模型?!边@一成就不僅為語(yǔ)言模型領(lǐng)域注入了新的活力,也為未來(lái)智能應(yīng)用的發(fā)展開(kāi)辟了更加廣闊的道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)管理
    +關(guān)注

    關(guān)注

    1

    文章

    340

    瀏覽量

    20581
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11322
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Alpamayo 1模型Hugging Face平臺(tái)下載量已突破10萬(wàn)次

    NVIDIA Alpamayo 1 在 Hugging Face 的下載量已突破 10 萬(wàn)次,且仍在持續(xù)增長(zhǎng),已成為 Hugging Face 平臺(tái)下載量最高的機(jī)器人
    的頭像 發(fā)表于 03-04 16:27 ?682次閱讀

    谷歌推出TranslateGemma全新開(kāi)放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開(kāi)放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問(wèn)世標(biāo)志著開(kāi)放翻譯領(lǐng)域邁出了重要一步,它可幫助人
    的頭像 發(fā)表于 02-26 10:22 ?548次閱讀

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進(jìn)一步擴(kuò)展了 Gemini 3 模型系列
    的頭像 發(fā)表于 01-22 16:04 ?507次閱讀

    NVIDIA 推出 Nemotron 3 系列開(kāi)放模型

    新聞?wù)?● Nemotron 3 系列開(kāi)放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開(kāi)發(fā)。 ● Nemotron 3 Nano
    的頭像 發(fā)表于 12-16 09:27 ?637次閱讀
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 <b class='flag-5'>系列</b>開(kāi)放<b class='flag-5'>模型</b>

    Microchip推出模型語(yǔ)境協(xié)議服務(wù)器

    為進(jìn)一步兌現(xiàn)公司為嵌入式工程師開(kāi)發(fā)AI解決方案的承諾,Microchip Technology Inc.(微芯科技公司)今日推出模型語(yǔ)境協(xié)議(MCP)服務(wù)器。作為AI接口,MCP服務(wù)器
    的頭像 發(fā)表于 11-24 15:43 ?578次閱讀

    NVIDIA推出面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源AI技術(shù)

    NVIDIA 秉持對(duì)開(kāi)源的長(zhǎng)期承諾,推出了面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源 AI 技術(shù),為構(gòu)建開(kāi)源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推動(dòng)創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)練框架貢獻(xiàn)給
    的頭像 發(fā)表于 11-06 11:49 ?1081次閱讀

    Motion Controls推出以CADENAS技術(shù)創(chuàng)建的D系列氣缸配置器

    工業(yè)自動(dòng)化制造商現(xiàn)提供熱門氣動(dòng)產(chǎn)品的CAD和 PDF即時(shí)在線訪問(wèn)服務(wù) 氣動(dòng)執(zhí)行器創(chuàng)新領(lǐng)域的領(lǐng)導(dǎo)者M(jìn)otion Controls公司為其廣受歡迎的D系列氣缸推出了新的在線配置器,使工程師能夠立即訪問(wèn)
    發(fā)表于 10-29 12:51

    NVIDIA開(kāi)源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開(kāi)源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開(kāi)發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動(dòng)畫的高精度角色。NVIDIA 開(kāi)源 Audio2Face 的訓(xùn)練框架,任何人都可以針對(duì)特定用例對(duì)現(xiàn)有
    的頭像 發(fā)表于 10-21 11:11 ?832次閱讀
    NVIDIA開(kāi)源Audio2<b class='flag-5'>Face</b><b class='flag-5'>模型</b>及SDK

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理
    的頭像 發(fā)表于 09-23 15:19 ?1285次閱讀

    商湯科技日日新V6大模型斬獲“雙料第一” 一項(xiàng)國(guó)內(nèi)榜首,一個(gè)全球第一

    衛(wèi)冕“雙冠”! 通用語(yǔ)言能力并列國(guó)內(nèi)榜首、多模態(tài)能力全球最強(qiáng),商湯「日日新V6」近期斬獲“雙料第一”。 5月28日,權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)測(cè)評(píng)2025年5月報(bào)告》全新
    的頭像 發(fā)表于 05-30 11:13 ?1598次閱讀
    商湯科技日日新V6大<b class='flag-5'>模型</b>斬獲“雙料第一” 一項(xiàng)國(guó)內(nèi)榜首,一個(gè)全球第一

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測(cè)報(bào)告

    近日,阿里巴巴通義千問(wèn)團(tuán)隊(duì)正式推出新一代開(kāi)源大語(yǔ)言模型——Qwen3 系列,該系列包含 6 款 Dense 稠密
    的頭像 發(fā)表于 05-09 15:05 ?4382次閱讀
    NVIDIA RTX 5880 Ada與Qwen3<b class='flag-5'>系列</b><b class='flag-5'>模型</b>實(shí)測(cè)報(bào)告

    小白學(xué)大模型:從零實(shí)現(xiàn) LLM語(yǔ)言模型

    在當(dāng)今人工智能領(lǐng)域,大型語(yǔ)言模型(LLM)的開(kāi)發(fā)已經(jīng)成為一個(gè)熱門話題。這些模型通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語(yǔ)言文本,完成各種復(fù)雜的任務(wù),如寫作、翻譯、問(wèn)答等。https
    的頭像 發(fā)表于 04-30 18:34 ?1319次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:從零實(shí)現(xiàn) LLM<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>

    如何基于Android 14在i.MX95 EVK上運(yùn)行Deepseek-R1-1.5B和性能

    Internet,或者您可以手動(dòng)下載模型。按“ ”并選擇 “從Hugging Face添加” 并搜索1.5B,找到deepseek-R1-1.5B模型,下載
    發(fā)表于 04-04 06:59

    ?VLM(視覺(jué)語(yǔ)言模型)?詳細(xì)解析

    視覺(jué)語(yǔ)言模型(Visual Language Model, VLM)是一種結(jié)合視覺(jué)(圖像/視頻)和語(yǔ)言(文本)處理能力的多模態(tài)人工智能模型,能夠理解并生成與視覺(jué)內(nèi)容相關(guān)的自然
    的頭像 發(fā)表于 03-17 15:32 ?8903次閱讀
    ?VLM(視覺(jué)<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>)?詳細(xì)解析

    利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL系列模型

    近期阿里通義實(shí)驗(yàn)室在 Hugging Face 和 ModelScope 上開(kāi)源了 Qwen2.5-VL 的 Base 和 Instruct 模型,包含 3B、7B 和 72B 在內(nèi)的 3 個(gè)
    的頭像 發(fā)表于 03-12 13:42 ?2621次閱讀
    利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL<b class='flag-5'>系列</b><b class='flag-5'>模型</b>