91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-06-17 14:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,英偉達(dá)宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)訓(xùn)練的新天地。該系列模型不僅包含高達(dá)3400億參數(shù),而且通過其獨(dú)特的架構(gòu),為醫(yī)療保健、金融、制造、零售等多個(gè)行業(yè)的商業(yè)應(yīng)用提供了強(qiáng)大的支持。

Nemotron-4 340B系列模型由三個(gè)主要組件構(gòu)成:Base基礎(chǔ)模型、Instruct指令模型和Reward獎(jiǎng)勵(lì)模型。這些模型協(xié)同工作,使得開發(fā)人員能夠生成高質(zhì)量的合成數(shù)據(jù),進(jìn)而訓(xùn)練出更加精準(zhǔn)、高效的大型語言模型。英偉達(dá)在訓(xùn)練過程中使用了驚人的9萬億個(gè)token(文本單位),確保了模型的廣泛覆蓋和深度理解。

值得一提的是,Nemotron-4 340B-Base在常識(shí)推理任務(wù)中展現(xiàn)出了非凡的實(shí)力。在ARC-c、MMLU和BBH等一系列基準(zhǔn)測(cè)試中,該模型的表現(xiàn)足以與業(yè)界知名的Llama-3 70B、Mixtral 8x22B和Qwen-2 72B等模型相媲美。這一成績不僅證明了Nemotron-4 340B的先進(jìn)性和可靠性,更為英偉達(dá)在人工智能領(lǐng)域的技術(shù)實(shí)力贏得了廣泛贊譽(yù)。

隨著Nemotron-4 340B系列模型的開源,英偉達(dá)為開發(fā)者們提供了一個(gè)強(qiáng)大的工具,使得他們能夠更加便捷地訓(xùn)練出適用于各種商業(yè)場(chǎng)景的大型語言模型。這一舉措無疑將加速人工智能技術(shù)的普及和應(yīng)用,推動(dòng)各行業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4219

    瀏覽量

    46191
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99247
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    346

    瀏覽量

    1338
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA 推出 Nemotron 3 系列開放模型

    新聞?wù)?● Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開發(fā)。 ● Nemotron
    的頭像 發(fā)表于 12-16 09:27 ?643次閱讀
    NVIDIA 推出 <b class='flag-5'>Nemotron</b> 3 <b class='flag-5'>系列</b>開放<b class='flag-5'>模型</b>

    NVIDIA推動(dòng)面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動(dòng)出行領(lǐng)域的行業(yè)級(jí)開源視覺-語言-動(dòng)作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1354次閱讀

    NVIDIA ACE現(xiàn)已支持開源Qwen3-8B語言模型

    助力打造實(shí)時(shí)、動(dòng)態(tài)的 NPC 游戲角色,NVIDIA ACE 現(xiàn)已支持開源 Qwen3-8B語言模型(SLM),可實(shí)現(xiàn) PC 游戲中的
    的頭像 發(fā)表于 10-29 16:59 ?1245次閱讀

    NVIDIA Nemotron模型如何推動(dòng)AI發(fā)展

    Nemotron 開源技術(shù)能夠幫助開發(fā)者與企業(yè)構(gòu)建強(qiáng)大的通用和專用智能系統(tǒng)。
    的頭像 發(fā)表于 10-13 11:12 ?1032次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1812次閱讀
    NVIDIA <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b>發(fā)布

    英偉達(dá)打響“小模型”第一槍

    電子發(fā)燒友網(wǎng)綜合報(bào)道 , 近日,Nvidia 推出了一款新的小型語言模型 Nemotron-Nano-9B-v2,該模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,且用戶可靈活控制其推理功能的開關(guān)。 該
    發(fā)表于 08-24 01:18 ?1395次閱讀

    利用自壓縮實(shí)現(xiàn)大型語言模型高效縮減

    隨著語言模型規(guī)模日益龐大,設(shè)備端推理變得越來越緩慢且耗能巨大。一個(gè)直接且效果出人意料的解決方案是剪除那些對(duì)任務(wù)貢獻(xiàn)甚微的完整通道(channel)。我們?cè)缙诘难芯刻岢隽艘环N訓(xùn)練階段的方法——自壓
    的頭像 發(fā)表于 07-28 09:36 ?569次閱讀
    利用自壓縮實(shí)現(xiàn)<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>高效縮減

    龍芯中科與文心系列模型開展深度技術(shù)合作

    ”解決方案。 強(qiáng)強(qiáng)聯(lián)合!自主架構(gòu)賦能大模型訓(xùn)練 文心大模型 文心4.5系列模型均使用飛槳深度學(xué)習(xí)框架進(jìn)行高效
    的頭像 發(fā)表于 07-02 16:53 ?1364次閱讀

    兆芯率先展開文心系列模型深度技術(shù)合作

    對(duì)文心系列模型的快速適配、無縫銜接。 ? 文心大模型 ? 文心4.5系列開源模型共10款,均使
    的頭像 發(fā)表于 07-01 10:49 ?982次閱讀

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與云提供商,共同優(yōu)化主權(quán)大語言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級(jí) AI。
    的頭像 發(fā)表于 06-12 15:42 ?1207次閱讀

    ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級(jí)助手

    Apriel Nemotron 15B 開源語言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama
    的頭像 發(fā)表于 05-12 15:37 ?934次閱讀

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源模型
    的頭像 發(fā)表于 05-08 11:45 ?3016次閱讀
    NVIDIA使用Qwen3<b class='flag-5'>系列</b><b class='flag-5'>模型</b>的最佳實(shí)踐

    英偉達(dá)Cosmos-Reason1 模型深度解讀

    英偉達(dá)近期發(fā)布的 Cosmos-Reason1 模型在物理常識(shí)推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計(jì)的多模態(tài)大語言模型,它通過融合視
    的頭像 發(fā)表于 03-29 23:29 ?3049次閱讀

    英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)大模型
    的頭像 發(fā)表于 03-20 11:05 ?2157次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力
    發(fā)表于 03-19 09:31 ?397次閱讀
    NVIDIA 推出開放推理 AI <b class='flag-5'>模型</b><b class='flag-5'>系列</b>,<b class='flag-5'>助力</b>開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)