近日,英偉達(dá)宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)訓(xùn)練的新天地。該系列模型不僅包含高達(dá)3400億參數(shù),而且通過其獨(dú)特的架構(gòu),為醫(yī)療保健、金融、制造、零售等多個(gè)行業(yè)的商業(yè)應(yīng)用提供了強(qiáng)大的支持。
Nemotron-4 340B系列模型由三個(gè)主要組件構(gòu)成:Base基礎(chǔ)模型、Instruct指令模型和Reward獎(jiǎng)勵(lì)模型。這些模型協(xié)同工作,使得開發(fā)人員能夠生成高質(zhì)量的合成數(shù)據(jù),進(jìn)而訓(xùn)練出更加精準(zhǔn)、高效的大型語言模型。英偉達(dá)在訓(xùn)練過程中使用了驚人的9萬億個(gè)token(文本單位),確保了模型的廣泛覆蓋和深度理解。
值得一提的是,Nemotron-4 340B-Base在常識(shí)推理任務(wù)中展現(xiàn)出了非凡的實(shí)力。在ARC-c、MMLU和BBH等一系列基準(zhǔn)測(cè)試中,該模型的表現(xiàn)足以與業(yè)界知名的Llama-3 70B、Mixtral 8x22B和Qwen-2 72B等模型相媲美。這一成績不僅證明了Nemotron-4 340B的先進(jìn)性和可靠性,更為英偉達(dá)在人工智能領(lǐng)域的技術(shù)實(shí)力贏得了廣泛贊譽(yù)。
隨著Nemotron-4 340B系列模型的開源,英偉達(dá)為開發(fā)者們提供了一個(gè)強(qiáng)大的工具,使得他們能夠更加便捷地訓(xùn)練出適用于各種商業(yè)場(chǎng)景的大型語言模型。這一舉措無疑將加速人工智能技術(shù)的普及和應(yīng)用,推動(dòng)各行業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程。
-
開源
+關(guān)注
關(guān)注
3文章
4219瀏覽量
46191 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4091瀏覽量
99247 -
LLM
+關(guān)注
關(guān)注
1文章
346瀏覽量
1338
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA 推出 Nemotron 3 系列開放模型
NVIDIA推動(dòng)面向數(shù)字與物理AI的開源模型發(fā)展
NVIDIA ACE現(xiàn)已支持開源Qwen3-8B小語言模型
NVIDIA Nemotron模型如何推動(dòng)AI發(fā)展
NVIDIA Nemotron Nano 2推理模型發(fā)布
英偉達(dá)打響“小模型”第一槍
利用自壓縮實(shí)現(xiàn)大型語言模型高效縮減
龍芯中科與文心系列模型開展深度技術(shù)合作
兆芯率先展開文心系列模型深度技術(shù)合作
歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型
ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級(jí)助手
英偉達(dá)Cosmos-Reason1 模型深度解讀
英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練
評(píng)論