91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩大AI模型性能提升 登上國(guó)際榜單

愛(ài)云資訊 ? 2025-01-16 12:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,由盛大AI團(tuán)隊(duì)研發(fā)的模型Watt-tool-70B和Newsbang/homer-72B,登上國(guó)際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團(tuán)隊(duì)研發(fā)的旗艦?zāi)P停壳拔涣蠦FCL Leaderboard總榜單第一。

wKgZO2eIhJiAH1CJAANvX9TW0Qo480.png

據(jù)悉,榜單BFCL Leaderboard是由加州大學(xué)伯克利分校開(kāi)發(fā)的評(píng)估LLM工具調(diào)用能力基準(zhǔn)測(cè)試平臺(tái)。作為目前大語(yǔ)言模型(LLM)最熱門(mén)的研究方向之一,工具調(diào)用(Function-Calling)是為了讓LLM理解,并能準(zhǔn)確使用API(應(yīng)用程序編程接口),來(lái)執(zhí)行更復(fù)雜而具體的任務(wù)。在近期公布的最新一輪評(píng)估結(jié)果中,Watt的“多輪對(duì)話(huà)執(zhí)行能力”相較于排名第二的GPT-4o 領(lǐng)先11分,比排名第十的Gemini-1.5-Pro 領(lǐng)先近40分。

“這個(gè)模型將加速大模型落地‘融合’過(guò)程?!盬att有關(guān)負(fù)責(zé)人說(shuō),還有助于從底層數(shù)據(jù)標(biāo)注到人機(jī)交互的體系化建設(shè),讓大模型初步實(shí)現(xiàn)從“光說(shuō)不練”到“能文能武”。

此外,由盛大集團(tuán)NewsBang團(tuán)隊(duì)開(kāi)發(fā)的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護(hù)的開(kāi)源語(yǔ)言模型評(píng)測(cè)平臺(tái)升級(jí)版本,采用更全面和嚴(yán)格評(píng)估標(biāo)準(zhǔn),對(duì)各類(lèi)開(kāi)源大語(yǔ)言模型進(jìn)行多維度測(cè)試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力,通過(guò)搭配數(shù)據(jù)篩選機(jī)制等,在多個(gè)核心評(píng)測(cè)維度,該模型性能有了大幅提升。

wKgZPGeIhJiAM0HvAAHlAh0t4MU103.png

據(jù)公開(kāi)報(bào)道,2023年初,盛大集團(tuán)宣布All in AI戰(zhàn)略,去年10月,聯(lián)合多家高校發(fā)表了AI與長(zhǎng)期記憶方面的論文,其自研的OMNE大模型多智能體框架登上GAIA 基準(zhǔn)測(cè)試排行榜榜首;其旗下的天橋腦科學(xué)研究院(TCCI)與國(guó)際學(xué)術(shù)雜志《Science》合作推出全球AI驅(qū)動(dòng)科學(xué)大獎(jiǎng),舉辦和支持包括“AI+精神健康”在內(nèi)的各種高水平國(guó)際會(huì)議和夏校項(xiàng)目,助力培養(yǎng)跨學(xué)科青年AI人才等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40005

    瀏覽量

    301654
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50129

    瀏覽量

    265700
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    572

    瀏覽量

    11324
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中軟國(guó)際榮登2025 AI智能體服務(wù)商TOP100榜單

    中軟國(guó)際憑借自主研發(fā)的數(shù)智化審計(jì)智能體平臺(tái),成功入選《2025 AI智能體服務(wù)商TOP100》榜單。這一重要榮譽(yù),不僅彰顯了公司在AI智能體領(lǐng)域的領(lǐng)先技術(shù)實(shí)力與行業(yè)影響力,更標(biāo)志著其在
    的頭像 發(fā)表于 02-25 15:47 ?334次閱讀

    使用NORDIC AI的好處

    不依賴(lài)持續(xù)聯(lián)網(wǎng),整體系統(tǒng)可靠性更高。[Edge AI 概述; Nordic Edge AI 技術(shù)頁(yè)] 覆蓋從“小 MCU”到“高性能 SoC”的完整產(chǎn)品線(xiàn) Neuton 模型 :超
    發(fā)表于 01-31 23:16

    曦智科技榮登2025VENTURE50兩大榜單

    2025年12月4日,由清科控股、投資界發(fā)起的 2025VENTURE50 榜單最終揭曉。曦智科技憑借卓越的創(chuàng)新實(shí)力與高成長(zhǎng)性,榮登 “風(fēng)云50” 與 “硬科技50” 兩大榜單,收獲來(lái)自資本市場(chǎng)與產(chǎn)業(yè)領(lǐng)域的雙重認(rèn)可!
    的頭像 發(fā)表于 12-11 17:51 ?1274次閱讀

    成都匯陽(yáng)投資關(guān)于國(guó)產(chǎn)開(kāi)源模型持續(xù)突破,國(guó)產(chǎn)AI 競(jìng)爭(zhēng)力增強(qiáng)

    ? ? ? ?國(guó)產(chǎn)開(kāi)源模型領(lǐng)跑 ,AI 生態(tài)有望加速繁榮 根據(jù)獨(dú)立 AI 基準(zhǔn)測(cè)試與分析平臺(tái) Artificial Analysis 最新榜單 , 國(guó)產(chǎn)
    的頭像 發(fā)表于 11-24 14:01 ?589次閱讀

    沐曦聯(lián)合香港科技大學(xué)登上AI頂會(huì)

    近日,沐曦PDE-AI Solution團(tuán)隊(duì)與香港科技大學(xué)合作,在兩大人工智能頂級(jí)會(huì)議NeurIPS2025與EMNLP 2025上發(fā)表重要研究成果,涵蓋大語(yǔ)言模型(LLM)的多樣化解碼與高效訓(xùn)練優(yōu)化方向,展現(xiàn)了中國(guó)企業(yè)在
    的頭像 發(fā)表于 10-14 09:46 ?1528次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力

    本章節(jié)作者分析了下AI的未來(lái)在哪里,就目前而言有來(lái)那個(gè)種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    是展望未來(lái)的AGI芯片,并探討相關(guān)的發(fā)展和倫理話(huà)題。 各章的目錄名稱(chēng)如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費(fèi) 第2章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu) 第3章 AI
    發(fā)表于 09-05 15:10

    水晶光電榮登2025年度浙江省兩大榜單

    近日,浙江省經(jīng)信廳公布2025年度"浙江省制造精品"和"浙江省優(yōu)秀工業(yè)新產(chǎn)品"名單,水晶光電自主研發(fā)的高端攝像頭藍(lán)寶石保護(hù)器件與合式折疊光路微棱鏡分別榮登兩大榜單
    的頭像 發(fā)表于 08-20 17:47 ?2494次閱讀

    全球首個(gè)胃癌影像篩查AI模型發(fā)布

    浙江省腫瘤醫(yī)院聯(lián)合阿里巴巴達(dá)摩院,發(fā)布了全球首個(gè)胃癌影像篩查AI模型DAMO GRAPE,首次利用平掃CT影像識(shí)別早期胃癌病灶,并聯(lián)合全國(guó)20家醫(yī)院,在近10萬(wàn)人的大規(guī)模臨床研究中大幅提升胃癌檢出率。 相關(guān)論文在24日
    的頭像 發(fā)表于 06-30 14:37 ?3869次閱讀

    中興通訊星云大模型登頂SuperCLUE推理專(zhuān)項(xiàng)榜單

    近日,中文大模型權(quán)威測(cè)評(píng)基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2025年5月報(bào)告》。報(bào)告顯示,中興通訊自主研發(fā)的星云大模型NebulaCoder-V6在推理專(zhuān)項(xiàng)榜單中斬獲
    的頭像 發(fā)表于 06-04 16:44 ?1476次閱讀

    天合儲(chǔ)能Elementa金剛2榮獲兩大國(guó)際權(quán)威機(jī)構(gòu)認(rèn)證

    近日,天合儲(chǔ)能Elementa 金剛2以其卓越的安全性、可靠性和可融資性,同時(shí)獲得DNV和UL Solutions兩大國(guó)際權(quán)威機(jī)構(gòu)的認(rèn)證。Elementa 金剛2針對(duì)海外不同的儲(chǔ)能需求提供4MWh和5MWh種配置方案,其創(chuàng)新設(shè)計(jì)和卓越
    的頭像 發(fā)表于 04-27 15:48 ?788次閱讀

    DevEco Studio AI輔助開(kāi)發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開(kāi)發(fā)效率再提升

    使用結(jié)合機(jī)制和反饋優(yōu)化手段,有效融合檢索模塊和生成模塊,以及不斷提升RAG系統(tǒng)性能: 1、結(jié)合機(jī)制: (1) 概率加權(quán):通過(guò)對(duì)檢索到的文檔分配權(quán)重,影響生成模型的輸出。 (2) 多文檔處理:結(jié)合多篇相關(guān)文檔
    發(fā)表于 04-18 14:43

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計(jì)算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時(shí),用戶(hù)體驗(yàn)更貼心。 聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣
    發(fā)表于 04-13 19:52

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動(dòng)力。 AI時(shí)代的兩大數(shù)據(jù)中心:AI工廠與AIAI時(shí)代
    發(fā)表于 03-25 17:35