91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智源研究院揭曉大模型測(cè)評(píng)結(jié)果,豆包與百川智能大模型表現(xiàn)優(yōu)異

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-05-20 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月18日,北京智源研究院發(fā)布了關(guān)于國(guó)內(nèi)外各類(lèi)開(kāi)/閉源語(yǔ)言及多模態(tài)大模型性能評(píng)估的最新研究成果。此項(xiàng)研究覆蓋了140余個(gè)語(yǔ)言模型的綜合實(shí)力對(duì)比,包括其對(duì)中文文本理解和多模態(tài)圖文問(wèn)答等任務(wù)的處理能力。

研究發(fā)現(xiàn),盡管?chē)?guó)內(nèi)頭部語(yǔ)言模型在中文環(huán)境中的整體表現(xiàn)已接近國(guó)際一流水平,但仍存在能力發(fā)展不平衡的問(wèn)題。

在多模態(tài)理解圖文問(wèn)答任務(wù)中,開(kāi)源和閉源模型表現(xiàn)相當(dāng),而國(guó)產(chǎn)模型則表現(xiàn)出色。此外,在中文語(yǔ)境下的文生圖能力方面,國(guó)產(chǎn)多模態(tài)模型與國(guó)際一流水平的差距相對(duì)較小。

具體到語(yǔ)言模型的排名,在中文語(yǔ)境下,字節(jié)跳動(dòng)的豆包Skylark2以及OpenAI的GPT-4分別名列第一和第二。值得注意的是,國(guó)產(chǎn)大模型在理解中國(guó)用戶需求方面具有明顯優(yōu)勢(shì)。

在語(yǔ)言模型客觀評(píng)價(jià)中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同時(shí),百度的文心一言4.0、智譜華章的GLM-4以及月之暗面的Kimi也躋身語(yǔ)言模型主客觀評(píng)價(jià)的前五名。

在多模態(tài)理解模型的客觀評(píng)價(jià)中,圖文問(wèn)答方面,阿里巴巴的通義Qwen-vl-max和上海人工智能實(shí)驗(yàn)室的InternVL-Chat-V1.5在某些指標(biāo)上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能實(shí)驗(yàn)室的Intern-XComposer2-VL-7B緊隨其后。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4223

    瀏覽量

    46202
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3761

    瀏覽量

    52131
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3663

    瀏覽量

    5197
  • 百川智能
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    180
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國(guó)產(chǎn)算力首證具身大腦模型訓(xùn)練實(shí)力:摩爾線程聯(lián)合智研究院完成RoboBrain 2.5全流程訓(xùn)練

    隨著具身智能成為人工智能的下一個(gè)戰(zhàn)略高地,底層算力底座的自主可控顯得尤為關(guān)鍵。近日,摩爾線程聯(lián)合北京智人工智能研究院(以下簡(jiǎn)稱:智)基于
    的頭像 發(fā)表于 01-14 09:05 ?519次閱讀
    國(guó)產(chǎn)算力首證具身大腦<b class='flag-5'>模型</b>訓(xùn)練實(shí)力:摩爾線程聯(lián)合智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>完成RoboBrain 2.5全流程訓(xùn)練

    廣電計(jì)量與長(zhǎng)沙三大研究院達(dá)成戰(zhàn)略合作

    11月26-27日,廣電計(jì)量與長(zhǎng)沙北斗產(chǎn)業(yè)安全技術(shù)研究院集團(tuán)股份有限公司(簡(jiǎn)稱“長(zhǎng)沙北斗研究院”)、長(zhǎng)沙量子測(cè)量產(chǎn)業(yè)技術(shù)研究院有限公司(簡(jiǎn)稱“長(zhǎng)沙量子研究院”)、湖南大學(xué)長(zhǎng)沙半導(dǎo)體技術(shù)
    的頭像 發(fā)表于 12-04 14:36 ?540次閱讀

    澎峰科技加入智研究院FlagOS開(kāi)源社區(qū)

    ,本次活動(dòng)由北京市發(fā)展改革委、北京市科委中關(guān)村管委會(huì)、北京市經(jīng)信局、中關(guān)村科學(xué)城管委會(huì)共同指導(dǎo),由中國(guó)人工智能學(xué)會(huì)提供支持,并匯聚了清華大學(xué)、北京智人工智能研究院等多家權(quán)威機(jī)構(gòu)與產(chǎn)業(yè)
    的頭像 發(fā)表于 10-13 16:49 ?1295次閱讀

    弘信電子攜手百川智能推動(dòng)醫(yī)療AI技術(shù)落地應(yīng)用

    近日,百川智能正式發(fā)布開(kāi)源醫(yī)療增強(qiáng)大模型Baichuan-M2,該模型以卓越性能問(wèn)鼎全球開(kāi)源醫(yī)療模型榜首,實(shí)現(xiàn)中國(guó)在醫(yī)療AI領(lǐng)域從跟跑到領(lǐng)跑
    的頭像 發(fā)表于 08-19 10:58 ?1232次閱讀
    弘信電子攜手<b class='flag-5'>百川</b><b class='flag-5'>智能</b>推動(dòng)醫(yī)療AI技術(shù)落地應(yīng)用

    模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和
    發(fā)表于 07-03 19:43

    商湯大裝置萬(wàn)象大模型開(kāi)發(fā)平臺(tái)獲得中國(guó)信通最高評(píng)級(jí)

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通”)完成可信AI《大模型推理平臺(tái)通用能力成熟度》首輪評(píng)估。
    的頭像 發(fā)表于 07-01 10:48 ?1014次閱讀

    多模態(tài)感知+豆包模型!家居端側(cè)智能升級(jí)

    的關(guān)鍵力量。星宸科技與豆包模型的合作,將這一技術(shù)趨勢(shì)落實(shí)到實(shí)際應(yīng)用場(chǎng)景中,在智能家居、可穿戴設(shè)備以及連鎖店等領(lǐng)域引發(fā)了深刻變革。 ? 智能家居升級(jí) ? 陳立敬指出:“
    的頭像 發(fā)表于 06-21 00:06 ?7145次閱讀
    多模態(tài)感知+<b class='flag-5'>豆包</b>大<b class='flag-5'>模型</b>!家居端側(cè)<b class='flag-5'>智能</b>升級(jí)

    商湯日日新SenseNova融合模態(tài)大模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    的大模型。 可信AI多模態(tài)大模型評(píng)估2025年1月啟動(dòng),由中國(guó)信通人工智能研究所牽頭,依據(jù)由業(yè)界60余家單位共同編制的《多模態(tài)大
    的頭像 發(fā)表于 06-11 11:57 ?1439次閱讀

    在V2板子上部署豆包模型調(diào)試指南

    在V2板子上部署豆包模型調(diào)試指南 準(zhǔn)備階段 首先,可以觀看大模型實(shí)戰(zhàn)(SC171開(kāi)發(fā)套件V3)并下載工程源碼,之后我們需要在板子上安裝這個(gè)代碼所要用到的一些庫(kù)。 pip3 install
    發(fā)表于 05-25 10:17

    度文心大模型X1 Turbo獲得信通當(dāng)前大模型最高評(píng)級(jí)證書(shū)

    度在520居然還領(lǐng)了個(gè)證?是它, 信通當(dāng)前大模型最高評(píng)級(jí)證書(shū) ! 在5月20日的度AI Day 上,中國(guó)信通公布了大
    的頭像 發(fā)表于 05-21 18:19 ?1294次閱讀
    <b class='flag-5'>百</b>度文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通<b class='flag-5'>院</b>當(dāng)前大<b class='flag-5'>模型</b>最高評(píng)級(jí)證書(shū)

    萬(wàn)里紅入選中國(guó)信通模型應(yīng)用交付供應(yīng)商名錄

    近日,中國(guó)信息通信研究院與中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)聯(lián)合發(fā)布了《大模型應(yīng)用交付供應(yīng)商名錄(2025年Q1)》。該名錄基于問(wèn)卷調(diào)研統(tǒng)計(jì),通過(guò)對(duì)政務(wù)、金融、醫(yī)療等十大重點(diǎn)行業(yè)大模型
    的頭像 發(fā)表于 04-25 17:25 ?1348次閱讀

    模型實(shí)戰(zhàn)(SC171開(kāi)發(fā)套件V3)

    模型實(shí)戰(zhàn)(SC171開(kāi)發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 火山引擎豆包模型調(diào)試指南 3分31秒 https://t.elecfans.com/v
    發(fā)表于 04-16 18:52

    安徽省水利科學(xué)研究院攜手中科曙光完成DeepSeek大模型部署

    近日,安徽省(水利部淮河水利委員會(huì))水利科學(xué)研究院攜手中科曙光,成功完成國(guó)產(chǎn)大模型DeepSeek、BGE-M3嵌入模型及重排模型的本地化部署與測(cè)試,并順利接入梅山水庫(kù)運(yùn)行管理矩陣平臺(tái)
    的頭像 發(fā)表于 03-25 11:36 ?1051次閱讀

    商湯“日日新”融合大模型登頂大語(yǔ)言與多模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡(jiǎn)稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國(guó)大模型年度評(píng)測(cè)》結(jié)果顯示:在語(yǔ)言和多模態(tài)核心能力測(cè)評(píng)中,商湯“日日新”融合大
    的頭像 發(fā)表于 03-18 10:35 ?1159次閱讀

    中國(guó)電信研究院蒞臨軟通動(dòng)力參觀交流

    近日,中國(guó)電信研究院副院長(zhǎng)李俊杰率隊(duì)參訪軟通動(dòng)力北京總部,與軟通動(dòng)力高級(jí)副總裁陳力銘等就人工智能、智能終端、數(shù)字能源、研發(fā)云、測(cè)評(píng)與認(rèn)證等領(lǐng)域開(kāi)展深入洽談,并達(dá)成一系列重要共識(shí)。
    的頭像 發(fā)表于 03-13 09:29 ?1036次閱讀