91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)內(nèi)大模型爭(zhēng)霸賽,你最看好哪家?

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 2023-05-19 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI Vs Google

e597a338-f620-11ed-90ce-dac502259ad0.png

目前大模型 top2 應(yīng)該就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。這兩家公司早已布局,而且技術(shù)實(shí)力雄厚。國(guó)內(nèi)大模型和 GPT-4 相比,還是有比較大的差距。

但是國(guó)內(nèi)的勢(shì)頭目前不錯(cuò),百家齊鳴,還沒(méi)有一家有絕對(duì)的優(yōu)勢(shì)。

讓人頭暈的排名

e5a19d3e-f620-11ed-90ce-dac502259ad0.png

之前有媒體給出了目前國(guó)內(nèi)Top-5的大模型公司,分別是:百度的文心一言、阿里的通義千問(wèn)、騰訊的混元、華為的盤古以及360的智腦。

而最近,中文通用大模型基準(zhǔn)(SuperCLUE)評(píng)測(cè)公布了最新結(jié)果,GPT-4 遙遙領(lǐng)先,而國(guó)內(nèi)成績(jī)最好的是科大訊飛的星火認(rèn)知大模型。這里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分還低,實(shí)在難以置信。

e5aa4c36-f620-11ed-90ce-dac502259ad0.png

但是我又仔細(xì)看了一下這個(gè)評(píng)測(cè)。媽呀,評(píng)測(cè)集是SuperCLUE,而非SuperGLUE。

眾所周知,在國(guó)際NLP領(lǐng)域,有大名鼎鼎的數(shù)據(jù)集 GLUE 和 SuperGLUE,非常權(quán)威,OpenAI、谷歌等的大模型都在上面評(píng)測(cè),極大推動(dòng)了 NLP 領(lǐng)域的發(fā)展。

這次這份 SuperCLUE 評(píng)測(cè)的發(fā)起方為 Chinese GLUE 組織 (簡(jiǎn)稱 CLUE),CLUE 是仿照 GLUE由國(guó)內(nèi)民間組織的評(píng)測(cè),權(quán)威度和影響力與 GLUE 相比差很遠(yuǎn),其微信賬號(hào)主體屬性為個(gè)人。但這也迷惑了不少圈內(nèi)人,GLUE和 CLUE 分不清楚,堪稱李逵和李鬼。

還有一點(diǎn)存疑,評(píng)測(cè)榜單發(fā)布當(dāng)天5月9日,其官網(wǎng)顯示信息,中文基準(zhǔn)測(cè)評(píng)成員顧問(wèn)中排名第一的是崔一鳴,身份為學(xué)術(shù)顧問(wèn)委員會(huì)主任,哈工大訊飛聯(lián)合實(shí)驗(yàn)室(HFL)資深級(jí)研究員。而5月10日,官網(wǎng)已刪除此條顧問(wèn)的信息。

而001號(hào)創(chuàng)始會(huì)員徐亮,是會(huì)長(zhǎng),相當(dāng)于這個(gè)榜單的實(shí)際負(fù)責(zé)人。昵稱 brightmart,中文任務(wù)基準(zhǔn)測(cè)評(píng)發(fā)起人。多個(gè)預(yù)訓(xùn)練模型中文版、文本分類和數(shù)據(jù)集開(kāi)源項(xiàng)目作者。

徐亮還有另一個(gè)身份,在5月9日官網(wǎng)中顯示,他是杭州實(shí)在智能算法專家,也就是元語(yǔ)智能的創(chuàng)始人,曾在2月份發(fā)布自稱“國(guó)內(nèi)首個(gè)功能對(duì)話大模型ChatYuan”,不僅無(wú)法測(cè)試,發(fā)布幾天即被監(jiān)管叫停。4月,又被報(bào)道套殼推出開(kāi)源組件。有分析人士認(rèn)為,不排除創(chuàng)業(yè)公司有融資壓力,蹭熱度吸引投資人關(guān)注。

該 SpuerClue 榜單發(fā)起方,001號(hào)顧問(wèn)是訊飛身份背景、001號(hào)基準(zhǔn)發(fā)起人是創(chuàng)業(yè)公司創(chuàng)始人。在榜單發(fā)布后,擔(dān)心行業(yè)質(zhì)疑其公平、公正,相關(guān)信息還被刪除。這就有點(diǎn)不言而喻了。

僅用100道評(píng)測(cè)題目就出來(lái)了一份“權(quán)威報(bào)告”

最后來(lái)說(shuō)下這個(gè)榜單本身,業(yè)內(nèi)人士一眼就可以看出來(lái),評(píng)測(cè)的很不合理,首先,沒(méi)有公布評(píng)估數(shù)據(jù),以及具體的評(píng)估方式。同時(shí)從它的公開(kāi)表述,可推斷總共題目就 100 道題目。這個(gè)題目量少到難以置信。專業(yè)人士可能有參與過(guò),像國(guó)際權(quán)威 SuperGlue 榜單,題目一般都得有 2 萬(wàn)多道,離權(quán)威可是差了幾萬(wàn)倍。況且,它的評(píng)測(cè)得分榜首都是人類,那這個(gè)評(píng)分的基準(zhǔn)到底是什么?是否有很多主觀性因素在里面?是否某些大模型提前在這個(gè)數(shù)據(jù)集上已經(jīng)訓(xùn)練過(guò)?

任務(wù)設(shè)計(jì)太武斷,所謂“通用”基準(zhǔn),是用以測(cè)試通用的人工認(rèn)知能力的,那么我們自然希望,評(píng)測(cè)任務(wù)是參考了模型想要模擬的認(rèn)知能力及相關(guān)理論,系統(tǒng)化地選擇出來(lái)的。而實(shí)際上,我們觀察到的則是,基準(zhǔn)的作者們?cè)谶x擇任務(wù)的時(shí)候,更像是圖方便、省事。以往,CLUE 中存在著部分?jǐn)?shù)據(jù)集,一味考慮任務(wù)的復(fù)雜性,卻在最起碼的分布邊界劃分上(如NER各個(gè)類別的邊界,如場(chǎng)所、景點(diǎn)類,組織機(jī)構(gòu)及其子類),模糊不清,且數(shù)據(jù)的一致性無(wú)法保證。

要么別比,要比就來(lái)點(diǎn)正規(guī)的比賽。自己出題自己考,說(shuō)不準(zhǔn)還搶跑,自己還是評(píng)委,那這是欺不負(fù)了解真相的吃瓜群眾。投機(jī)取巧,終皆散去??嗑殐?nèi)功,才是王道。

國(guó)內(nèi)大模型排名(僅供參考)

拋開(kāi)這些,從模型規(guī)模、模型效果、市場(chǎng)占有率等多個(gè)角度,百度的文心一言、華為的盤古、阿里的通義千問(wèn)、騰訊的混元排在前四,應(yīng)該是比較合理的,至于后面的排名,就不大能保證了。不過(guò)下面的排名也可以參考一下:

e5b3b104-f620-11ed-90ce-dac502259ad0.png

下面是一份完整的名單:

e5b8a9b6-f620-11ed-90ce-dac502259ad0.png

e5c31432-f620-11ed-90ce-dac502259ad0.png

按發(fā)布時(shí)間排序:

e5c914ea-f620-11ed-90ce-dac502259ad0.png

百度:文心一言

作為國(guó)內(nèi)最早發(fā)布的大模型,百度的文心一言在今年3月16號(hào)就發(fā)布了,隨后經(jīng)過(guò)了多個(gè)版本的迭代。目前已經(jīng)有上千家企業(yè)接入。文心一言支持圖片、語(yǔ)音等多模態(tài)。

3月16日,百度在全球大廠中率先發(fā)布對(duì)標(biāo) ChatGPT 的大模型產(chǎn)品文心一言。據(jù)了解,文心一言內(nèi)測(cè)一個(gè)多月,就完成了4次大的技術(shù)升級(jí),大模型推理性能提升近10倍。

李彥宏在5月4日百度內(nèi)部活動(dòng)中表示,百度之所以能夠在Google、Meta、Amazon等大廠之前率先發(fā)布生成式大模型產(chǎn)品,是因?yàn)榘俣仍谛酒?、框架、模型、?yīng)用等四個(gè)層面做到全棧布局、層層領(lǐng)先。

360:360智腦

百度是國(guó)內(nèi)搜索市場(chǎng)排名第一公司,而排名第二就是360。

大模型依靠的算力、數(shù)據(jù)、算法、場(chǎng)景,這兩家公司都具備,這也是搜索公司的優(yōu)勢(shì),有業(yè)務(wù)和數(shù)據(jù)支撐大模型研發(fā)和落地。

5月16日,360集團(tuán)和智譜AI宣布達(dá)成戰(zhàn)略合作,雙方共同研發(fā)的千億級(jí)大模型“360GLM”已具備新一代認(rèn)知智能通用模型水準(zhǔn)。

而在今天的世界智能大會(huì)上,周鴻祎展示了“360智腦”的多輪對(duì)話和“360鴻圖”的AI生圖兩個(gè)能力。

e5d272d8-f620-11ed-90ce-dac502259ad0.png

就像谷歌和微軟,一個(gè)擁有谷歌搜索,一個(gè)擁有必應(yīng)。國(guó)內(nèi)的百度和360,一個(gè)擁有百度搜索,一個(gè)擁有360搜索。

搜索公司應(yīng)該是這場(chǎng)大模型爭(zhēng)霸賽最后的贏家。(只是個(gè)人看法)

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52124
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16883
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10098

原文標(biāo)題:國(guó)內(nèi)大模型爭(zhēng)霸賽,你最看好哪家?這是你心目中的大模型排名嗎?

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國(guó)內(nèi)哪家 SLIC 芯片支持定制?思電子脫穎而出

    在當(dāng)今科技飛速發(fā)展的時(shí)代,芯片作為各類電子設(shè)備的核心部件,其重要性不言而喻。對(duì)于特定行業(yè)和應(yīng)用場(chǎng)景而言,定制化的SLIC(用戶線路接口)芯片需求愈發(fā)凸顯,那么國(guó)內(nèi)究竟哪家SLIC芯片支持定制呢?今天
    的頭像 發(fā)表于 01-20 14:49 ?1276次閱讀
    <b class='flag-5'>國(guó)內(nèi)</b><b class='flag-5'>哪家</b> SLIC 芯片支持定制?<b class='flag-5'>賽</b>思電子脫穎而出

    國(guó)內(nèi)恒溫晶振廠家哪家好?

    在科技飛速發(fā)展的今天,恒溫晶振作為一種高精度、高穩(wěn)定性的頻率控制元件,在國(guó)內(nèi)眾多行業(yè)都有著廣泛的應(yīng)用。那么,國(guó)內(nèi)的恒溫晶振廠家究竟哪家更好呢?這是一個(gè)值得深入探討的問(wèn)題。一、技術(shù)實(shí)力是關(guān)鍵要評(píng)判一家
    的頭像 發(fā)表于 01-08 15:42 ?368次閱讀
    <b class='flag-5'>國(guó)內(nèi)</b>恒溫晶振廠家<b class='flag-5'>哪家</b>好?

    百度文心大模型5.0 Preview榮登LMArena文本榜國(guó)內(nèi)第一

    12月23日,LMArena大模型競(jìng)技場(chǎng)發(fā)布最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國(guó)內(nèi)第一該模型在創(chuàng)意寫作、高難度指
    的頭像 發(fā)表于 12-23 15:02 ?558次閱讀

    openDACS 2025 開(kāi)源EDA與芯片項(xiàng) 題七:基于大模型的生成式原理圖設(shè)計(jì)

    領(lǐng)域,對(duì)促進(jìn)產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要意義。本項(xiàng)包含7道題,下面是題七 基于大模型的生成式原理圖設(shè)計(jì)的介紹。 2. 命題單位及題Chai
    發(fā)表于 11-13 11:49

    百度文心大模型5.0-Preview文本能力國(guó)內(nèi)第一

    11月8日凌晨,LMArena大模型競(jìng)技場(chǎng)最新排名顯示,文心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國(guó)第一該模型在創(chuàng)意寫作、復(fù)雜長(zhǎng)問(wèn)題理解、指令遵循等方面表現(xiàn)突出,超過(guò)多款
    的頭像 發(fā)表于 11-11 17:15 ?1484次閱讀

    知識(shí)分享 | 使用MXAM進(jìn)行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型

    知識(shí)分享在知識(shí)分享欄目中,我們會(huì)定期與讀者分享來(lái)自MES模思的基于模型的軟件開(kāi)發(fā)相關(guān)Know-How干貨,關(guān)注公眾號(hào),隨時(shí)掌握基于模型的軟件設(shè)計(jì)的技術(shù)知識(shí)。使用MXAM進(jìn)行AUTOSAR模型
    的頭像 發(fā)表于 08-27 10:04 ?737次閱讀
    知識(shí)分享 | 使用MXAM進(jìn)行AUTOSAR<b class='flag-5'>模型</b>的靜態(tài)分析:Embedded Coder與TargetLink<b class='flag-5'>模型</b>

    可編程SLIC語(yǔ)音芯片哪家好?

    呢?思電子科技無(wú)疑是其中的佼佼者。思電子科技作為國(guó)內(nèi)知名的數(shù)?;旌闲酒瑥S商,在可編程SLIC語(yǔ)音芯片領(lǐng)域展現(xiàn)出了強(qiáng)大的實(shí)力。其推出的ASX630系列芯片,堪稱
    的頭像 發(fā)表于 06-12 13:55 ?759次閱讀
    可編程SLIC語(yǔ)音芯片<b class='flag-5'>哪家</b>好?

    商湯日日新SenseNova融合模態(tài)大模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)完成可信AI多模態(tài)大模型首輪評(píng)估。 商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當(dāng)前最高評(píng)級(jí)——4+級(jí),并成為國(guó)內(nèi)首家
    的頭像 發(fā)表于 06-11 11:57 ?1428次閱讀

    手表芯片多強(qiáng)爭(zhēng)霸賽開(kāi)啟!小米玄戒T1入局,格局生變?

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)當(dāng)前,國(guó)內(nèi)可穿戴設(shè)備主控芯片市場(chǎng)呈現(xiàn)出“一超多強(qiáng)、梯度競(jìng)爭(zhēng)”的競(jìng)爭(zhēng)態(tài)勢(shì),就在5月,小米重磅推出智能手表玄戒T1,在通信性能、功耗控制和功能擴(kuò)展方面展現(xiàn)了新的突破,標(biāo)志著
    的頭像 發(fā)表于 05-29 01:05 ?1.1w次閱讀
    手表芯片多強(qiáng)<b class='flag-5'>爭(zhēng)霸賽</b>開(kāi)啟!小米玄戒T1入局,格局生變?

    當(dāng)我問(wèn)DeepSeek國(guó)內(nèi)壓力傳感器哪家強(qiáng),它這樣回答

    特意問(wèn)DeepSeek國(guó)內(nèi)壓力傳感器發(fā)展現(xiàn)狀,以及國(guó)內(nèi)壓力傳感器到底哪家強(qiáng),DeepSeek這樣回復(fù)我——壓力傳感器在工業(yè)自動(dòng)化、汽車電子和醫(yī)療設(shè)備領(lǐng)域有著廣泛應(yīng)
    的頭像 發(fā)表于 05-28 14:48 ?1523次閱讀
    當(dāng)我問(wèn)DeepSeek<b class='flag-5'>國(guó)內(nèi)</b>壓力傳感器<b class='flag-5'>哪家</b>強(qiáng),它這樣回答

    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)哪家好?思時(shí)鐘系統(tǒng)助力中國(guó)氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)哪家好?思時(shí)鐘系統(tǒng)助力中國(guó)氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-20 09:32 ?884次閱讀
    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)<b class='flag-5'>哪家</b>好?<b class='flag-5'>賽</b>思時(shí)鐘系統(tǒng)助力中國(guó)氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭(zhēng)霸

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭(zhēng)霸
    的頭像 發(fā)表于 05-17 17:31 ?933次閱讀
    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄<b class='flag-5'>爭(zhēng)霸</b>”

    西威端側(cè)大模型重塑智能座艙體驗(yàn)

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴(kuò)張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動(dòng)的智能化升級(jí)將成為產(chǎn)業(yè)突破的核心引擎。在日前召開(kāi)的2025上海車展國(guó)際汽車關(guān)鍵技術(shù)論壇上,德西威技術(shù)中心人工智能實(shí)驗(yàn)室專家張書赫博士以《端側(cè)智能·重塑體驗(yàn)》為題,分享了對(duì)大模型
    的頭像 發(fā)表于 05-15 09:13 ?1795次閱讀

    西威與面壁智能發(fā)布端側(cè)大模型語(yǔ)音交互方案

    日前,全球領(lǐng)先的移動(dòng)出行科技公司德西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個(gè)基于高通座艙平臺(tái)(SA8255P,簡(jiǎn)稱8255)的端側(cè)大模型語(yǔ)音交互方案,這是雙方自2024年12月簽署戰(zhàn)略合作協(xié)議以來(lái)發(fā)布的首個(gè)合作成果。
    的頭像 發(fā)表于 05-14 17:40 ?1313次閱讀

    當(dāng) RDK X3 遇上倉(cāng)儲(chǔ)機(jī)器人,智鏈團(tuán)隊(duì)讓效率原地起飛

    倉(cāng)儲(chǔ)界現(xiàn)在是"卷王"爭(zhēng)霸賽!2023年全國(guó)消費(fèi)狂飆47萬(wàn)億,網(wǎng)購(gòu)更是坐火箭般漲了11%,但老派倉(cāng)儲(chǔ)還在用"人海戰(zhàn)術(shù)",設(shè)備像戴著近視眼鏡,看啥都不清不楚。別急
    的頭像 發(fā)表于 04-21 01:18 ?881次閱讀
    當(dāng) RDK X3 遇上倉(cāng)儲(chǔ)機(jī)器人,智鏈團(tuán)隊(duì)讓效率原地起飛