91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型參數(shù)達(dá)百萬(wàn)億級(jí)別,AI商業(yè)化進(jìn)程加速!

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-02-26 00:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)大模型,又稱為預(yù)訓(xùn)練模型、基礎(chǔ)模型等,大模型通常是在大規(guī)模無(wú)標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練,學(xué)習(xí)出一種特征和規(guī)則。近期火爆的ChatGPT,便是基于GPT大模型的一個(gè)自然語(yǔ)言處理工具。

從參數(shù)規(guī)模上看,AI大模型先后經(jīng)歷了預(yù)訓(xùn)練模型、大規(guī)模預(yù)訓(xùn)練模型、超大規(guī)模預(yù)訓(xùn)練模型三個(gè)階段,參數(shù)量實(shí)現(xiàn)了從億級(jí)到百萬(wàn)億級(jí)的突破。從模態(tài)支持上看,AI大模型從支持圖片、圖像、文本、語(yǔ)音單一模態(tài)下的單一任務(wù),逐漸發(fā)展為支持多種模態(tài)下的多種任務(wù)。

AI大模型的發(fā)展歷程

AI大模型的發(fā)展,還要從2017年Vaswani等提出Transformer架構(gòu)說(shuō)起,Transformer架構(gòu)的提出奠定了當(dāng)前大模型領(lǐng)域主流的算法架構(gòu)基礎(chǔ)。

2018年,谷歌提出了大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型BERT,該模型是基于Transformer的雙向深層預(yù)訓(xùn)練模型,其參數(shù)首次超過(guò)3億規(guī)模;同年,OpenAI提出了生成式預(yù)訓(xùn)練Transformer模型GPT,大大地推動(dòng)了自然語(yǔ)言處理領(lǐng)域的發(fā)展。此后,基于BERT的改進(jìn)模型、ELNet、RoBERTa、T5等大量新式預(yù)訓(xùn)練語(yǔ)言模型不斷涌現(xiàn),預(yù)訓(xùn)練技術(shù)在自然語(yǔ)言處理領(lǐng)域蓬勃發(fā)展。

2019年,OpenAI繼續(xù)推出15億參數(shù)的GPT-2,能夠生成連貫的文本段落,做到初步的閱讀理解、機(jī)器翻譯等。緊接著,英偉達(dá)推出了83億參數(shù)的Megatron-LM,谷歌推出了110億參數(shù)的T5,微軟推出了170億參數(shù)的圖靈Turing-NLG。

2020年,OpenAI推出了超大規(guī)模語(yǔ)言訓(xùn)練模型GPT-3,參數(shù)達(dá)到1750億,在兩年左右的時(shí)間實(shí)現(xiàn)了模型規(guī)模從億級(jí)到上千億級(jí)的突破,并能夠?qū)崿F(xiàn)作詩(shī)、聊天、生成代碼等功能。此后,微軟和英偉達(dá)在2020年10月聯(lián)手發(fā)布了5300億參數(shù)的MegatronTuring自然語(yǔ)言生成模型(MT-NLG)。

2021年1月,谷歌推出的Switch Transformer模型以高達(dá)1.6萬(wàn)億的參數(shù)量成為史上首個(gè)萬(wàn)億級(jí)語(yǔ)言模型;到2022年一大批大模型涌現(xiàn),比如Stability AI發(fā)布的文字到圖像的創(chuàng)新模型Diffusion,以及OpenAI推出的ChatGPT。

在國(guó)內(nèi),大模型研究發(fā)展迅速。2021年,商湯發(fā)布了書生(INTERN)大模型,擁有100億的參數(shù)量;2021年4月,華為云聯(lián)合循環(huán)智能發(fā)布盤古NLP超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,參數(shù)規(guī)模達(dá)1000億,聯(lián)合北京大學(xué)發(fā)布盤古α超大規(guī)模預(yù)訓(xùn)練模型,參數(shù)規(guī)模達(dá)2000億。

同年4月,阿里達(dá)摩院發(fā)布270億參數(shù)的中文預(yù)訓(xùn)練語(yǔ)言模型PLUG,聯(lián)合清華大學(xué)發(fā)布參數(shù)規(guī)模達(dá)到 1000億的中文多模態(tài)預(yù)訓(xùn)練模型M6;7月,百度推出ERNIE 3.0知識(shí)增強(qiáng)大模型,參數(shù)規(guī)模達(dá)到百億;10月,浪潮信息發(fā)布約2500億的超大規(guī)模預(yù)訓(xùn)練模型“源 1.0”;12月,百度推出ERNIE 3.0 Titan模型,參數(shù)規(guī)模達(dá)2600億。

2022 年,基于清華大學(xué)、阿里達(dá)摩院等研究成果以及超算基礎(chǔ)實(shí)現(xiàn)的“腦級(jí)人工智能模型”八卦爐(BAGUALU)完成建立,其模型參數(shù)規(guī)模突破了174萬(wàn)億個(gè)??梢钥吹剑壳按竽P蛥?shù)規(guī)模最高已經(jīng)達(dá)到百萬(wàn)億級(jí)別。

大模型研究的重要意義

當(dāng)前人工智能正處在可以用到好用的落地階段,但目前仍處于商業(yè)落地早期,主要面臨著場(chǎng)景需求碎片化、人力研發(fā)和應(yīng)用計(jì)算成本高、長(zhǎng)尾場(chǎng)景數(shù)據(jù)較少導(dǎo)致模型訓(xùn)練精度不夠、模型算法從實(shí)驗(yàn)室場(chǎng)景到真實(shí)場(chǎng)景效果差距大等行業(yè)痛點(diǎn)。

大模型具備大規(guī)模和預(yù)訓(xùn)練的特點(diǎn),一方面有良好的通用性、泛化性,能夠解決傳統(tǒng)AI應(yīng)用中門檻高、部署難的問(wèn)題,另一方面可以作為技術(shù)底座,支撐智能化產(chǎn)品及應(yīng)用落地。

過(guò)去很多年,雖然各大科技公司不斷推出較大規(guī)模的模型,然而直到去年生成式AI逐漸走向商業(yè)化,以及去年底今年初OpenAI推出的ChatGPT爆火,AI大模型才真正迎來(lái)發(fā)展的轉(zhuǎn)折點(diǎn)。美國(guó)國(guó)家工程院外籍院士、北京智源人工智能研究院理事張宏江此前表示,ChatGPT和AIGC,技術(shù)爆火背后,代表著人工智能(AI)大模型進(jìn)入一個(gè)新的技術(shù)范式,也是第三波AI浪潮經(jīng)過(guò)十幾年發(fā)展之后一個(gè)非常重要的拐點(diǎn)。

張宏江認(rèn)為,它其實(shí)代表著從以前各自研發(fā)專用小模型到研發(fā)超大規(guī)模通用智能模型的一個(gè)范式轉(zhuǎn)變。這個(gè)轉(zhuǎn)變的重要意義在于:通過(guò)這種比較先進(jìn)的算法架構(gòu),盡可能多的數(shù)據(jù),匯集大量算力,集約化的訓(xùn)練達(dá)模式,從而供大量用戶使用。

大模型的發(fā)展很可能會(huì)改變信息產(chǎn)業(yè)的格局,改變以前作坊式AI開發(fā)模式,把AI應(yīng)用帶入基于互聯(lián)網(wǎng)、云計(jì)算的大規(guī)模智能云階段。

小結(jié)

雖然過(guò)去十幾年人工智能技術(shù)發(fā)展迅速,然而在近幾年卻遇到了一些技術(shù)瓶頸和商業(yè)化難題。而大模型的發(fā)展和普及,尤其是通過(guò)大模型+微調(diào)的新技術(shù)開發(fā)范式,人工智能將能夠更好的在各種場(chǎng)景中實(shí)現(xiàn)應(yīng)用,當(dāng)然大模型的訓(xùn)練和推理對(duì)算力等也提出了很高的要求,因此大模型的研究最終能夠如何推進(jìn)人工智能產(chǎn)業(yè)的發(fā)展,還需要產(chǎn)業(yè)鏈各環(huán)節(jié)的共同努力。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39943

    瀏覽量

    301570
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10297
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AR眼鏡方案亮相國(guó)際展會(huì),鐳昱單片全彩Micro-LED邁入商業(yè)化新階段

    2026新年伊始,鐳昱在Micro-LED微顯示領(lǐng)域的商業(yè)化進(jìn)程迎來(lái)關(guān)鍵突破——搭載鐳昱PowerMatch? 1單片全彩Micro-LED微顯示屏的AR眼鏡方案,先后亮相CES與SPIE
    的頭像 發(fā)表于 02-28 16:38 ?715次閱讀
    AR眼鏡方案亮相國(guó)際展會(huì),鐳昱單片全彩Micro-LED邁入<b class='flag-5'>商業(yè)化</b>新階段

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    邁向吉瓦級(jí)AI工廠的能源變革:英偉達(dá)Rubin平臺(tái)電源架構(gòu)解析

    隨著人工智能(AI)模型參數(shù)量突破萬(wàn)億級(jí)別,從大語(yǔ)言模型(LLM)的訓(xùn)練向推理、以及更高級(jí)的代理
    的頭像 發(fā)表于 01-15 17:42 ?790次閱讀
    邁向吉瓦級(jí)<b class='flag-5'>AI</b>工廠的能源變革:英偉<b class='flag-5'>達(dá)</b>Rubin平臺(tái)電源架構(gòu)解析

    PIX Moving與泰宇坦行啟動(dòng)城市機(jī)器人商業(yè)化試點(diǎn)運(yùn)營(yíng)

    加速自動(dòng)駕駛技術(shù)在真實(shí)商業(yè)場(chǎng)景中的價(jià)值轉(zhuǎn)化,PIX Moving 近日宣布與運(yùn)營(yíng)合作伙伴泰宇坦行(勘設(shè)股份控股子公司)達(dá)成戰(zhàn)略合作,在貴陽(yáng)市觀山湖區(qū)正式啟動(dòng)城市機(jī)器人商業(yè)化試點(diǎn)運(yùn)營(yíng)。
    的頭像 發(fā)表于 01-15 11:32 ?737次閱讀

    踏歌智行斬獲2025高工金球獎(jiǎng)年度無(wú)人駕駛商業(yè)化落地先鋒獎(jiǎng)

    在12月11日舉行的2025高工智能汽車金球獎(jiǎng)評(píng)選中,踏歌智行憑借豐富的露天礦商業(yè)化實(shí)踐經(jīng)驗(yàn),以及優(yōu)秀的運(yùn)營(yíng)效率表現(xiàn),一舉斬獲“無(wú)人駕駛商業(yè)化落地先鋒獎(jiǎng)”年度大獎(jiǎng)。
    的頭像 發(fā)表于 12-19 17:38 ?839次閱讀

    智行者科技榮獲2025高工金球獎(jiǎng)年度無(wú)人駕駛商業(yè)化落地先鋒獎(jiǎng)

    近日,在2025(第九屆)高工智能汽車年會(huì)上,備受業(yè)界矚目的年度金球獎(jiǎng)榜單正式揭曉。智行者憑借在無(wú)人駕駛領(lǐng)域卓越的商業(yè)化落地成果與顯著的行業(yè)示范價(jià)值,成功摘得 “年度無(wú)人駕駛商業(yè)化落地先鋒獎(jiǎng)”。
    的頭像 發(fā)表于 12-16 14:14 ?453次閱讀

    xMEMS完成2100萬(wàn)美元D輪融資,加速突破性piezoMEMS技術(shù)在AI消費(fèi)設(shè)備中的商業(yè)化進(jìn)程

    、CDIB-TEN Capital、Harbinger Venture Capital、SIG Asia Investments(海納國(guó)際集團(tuán)SIG的附屬公司)及其他戰(zhàn)略投資者跟投。 新資金將用于加速xMEMS基于piezoMEMS的揚(yáng)聲器和微型散熱芯片的量產(chǎn)與全球商業(yè)化
    的頭像 發(fā)表于 11-07 10:45 ?750次閱讀
    xMEMS完成2100萬(wàn)美元D輪融資,<b class='flag-5'>加速</b>突破性piezoMEMS技術(shù)在<b class='flag-5'>AI</b>消費(fèi)設(shè)備中的<b class='flag-5'>商業(yè)化</b><b class='flag-5'>進(jìn)程</b>

    企創(chuàng)科技與天罡智算合作再升級(jí),獨(dú)家運(yùn)營(yíng)模型市場(chǎng)賦能AI應(yīng)用高效商業(yè)化

    重要升級(jí)。在既有品牌戰(zhàn)略合作基礎(chǔ)上,企創(chuàng)科技正式成為天罡智算平臺(tái)"AI模型市場(chǎng)"的獨(dú)家運(yùn)營(yíng)商,此標(biāo)志著雙方合作從品牌層面深化至業(yè)務(wù)運(yùn)營(yíng)核心,共同為人工智能企業(yè)打造從市場(chǎng)推廣到商業(yè)轉(zhuǎn)化的完整閉環(huán)服務(wù)。 一、強(qiáng)強(qiáng)聯(lián)合,構(gòu)建
    的頭像 發(fā)表于 10-22 13:43 ?165次閱讀
    企創(chuàng)科技與天罡智算合作再升級(jí),獨(dú)家運(yùn)營(yíng)<b class='flag-5'>模型</b>市場(chǎng)賦能<b class='flag-5'>AI</b>應(yīng)用高效<b class='flag-5'>商業(yè)化</b>

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    從續(xù)航焦慮到安全飛行:增程式技術(shù)如何推動(dòng)eVTOL商業(yè)化落地

    在低空經(jīng)濟(jì)加速發(fā)展的背景下,電動(dòng)垂直起降飛行器(eVTOL)的商業(yè)化進(jìn)程面臨核心挑戰(zhàn)——續(xù)航能力和動(dòng)力可靠性。純電推進(jìn)系統(tǒng)受限于當(dāng)前電池能量密度,難以滿足中遠(yuǎn)程飛行需求,而增程式發(fā)電系統(tǒng)
    的頭像 發(fā)表于 09-25 11:25 ?1162次閱讀
    從續(xù)航焦慮到安全飛行:增程式技術(shù)如何推動(dòng)eVTOL<b class='flag-5'>商業(yè)化</b>落地

    比肩HBM,SOCAMM內(nèi)存模組即將商業(yè)化

    參數(shù)規(guī)模達(dá)數(shù)百億甚至萬(wàn)億級(jí)別,帶來(lái)巨大內(nèi)存需求,但HBM內(nèi)存價(jià)格高昂,只應(yīng)用在高端算力卡上。SOCAMM則有望應(yīng)用于AI服務(wù)器、高性能計(jì)算、
    的頭像 發(fā)表于 05-17 01:15 ?4041次閱讀

    經(jīng)緯恒潤(rùn)和白犀牛達(dá)成戰(zhàn)略合作,加速自動(dòng)駕駛商業(yè)化進(jìn)程

    近日,經(jīng)緯恒潤(rùn)與全球領(lǐng)先的L4級(jí)別自動(dòng)駕駛公司白犀牛達(dá)成戰(zhàn)略合作。雙方將圍繞車規(guī)級(jí)智能硬件研發(fā)、高可靠性無(wú)人車產(chǎn)品開發(fā)展開深度合作,共同推動(dòng)末端物流無(wú)人車的規(guī)模商業(yè)落地。此次合作,雙方將充分發(fā)揮
    的頭像 發(fā)表于 05-14 17:03 ?880次閱讀
    經(jīng)緯恒潤(rùn)和白犀牛達(dá)成戰(zhàn)略合作,<b class='flag-5'>加速</b>自動(dòng)駕駛<b class='flag-5'>商業(yè)化</b><b class='flag-5'>進(jìn)程</b>

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    基石。 Neuron Studio打造全流程一站式開發(fā)體驗(yàn),為AI應(yīng)用開發(fā)按下加速AI 應(yīng)用的開發(fā)瓶頸,從來(lái)都不是“點(diǎn)的問(wèn)題”,而是“鏈的問(wèn)題”:開發(fā)工具碎片,調(diào)優(yōu)過(guò)程靠手動(dòng),單
    發(fā)表于 04-13 19:52

    PCIe 7.0最終版草案發(fā)布,傳輸速率128 GT/s,PCIe 6.0加速商業(yè)化

    PCIe 7.0最終版草案發(fā)布,傳輸速率128 GT/s,PCIe 6.0加速商業(yè)化 ? 電子發(fā)燒友網(wǎng)綜合報(bào)道,近日,PCI-SIG 組織公布了 PCI Express 7.0 規(guī)范的0.9 版草案
    發(fā)表于 03-29 00:07 ?1178次閱讀

    AI模型端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI模型解決方案,激活場(chǎng)景智能新范式

    AI模型解決方案?jìng)涫懿毮浚瑸?b class='flag-5'>AI設(shè)備的革新注入了澎湃動(dòng)力。萬(wàn)億級(jí)市場(chǎng)藍(lán)海顯現(xiàn),端側(cè)AI模型
    的頭像 發(fā)表于 03-26 19:05 ?1276次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式