91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大模型,化繁為簡歸文心

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-11-30 23:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型,已經(jīng)變成今天AI產(chǎn)業(yè)最為關注、最受期待的技術方向,甚至沒有之一。

其原因在于,大模型帶來了強大的泛化能力以及優(yōu)異的效果,并且能夠實現(xiàn)AI模型研發(fā)-部署-應用的標準化提升。這些價值與各界對AI工業(yè)化、大規(guī)模部署的期待不謀而合。于是,通過大模型進入AI工業(yè)大生產(chǎn)時代,已經(jīng)在業(yè)界凝聚了高度共識。

近兩年,圍繞大模型的技術創(chuàng)新、工具創(chuàng)新層出不窮。在繁花似錦的整體趨勢下,我們似乎也能看到隱藏的問題。比如大模型的門檻依舊偏高,與產(chǎn)業(yè)結合更多偏向案例性質,大范圍應用還有非常多的挑戰(zhàn)。參數(shù)繁榮、技術繁多、種類繁復的大模型,正有待迎接一次轉變。

11月30日,由深度學習技術與應用國家工程研究中心主辦、飛槳承辦的WAVE SUMMIT+ 2022在線上舉行。期間,圍繞文心大模型的一系列更新、升級引發(fā)了開發(fā)者廣泛關注。如果我們?yōu)槲男拇竽P偷纳夁M行一個簡要描述,或許可以用到“化繁為簡”這個詞。

aedb60119e2d46b09a66ccb7325aacfd~tplv-tt-shrink:640:0.image

峰會期間,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰提出,深度學習平臺加上大模型,貫通從硬件適配、模型訓練、推理部署到場景應用的AI全產(chǎn)業(yè)鏈,夯實產(chǎn)業(yè)智能化基座,將進一步加速智能化升級。

而在構建智能化基座的過程中,大模型的產(chǎn)業(yè)化路徑,必然是要封裝復雜的模型生產(chǎn)過程,從而高效支撐千行百業(yè)應用。

大模型的復雜技術與研發(fā)挑戰(zhàn),應該是停留在產(chǎn)業(yè)上游的。具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè),應該將模型生產(chǎn)進行封裝,在產(chǎn)業(yè)鏈上游就解決大數(shù)據(jù)、大算力、大模型的能力挑戰(zhàn)。這樣,應用場景與企業(yè)用戶、開發(fā)者,將得到簡單、易用、工業(yè)化的大模型能力。只有這樣,大模型才能真正落下去、推廣開。

兩點之間,直線最短。大模型已經(jīng)來到了化繁為簡的臨界點,而百度正在用飛槳+文心大模型,在技術與產(chǎn)業(yè)之間畫出這條直線。

在路上的大模型,需要化繁為簡

討論大模型的新升級、新發(fā)展思路,必須建立在對大模型產(chǎn)業(yè)化的客觀理解上。

在目前階段,大模型正處在高速發(fā)展期。我們近乎每個月,甚至每星期都可以看到產(chǎn)業(yè)界、學術界公布大模型創(chuàng)新。并且在今天,已經(jīng)很少看到大模型創(chuàng)新過分執(zhí)著參數(shù)對比,更多是進行不同技術路線、不同應用領域的多樣化創(chuàng)新。

與此同時,伴隨著大模型種類、功能的繁復多樣,輔助大模型的開發(fā)工具、軟硬件基礎設施、開源開放平臺也豐富了起來。圍繞大模型的產(chǎn)業(yè)生態(tài)開始壯大。

然而在這種情況下,我們依舊會發(fā)現(xiàn)大模型發(fā)展中有一個客觀存在的核心問題:產(chǎn)業(yè)主要提升的,是“訓大模型”的能力,而不是“用大模型”的能力。

一般來說,前者關注如何讓大模型更加“繁華”;但后者卻需要考慮實際場景,消弭應用門檻。在某種程度上需要反過來,化繁為簡。

fffe25fa39284b3398f0192cff6d1f5b~tplv-tt-shrink:640:0.image

很多產(chǎn)業(yè)都在理論上、需求上適合大模型落地。但在實操過程中將面對一系列適配問題。比如說:

1.自己開發(fā)大模型難度太大,訓練成本、存算成本過高。開發(fā)工具與社區(qū)支持也不足。

2.想要應用成熟的大模型,又往往缺少產(chǎn)業(yè)示范與行業(yè)路徑。不知道自己的行業(yè)該用哪種大模型,行業(yè)知識與行業(yè)需求如何與大模型對齊。

3.即使選到想用的大模型,又會發(fā)現(xiàn)本地環(huán)境難以兼容適配。大模型應用的工程化能力很難讓人滿意。

面對這些問題,千行百業(yè)需要從基礎模型、開發(fā)工具、開發(fā)社區(qū),到行業(yè)路徑的一系列幫助與加持,打通從大模型到產(chǎn)業(yè)的一系列關節(jié)。這種圍繞行業(yè)需求與產(chǎn)業(yè)應用進行創(chuàng)新,而不是圍繞大模型本身進行提升的思路,就是百度發(fā)展文心大模型,以及構建飛槳+文心產(chǎn)業(yè)智能化基座的獨特思路。

WAVE SUMMIT+ 2022所展現(xiàn)的,就是這種思路的進一步完備與壯大。

為行業(yè)找路徑:行業(yè)大模型已蔚為大觀

行業(yè)需求與AI技術對齊,這件事本身經(jīng)歷了漫長的發(fā)展,在今天已經(jīng)挑戰(zhàn)重重。而當行業(yè)面向大模型這個更新、更強的技術時,需求難以對齊的矛盾就會更加明顯。

面向這種困難,只有一個個行業(yè)去探索,在重點行業(yè)形成有效的大模型落地參考路徑。這或許是“最重”的選擇,但同時也是“最優(yōu)解”。

今年5月,文心大模型面向具體的行業(yè)需求,發(fā)布了行業(yè)大模型這一全新發(fā)展路徑。其通過文心大模型的基礎模型能力,搭配對海量行業(yè)數(shù)據(jù)的挖掘,以及由合作機構、行業(yè)客戶提供的行業(yè)特色數(shù)據(jù)和知識,加上行業(yè)特色的專家經(jīng)驗多方結合,進行相應的行業(yè)訓練任務設計,最終形成了文心行業(yè)大模型。

在于行業(yè)結合的過程中,文心大模型知識增強與產(chǎn)業(yè)級兩大特色得以充分發(fā)揮,形成了行業(yè)知識增強的關鍵路徑。這一路徑不僅解決了大模型的應用挑戰(zhàn),還凝結成了一系列面向重點行業(yè)的大模型產(chǎn)業(yè)落地方法。實現(xiàn)了大模型在行業(yè)場景中“不但能用還便捷好用”的價值。

在本次峰會上,文心行業(yè)大模型持續(xù)升級,在原有能源、金融、航天、傳媒等行業(yè)的基礎上,進一步升級到了11個行業(yè)大模型,將行業(yè)大模型延伸到了制造業(yè)、城市管理、汽車等關鍵領域??梢哉f,行業(yè)大模型已經(jīng)從先鋒、探索性質,發(fā)展到了覆蓋行業(yè)眾多、體系完備的新階段。從應用效果與行業(yè)覆蓋上來說,都已經(jīng)實現(xiàn)了蔚為大觀。

0b8cfa814288445298945f0e7c9ada34~tplv-tt-shrink:640:0.image

舉個例子,智慧城市建設是數(shù)字中國的重點發(fā)展方向。在今天,中國所有地級市都已經(jīng)有智慧城市項目落地。而大模型與智慧城市的結合,在目前階段還非常新穎。

在哈爾濱,近年來冰城探索了一系列AI技術賦能城市高質量發(fā)展、東北老工業(yè)基地振興的嘗試,取得了顯著成效。而就在剛剛,哈爾濱市政府攜手百度,聯(lián)合發(fā)布面向城市領域的行業(yè)大模型——冰城-百度·文心。

冰城-百度·文心大模型,可以將城市中跨業(yè)務、跨結構、跨部門的數(shù)據(jù)知識和多種任務算法進行融合,基于百度文心NLP大模型ERNIE 3.0,打造統(tǒng)一預訓練模型,提供強大的語言理解、語義分析等能力,支撐城市中各領域的AI規(guī)?;Ч嵘N男男袠I(yè)大模型,至此可以從城市治理、產(chǎn)業(yè)發(fā)展、公共服務等多個領域支持哈爾濱的數(shù)字化發(fā)展。從產(chǎn)業(yè)路徑上看,這一聯(lián)合發(fā)布、聯(lián)合打造,將大模型與智慧城市需求有效結合在了一起。為更多城市獲得大模型價值提供了參考路徑。

如今,行業(yè)大模型已經(jīng)在多個領域取得可信的成果。比如文心大模型與電影頻道結合,可以實現(xiàn)每天修復28.5萬幀老舊影片。即使是精修,文心大模型的修復速度也較人工效率提升了3到4倍。在能源、金融等一系列領域,行業(yè)大模型已經(jīng)形成了產(chǎn)業(yè)智能化的發(fā)展路標。

當然,除了行業(yè)大模型之外,文心大模型還以更多方式融入更廣泛的行業(yè)應用。比如從2019年3月文心ERNIE1.0發(fā)布以來,幾乎百度全系列產(chǎn)品都在逐步使用文心大模型。在千行百業(yè),文心大模型已通過飛槳開源開放平臺、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)。

行業(yè)有路徑,是文心大模型持續(xù)升級的首要目標。

為應用備技術:從模型、工具到應用的全線升級

如果說,大模型通向行業(yè),與行業(yè)需求、行業(yè)知識融合的大模型向產(chǎn)業(yè)的縱向打通。那么大模型對各種開發(fā)需求、應用需求的覆蓋,就是大模型走向產(chǎn)業(yè)的橫向能力打開。

在真實的應用場景中,企業(yè)和開發(fā)者需要接入大模型的方式是十分多樣的。有的企業(yè)確實需要自己開發(fā)大模型;也有企業(yè)需要以最低成本完成大模型適配;還有一些企業(yè)可能需要具有特殊能力的模型;有一部分企業(yè)需要產(chǎn)品級、可API接入的大模型能力。

只有從模型到工具,再到產(chǎn)品、社區(qū)都有完善、完整的技術儲備,才有能力降低大模型應用門檻,才有機會成為產(chǎn)業(yè)智能化的基座。

為此,百度全面升級了文心大模型的全景圖,既豐富了大模型的種類。同時也在大模型開發(fā)工具、產(chǎn)品能力、社區(qū)建設上進行了升級。

大模型因“大”而效果好,同時在產(chǎn)業(yè)應用中也會因為“太大”而難以落地部署。為了解決這個問題,百度全新發(fā)布了ERNIE 3.0 Tiny模型。其通過將千億模型作為教師模型,經(jīng)過知識蒸餾等方式,可以形成一系列輕量化模型。最終實現(xiàn)在效果損失非常有限的情況下,模型體量變小,但較比傳統(tǒng)模型卻有數(shù)十倍、上百倍的性能提升,以此滿足產(chǎn)業(yè)場景的真實應用需求。

同時,在跨模態(tài)領域,百度發(fā)布跨模態(tài)理解大模型ERNIE ViL 2.0、跨模態(tài)生成大模型ERNIE ViLG 2.0、文檔智能大模型 ERNIE-Layout。在生物計算方面,最新發(fā)布了蛋白質預測模型HelixFold-Single。而在任務大模型方面,則發(fā)布了代碼大模型ERNIE-Code。其可以通過多語言學習的形式,在語料上更加豐富多樣,使得模型能力更強,并且能夠支持多個語種。

在一系列新加入的模型之外,百度也在推動大模型開發(fā)工具建設、產(chǎn)品化升級與社區(qū)建設。在工具與平臺的技術升級上,百度提供面向場景化,以及行業(yè)大模型的配套能力。比如在模型精調(diào)方面提供的技術工具更加豐富,大模型的API當中將包含更豐富的精調(diào)能力。同時,在大模型訓練中也會添加一系列可信學習工具,滿足開發(fā)者對大模型的安全、可控需求。

在文心大模型的產(chǎn)品和社區(qū)方面,百度保留了旸谷社區(qū)作為創(chuàng)意社區(qū)。同時增加了兩款以大模型為核心驅動的產(chǎn)品。這些產(chǎn)品既可以直接賦能給有相關需求的產(chǎn)業(yè)用戶和泛科技用戶,豐富大模型的應用價值。同時也為行業(yè)起到了示范作用,展示了大模型產(chǎn)品化的技術路徑。

在最近備受關注的AIGC方面,百度打造的文心一格,在本次峰會上進行了一系列新能力的發(fā)布。比如近期非?;鸨囊詧D生圖能力、圖片通過文字進行編輯的能力,以及一鍵生成視頻的能力。

f495cad7f13d47ef9171970c73851ce7~tplv-tt-shrink:640:0.image

另一項產(chǎn)品升級,是以大模型核心驅動的搜索產(chǎn)品“文心百中”。這一產(chǎn)品由百度搜索與文心大模型聯(lián)合研制,可以滿足開發(fā)者和企業(yè)用戶的垂直搜索、企業(yè)搜索需求。其本身具有極簡的邏輯架構,以及強大的語義理解能力,并且可以極大降低搭建垂直搜索帶來的數(shù)據(jù)成本與人力成本?!拔男陌僦小保梢哉f從搜索這個全新層面,向業(yè)界展現(xiàn)了大模型的應用價值與產(chǎn)業(yè)空間,并且同樣也指向著清晰的應用場景。

從新的模型、新的工具,到產(chǎn)品與社區(qū)的升級,文心大模型可以說從多角度、全方位升級了技術儲備。這些技術能力對應著不同類型開發(fā)者、企業(yè)對大模型的多樣化需求。只有滿足這些具體的需求,打通一個個關隘,大模型才能去向它最應該去的地方——應用。

為智能筑底座:飛槳+大模型,畫出一條直線

兩點之間,直線最短。但大模型與產(chǎn)業(yè)之間,往往會因為技術路線分歧、訓練部署環(huán)境、行業(yè)知識無法對齊,而要七拐八拐,走大量彎路。這些彎路的存在,自然有大模型發(fā)展過程中的一系列客觀因素的影響,但同時也確實影響著大模型的應用效率、產(chǎn)業(yè)效能。

為了解決這些問題,百度的思考是盡量畫一條直線,讓開發(fā)者與行業(yè)可以不走彎路,以最高效率直接抵達大模型的內(nèi)在價值。

這條直線,需要包含工具集成性、技術豐富性、行業(yè)路徑完善性等等價值。只有把這些能力合而為一,才能實現(xiàn)將化繁為簡的目標。面向大模型的產(chǎn)業(yè)需求、應用場景,不僅需要做到有模型、有工具,同時需要將大模型與深度學習平臺結合起來,滿足企業(yè)、開發(fā)者從算力到應用的全流程需求。

為了更好幫助企業(yè)與開發(fā)者,實現(xiàn)從開發(fā)大模型到應用大模型的全流程實踐,百度勾勒出了飛槳+文心,即深度學習平臺+大模型的產(chǎn)業(yè)路徑。二者結合,開發(fā)者可以獲得從算力、框架、模型庫,再到大模型調(diào)用、大模型行業(yè)化的所有能力,獲得了完善、穩(wěn)固的產(chǎn)業(yè)智能化基座。自然也就完成了從大模型到產(chǎn)業(yè)的最短距離直達。

6658423a18024313a06a0309eab5b7f5~tplv-tt-shrink:640:0.image

為了與文心大模型一道構建產(chǎn)業(yè)智能化基座,飛槳也進行了一系列升級。最新發(fā)布的飛槳核心框架2.4版本,就著重對大模型開發(fā)進行了一系列功能的支持,以及面向大模型推理部署需求提供了一系列模型封裝能力,并且提供簡單易用的模型開發(fā)工具。飛槳企業(yè)版AI開發(fā)平臺EasyDL和BML也圍繞大模型的技術應用進行了全新升級,在業(yè)界首發(fā)端到端大模型開發(fā)套件PaddleFleetX。發(fā)布了提供全流程開箱即用的大模型平臺能力,加速大模型的產(chǎn)業(yè)落地。

至此,我們可以看到百度在搭建飛槳+文心產(chǎn)業(yè)基座,賦能大模型開發(fā)過程中的清晰思路:大模型并不僅僅是某種技術的創(chuàng)新,或者一個平臺的搭建。而是需要從最終用戶,最開發(fā)者與企業(yè)的應用需求出發(fā)。一步步倒推需要哪些支持,每一個環(huán)節(jié)還有哪些阻礙?

只要將這些阻礙一個個解決掉,將支持一個個搭建好,將所有復雜且具有挑戰(zhàn)的事先行完成,那么開發(fā)者和企業(yè)最終就將得到最簡單、可用的大模型。大模型與產(chǎn)業(yè)之間,也就實現(xiàn)了兩點之間,直線最短的連接。

這就是百度式的大模型發(fā)展思路,這就是化繁為簡歸文心。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39911

    瀏覽量

    301550
  • 模型
    +關注

    關注

    1

    文章

    3757

    瀏覽量

    52130
  • 大模型
    +關注

    關注

    2

    文章

    3660

    瀏覽量

    5196
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度模型5.0正式版上線

    今天,在百度Moment大會現(xiàn)場,模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1321次閱讀

    百度模型5.0 Preview榮登LMArena文本榜國內(nèi)第一

    12月23日,LMArena大模型競技場發(fā)布最新排名,模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內(nèi)第一該
    的頭像 發(fā)表于 12-23 15:02 ?566次閱讀

    百度模型5.0-Preview文本能力國內(nèi)第一

    11月8日凌晨,LMArena大模型競技場最新排名顯示,全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一該
    的頭像 發(fā)表于 11-11 17:15 ?1491次閱讀

    基礎模型升級,是跨越實用門檻的關鍵?

    模型,支撐產(chǎn)業(yè)智能的承重樁
    的頭像 發(fā)表于 11-09 23:30 ?6859次閱讀
    基礎<b class='flag-5'>模型</b>升級,是跨越實用門檻的關鍵?

    如果大模型是一片星空,誰是北斗?

    X1.1,破解推理模型的發(fā)展瓶頸
    的頭像 發(fā)表于 09-10 18:02 ?3567次閱讀
    如果大<b class='flag-5'>模型</b>是一片星空,誰是北斗?

    百度模型X1.1正式發(fā)布

    今天,在WAVE SUMMIT深度學習開發(fā)者大會2025上,模型X1.1正式發(fā)布,在事實性、指令遵循、智能體等能力上均提升顯著。
    的頭像 發(fā)表于 09-10 11:08 ?2140次閱讀

    中興努比亞啟動接入百度4.5系列開源大模型

    近日,中興努比亞啟動接入4.5系列開源大模型,為星云智能提供新引擎,共同推動人工智能在AI手機的創(chuàng)新應用,加速AI技術落地,進一步提升用戶AI體驗。
    的頭像 發(fā)表于 07-15 09:35 ?1063次閱讀

    寧暢與與百度模型展開深度技術合作

    近日,百度正式開源模型4.5系列模型。作為開源合作伙伴,寧暢在
    的頭像 發(fā)表于 07-07 16:26 ?884次閱讀

    黑芝麻智能與模型技術合作升級

    近日,模型正式開源,黑芝麻智能即日起快速啟動與模型技術合作。
    的頭像 發(fā)表于 07-04 17:24 ?1347次閱讀
    黑芝麻智能與<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>技術合作升級

    龍芯中科與心系列模型開展深度技術合作

    ? ? ? ? ? 6月30日,4.5系列模型正式開源。龍芯中科在模型開源首日啟動技術
    的頭像 發(fā)表于 07-02 16:53 ?1364次閱讀

    兆芯率先展開心系列模型深度技術合作

    6月30日,百度正式開源模型4.5系列等10款模型,并實現(xiàn)預訓練權重和推理代碼的完全開源,兆芯率先與心系列
    的頭像 發(fā)表于 07-01 10:49 ?983次閱讀

    再看2025大模型風云變幻,深根者立于終局

    從百度AI根系,看模型持續(xù)創(chuàng)新的根源力量
    的頭像 發(fā)表于 05-22 23:37 ?788次閱讀
    再看2025大<b class='flag-5'>模型</b>風云變幻,深根者立于終局

    百度模型X1 Turbo獲得信通院當前大模型最高評級證書

    百度在520居然還領了個證?是它, 信通院當前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結果—— 百度
    的頭像 發(fā)表于 05-21 18:19 ?1290次閱讀
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當前大<b class='flag-5'>模型</b>最高評級證書

    百度發(fā)布4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發(fā)者大會在武漢舉辦。百度創(chuàng)始人李彥宏發(fā)布了模型4.5 Turbo及深度思考模型X1 Turbo兩大模型
    的頭像 發(fā)表于 04-30 10:16 ?1162次閱讀

    百度發(fā)布模型4.5和文模型X1

    模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎大模型,通過多個模態(tài)聯(lián)合建模實現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯
    的頭像 發(fā)表于 03-18 16:29 ?937次閱讀