91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

垂直大模型競(jìng)爭(zhēng),能突破數(shù)據(jù)“卡點(diǎn)”嗎?

科技云報(bào)到 ? 來(lái)源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-19 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報(bào)道原創(chuàng)。

AI大模型火遍全球,中國(guó)產(chǎn)業(yè)也激發(fā)了對(duì)人工智能應(yīng)用的新熱情。

隨著各大廠商參與競(jìng)逐,市場(chǎng)正在分化為通用與垂直兩大路徑,兩者在參數(shù)級(jí)別、應(yīng)用場(chǎng)景、商業(yè)模式等方面差異已逐步顯現(xiàn)。

企業(yè)涌入垂直大模型賽道

通用AI大模型像ChatGPT,能夠處理各種領(lǐng)域和場(chǎng)景的自然語(yǔ)言,但由于需要巨大的計(jì)算資源和數(shù)據(jù)量,已經(jīng)成為國(guó)內(nèi)外大廠的重點(diǎn)項(xiàng)目。

這類企業(yè)往往有著強(qiáng)大的技術(shù)團(tuán)隊(duì)和資金支持,且有著自己的場(chǎng)景和流量?jī)?yōu)勢(shì)。比如百度、阿里、騰訊、字節(jié)、華為等,在搜索、社交、電商、辦公等領(lǐng)域都有著自己的通用AI大模型。

相較之下,創(chuàng)業(yè)公司、細(xì)分領(lǐng)域企業(yè)很難在這樣的競(jìng)爭(zhēng)中獲得先發(fā)優(yōu)勢(shì)或者差異化優(yōu)勢(shì)。

而垂直AI大模型只關(guān)注某個(gè)特定的領(lǐng)域或者場(chǎng)景,它能夠利用行業(yè)的數(shù)據(jù)和知識(shí),提供更精準(zhǔn)和高效的解決方案,更好地滿足用戶在某個(gè)領(lǐng)域或者場(chǎng)景下的需求和期待,如:醫(yī)療、金融、教育等。

同時(shí),它可以利用一些開(kāi)源或者閉源的通用AI大模型作為基礎(chǔ),然后在其上進(jìn)行指令微調(diào)(instruction tuning),來(lái)適應(yīng)自己的目標(biāo)領(lǐng)域或者場(chǎng)景。

因此,它的參數(shù)規(guī)模比通用大模型低一個(gè)量級(jí),如果讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,在某些特定領(lǐng)域甚至比通用大模型的效果更好、成本更低。

在這樣的背景下,越來(lái)越多的企業(yè)加入了垂直大模型的賽道。

5月18日,深信服發(fā)布國(guó)內(nèi)首個(gè)自研安全大模型,成為安全領(lǐng)域GPT技術(shù)應(yīng)用首秀;

5月5日,學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu);

3月,達(dá)觀數(shù)據(jù)公布正在開(kāi)發(fā)曹植系統(tǒng),專注于金融、政務(wù)、制造等垂直領(lǐng)域的大語(yǔ)言模型。

明確的商業(yè)化落地場(chǎng)景和更低的算力成本,為各類企業(yè)打開(kāi)了進(jìn)軍垂直大模型的大門。

垂直大模型的考驗(yàn)

垂直大模型的優(yōu)勢(shì)在于不夠大:算力不夠大、算法難度低,但并不代表垂直大模型誰(shuí)都能做。

眾所周知,AI大模型三要素:算力、算法、數(shù)據(jù),都是喂養(yǎng)AI的“飼料”。

先說(shuō)算力。

大模型之所以“大”,就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大。AI大模型所需要的計(jì)算量,大致上相當(dāng)于參數(shù)量與數(shù)據(jù)量的乘積。

過(guò)去5年,AI大模型的參數(shù)量幾乎每年提升一個(gè)數(shù)量級(jí),例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬(wàn)億個(gè)。

隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型,必須擁有大算力。

而一套垂直大模型的訓(xùn)練和推理成本,做個(gè)參考,在數(shù)字人垂類技術(shù)場(chǎng)景中,可以做到比Open AI同參數(shù)規(guī)模的模型低一個(gè)量級(jí),像啟元世界的戰(zhàn)略總監(jiān)王思捷就曾提到:先構(gòu)建更小的垂類模型(比如百億參數(shù)、十億參數(shù)),讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,垂類模型在某些領(lǐng)域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已遠(yuǎn)遠(yuǎn)低于通用大模型,但對(duì)算力基礎(chǔ)設(shè)施的投入依然會(huì)阻擋部分小公司的入局。

再說(shuō)算法。

在三要素中,算法的研發(fā)難度相對(duì)較低,每家公司都有自己實(shí)現(xiàn)大模型的路徑算法,且有眾多開(kāi)源項(xiàng)目可作為參考,中國(guó)公司最容易縮短甚至抹平差距。

最后說(shuō)數(shù)據(jù)。

高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵,足夠多、足夠豐富的數(shù)據(jù),是AI大模型的根基。

OpenAI此前披露,為了AI像人類那樣流暢交談,研發(fā)人員給GPT-3.5提供多達(dá)45TB的文本語(yǔ)料,相當(dāng)于472萬(wàn)套中國(guó)“四大名著”。這些語(yǔ)料的來(lái)源包括維基百科、網(wǎng)絡(luò)文章、書籍期刊等,甚至還將代碼開(kāi)源平臺(tái)Github納入其中。

但是聚焦到細(xì)分行業(yè),數(shù)據(jù)的獲取就沒(méi)那么容易了。

興業(yè)證券公開(kāi)表示,要訓(xùn)練專業(yè)的行業(yè)大模型,優(yōu)質(zhì)的行業(yè)數(shù)據(jù)、公共數(shù)據(jù)至關(guān)重要。

就國(guó)內(nèi)數(shù)據(jù)市場(chǎng)而言,據(jù)發(fā)改委官方批露,我國(guó)政府?dāng)?shù)據(jù)資源占全國(guó)數(shù)據(jù)資源的比重超過(guò)3/4,但開(kāi)放規(guī)模不足美國(guó)的10%,個(gè)人和企業(yè)可以利用的規(guī)模更是不及美國(guó)的7%。

而行業(yè)數(shù)據(jù)更是非常核心的私域數(shù)據(jù),私域數(shù)據(jù)量越大,質(zhì)量越高,就越有價(jià)值。

比如,一個(gè)醫(yī)療公司擁有大量醫(yī)療數(shù)據(jù)、病例數(shù)據(jù),那么它就能開(kāi)發(fā)出醫(yī)療垂直大模型類的產(chǎn)品。同理,建筑行業(yè)的項(xiàng)目數(shù)據(jù)、金融行業(yè)的用戶畫像數(shù)據(jù)、海運(yùn)行業(yè)的船位數(shù)據(jù)等,都是賦能垂直大模型的關(guān)鍵。

但是這些私域數(shù)據(jù)都攥在企業(yè)自己手中,而且為了數(shù)據(jù)安全和合規(guī),絕大部分機(jī)構(gòu)是要本地化部署才會(huì)嘗試大模型訓(xùn)練,很難想象企業(yè)會(huì)把自己的核心數(shù)據(jù)拿給別人去訓(xùn)練。

此外,如何合理地給數(shù)據(jù)打上分級(jí)標(biāo)簽、做好標(biāo)注也非常重要。數(shù)據(jù)分級(jí)分類能夠幫助產(chǎn)品提效,而高精度的標(biāo)注數(shù)據(jù)能夠進(jìn)一步提升大模型的專業(yè)表現(xiàn)。

但現(xiàn)階段垂直行業(yè)想要獲取高精度標(biāo)注數(shù)據(jù)的成本較高,而在公開(kāi)數(shù)據(jù)庫(kù)中,行業(yè)專業(yè)數(shù)據(jù)也較少,因此對(duì)垂直大模型的建構(gòu)提出了很高的要求。

總體而言,想要做好垂直大模型,數(shù)據(jù)的重要性,遠(yuǎn)超過(guò)算力和算法。

數(shù)據(jù),已成為企業(yè)突破垂直大模型的“卡點(diǎn)”。

手握行業(yè)數(shù)據(jù)領(lǐng)先一步

垂類大模型講求應(yīng)用與場(chǎng)景先行的邏輯,而在國(guó)內(nèi)更是強(qiáng)調(diào)產(chǎn)業(yè)側(cè)的價(jià)值。

一方面,在當(dāng)前中國(guó)的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場(chǎng)需求;另一方面,在toB生態(tài)下,基于垂直應(yīng)用的實(shí)踐也有利于形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。

而這一切的前提,是推出垂類大模型的公司在該行業(yè)已建立技術(shù)壁壘與護(hù)城河,即“人無(wú)我有”的競(jìng)爭(zhēng)優(yōu)勢(shì)。

如此看來(lái),在垂直行業(yè)深耕多年的企業(yè)或?qū)⒂懈蟮内A面。

這類企業(yè)在數(shù)據(jù)層面、大模型以及知識(shí)圖譜方面都有較為深厚的積累,對(duì)于大模型的優(yōu)化更具優(yōu)勢(shì)。同時(shí),它們對(duì)于to B客戶需求和落地場(chǎng)景有很深的理解,能夠更好地保證垂直大模型產(chǎn)品的可信和可靠,滿足企業(yè)級(jí)對(duì)于安全可控合規(guī)的需求。

目前,已有一些垂類大模型在金融、教育、醫(yī)藥、營(yíng)銷等場(chǎng)景中得到試煉。

例如,彭博社利用自身豐富的金融數(shù)據(jù)源,基于開(kāi)源的GPT-3框架再訓(xùn)練,開(kāi)發(fā)出了金融專屬大模型BloombergGPT;

網(wǎng)易有道則面向教育場(chǎng)景,推出自研的類ChatGPT模型“子曰”;

在ChatGPT發(fā)布后僅幾周,谷歌公布了一個(gè)專門用于回答醫(yī)療保健相關(guān)問(wèn)題的大型醫(yī)用語(yǔ)言模型Med-PaLM......

相信隨著越來(lái)越多企業(yè)入局,垂直大模型在各個(gè)行業(yè)和細(xì)分領(lǐng)域中將大量涌現(xiàn)。而那些能將一個(gè)垂直領(lǐng)域做專、做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,跑通商業(yè)閉環(huán),構(gòu)建起產(chǎn)業(yè)生態(tài)的企業(yè),最終將把價(jià)值鏈做到足夠長(zhǎng)。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7340

    瀏覽量

    94871
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40160

    瀏覽量

    301770
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10320
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3683

    瀏覽量

    5206
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    云知聲成功中標(biāo)全國(guó)首個(gè)省級(jí)醫(yī)保垂直模型項(xiàng)目

    2026年開(kāi)年,智慧醫(yī)保領(lǐng)域迎來(lái)里程碑式突破——云知聲智能科技股份有限公司成功中標(biāo)全國(guó)首個(gè)省級(jí)醫(yī)保垂直模型項(xiàng)目“江蘇省醫(yī)保垂直模型及智能
    的頭像 發(fā)表于 01-23 17:16 ?780次閱讀

    英泰斯特獲評(píng)2025年武漢市垂直行業(yè)優(yōu)秀模型

    2025年12月15日,武漢市經(jīng)濟(jì)和信息化局發(fā)布《2025年武漢市垂直行業(yè)模型擬認(rèn)定名單》,英泰斯特自主研發(fā)的“智能車聯(lián)網(wǎng)故障預(yù)警大模型”,憑借其領(lǐng)先的技術(shù)創(chuàng)新性和廣泛的應(yīng)用前景成功入選,并獲評(píng)優(yōu)秀
    的頭像 發(fā)表于 12-22 11:17 ?663次閱讀

    模型物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng):功能特點(diǎn)與平臺(tái)架構(gòu)解析

    ? ? 大模型物資需求預(yù)測(cè)與采購(gòu)智能化:核心功能與價(jià)值解析 ? ?大模型物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng)通過(guò)深度整合多源數(shù)據(jù)、構(gòu)建動(dòng)態(tài)預(yù)測(cè)
    的頭像 發(fā)表于 12-16 11:54 ?338次閱讀

    安森美垂直GaN技術(shù)賦功率器件應(yīng)用未來(lái)

    在傳統(tǒng)橫向結(jié)構(gòu)的GaN器件中,電流沿芯片表面流動(dòng)。而垂直 GaN 的 GaN 層生長(zhǎng)在氮化鎵襯底上,其獨(dú)特結(jié)構(gòu)使電流直接從芯片頂部流到底部,而不是僅在表面流動(dòng)。這種垂直電流路徑讓器件能夠承受更高的電壓和更大的電流,從而實(shí)現(xiàn)更高
    的頭像 發(fā)表于 12-04 09:28 ?1949次閱讀
    安森美<b class='flag-5'>垂直</b>GaN技術(shù)賦<b class='flag-5'>能</b>功率器件應(yīng)用未來(lái)

    成都匯陽(yáng)投資關(guān)于國(guó)產(chǎn)開(kāi)源模型持續(xù)突破,國(guó)產(chǎn)AI 競(jìng)爭(zhēng)力增強(qiáng)

    ? ? ? ?國(guó)產(chǎn)開(kāi)源模型領(lǐng)跑 ,AI 生態(tài)有望加速繁榮 根據(jù)獨(dú)立 AI 基準(zhǔn)測(cè)試與分析平臺(tái) Artificial Analysis 最新榜單 , 國(guó)產(chǎn)模型 KimiK2Thinking
    的頭像 發(fā)表于 11-24 14:01 ?608次閱讀

    安森美入局垂直GaN,GaN進(jìn)入高壓時(shí)代

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,安森美發(fā)布器垂直GaN功率半導(dǎo)體技術(shù),憑借 GaN-on-GaN 專屬架構(gòu)與多項(xiàng)性能突破,為全球高功率應(yīng)用領(lǐng)域帶來(lái)革命性解決方案,重新定義了行業(yè)在效、緊湊性與耐用性上
    的頭像 發(fā)表于 11-10 03:12 ?7559次閱讀

    安森美推出垂直氮化鎵功率半導(dǎo)體

    隨著全球能源需求因 AI 數(shù)據(jù)中心、電動(dòng)汽車以及其他高能耗應(yīng)用而激增,安森美(onsemi)推出垂直氮化鎵(vGaN)功率半導(dǎo)體,為相關(guān)應(yīng)用的功率密度、效和耐用性樹(shù)立新標(biāo)桿。這些突破
    的頭像 發(fā)表于 10-31 13:56 ?2221次閱讀

    端到端語(yǔ)音交互數(shù)據(jù) 精準(zhǔn)賦語(yǔ)音大模型進(jìn)階

    在語(yǔ)音大模型從“識(shí)別”向“懂語(yǔ)境”跨越的關(guān)鍵階段,高質(zhì)量場(chǎng)景化語(yǔ)音數(shù)據(jù)已成為制約技術(shù)突破的核心瓶頸。傳統(tǒng)語(yǔ)音識(shí)別數(shù)據(jù)集采用孤立標(biāo)注,在語(yǔ)音
    的頭像 發(fā)表于 09-11 17:17 ?768次閱讀

    模型工具的 “京東答案”

    隨著大模型技術(shù)的迅猛發(fā)展,AI工具已成為重要的輔助生產(chǎn)力工具和工作伙伴。它能夠顯著提升工作效率、幫助解決業(yè)務(wù)痛點(diǎn),甚至通過(guò)知識(shí)延展與智能協(xié)同,幫助團(tuán)隊(duì)突破傳統(tǒng)認(rèn)知邊界。掌握大
    的頭像 發(fā)表于 08-25 16:09 ?612次閱讀

    垂直GaN迎來(lái)新突破!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 最近垂直GaN功率器件又迎來(lái)新進(jìn)展。7月10日,廣東致CEO黎子蘭博士,在瑞典舉辦的全球氮化物半導(dǎo)體頂尖會(huì)議ICNS(國(guó)際氮化物半導(dǎo)體會(huì)議)上發(fā)表邀請(qǐng)報(bào)告,首次報(bào)道了廣東致
    發(fā)表于 07-22 07:46 ?5023次閱讀
    <b class='flag-5'>垂直</b>GaN迎來(lái)新<b class='flag-5'>突破</b>!

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    融入 Transformer,通過(guò)替換 FFN 層、多機(jī)多訓(xùn)練等策略,試圖拓展模型能力。看到模型容量因?qū)<覕?shù)量增加而擴(kuò)展,處理更復(fù)雜任務(wù),讓我感受到創(chuàng)新的潛力。但同時(shí),通信成本高、
    發(fā)表于 07-20 15:07

    數(shù)據(jù)標(biāo)注與大模型的雙向賦:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動(dòng)力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動(dòng)力,是
    的頭像 發(fā)表于 06-04 17:15 ?2061次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>標(biāo)注與大<b class='flag-5'>模型</b>的雙向賦<b class='flag-5'>能</b>:效率與性能的躍升

    如何賦醫(yī)療AI大模型應(yīng)用?

    “百模大戰(zhàn)”。不僅如此,這些通用AI大模型還逐漸滲透到各個(gè)垂直行業(yè)中,其中生命科學(xué)和醫(yī)療健康行業(yè)成為了拓展速度較快的一個(gè)領(lǐng)域。從2023年2月至10月初,國(guó)內(nèi)市場(chǎng)上
    的頭像 發(fā)表于 05-07 09:36 ?717次閱讀
    如何賦<b class='flag-5'>能</b>醫(yī)療AI大<b class='flag-5'>模型</b>應(yīng)用?

    絕味20歲生日會(huì),鴨廠鵝廠聯(lián)手發(fā)布中國(guó)零售連鎖AI垂直場(chǎng)景大模型

    絕味×騰訊,首個(gè)中國(guó)零售連鎖AI垂直場(chǎng)景大模型的破殼之路
    的頭像 發(fā)表于 04-23 19:18 ?1457次閱讀
    絕味20歲生日會(huì),鴨廠鵝廠聯(lián)手發(fā)布中國(guó)零售連鎖AI<b class='flag-5'>垂直</b>場(chǎng)景大<b class='flag-5'>模型</b>

    模型時(shí)代 垂直化是數(shù)據(jù)市場(chǎng)發(fā)展趨勢(shì) 解決單點(diǎn)難題是核心競(jìng)爭(zhēng)

    數(shù)據(jù),作為一種革命性的生產(chǎn)資源,與算力、算法共同構(gòu)成了人工智能產(chǎn)業(yè)的三大要素。受益于人工智能的蓬勃發(fā)展,人類加速進(jìn)入到由數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化時(shí)代,數(shù)據(jù)作為核心要素的作用越來(lái)越重要。 01 大模型
    的頭像 發(fā)表于 04-09 11:48 ?472次閱讀