91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

1.5T內(nèi)存挑戰(zhàn)英偉達(dá)!8枚芯片撐起3個GPT-4,華人AI芯片獨(dú)角獸估值365億

傳感器技術(shù) ? 來源:量子位 ? 2023-09-23 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高端GPU持續(xù)缺貨之下,一家要挑戰(zhàn)英偉達(dá)的芯片初創(chuàng)公司成為行業(yè)熱議焦點(diǎn)。

8枚芯片跑大模型,就能支持5萬億參數(shù)(GPT-4的三倍)。

這是獨(dú)角獸企業(yè)SambaNova剛剛發(fā)布的新型AI芯片SN40L——

型號中40代表是他們第四代產(chǎn)品,L代表專為大模型(LLM)優(yōu)化:高達(dá)1.5T的內(nèi)存,支持25.6萬個token的序列長度。

CEORodrigo Liang表示,當(dāng)前行業(yè)標(biāo)準(zhǔn)做法下運(yùn)行萬億參數(shù)大模型需要數(shù)百枚芯片,我們的方法使總擁有成本只有標(biāo)準(zhǔn)方法的1/25。

SambaNova目前估值50億美元(約365億人民幣),累計(jì)完成了6輪總計(jì)11億美元的融資,投資方包括英特爾、軟銀、三星、GV等。

他們不僅在芯片上要挑戰(zhàn)英偉達(dá),業(yè)務(wù)模式上也說要比英偉達(dá)走的更遠(yuǎn):直接參與幫助企業(yè)訓(xùn)練私有大模型。

目標(biāo)客戶上野心更是很大:瞄準(zhǔn)世界上最大的2000家企業(yè)。

1.5TB內(nèi)存的AI芯片

最新產(chǎn)品SN40L,由臺積電5納米工藝制造,包含1020億晶體管,峰值速度638TeraFLOPS。

與英偉達(dá)等其他AI芯片更大的不同在于新的三層Dataflow內(nèi)存系統(tǒng)。

520MB片上SRAM內(nèi)存

65GB的高帶寬HBM3內(nèi)存

以及高達(dá)1.5TB的外部DRAM內(nèi)存

831e8822-599c-11ee-939d-92fbcf53809c.png

與主要競品相比,英偉達(dá)H100最高擁有80GB HBM3內(nèi)存,AMD MI300擁有192GB HBM3內(nèi)存。

SN40L的高帶寬HBM3內(nèi)存實(shí)際比前兩者小,更多依靠大容量DRAM。

Rodrigo Liang表示,雖然DRAM速度更慢,但專用的軟件編譯器可以智能地分配三個內(nèi)存層之間的負(fù)載,還允許編譯器將8個芯片視為單個系統(tǒng)。

83257e16-599c-11ee-939d-92fbcf53809c.png

除了硬件指標(biāo),SN40L針對大模型做的優(yōu)化還有同時提供密集和稀疏計(jì)算加速。

他們認(rèn)為大模型中許多權(quán)重設(shè)置為0,像其他數(shù)據(jù)一樣去執(zhí)行操作很浪費(fèi)。

他們找到一種軟件層面的加速辦法,與調(diào)度和數(shù)據(jù)傳輸有關(guān),但沒有透露細(xì)節(jié),“我們還沒準(zhǔn)備好向公布是如何做到這一點(diǎn)的”。

咨詢機(jī)構(gòu)Gartner的分析師Chirag Dekate認(rèn)為,SN40L的一個可能優(yōu)勢在于多模態(tài)AI。

GPU的架構(gòu)非常嚴(yán)格,面對圖像、視頻、文本等多樣數(shù)據(jù)時可能不夠靈活,而SambaNova可以調(diào)整硬件來滿足工作負(fù)載的要求。

目前,SambaNova的芯片和系統(tǒng)已獲得不少大型客戶,包括世界排名前列的超算實(shí)驗(yàn)室,日本富岳、美國阿貢國家實(shí)驗(yàn)室、勞倫斯國家實(shí)驗(yàn)室,以及咨詢公司埃森哲等。

業(yè)務(wù)模式也比較特別,芯片不單賣,而是出售其定制技術(shù)堆棧,從芯片到服務(wù)器系統(tǒng),甚至包括部署大模型。

為此,他們與TogetherML聯(lián)合開發(fā)了BloomChat,一個1760億參數(shù)的多語言聊天大模型。

BloomChat建立在BigScience組織的開源大模型Bloom之上,并在來自O(shè)penChatKit、Dolly 2.0和OASST1的OIG上進(jìn)行了微調(diào)。

訓(xùn)練過程中,它使用了SambaNova獨(dú)特的可重配置數(shù)據(jù)流架構(gòu),然后在SambaNova DataScale系統(tǒng)進(jìn)行訓(xùn)練。

8345a0ce-599c-11ee-939d-92fbcf53809c.png

這也是這家公司最大被投資者熱捧之外的最大爭議點(diǎn)之一,很多人不看好一家公司既做芯片又做大模型。

給每家大企業(yè)打造150個大模型

在與The Next Platform網(wǎng)站交流時,CEO Rodrigo Liang表示:

用于大模型訓(xùn)練的公開數(shù)據(jù)已快耗盡,但對參數(shù)數(shù)量的追求還在不斷增加。

各種大模型的性能相差只有幾個百分點(diǎn),這不是大家應(yīng)該玩的游戲。

他認(rèn)為大模型與生成式AI商業(yè)化的下一個戰(zhàn)場是企業(yè)的私有數(shù)據(jù),尤其是大企業(yè)。

這些企業(yè)坐擁大量的數(shù)據(jù),但自己不知道其中大部分內(nèi)容是什么。

834f900c-599c-11ee-939d-92fbcf53809c.png

對于企業(yè)私有大模型的形態(tài),SambaNova也有與眾不同的觀點(diǎn)。

他們認(rèn)為最終企業(yè)內(nèi)部不會運(yùn)行一個GPT-4或谷歌Gemini那樣的超大模型,而是根據(jù)不同數(shù)據(jù)子集創(chuàng)建150個獨(dú)特的模型,聚合參數(shù)超過萬億。

相當(dāng)于把GPT-4等大模型內(nèi)部的Mixture of Experts(專家混合)架構(gòu)擴(kuò)展到整個系統(tǒng),稱為Composition of Experts(專家合成)。

在企業(yè)運(yùn)轉(zhuǎn)的每個節(jié)點(diǎn)運(yùn)行一個完整且經(jīng)過專門調(diào)整的基礎(chǔ)模型,分別用法律語料庫、制造語料庫、風(fēng)險(xiǎn)管理語料庫、財(cái)富管理語料庫、客戶銷售語料庫、客戶支持語料庫等等不同數(shù)據(jù)訓(xùn)練。

這些專家模型之間通過一種軟件路由或負(fù)載平衡器聯(lián)在一起,收到推理請求后決定具體向哪個模型推送提示詞。

這一策略與GPT-4和谷歌Gemini等做法形成鮮明對比,巨頭大多希望創(chuàng)建一個能泛化到數(shù)百萬個任務(wù)的巨型模型。

分析師認(rèn)為技術(shù)上可能谷歌的做法性能更強(qiáng),但SambaNova的方法對企業(yè)來說更實(shí)用。

沒有任何一個模型或人能完整訪問企業(yè)的所有數(shù)據(jù),限制每個部門能訪問的專家模型,就能限制他們能訪問的數(shù)據(jù)。

斯坦福系芯片公司,華人工程師主力

SambaNova成立于2017年,2020年之前都比較低調(diào)。

聯(lián)創(chuàng)3人都是斯坦福背景,連產(chǎn)品系列名Cardinal(深紅色)都是斯坦福的昵稱與代表顏色。

CEO Rodrigo Liang是前Sun/甲骨文工程副總裁,也有人將這個名字解讀為暗指甲骨文老對頭IBM的DeepBlue(深藍(lán))。

另外兩位聯(lián)合創(chuàng)始人都是斯坦福教授。

CTOKunle Olukotun是電氣工程教授,因多核芯片架構(gòu)方面的研究而聞名,開發(fā)了首批支持線程級推測 (TLS) 的芯片之一。

Christopher Ré是計(jì)算機(jī)科學(xué)副教授,重點(diǎn)研究方向機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的速度和可擴(kuò)展性。

此外團(tuán)隊(duì)中還有不少華人工程師。

從官網(wǎng)公開信息來看,SambaNova的領(lǐng)導(dǎo)團(tuán)隊(duì)中,至少有3名華人。

Jonathan Chang,擁有UC伯克利的機(jī)械工程學(xué)士學(xué)位以及南加州大學(xué)的MBA學(xué)位。

他在構(gòu)建高增長方面擁有20多年的經(jīng)驗(yàn)。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾擔(dān)任甲骨文公司系統(tǒng)產(chǎn)品管理和解決方案開發(fā)副總裁,監(jiān)督了數(shù)十個行業(yè)的企業(yè)硬件和軟件產(chǎn)品的上市。

Penny Li,在EDA工具微處理器設(shè)計(jì)方面擁有超過27年的經(jīng)驗(yàn)。此前,她曾在IBM和甲骨文工作過。

如果去領(lǐng)英搜索還能發(fā)現(xiàn)更多華人團(tuán)隊(duì)成員。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定價(jià)沒有公開。

根據(jù)Rodrigo Liang的說法,8個SN40L組成的集群總共可處理5萬億參數(shù),相當(dāng)于70個700億參數(shù)大模型。

全球2000強(qiáng)的企業(yè)只需購買兩個這樣的8芯片集群,就能滿足所有大模型需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135510
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4089

    瀏覽量

    99232
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2128

    瀏覽量

    36796

原文標(biāo)題:1.5T內(nèi)存挑戰(zhàn)英偉達(dá)!8枚芯片撐起3個GPT-4,華人AI芯片獨(dú)角獸估值365億

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    3倍,破110美元!英偉達(dá)投資,AI初創(chuàng)公司劍指IPO

    2月4日,人工智能初創(chuàng)公司ElevenLabs 周三宣布,已完成5美元D輪資金,達(dá) 110
    的頭像 發(fā)表于 02-06 10:51 ?1.5w次閱讀
    漲<b class='flag-5'>3</b>倍,<b class='flag-5'>估</b><b class='flag-5'>值</b>破110<b class='flag-5'>億</b>美元!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>投資,<b class='flag-5'>AI</b>初創(chuàng)公司劍指IPO

    航盛集團(tuán)受邀出席第三屆中國汽車獨(dú)角獸大會

    1月18日,由汽車評價(jià)研究院、北京隱形獨(dú)角獸信息科技院、中國汽車隱形獨(dú)角獸評委會聯(lián)合主辦,以“硬核創(chuàng)新?重構(gòu)生態(tài):‘十五五’汽車獨(dú)角獸攻堅(jiān)科技制高點(diǎn)”為主題的第三屆中國汽車獨(dú)角獸大會在
    的頭像 發(fā)表于 01-23 15:42 ?369次閱讀

    深蘭科技榮登2025全球獨(dú)角獸企業(yè)500強(qiáng)榜單

    近日,在青島舉辦的“2025全球獨(dú)角獸企業(yè)500強(qiáng)大會”上,深蘭科技憑借在人工智能特別是具身智能方向的技術(shù)創(chuàng)新與產(chǎn)業(yè)落地能力,成功入選“2025全球獨(dú)角獸企業(yè)500強(qiáng)”,并獲頒“全球獨(dú)角獸企業(yè)”證書。自2021年起,深蘭科技已連
    的頭像 發(fā)表于 12-24 16:13 ?516次閱讀

    奕斯偉計(jì)算榮登2025全球獨(dú)角獸企業(yè)500強(qiáng)榜單

    近日,由獨(dú)角獸工程院聯(lián)合中國人民大學(xué)中國民營企業(yè)研究中心、清華大學(xué)新質(zhì)生產(chǎn)力研究院、北京隱形獨(dú)角獸信息科技院和浙江清華長三角研究院獨(dú)角獸企業(yè)研究中心共同發(fā)布的《2025全球獨(dú)角獸企業(yè)5
    的頭像 發(fā)表于 12-18 13:50 ?418次閱讀

    桐汭科技榮獲2025深圳市“種子獨(dú)角獸企業(yè)”

    近日,深圳桐汭科技有限公司(簡稱:桐汭科技)憑借卓越的創(chuàng)新實(shí)力與高速成長潛力,榮獲由深圳市瞪羚獨(dú)角獸企業(yè)評價(jià)委員會授予的【種子獨(dú)角獸企業(yè)】證書!
    的頭像 發(fā)表于 11-14 17:46 ?1919次閱讀

    左藍(lán)微電子入選2025年江蘇省潛在獨(dú)角獸企業(yè)

    2025年9月24日,江蘇省新質(zhì)生產(chǎn)力促進(jìn)中心在南京舉辦了“2025年江蘇獨(dú)角獸企業(yè)和瞪羚企業(yè)評估結(jié)果發(fā)布會”。會上,2025年江蘇獨(dú)角獸企業(yè)、潛在獨(dú)角獸企業(yè)和瞪羚企業(yè)名單正式揭曉。在這份重量級榜單
    的頭像 發(fā)表于 09-30 10:52 ?1333次閱讀

    宏景智駕榮登中國AI出海未來獨(dú)角獸企業(yè)TOP100榜單

    此前,2025年9月17日-21日,第22屆中國-東盟博覽會(以下簡稱“東博會”)在廣西南寧隆重召開。宏景智駕應(yīng)邀參會,并憑借其技術(shù)優(yōu)勢和行業(yè)影響力在東博會的主題活動AI出海獨(dú)角獸之夜活動中入選《中國AI出海未來
    的頭像 發(fā)表于 09-30 10:43 ?875次閱讀

    宏景智駕榮登2025中國隱形獨(dú)角獸500強(qiáng)榜單

    “2025中國隱形獨(dú)角獸大會”在廣州舉辦,會上發(fā)布《2025中國隱形獨(dú)角獸500強(qiáng)榜單》,宏景智駕(衢州)科技有限公司(以下簡稱:宏景智駕)榮登榜單。
    的頭像 發(fā)表于 08-28 11:19 ?1339次閱讀

    芯馳科技出席獨(dú)角獸企業(yè)融資對接會

    8月15日,由市科委中關(guān)村管委會創(chuàng)新創(chuàng)業(yè)服務(wù)處、中關(guān)村高科技產(chǎn)業(yè)促進(jìn)中心聯(lián)合中關(guān)村獨(dú)角獸企業(yè)發(fā)展聯(lián)盟、中國銀行北京市分行主辦的“獨(dú)角獸企業(yè)融資對接會”在中關(guān)村特色園區(qū)——首鋼園成功舉辦。
    的頭像 發(fā)表于 08-19 13:46 ?1030次閱讀

    1414元,2025最新中國傳感器獨(dú)角獸名單出爐,有3家退出?。ǜ饺麊危?/a>

    獨(dú)角獸企業(yè)共372家,總超1.2萬億美元,平均33.4美元。其中,11家超級
    的頭像 發(fā)表于 07-30 18:11 ?12.1w次閱讀
    總<b class='flag-5'>估</b><b class='flag-5'>值</b>1414<b class='flag-5'>億</b>元,2025最新中國傳感器<b class='flag-5'>獨(dú)角獸</b>名單出爐,有<b class='flag-5'>3</b>家退出!(附全名單)

    隼眼科技榮獲2025年度南京市培育獨(dú)角獸企業(yè)

    近日,備受矚目的《2025年度南京市獨(dú)角獸、培育獨(dú)角獸、瞪羚企業(yè)榜單》正式揭曉,隼眼科技成功入選“2025年度南京市培育獨(dú)角獸企業(yè)”。這一榮譽(yù)不僅是對隼眼科技過往成績的高度認(rèn)可,更是對其未來發(fā)展?jié)摿Φ某浞挚隙ā?/div>
    的頭像 發(fā)表于 06-05 17:49 ?1381次閱讀

    榮耀再續(xù)!洛微科技榮膺2025杭州準(zhǔn)獨(dú)角獸企業(yè)榮譽(yù)

    4月24日,第九屆萬物生長大會于杭州圓滿落幕。會上,《2025杭州獨(dú)角獸與準(zhǔn)獨(dú)角獸企業(yè)榜單》重磅揭曉,洛微科技憑借高速的成長態(tài)勢、強(qiáng)大的創(chuàng)新實(shí)力以及廣闊的發(fā)展前景,再度榮獲“2025杭州準(zhǔn)獨(dú)角
    的頭像 發(fā)表于 04-27 10:59 ?1003次閱讀
    榮耀再續(xù)!洛微科技榮膺2025杭州準(zhǔn)<b class='flag-5'>獨(dú)角獸</b>企業(yè)榮譽(yù)

    宇樹科技王興興的對手Figure2900 成立于2022年的硅谷具身智能獨(dú)角獸

    王興興的宇樹科技開創(chuàng)了全球低成本高性能足式機(jī)器人的技術(shù)先河,春晚亮相的人形機(jī)器人更是驚艷全球,這一賽道也吸引了更多人加入,F(xiàn)igure這家成立于2022年的硅谷具身智能獨(dú)角獸高達(dá)2900
    的頭像 發(fā)表于 04-08 11:32 ?1896次閱讀

    智行者科技獲評2025中國獨(dú)角獸企業(yè)

    近日,在第二屆全球獨(dú)角獸企業(yè)大會上,智行者憑借在輪形特種機(jī)器人領(lǐng)域的技術(shù)創(chuàng)新與規(guī)?;虡I(yè)化成果,再度入選《中國獨(dú)角獸企業(yè)發(fā)展報(bào)告(2025)》,成功蟬聯(lián)“中國獨(dú)角獸企業(yè)”稱號,智行者董事長兼CEO張德兆受邀出席并參與授牌儀式。
    的頭像 發(fā)表于 04-02 16:46 ?1496次閱讀

    士模微電子上榜“中國潛在獨(dú)角獸企業(yè)”

    2024年10月下旬,長城戰(zhàn)略咨詢發(fā)布《中國潛在獨(dú)角獸企業(yè)研究報(bào)告2024》,北京士模微電子有限責(zé)任公司入選中國“潛在獨(dú)角獸”企業(yè)榜單?!?b class='flag-5'>獨(dú)角獸”指具有發(fā)展速度快、數(shù)量稀少、備受投資者青睞等屬性
    的頭像 發(fā)表于 03-11 14:55 ?1275次閱讀
    士模微電子上榜“中國潛在<b class='flag-5'>獨(dú)角獸</b>企業(yè)”