91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Kleidi加速AI發(fā)展

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-09-14 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 開發(fā)者平臺副總裁 Geraint North

在持續(xù)快速發(fā)展的人工智能 (AI) 時代,我們堅定地支持全球數(shù)百萬開發(fā)者,確保他們能夠獲得所需的性能、工具和軟件庫,從而順利打造下一波令人驚嘆的 AI 體驗。

為此,我們推出了 Arm Kleidi,這是一項廣泛的軟件和軟件社區(qū)參與計劃,旨在加速 AI 發(fā)展。其中的第一個舉措是推出面向熱門 AI 框架的 Arm Kleidi 軟件庫。這使開發(fā)者可以直接取得 Arm CPU 的出色 AI 功能,而如今全球從云端到邊緣側(cè)的大多數(shù) AI 推理工作負載都在這些 Arm CPU 上運行。開發(fā)者可以借助 Arm 超過 20 年的架構(gòu)創(chuàng)新,從 Armv7 架構(gòu)首次引入高級單指令多數(shù)據(jù) (SIMD) 擴展以支持機器學(xué)習(xí) (ML) 工作負載,到如今的 Armv9 架構(gòu)在 Arm CPU 上囊括了加速和保護高級生成式 AI 工作負載的功能,這些創(chuàng)新持續(xù)推動 AI 能力和性能的提升。

Kleidi 軟件庫包含面向 AI 工作負載的 KleidiAI 和面向運行于 Arm CPU 上出色的計算機視覺工作負載的 KleidiCV。該軟件庫可以被直接嵌入到熱門的 AI 框架中,開發(fā)者無需進行任何操作。如此一來,開發(fā)者可以輕松地啟用 Arm CPU 的 AI 功能,從而快速構(gòu)建 AI 應(yīng)用,并在盡可能廣泛的設(shè)備上實現(xiàn)最出色性能。

加速 AI 發(fā)展

為了應(yīng)對設(shè)備類型、神經(jīng)網(wǎng)絡(luò)和推理引擎的爆發(fā)式增長,KleidiAI 是我們所給出的解決方案。它由一系列高度優(yōu)化的 AI 內(nèi)核組成,可在生成式 AI 等用例中實現(xiàn)高性能。KleidiAI 的優(yōu)勢在于,我們不會給開發(fā)者額外增加工作量,而是直接與領(lǐng)先的 AI 框架合作,包括 MediaPipe(通過 XNNPACK)、LLAMA.cpp、PyTorch(通過 ExecuTorch)和 TensorFlow Lite(通過 XNNPACK),以集成 KleidiAI。這不僅加快了開發(fā)流程,并釋放了 AI 性能,為開發(fā)者提供了默認的高性能,使他們能夠順利地打造出色的 AI 體驗。KleidiAI 還提供了前瞻性的兼容性,隨著我們推出更多的技術(shù),這將確保開發(fā)者能夠充分利用未來 AI 加速機會。

KleidiAI 的集成已經(jīng)為生成式 AI 工作負載帶來了顯著的性能提升。與參考實現(xiàn)方案(基于 llama.cpp,但不含我們的軟件 Kleidi 優(yōu)化)相比,在新的 Arm Cortex-X925 CPU 上,使用(集成了 KleidiAI 的)llama.cpp 的 Meta Llama 3 和微軟 Phi-3 大語言模型 (LLM) 的詞元 (Token) 首次響應(yīng)時間加快了 190%。KleidiAI 非常易于集成,Arm 的工程團隊只用不到 24 小時就測出了 Llama 3 的優(yōu)化性能。此外,KleidiAI 還通過 XNNPACK 與 MediaPipe 集成,為在移動設(shè)備上運行的開源 Gemma LLM 提供支持。得益于此,Google Pixel 8 Pro 智能手機上 Gemma 2B 的詞元首次響應(yīng)時間縮短了 25%。

與此同時,我們正在與 Unity 合作開發(fā) Sentis,這是一個端側(cè) AI 推理引擎,可讓游戲開發(fā)者在所有支持 Unity 游戲引擎的設(shè)備上打造創(chuàng)新的 AI 游戲體驗。在集成 KleidAI 后,Unity Sentis 成功啟用了 int4 量化功能,將模型內(nèi)存占用率降低了 72.5%,同時在運行 Phi-2 LLM 時性能提升了 660%。

加速計算機視覺發(fā)展

KleidiCV 能夠加速許多攝像頭用例中的計算機視覺管線。OpenCV 是全球最大的計算機視覺庫,包含 2,500 多種算法,為數(shù)十萬開發(fā)者提供支持?;?KleidiCV 集成,OpenCV 發(fā)現(xiàn)各種圖像處理任務(wù)的典型性能提升高達 75%。作為我們與 OpenCV 的戰(zhàn)略軟件合作關(guān)系[1]的一部分,我們還首次將安卓構(gòu)建引入 Maven Central,這是一個面向 Java 開發(fā)的開源軟件組件、軟件庫的資源庫。

CPU 上的 AI 優(yōu)勢

Arm Kleidi 專注于加速 CPU 上的 AI 功能,因為在大多數(shù)情況下,所有 AI 工作負載都會從CPU 上開始運行。這使得 CPU 成為開發(fā)者在為其 AI 工作負載設(shè)定目標時的最便捷路徑。因此,我們?yōu)殚_發(fā)者提供的這一路徑性能越出色,他們就更有可能在開發(fā)過程中繼續(xù)使用 CPU 并將其作為目標。此外,隨著 LLM 變得更小更高效,越來越多的 AI 工作負載將適合在 CPU 上處理。最終,開發(fā)過程將變得更加順暢、無縫,進而優(yōu)化開發(fā)者的 AI 工作負載性能。

在 Arm 平臺上構(gòu)建 AI 的未來

Arm Kleidi 的推出再次突顯了 Arm 作為端側(cè)生成式 AI 計算平臺的領(lǐng)先地位。它使開發(fā)者無需學(xué)習(xí)額外的工具和技能,就能夠在非常廣泛的硬件中獲得 Arm CPU 的出色 AI 性能。隨著我們不斷創(chuàng)新,持續(xù)為新一代 AI 打造前沿架構(gòu),開發(fā)者未來將能夠獲得更強大、更先進的 AI 功能。對于最終用戶來說,這意味著更快速、更智能、更具交互性、更沉浸式、更安全的出色 AI 體驗。

Arm Kleidi 的推出只是一個開端,我們未來還計劃推出更多軟件庫、計算內(nèi)核和引擎集成。我們將持續(xù)在 Arm 平臺上構(gòu)建 AI 的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9559

    瀏覽量

    392183
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39926

    瀏覽量

    301562
  • 開發(fā)者
    +關(guān)注

    關(guān)注

    1

    文章

    773

    瀏覽量

    18018

原文標題:Arm Kleidi 助力 AI 開發(fā)者加速創(chuàng)新

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    <5 KB),可在任何 Nordic SoC/SiP 的主 CPU 上運行,適合加速度計、IMU、PPG、溫度、電流等時序傳感器數(shù)據(jù)的 AI 任務(wù)。[Nordic Edge AI 技術(shù)頁
    發(fā)表于 01-31 23:16

    西門子EDA與Arm攜手合作加速系統(tǒng)設(shè)計驗證進程與軟件啟動

    對芯片設(shè)計而言,加速產(chǎn)品的上市流程至關(guān)重要。為此,西門子EDA與Arm攜手合作,為Arm的合作伙伴提供了一系列基于Arm Neoverse CSS與
    的頭像 發(fā)表于 12-19 09:06 ?700次閱讀
    西門子EDA與<b class='flag-5'>Arm</b>攜手合作<b class='flag-5'>加速</b>系統(tǒng)設(shè)計驗證進程與軟件啟動

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI發(fā)展歷程嗎?本章作者將為我們打開AI發(fā)展歷程以
    發(fā)表于 09-12 16:07

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動設(shè)備上實現(xiàn)PC級別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),首次在移動設(shè)備上實現(xiàn) PC 級別的 AI 圖形性能,為未來的端側(cè) AI
    的頭像 發(fā)表于 08-14 17:59 ?2781次閱讀

    Arm 洞察與思考:為什么 AI 向邊緣遷移的速度超乎想象

    ,人們不再質(zhì)疑邊緣 AI 是否能實現(xiàn)規(guī)?;讶怀蔀楝F(xiàn)實。 Arm 最新發(fā)布了《AI 效率熱潮:更小的模型與加速的計算正驅(qū)動 AI 無處
    的頭像 發(fā)表于 08-11 14:43 ?11.5w次閱讀

    Arm KleidiAI與XNNPack集成實現(xiàn)AI性能提升

    Arm KleidiAI 首次集成到 XNNPack 已過去整整一年。KleidiAI 是一款高度優(yōu)化的軟件庫,旨在加速 Arm CPU 上的人工智能 (AI) 推理。在過去一年中
    的頭像 發(fā)表于 08-08 15:19 ?2838次閱讀
    <b class='flag-5'>Arm</b> KleidiAI與XNNPack集成實現(xiàn)<b class='flag-5'>AI</b>性能提升

    Arm Kleidi助力輕松加速AI工作負載

    正如 Arm 工程部軟件高級副總裁 Mark Hambleton 在《2025 年芯片新思維》報告中所說:人工智能 (AI) 的未來發(fā)展離不開軟硬件的協(xié)同。
    的頭像 發(fā)表于 06-19 10:45 ?993次閱讀

    Arm 與微軟合作,為基于 Arm 架構(gòu)的 PC 和移動設(shè)備應(yīng)用提供超強 AI 體驗

    ArmKleidiAI與ONNXRuntime的集成,為Windows和安卓操作系統(tǒng)帶來了顯著的AI性能優(yōu)化,實現(xiàn)高達2.6倍的AI推理速度提升,從而加速應(yīng)用體驗。聯(lián)合作者:Arm終端
    的頭像 發(fā)表于 06-03 16:47 ?882次閱讀
    <b class='flag-5'>Arm</b> 與微軟合作,為基于 <b class='flag-5'>Arm</b> 架構(gòu)的 PC 和移動設(shè)備應(yīng)用提供超強 <b class='flag-5'>AI</b> 體驗

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    子系統(tǒng)(CSS)? ? 的垂直領(lǐng)域延伸,Niva 旨在通過軟硬件深度整合,解決傳統(tǒng) x86 架構(gòu)在能效比、AI 加速與生態(tài)兼容性上的痛點。以下結(jié)合技術(shù)架構(gòu)、性能突破、競爭格局與戰(zhàn)略意義展開分析: 一、技術(shù)架構(gòu)
    的頭像 發(fā)表于 05-29 09:56 ?1646次閱讀

    Arm與微軟合作加速邊緣設(shè)備上的AI體驗

    隨著人工智能 (AI) 成為當今個人電腦 (PC) 和移動設(shè)備使用體驗(從聊天機器人到生產(chǎn)力提升)中不可或缺的一部分,這些設(shè)備對 CPU 高效、可擴展的推理需求也在持續(xù)增長。Arm 與微軟正攜手合作
    的頭像 發(fā)表于 05-28 13:54 ?842次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進的技術(shù),從云到 PC 加速代理式 AI 應(yīng)用的
    的頭像 發(fā)表于 05-27 14:03 ?1060次閱讀

    NVIDIA Cosmos加速機器人和自動駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?1284次閱讀
    NVIDIA Cosmos<b class='flag-5'>加速</b>機器人和自動駕駛汽車物理<b class='flag-5'>AI</b><b class='flag-5'>發(fā)展</b>

    華為加速AI時代數(shù)據(jù)存儲產(chǎn)業(yè)發(fā)展

    近日,在華為中國合作伙伴大會2025上,華為數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲產(chǎn)業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享AI時代數(shù)據(jù)存儲產(chǎn)業(yè)
    的頭像 發(fā)表于 04-01 15:35 ?1194次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    架構(gòu),賦能多場景應(yīng)用 BPI-AI2N 采用 RZ/V2N 處理器,集成 4 核 Arm? Cortex?-A55(1.8GHz)與 Cortex?-M33(200MHz),提供強勁的計算能力,同時兼顧
    發(fā)表于 03-19 17:54

    Arm Kleidi擴展到汽車市場 Arm Kleidi實現(xiàn)性能自動優(yōu)化

    (AI) 的發(fā)展。通過 Arm Kleidi,合作伙伴將能夠充分挖掘下一代特定應(yīng)用 AI 模型在汽車中的優(yōu)勢,并加快其部署速度。 ? “?
    的頭像 發(fā)表于 03-14 15:36 ?1622次閱讀