91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

牽手一起夢 ? 來源:騰訊產業(yè)互聯(lián)網 ? 作者:佚名 ? 2020-06-15 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從學界到工業(yè)界,“開源”已經成為AI領域的一個關鍵詞。一方面,它以“授人以漁”的方式為AI構建了一個開放共進的生態(tài)環(huán)境,幫助行業(yè)加速AI應用落地;另一方面,在解決行業(yè)實際問題時持續(xù)更新和迭代,源源不斷地給AI領域輸送重要的技術養(yǎng)料和創(chuàng)造力,可以說開源是AI落地和繁榮不可或缺的源動力。

6月10日,騰訊優(yōu)圖實驗室宣布正式開源新一代移動端深度學習推理框架TNN,通過底層技術優(yōu)化實現在多個不同平臺的輕量部署落地,性能優(yōu)異、簡單易用。基于TNN,開發(fā)者能夠輕松將深度學習算法移植到手機端高效的執(zhí)行,開發(fā)出人工智能APP,真正將 AI 帶到指尖。

輕量級部署,TNN助力深度學習提速增效

深度學習對算力的巨大需求一直制約著其更廣泛的落地,尤其是在移動端,由于手機處理器性能弱、算力無法多機拓展、運算耗時長等因素常常導致發(fā)熱和高功耗,直接影響到app等應用的用戶體驗。騰訊優(yōu)圖基于自身在深度學習方面的技術積累,并借鑒業(yè)內主流框架優(yōu)點,推出了針對手機端的高性能、輕量級移動端推理框架TNN。

TNN在設計之初便將移動端高性能融入核心理念,對2017年開源的ncnn框架進行了重構升級。通過GPU深度調優(yōu)、ARM SIMD深入匯編指令調優(yōu)、低精度計算等技術手段,在性能上取得了進一步提升。以下是MNN, ncnn, TNN框架在多款主流平臺的實測性能:

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

TNN在麒麟970、驍龍835、驍龍845,驍龍615平臺實測性能數據

注:縱軸單位:ms 測試分支:MNN:1.0.0(2020.05.07), ncnn:20200413, TNN: master(2020.06.10)

測試模型:

低精度計算的運用對TNN的性能提升發(fā)揮了重要作用。在神經網絡計算中,浮點精度在許多研究和業(yè)務落地成果上都被證明存在一定冗余,而在計算、內存資源都極為緊張的移動端,消除這部分冗余極為必要。TNN引入了INT8、 FP16、 BFP16等多種計算低精度的支持,相比大部分僅提供INT8支持的框架,不僅能靈活適配不同場景,還讓計算性能大大提升。TNN通過采用8bit整數代替float進行計算和存儲,模型尺寸和內存消耗均減少至1/4,在計算性能上提升50%以上。同時引入arm平臺BFP16的支持,相比浮點模型,BFP16使模型尺寸、內存消耗減少50%,在中低端機上的性能也提升約20%。驍龍615平臺實測:

騰訊優(yōu)圖TNN助力深度學習提速增效,在手機端進行AI APP開發(fā)

通用、輕便是TNN框架的另一大亮點。長久以來,不同框架間的模型轉換都是AI項目應用落地的痛點。TNN設計了與平臺無關的模型表示,為開發(fā)人員提供統(tǒng)一的模型描述文件和調用接口,支持主流安卓、iOS操作系統(tǒng),適配CPU、 GPU、NPU硬件平臺。企業(yè)一套流程就能部署到位,簡單易用、省時省力。同時, TNN通過ONNX可支持TensorFlow, PyTorch, MXNet, Caffe等多種訓練框架,目前支持ONNX算子超過80個,覆蓋主流CNN網絡。TNN所有算子均為源碼直接實現,不依賴任何第三方,接口易用,切換平臺僅需修改調用參數即可。

開源文化興起,AI底層技術助推產業(yè)發(fā)展

事實上,作為騰訊旗下頂級AI實驗室,騰訊優(yōu)圖長期致力于AI基礎設施的研發(fā)和推進。此前,騰訊優(yōu)圖已開發(fā)了Rapidnet 前向計算框架、RapidAIoT 邊緣計算框架,實現了業(yè)界首個專注移動端的推斷框架ncnn的開源,并在業(yè)界受到廣泛推崇。從2017年開源至今,ncnn在GitHub上star(8.9k)和 fork(2.3k)數均領先于其它各大推理框架。

據悉,TNN已于3月中旬在騰訊內部開源,為騰訊QQ、QQ空間、騰訊微視、騰訊云、天天P圖等多款產品和服務中持續(xù)提供技術能力,釋放出更多效能。

“TNN已在GitHub上開源,歡迎業(yè)界人士參與協(xié)同共建,共同打造更優(yōu)的移動端推理框架?!膀v訊優(yōu)圖實驗室副總經理吳永堅介紹,騰訊優(yōu)圖后續(xù)將在現有CV業(yè)務的基礎上研發(fā)更多的AI推理模型,如語音、NLP等相關業(yè)務,同時開展針對CPU、GPU服務器端的服務,為業(yè)界公司提供更廣泛的優(yōu)化服務。 “作為產業(yè)發(fā)展的高速公路,以深度學習框架、組件為代表的AI基礎設施將是未來的主流趨勢,騰訊優(yōu)圖也將以此為著力點,助推產業(yè)發(fā)展?!眳怯缊员硎?,騰訊優(yōu)圖還將持續(xù)開發(fā)模型訓練組件、模型壓縮組件、基礎算法組件,并擇機開源,希望從框架到平臺、到算法,打造一體化的AI基礎設施,降低AI門檻,加速產業(yè)發(fā)展。

隨著以開源為代表的新代碼文化的興起,騰訊近年來在開源領域表現亮眼:在全球最大的代碼托管平臺GitHub上,騰訊發(fā)布的開源項目已經超過一百個,涵蓋云原生、大數據、AI、云計算、安全、硬件等多個熱門的技術方向。

通過開源協(xié)同,騰訊將各個事業(yè)群最底層和共性的技術能力進行梳理和拉通,在業(yè)務實踐和海量用戶檢驗下,優(yōu)質的內部開源項目不僅在公司層面推廣復用,同時也對外貢獻整個開源社區(qū)。僅在Github上,騰訊的開源項目就收獲了30w+star數,躋身國際上有影響力的開源企業(yè)之一。

在開源的道路上,騰訊不僅將內部優(yōu)質項目持續(xù)對外開放,也積極與開源社區(qū)協(xié)同合作,發(fā)揮中國企業(yè)的科技力量,推動開源和開放進一步升級。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 手機
    +關注

    關注

    36

    文章

    7000

    瀏覽量

    161087
  • AI
    AI
    +關注

    關注

    91

    文章

    40101

    瀏覽量

    301737
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124457
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    在手動拼接 AI 代碼?你的 IDE 早就該升級了

    進度,更可能因操作繁瑣引發(fā)代碼錯誤,直接影響工業(yè)控制系統(tǒng)的穩(wěn)定性與安全性。傳統(tǒng)IDE的AI應用模式,早已無法適配嵌入式開發(fā)的高效、高可靠需求。 我們真正需要的,是一款深度適配嵌入式開發(fā)
    發(fā)表于 03-11 10:25

    安霸推出開發(fā)者社區(qū)以助力部署AI應用

    安霸開發(fā)者社區(qū)為合作伙伴提供優(yōu)先體驗通道,助力其在安霸 AI SoC 及 Cooper 開發(fā)軟件上評估、構建并大規(guī)模部署
    的頭像 發(fā)表于 01-08 14:50 ?322次閱讀

    融合AI的OpenHarmony應用軟件開發(fā)ai學習自律輔助軟件

    *附件:ai study.zip*附件:融合AI的OpenHarmony應用軟件開發(fā)ai學習自律輔助軟件.pdf 基于開源鴻蒙編寫的
    發(fā)表于 11-12 15:38

    能源監(jiān)測管理平臺支持手機遠程訪問嗎

    能源監(jiān)測管理平臺普遍支持手機遠程訪問 ,用戶可通過手機APP或網頁實時查看能耗數據、設備狀態(tài)及報警信息,實現遠程監(jiān)控與管理。以下為具體說
    的頭像 發(fā)表于 09-30 11:48 ?427次閱讀
    能源監(jiān)測管理平臺支持<b class='flag-5'>手機</b><b class='flag-5'>端</b>遠程訪問嗎

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優(yōu)勢如下: ①模
    發(fā)表于 09-12 17:30

    HarmonyOS AI輔助編程工具(CodeGenie)智慧調優(yōu)

    DevEco Studio提供智慧調優(yōu)能力,支持通過自然語言交互,分析并解釋當前實例或項目中存在的性能問題,幫助開發(fā)者快速定位影響性能的具體原因。該功能從DevEco Studio 6.0.0
    發(fā)表于 08-14 11:12

    Arm率先適配騰訊混元開源模型,助力AI創(chuàng)新開發(fā)

    共同賦能側人工智能 (AI) 部署,助力本土開發(fā)者實現 AI 應用創(chuàng)新! 這次的首日開源適配是雙方再次攜手提升
    的頭像 發(fā)表于 08-08 09:16 ?1424次閱讀
    Arm率先適配<b class='flag-5'>騰訊</b>混元開源模型,<b class='flag-5'>助力</b><b class='flag-5'>端</b>側<b class='flag-5'>AI</b>創(chuàng)新<b class='flag-5'>開發(fā)</b>

    朗國科技獲深度學習數據集高效管理專利,助力AI研發(fā)降本增效

    國家知識產權局公開信息顯示,廣州朗國電子科技股份有限公司(下文稱“朗國科技”或“公司”)近期成功獲得一項名為“一種深度學習數據集存儲與檢索方法及系統(tǒng)”的發(fā)明專利授權,專利號為CN116795788B
    的頭像 發(fā)表于 07-29 09:25 ?493次閱讀

    【沁恒CH585開發(fā)板免費試用體驗】+無線通訊功能測試

    的接收信息。 2 接收藍牙發(fā)送內容 此時,在手機可外發(fā)送數據或信息,見圖3所示。 3 發(fā)送數據 在完成發(fā)送后,在電腦會見到
    發(fā)表于 07-07 10:52

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)進行深度學習實踐,并盡量實現皮膚病理圖片的識別,第二階段

    /Train_Custom_Dataset 當然內容還是非常多的 借助子豪兄的力量,通過onnx這個中間表示,最后簡單做了一個apk *附件:mobilev2.rar 走到這里的體會是,這個生態(tài)在手機和pc似乎比較完善。要從
    發(fā)表于 06-23 18:37

    【「零基礎開發(fā)AI Agent」閱讀體驗】+ 入門篇學習

    的是基礎篇,主要從為什么要學習AI Agent和開發(fā)AI Agent的知識儲備入手進行介紹。作為入門AI
    發(fā)表于 05-02 09:26

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率再提升

    ;“DevEco Studio”,可“立即下載”最新版AI輔助編程插件,進行安裝使用。 4:CodeGenie單獨下載路徑 進入“HarmonyOS開發(fā)者官網”,點擊“
    發(fā)表于 04-18 14:43

    基于RV1126開發(fā)板移植NCNN部署庫方法

    移動優(yōu)化的開源神經網絡推斷庫。能實現無第三方依賴,跨平臺操作,在手機CPU運算速度在開源框架中處于領先水平。基于該平臺,開發(fā)者能夠輕松將深度
    的頭像 發(fā)表于 04-16 15:24 ?644次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板移植NCNN部署庫方法

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓AI模型接入得心應手

    、內存帶寬占用量大幅度降低50%,讓AI推理更聰明、響應更迅速。 天璣AI開發(fā)套件2.0還首次引入基于NPU的側LoRA訓練,
    發(fā)表于 04-13 19:52

    可智能深度學習AI攝像機模組方案

    、方案優(yōu)勢 500/800萬像素CMOS傳感器。 專業(yè)級海思Hi3519DV500、 Hi3403/3402、星宸SSC338G。 可內嵌智能深度學習人臉算法,機動車識別、車牌識別、非機動車識別算法
    發(fā)表于 03-21 11:28