91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的圖像識別原理是什么?

深圳市汽車電子行業(yè)協(xié)會 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2021-06-26 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特斯拉利用8個攝像頭來識別現(xiàn)實世界中的物體。攝像頭獲取的圖像包括行人、其他車輛、動物或障礙物,這不僅對特斯拉車輛駕駛員的安全很重要,對其他人也很重要。專利稱,重要的是,攝像頭能夠及時準(zhǔn)確地識別這些物體。

785551ea-d5b5-11eb-9e57-12bb97331649.png

特斯拉專利框

特斯拉專利演示

算法的代碼層面來說,特斯拉把它們的深度學(xué)習(xí)網(wǎng)絡(luò)稱為HydraNet。其中,基礎(chǔ)算法代碼是共享的,整個HydraNet包含48個不同的神經(jīng)網(wǎng)絡(luò),通過這48個神經(jīng)網(wǎng)絡(luò),就能輸出1000個不同的預(yù)測張量。理論上來說,特斯拉的這個超級網(wǎng)絡(luò),能同時檢測1000種物體。完成這些運(yùn)算并不簡單,特斯拉已經(jīng)耗費(fèi)了7萬個GPU小時進(jìn)行深度學(xué)習(xí)模型訓(xùn)練。

雖然工作量很大,但由于大部分工作由機(jī)器承擔(dān),特斯拉的人工智能團(tuán)隊僅由幾十人組成,與其他自動駕駛公司數(shù)百人甚至數(shù)千人的規(guī)模相比,確實規(guī)模不大。

完成2D的圖像還不算牛掰的,畢竟云端有超級計算機(jī)可以去訓(xùn)練,本地的芯片也是自己開發(fā)的,可以很好的匹配算法,特斯拉真正牛掰的地方,通過視覺完成3D的深度信息,并可以通過視覺建立高精度地圖,完成一些底下停車場的附件駕駛場景。

特斯拉全車共配備了8個攝像頭,一個毫米波雷達(dá)和12個超聲波雷達(dá),監(jiān)測外部環(huán)境,向自動駕駛電腦實時傳送信息。

特斯拉車外傳感器

簡單來看,特斯拉的攝像頭、毫米波雷達(dá)、超聲波雷達(dá)以及慣性測量單元記錄下當(dāng)前車輛所處的環(huán)境數(shù)據(jù),并將數(shù)據(jù)發(fā)送給特斯拉的自動駕駛電腦。自動駕駛電腦在進(jìn)行算法的計算之后,將速度和方向信息傳遞給轉(zhuǎn)向舵以及加速、制動踏板,實現(xiàn)對車輛的控制。

不過,在日常行駛過程中,攝像頭作為傳感器捕捉的內(nèi)容都是二維圖像,并沒有深度信息。

也就是說,雖然二維圖像已經(jīng)可以區(qū)分公路和路旁的人行道,但并不知道現(xiàn)在車輛距離“馬路牙子”還有多遠(yuǎn)。由于缺失這樣一個重要信息,自動駕駛的運(yùn)算可能并不準(zhǔn)確,操作可能出錯。因此,捕捉或者建立一個三維的圖景很有必要。

特斯拉使用三目相機(jī)的,它可以通過比較兩個攝像頭圖像的差異判斷物體的遠(yuǎn)近,獲得物體的深度信息。通過中央處理器對輸入圖像進(jìn)行感知、分割、檢測、跟蹤等操作,輸出給導(dǎo)航網(wǎng)絡(luò)端進(jìn)行語義建圖及匹配定位,同時通過目標(biāo)識別形成相應(yīng)的ADAS系統(tǒng)目標(biāo)屬性。

特斯拉還有更厲害的地方,那就是算法可以預(yù)測流媒體視頻中每一個像素的深度信息。也就是說,只要算法足夠好,流媒體視頻更加清晰,特斯拉的視覺傳感器所捕捉的深度信息甚至可以超過激光雷達(dá)。

在實際的自動駕駛應(yīng)用中,泊車入位和智能召喚兩個使用場景下就能充分利用這套算法。在停車場行駛時,車輛之間的距離很小,即使是駕駛員駕駛,稍不留神也很容易出現(xiàn)刮蹭事故。對于機(jī)器來說,停車場場景的行駛更加困難。在預(yù)測到深度信息之后,車輛可以在超聲波雷達(dá)的輔助之下,快速完成對周圍環(huán)境的識別,車輛泊車就會更加順利。

在完成深度信息的預(yù)測之后,這部分信息會顯示在車機(jī)上,同時也會直接參與控制轉(zhuǎn)向、加速、制動等駕駛動作。不過,轉(zhuǎn)向、加速、制動這些駕駛策略沒有固定的規(guī)則,有一定靈活性。因此,自動駕駛的駕駛策略沒有最佳,只有更好。

怎么提高神經(jīng)網(wǎng)絡(luò)的算法效率:

為什么這么多廠家只有百度敢挑戰(zhàn)視覺為主的輔助駕駛方案,不使用激光雷達(dá),其中很大一個原因就是神經(jīng)網(wǎng)絡(luò)算法相當(dāng)耗費(fèi)芯片算力和內(nèi)存資源,本地端的芯片要算力足夠強(qiáng)大,對于神經(jīng)網(wǎng)絡(luò)的算法要有優(yōu)化。

對于神經(jīng)網(wǎng)絡(luò)來說,其實很多的連接并不是一定要存在的,也就是說我去掉一些連接,可能壓縮后的網(wǎng)絡(luò)精度相比壓縮之前并沒有太大的變化。基于這樣的理念,很多剪枝的方案也被提了出來,也確實從壓縮的角度帶來了很大效果提升。

需要特別提出的是,大家從圖中可以看到,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)包括卷積層和全連接層兩大塊,剪枝對全連接層的壓縮效率是最大的。下面柱狀圖的藍(lán)色部分就是壓縮之后的系數(shù)占比,從中可以看到剪枝對全連接層的壓縮是最大的,而對卷積層的壓縮效果相比全連接層則差了很多。

所以這也是為什么,在語音的加速上很容易用到剪枝的一些方案,但是在機(jī)器視覺等需要大量卷積層的應(yīng)用中剪枝效果并不理想。

對于整個Deep Learning網(wǎng)絡(luò)來說,每個權(quán)重系數(shù)是不是一定要浮點的,定點是否就能滿足?定點是不是一定要32位的?很多人提出8位甚至1位的定點系數(shù)也能達(dá)到很不錯的效果,這樣的話從系數(shù)壓縮來看就會有非常大的效果。從下面三張人臉識別的紅點和綠點的對比,就可以看到其實8位定點系數(shù)在很多情況下已經(jīng)非常適用了,和32位定點系數(shù)相比并沒有太大的變化。所以,從這個角度來說,權(quán)重系數(shù)的壓縮也會帶來網(wǎng)絡(luò)模型的壓縮,從而帶來計算的加速。

這些都需要非常資深的軟件算法團(tuán)隊去優(yōu)化,同時需要懂得底層芯片的資源情況,而百度在人工算法這方面非常具有優(yōu)勢,所以有勇氣去挑戰(zhàn)視覺為主的自動駕駛 Apollo Lite方案。

百度表示,攝像頭是相對成熟的傳感器,除具備輕巧低成本和符合車規(guī)的優(yōu)勢外,高分辨率高幀率(成像頻率)的成像技術(shù)發(fā)展趨勢意味著圖像內(nèi)蘊(yùn)含的環(huán)境信息更豐富,同時視頻數(shù)據(jù)也和人眼感知的真實世界最為相似,但和三維點云數(shù)據(jù)相比,二維圖像中的信息更難挖掘,需要設(shè)計更強(qiáng)大的算法、大量數(shù)據(jù)的積累和更長期的研發(fā)投入。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    5096

    瀏覽量

    103180
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6413

    瀏覽量

    131397

原文標(biāo)題:【行業(yè)資訊】自動駕駛傳感器之?dāng)z像頭(十二)特斯拉圖像識別原理闡述

文章出處:【微信號:qidianxiehui,微信公眾號:深圳市汽車電子行業(yè)協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何讓ResNet50圖像識別模型在光計算硬件上飛快運(yùn)行

    你可能每天都在用圖像識別:手機(jī)相冊自動歸類、刷臉支付、甚至智能相機(jī)的寵物模式。但你有沒有想過,這些“一眼認(rèn)出”的本領(lǐng),是怎么教出來的?
    的頭像 發(fā)表于 03-09 14:21 ?191次閱讀

    ??低暤\花圖像識別智能系統(tǒng)推動水質(zhì)處理精細(xì)化管控

    為了解決這個痛點,??低曂瞥龅\花圖像識別智能系統(tǒng)——為水處理提質(zhì)增效,告別單一“肉眼判斷”時代。
    的頭像 發(fā)表于 01-10 16:08 ?2463次閱讀

    基于米爾MYC-YM90X安路飛龍DR1開發(fā)板儀表圖像識別系統(tǒng)開發(fā)

    滿足工業(yè)自動化、智能化發(fā)展需求。圖像識別技術(shù)為儀表自動化讀數(shù)提供了有效途徑。隨著集成電路技術(shù)發(fā)展,異構(gòu)計算芯片在圖像識別領(lǐng)域優(yōu)勢凸顯。安路飛龍 FPSOC 集成 ARM 處理器與 FPGA 可編程邏輯
    發(fā)表于 08-17 21:29

    國家級認(rèn)證!拓維海云天“中文手寫體作文圖像識別評分生成算法”通過國家網(wǎng)信辦備案

    近日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布第十二批深度合成服務(wù)算法備案公告,拓維海云天自主研發(fā)的核心技術(shù)成果——“中文手寫體作文圖像識別評分生成算法”成功通過備案(備案編號:250011號)。這是拓維海云天在
    的頭像 發(fā)表于 08-15 16:42 ?1371次閱讀
    國家級認(rèn)證!拓維海云天“中文手寫體作文<b class='flag-5'>圖像識別</b>評分生成算法”通過國家網(wǎng)信辦備案

    華怡豐推出ISC-B/C系列圖像識別傳感器

    在工業(yè)自動化領(lǐng)域,精準(zhǔn)、高效的視覺檢測是提升生產(chǎn)效率的關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識別傳感器集高精度定位、測量算法與先進(jìn)圖像處理技術(shù)于一體,為各類工業(yè)場景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?1730次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識別</b>傳感器

    基于FPGA的數(shù)字識別系統(tǒng)設(shè)計

    圖像處理領(lǐng)域,圖像識別是較為困難而關(guān)鍵的技術(shù)。這項技術(shù)被廣泛的應(yīng)用到娛樂、工業(yè)、軍事等領(lǐng)域。本次設(shè)計數(shù)字識別系統(tǒng)已經(jīng)在車牌識別、運(yùn)動員號碼識別
    的頭像 發(fā)表于 07-16 14:28 ?1584次閱讀
    基于FPGA的數(shù)字<b class='flag-5'>識別</b>系統(tǒng)設(shè)計

    火車車號圖像識別系統(tǒng)如何應(yīng)對不同光照條件下的識別問題?

    在鐵路運(yùn)輸管理中,準(zhǔn)確識別火車車號是實現(xiàn)自動化車輛管理的關(guān)鍵環(huán)節(jié)。然而,實際應(yīng)用場景中復(fù)雜多變的光照條件給車號識別帶來了巨大挑戰(zhàn)?,F(xiàn)代火車車號圖像識別系統(tǒng)通過多項技術(shù)創(chuàng)新,有效解決了這一難題。 多
    的頭像 發(fā)表于 07-15 11:37 ?780次閱讀
    火車車號<b class='flag-5'>圖像識別</b>系統(tǒng)如何應(yīng)對不同光照條件下的<b class='flag-5'>識別</b>問題?

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    ./Test-DigitHandRecog LZ-DigitHandRecog.rknn Capture # 單張圖像識別 ./Test-DigitHandRecog
    發(fā)表于 06-30 16:45

    想用K230放在無人機(jī)上做圖像識別,加裝一個4G模塊把識別結(jié)果和畫面同時傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,怎么操作?

    我想用K230放在無人機(jī)上做圖像識別,然后想加裝一個4G模塊把識別結(jié)果和畫面同時傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,這個目前可以如何處理? 你好,目前底層是支持4G模塊得驅(qū)動,參考https
    發(fā)表于 06-16 07:08

    新唐科技M55M1 MCU在藥品識別上的應(yīng)用

    在AI時代,物體識別圖像顯示的重要性日益凸顯。圖像識別作為人工智能的重要分支,能模擬人類視覺系統(tǒng)以理解、識別并解釋圖像或視頻信息。該技術(shù)已
    的頭像 發(fā)表于 05-08 11:33 ?1197次閱讀
    新唐科技M55M1 MCU在藥品<b class='flag-5'>識別</b>上的應(yīng)用

    手持終端集裝箱識別系統(tǒng)的圖像識別技術(shù)

    行業(yè)提供了更靈活、精準(zhǔn)的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識別技術(shù),結(jié)合深度學(xué)習(xí)算法,可快速捕捉并解析集裝箱號碼。其技術(shù)優(yōu)勢體現(xiàn)在: 1. 復(fù)雜環(huán)境適應(yīng)性:通過動態(tài)曝光補(bǔ)償和圖像增強(qiáng)算
    的頭像 發(fā)表于 04-03 10:49 ?744次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術(shù)!

    在港口自動化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過AI技術(shù)替代傳統(tǒng)人工理貨?讓我們一探
    的頭像 發(fā)表于 04-02 09:45 ?761次閱讀

    驚了!這個“神器”讓樹莓派秒變智能管家,圖像識別+無線投屏,太秀了!

    和BalenaCloud,讓樹莓派實現(xiàn)從圖像識別到智能生活的華麗轉(zhuǎn)身!圖像分類項目:用樹莓派和BalenaOS實現(xiàn)智能識別1.項目背景:讓樹莓派“看懂”世界想象一下,你的
    的頭像 發(fā)表于 03-25 09:23 ?1804次閱讀
    驚了!這個“神器”讓樹莓派秒變智能管家,<b class='flag-5'>圖像識別</b>+無線投屏,太秀了!

    【幸狐Omni3576邊緣計算套件試用體驗】RKNN 推理測試與圖像識別

    【幸狐 Omni3576 邊緣計算套件測評】RKNN 推理測試與圖像識別 本文介紹了幸狐 Omni3576 邊緣計算套件實現(xiàn) RKNN 推理和圖像物體識別的測試流程,包括 RKNN 介紹、環(huán)境搭建
    發(fā)表于 03-20 16:14