91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像標注在計算機視覺中起著至關(guān)重要的作用

Dbwd_Imgtec ? 來源:AI公園 ? 作者:AI公園 ? 2021-01-08 14:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

給大家介紹圖像標注的種類,應(yīng)用場景,以及各種標注的優(yōu)缺點。

介紹

“如果沒有數(shù)據(jù)分析,公司就會變得既盲又聾,就像高速公路上的鹿一樣在網(wǎng)絡(luò)上游蕩?!?/p>

— Geoffrey Moore

每個數(shù)據(jù)科學(xué)任務(wù)都需要數(shù)據(jù)。具體地說,是輸入系統(tǒng)的干凈易懂的數(shù)據(jù)。說到圖像,計算機需要看到人類眼睛看到的東西。

例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機視覺來解釋它接收到的視覺數(shù)據(jù)。這就是圖像標注的作用。

圖像標注在計算機視覺中起著至關(guān)重要的作用。圖像標注的目標是為和任務(wù)相關(guān)的、特定于任務(wù)的標簽。這可能包括基于文本的標簽(類),繪制在圖像上的標簽(即邊框),甚至是像素級的標簽。我們將在下面探討這一系列不同的標注技術(shù)。

人工智能需要的人工干預(yù)比我們想象的要多。為了準備高精度的訓(xùn)練數(shù)據(jù),我們必須對圖像進行標注以得到正確的結(jié)果。數(shù)據(jù)注釋通常需要較高水平的領(lǐng)域知識,只有來自特定領(lǐng)域的專家才能提供這些知識。

需要標注的計算機視覺任務(wù):

物體檢測

線/邊緣檢測

分割

姿態(tài)預(yù)測/關(guān)鍵點識別

圖像分類

目標檢測

進行目標檢測的技術(shù)主要有兩種,即2D和3D包圍框。 對于多邊形物體,可以使用多邊形方法。讓我們詳細討論一下。

2D 包圍框

在這種方法中,只需要在被檢測的物體周圍繪制矩形框。它們用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標和右下角的x、y軸坐標來確定。

優(yōu)點和缺點:

標注起來快速和容易。

不能提供重要的信息,如物體的方向,這對許多應(yīng)用來說是至關(guān)重要的。

包括不屬于物體一部分的背景像素。這可能會影響訓(xùn)練。

3D 包圍框或者立方體

類似于2D邊框,除了它們還可以顯示目標的深度。這種標注是通過將二維圖像平面上的邊界框向后投影到三維長方體來實現(xiàn)的。它允許系統(tǒng)區(qū)分三維空間中的體積和位置等特征。

優(yōu)點和缺點:

解決了物體方向的問題。

當物體被遮擋,這種標注可以想象包圍框的維度,這可能會影響訓(xùn)練。

這種標注也會包括背景像素,可能會影響訓(xùn)練。

多邊形

有時,必須標記形狀不規(guī)則的物體。在這種情況下,使用多邊形。注釋時只需標記物體的邊緣,我們就能得到要檢測的物體的完美輪廓。

優(yōu)點和缺點:

多邊形標記的主要優(yōu)點是它消除了背景像素,并捕獲了物體的精確尺寸。

非常耗時,如果物體的形狀是復(fù)雜的,很難標注。

注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。

數(shù)據(jù)采集是ML冷啟動的問題。但是,即使你有了一個可行的數(shù)據(jù)集,構(gòu)建和測試模型也是需要技巧的。

線/邊緣檢測(線和樣條)

在劃分邊界時,線和樣條是有用的。將區(qū)分一個區(qū)域和另一個區(qū)域的像素進行標注。

優(yōu)點和缺點:

這種方法的優(yōu)點是,連線上的像素不需要都是連續(xù)的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。

手動標注圖像中的線是非常累人和費時的,特別是圖像中有很多的線的時候。

當物體碰巧是對齊的時候,可能會給出誤導(dǎo)的結(jié)果。

姿態(tài)預(yù)測 / 關(guān)鍵點識別

在許多計算機視覺應(yīng)用中,神經(jīng)網(wǎng)絡(luò)常常需要識別輸入圖像中重要的感興趣的點。我們把這些點稱為地標或關(guān)鍵點。在這種應(yīng)用中,我們希望神經(jīng)網(wǎng)絡(luò)輸出關(guān)鍵點的坐標(x, y)。

分割

圖像分割是將一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。圖像分割方法有很多種。

語義分割:語義分割是一項機器學(xué)習(xí)任務(wù),它需要像素級標注,其中圖像中的每個像素都被分配給一個類。每個像素都帶有語義意義。這主要用于環(huán)境背景非常重要的情況。

實例分割:實例分割是圖像分割的一種子類型,它在像素級別上標識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級別之一。

全景分割:全景分割結(jié)合了語義分割和實例分割,所有像素都被分配一個類標簽,所有目標實例都被唯一地分割。

圖像分類

圖像分類不同于目標檢測。目標檢測的目的是識別和定位目標,而圖像分類的目的是識別和識別特定的目標類。這個用例的一個常見示例是對貓和狗的圖片進行分類。標注者必須為一只狗的圖像分配一個類標簽“dog”,對貓的圖像分配類標簽“cat”。

圖像標注的用例

在本節(jié)中,我們將討論如何使用圖像標注來幫助機器模型執(zhí)行特定行業(yè)的任務(wù):

零售:

2D邊框可以用于標注產(chǎn)品的圖像,然后機器學(xué)習(xí)算法可以使用這些圖像來預(yù)測成本和其他屬性。圖像分類在這方面也有幫助。

醫(yī)學(xué):

多邊形可用于在醫(yī)用x射線中標記器官,以便將它們輸入深度學(xué)習(xí)模型,以訓(xùn)練x射線中的畸形或缺陷。這是圖像標注最重要的應(yīng)用之一,需要醫(yī)學(xué)專家具有較高的領(lǐng)域知識。

自動駕駛汽車:

這是另一個重要的領(lǐng)域,圖像標注可以應(yīng)用。利用語義分割對圖像中的每個像素進行標記,使車輛能夠感知到道路上的障礙物。這一領(lǐng)域的研究仍在進行中。

情緒檢測:

這是里程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應(yīng)用于評估受試者對特定內(nèi)容的情緒反應(yīng)。

制造行業(yè):

線和樣條可用于標注工廠的圖像線跟隨機器人工作。這可以幫助自動化生產(chǎn)過程,人力勞動可以最小化。

圖像標注的一些挑戰(zhàn)

時間復(fù)雜度

手工標注圖像需要很多時間,機器學(xué)習(xí)需要大量的數(shù)據(jù)集,需要大量的時間來有效地標注這些基于圖像的數(shù)據(jù)集。

計算復(fù)雜度

機器學(xué)習(xí)需要精確標注的數(shù)據(jù)來運行模型。如果標注者在給圖像做標注的時候,注入任何一種錯誤,都可能會影響到訓(xùn)練,所有的努力都可能付諸東流。

領(lǐng)域知識

如前所述,圖像標注通常需要特定領(lǐng)域的高級領(lǐng)域知識。因此,我們需要知道該標注什么的注解者,以及該領(lǐng)域的專家。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42344
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47641
  • 圖像標注
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    2723

原文標題:圖像標注的基礎(chǔ)內(nèi)容介紹

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    為什么無線測試汽車設(shè)計至關(guān)重要

    自20世紀70年代起,電子系統(tǒng)便已成為眾多汽車的重要組成部分,但如今的聯(lián)網(wǎng)汽車功能與復(fù)雜程度上已達到全新高度。如今的汽車宛如精密復(fù)雜、高度聯(lián)網(wǎng)的計算機。其運行的關(guān)鍵環(huán)節(jié)之一,便是借助包括Wi-Fi、藍牙、超寬帶(UWB)、近場
    的頭像 發(fā)表于 03-09 10:53 ?674次閱讀
    為什么無線測試<b class='flag-5'>在</b>汽車設(shè)計<b class='flag-5'>中</b><b class='flag-5'>至關(guān)重要</b>

    上海計算機視覺企業(yè)行學(xué)術(shù)沙龍走進西井科技

    12月5日,由中國圖象圖形學(xué)學(xué)會青年工作委員會(下簡稱“青工委”)、上海市計算機學(xué)會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?599次閱讀

    工業(yè)圖像采集卡:機器視覺的“信號中樞”

    一、定位:連接物理視界與數(shù)字大腦的重要樞紐工業(yè)自動化生產(chǎn)線的精密檢測工位上,當高速相機捕捉到PCB板的微米級紋路時,一個常被忽視卻至關(guān)重要的硬件正在完成關(guān)鍵轉(zhuǎn)換——工業(yè)圖像采集卡如同
    的頭像 發(fā)表于 11-06 15:09 ?330次閱讀
    工業(yè)<b class='flag-5'>圖像</b>采集卡:機器<b class='flag-5'>視覺</b>的“信號中樞”

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    CMOS RGB圖像傳感器、ISM330DLC慣性運動單元和VL53L5CX ToF傳感器。B-CAMS-IMX可用于任何具有MIPI CSI-2? 接口(帶22引腳FFC連接器)的STM32開發(fā)板,輕松STM32微控制器和微處理器上實現(xiàn)全功能
    的頭像 發(fā)表于 10-20 09:46 ?1308次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1231次閱讀

    工業(yè)計算機重要

    工業(yè)計算機對某些行業(yè)至關(guān)重要。我們將在下面詳細解釋這些行業(yè)的工業(yè)計算機應(yīng)用。1.制造與工業(yè)自動化工業(yè)級計算機非常適合制造工廠,特別是那些想
    的頭像 發(fā)表于 07-28 16:07 ?583次閱讀
    工業(yè)<b class='flag-5'>計算機</b>的<b class='flag-5'>重要</b>性

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設(shè)計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠各種不同的極端環(huán)境
    的頭像 發(fā)表于 07-21 16:44 ?633次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?752次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    什么是自動駕駛數(shù)據(jù)標注?如何好做數(shù)據(jù)標注?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛系統(tǒng)的開發(fā)過程,數(shù)據(jù)標注是一項至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的
    的頭像 發(fā)表于 07-09 09:19 ?1397次閱讀
    什么是自動駕駛數(shù)據(jù)<b class='flag-5'>標注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標注</b>?

    圖像采集卡:機器視覺與專業(yè)成像的關(guān)鍵橋梁

    在當今數(shù)字化時代,從工業(yè)自動化檢測到醫(yī)療影像診斷,從科學(xué)研究到高清視頻制作,圖像信息的實時獲取和處理變得至關(guān)重要。而將現(xiàn)實世界的光信號(通過攝像頭或相機)高效、準確地轉(zhuǎn)換為計算機能夠處理的數(shù)字
    的頭像 發(fā)表于 06-19 12:25 ?1022次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器<b class='flag-5'>視覺</b>與專業(yè)成像的關(guān)鍵橋梁

    電源濾波器醫(yī)療設(shè)備重要作用

    電源濾波器現(xiàn)代醫(yī)療設(shè)備起著至關(guān)重要作用,通過抑制電源線電磁干擾和射頻干擾,保證設(shè)備性能穩(wěn)
    的頭像 發(fā)表于 06-13 14:34 ?707次閱讀
    電源濾波器<b class='flag-5'>在</b>醫(yī)療設(shè)備<b class='flag-5'>中</b>的<b class='flag-5'>重要作用</b>

    工業(yè)相機圖像采集卡:技術(shù)剖析、應(yīng)用場景與未來發(fā)展

    工業(yè)相機圖像采集卡,作為連接工業(yè)相機與計算機系統(tǒng)的橋梁,機器視覺領(lǐng)域扮演著至關(guān)重要的角色。它將工業(yè)相機采集的模擬或數(shù)字
    的頭像 發(fā)表于 05-28 13:49 ?799次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:技術(shù)剖析、應(yīng)用場景與未來發(fā)展

    工業(yè)相機圖像采集卡:機器視覺的核心樞紐

    應(yīng)用廣泛。工業(yè)相機圖像采集卡的主要功能在機器視覺系統(tǒng),工業(yè)相機負責(zé)捕獲目標對象的圖像,而圖像采集卡則負責(zé)將這些
    的頭像 發(fā)表于 05-21 12:13 ?868次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:機器<b class='flag-5'>視覺</b>的核心樞紐

    基于LockAI視覺識別模塊:C++圖像的基本運算

    圖像處理,理解圖像的基本操作是掌握計算機視覺技術(shù)的關(guān)鍵。本文章將介紹基于LockAI
    的頭像 發(fā)表于 05-06 16:20 ?724次閱讀
    基于LockAI<b class='flag-5'>視覺</b>識別模塊:C++<b class='flag-5'>圖像</b>的基本運算

    時鐘同步通信系統(tǒng)中有哪些重要作用?

    時鐘同步是指在一個系統(tǒng),各個時鐘能夠準確地顯示相同的時間。現(xiàn)代科技發(fā)展,時鐘同步是非常重要的,特別是
    的頭像 發(fā)表于 04-29 13:44 ?1128次閱讀
    時鐘同步<b class='flag-5'>在</b>通信系統(tǒng)中有哪些<b class='flag-5'>重要作用</b>?