隨著科技的發(fā)展,視覺信息數(shù)據(jù)正在發(fā)生爆炸式的增長。如果設(shè)備、人工智能想要在現(xiàn)實(shí)世界發(fā)揮重要作用,就必須看懂這些圖形圖像信息所表達(dá)和表現(xiàn)的內(nèi)容。

1970-2020年網(wǎng)絡(luò)上新增數(shù)據(jù)的占比趨勢圖,藍(lán)色是非結(jié)構(gòu)化數(shù)據(jù),其中大部分都是圖像和視頻信息數(shù)據(jù)。
如何讓數(shù)字雙眼看懂真實(shí)世界?
如何讓數(shù)字感知與現(xiàn)實(shí)同頻?
這就是計算機(jī)CV技術(shù)要解決的問題。

近年,機(jī)器學(xué)習(xí)大熱風(fēng)潮掀起,計算機(jī)CV技術(shù)與自然語言處理及語音識別并列為機(jī)器學(xué)習(xí)方向的三大熱點(diǎn)方向。
而計算機(jī)CV技術(shù),即計算機(jī)視覺(Computer vision),作為其中的一個重要分支,它的目的其實(shí)很簡單:看懂圖片或視頻里的內(nèi)容,或者說,對視覺關(guān)鍵信息的篩選和篩查。
一門研究如何使機(jī)器“看”的技術(shù)~

計算機(jī)CV技術(shù)可以利用神經(jīng)網(wǎng)絡(luò)中的深度卷積,提取復(fù)雜背景環(huán)境下圖像的邊緣、形狀、輪廓及紋理等關(guān)鍵特征,并進(jìn)行精確的識別和預(yù)測,從而達(dá)到代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量。

目前,計算機(jī)CV技術(shù)目前有八大類別,分別是圖像分類、目標(biāo)檢測、語義分割、實(shí)例分割、視頻分類、人體關(guān)鍵點(diǎn)檢測、場景文字識別、目標(biāo)跟蹤。
圖像分類
圖像分類是計算機(jī)視覺中重要的基礎(chǔ)問題,其余任務(wù)類別都是建立在圖像分類的基礎(chǔ)上的。比較典型有:人臉識別、圖片鑒黃、相冊根據(jù)人物自動分類等。

目標(biāo)檢測
目標(biāo)檢測任務(wù)的目標(biāo)是給定一張圖像或是一個視頻幀,讓計算機(jī)找出其中所有目標(biāo)的位置,并給出每個目標(biāo)的具體類別。

語義分割
它將整個圖像分成像素組,然后對像素組進(jìn)行標(biāo)記和分類。語義分割試圖在語義上理解圖像中每個像素是什么,并且還必須確定每個物體的邊界。

實(shí)例分割
實(shí)例分割將不同類型的實(shí)例進(jìn)行分類,會區(qū)分多個重疊物體和不同背景的復(fù)雜景象,不僅需要將不同的對象進(jìn)行分類,而且還要確定對象的邊界、差異,彼此之間空間、位置等關(guān)系。

視頻分類
與圖像分類不同的是,分類的對象不再是靜止的圖像,而是一個由多幀圖像構(gòu)成的、包含語音數(shù)據(jù)、包含運(yùn)動信息等的視頻對象。視頻分類因此要理解視頻幀與幀之間的關(guān)聯(lián)信息,還要理解每幀圖像信息。

體關(guān)鍵點(diǎn)檢測
會通過人體關(guān)鍵節(jié)點(diǎn)的組合和追蹤來識別人的運(yùn)動和行為,從而達(dá)到描述人體姿態(tài),預(yù)測人體行為。
7
場景文字識別
場景文字識別是在圖像背景復(fù)雜、分辨率低下、字體多樣、分布隨意等情況下,將圖像信息轉(zhuǎn)化為文字序列的過程。

目標(biāo)跟蹤
目標(biāo)跟蹤是指在特定場景跟蹤某一個或多個特定感興趣對象的過程。傳統(tǒng)的應(yīng)用就是視頻和真實(shí)世界的交互,在檢測到初始對象之后進(jìn)行觀察。

計算機(jī)CV技術(shù)目前的應(yīng)用領(lǐng)域和場景非常廣泛,例如人臉識別、手勢識別、圖像識別、圖像檢索、OCR、神經(jīng)網(wǎng)絡(luò)芯片、醫(yī)療影像診斷、無人駕駛、工業(yè)視覺、三維重建、圖像與NLP結(jié)合、智能視頻分析等。
以計算機(jī)CV技術(shù)為支撐的互聯(lián)網(wǎng)功能,已經(jīng)覆蓋了生活中的每個角落,也悄悄的改變著一切。

例?/ 百度CV技術(shù)應(yīng)用覆蓋樹狀圖
CV技術(shù)在能源行業(yè)和森林防火行業(yè)中? ? ??
可解決的難點(diǎn)
在一些特殊性質(zhì)的行業(yè),例如能源行業(yè)和森林防火行業(yè)。
能源行業(yè)如何規(guī)避?;繁旧硭鶐淼母唢L(fēng)險、如何實(shí)現(xiàn)標(biāo)準(zhǔn)化和高效低風(fēng)險的巡檢和作業(yè)流程、如何規(guī)避管理管控中的遺漏點(diǎn)、如何及時響應(yīng)突發(fā)安全隱患事件……
森防行業(yè)如何在廣闊山林有效的巡山、如何及時發(fā)現(xiàn)和撲滅突發(fā)的火情、如何在林火蔓延時預(yù)判趨勢、如何使得滅火無人機(jī)等設(shè)備精準(zhǔn)的執(zhí)行工作、如何管理距離遙遠(yuǎn)的工作人員……
這些難點(diǎn)和痛點(diǎn)很多都可以通過計算機(jī)CV技術(shù)解決。
由計算機(jī)來代替人力,用數(shù)字雙眼代替人眼,建立能夠從圖像或者多維數(shù)據(jù)中獲取‘信息’的人工智能系統(tǒng),通過算法自動識別,自動甄別,可高精準(zhǔn)判斷隱患風(fēng)險、智能化識別管理和作業(yè)遺漏,迅速的提升各類工作執(zhí)行效能。
?
垂直行業(yè)!
龐大數(shù)據(jù)資源庫搭建和算法技術(shù)加持

在能源行業(yè)和森林防火行業(yè)CV識別中,面臨著兩個技術(shù)難點(diǎn):①特征提取難;②計算量大。
面對這兩個問題,弘和集團(tuán)采用卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí),可以有效的抓取油氣站、油庫、森林防火各類場景圖像中的特征,在不影響特征提取的前提下,使用海量的數(shù)據(jù)進(jìn)行有效的降維,不但大大減少了對算力的要求,并且在保證高識別準(zhǔn)確率的同時達(dá)到了高響應(yīng)速度。
龐大的數(shù)據(jù)庫支撐和算法技術(shù)突破并行:針對能源行業(yè)和森林防火行業(yè)驗證了超過十萬個數(shù)學(xué)模型。針對特定的應(yīng)用場景,標(biāo)注和質(zhì)檢的訓(xùn)練集達(dá)千萬GB,測試集達(dá)百萬GB。
豐富的算法模型、數(shù)據(jù)庫資源迭代,可以保證能源行業(yè)和森林防火行業(yè)各類CV應(yīng)用場景識別的效率和精準(zhǔn)率。
?
如果想要機(jī)器能夠進(jìn)行思考??
我們需要先教會它們?nèi)タ础?/strong>
——斯坦福人工智能實(shí)驗室
二十年前還是直板手機(jī)的時代,計算機(jī)還是奢侈品,時代變化日新月異,從1959年生物學(xué)家開始研究視覺的機(jī)理,到1966年計算機(jī)視覺的產(chǎn)生,技術(shù)的飛速發(fā)展不斷推進(jìn)產(chǎn)業(yè)的變革。
對于傳統(tǒng)的能源和森林防火行業(yè),在計算機(jī)CV技術(shù)賦能之后,迅速運(yùn)轉(zhuǎn)的管理通路和極速響應(yīng)的應(yīng)急通路連通成閉環(huán),科技的革新之力下,兩個行業(yè)睜開數(shù)字雙眼,開啟智能化的新時代。
編輯:黃飛
?
電子發(fā)燒友App







評論