91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度推智能數(shù)據(jù)服務(wù)平臺(tái)EasyData,具有高級(jí)智能數(shù)據(jù)清洗功能

如意 ? 來(lái)源:51cto ? 作者:佚名 ? 2020-09-07 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在進(jìn)行AI模型開(kāi)發(fā)時(shí),數(shù)據(jù)的數(shù)量與質(zhì)量直接影響模型效果。在實(shí)地?cái)?shù)據(jù)采集之后,企業(yè)往往需要從大量數(shù)據(jù)中篩選出符合訓(xùn)練要求的相關(guān)數(shù)據(jù),剔除質(zhì)量差或不相關(guān)的數(shù)據(jù),這個(gè)步驟被稱為數(shù)據(jù)清洗。

通常來(lái)講,在清洗數(shù)據(jù)時(shí)主要會(huì)清理掉對(duì)訓(xùn)練任務(wù)沒(méi)有用途的數(shù)據(jù),例如在訓(xùn)練工廠工人佩戴安全帽識(shí)別模型時(shí),希望在視頻抽幀后的大量圖片中僅保留有工人出現(xiàn)的圖片進(jìn)行標(biāo)注訓(xùn)練。在這一步驟上,傳統(tǒng)做法是進(jìn)行人工篩選,人力投入較多且容易發(fā)生遺漏;隨著人工智能發(fā)展,目前許多平臺(tái),如百度大腦AI開(kāi)放平臺(tái),已經(jīng)提供人臉檢測(cè)、人體檢測(cè)的通用接口,用戶可以先調(diào)用接口處理數(shù)據(jù),篩選出采集到人像的數(shù)據(jù),再進(jìn)入到具體的檢測(cè)識(shí)別步驟。那么,是否有一個(gè)集成了各項(xiàng)數(shù)據(jù)處理能力,盡量減少人工干預(yù),能夠自動(dòng)完成視頻數(shù)據(jù)采集、抽幀、數(shù)據(jù)清洗、智能標(biāo)注,從而高效提取高質(zhì)量訓(xùn)練數(shù)據(jù)的解決方案呢?

關(guān)注到有越來(lái)越多的用戶對(duì)數(shù)據(jù)處理有強(qiáng)烈需求,今年4月,百度全新推出智能數(shù)據(jù)服務(wù)平臺(tái)EasyData,集數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注等功能于一身,完成上述數(shù)據(jù)處理工作之后,可以在EasyDL平臺(tái)進(jìn)行模型訓(xùn)練、模型部署。

針對(duì)數(shù)據(jù)清洗這一具體功能,EasyData目前上線了去相似、去模糊、旋轉(zhuǎn)、裁剪和鏡像這5種基礎(chǔ)的數(shù)據(jù)清洗功能。那么除了常規(guī)能力之外,EasyData還有什么業(yè)內(nèi)獨(dú)家的終極秘技?

從應(yīng)用出發(fā),高級(jí)清洗功能讓數(shù)據(jù)處理事半功倍

在園區(qū)智能管理等場(chǎng)景下,需要監(jiān)測(cè)工廠園區(qū)、林區(qū)中是否有人闖入,或檢查工人是否佩戴安全帽。為了滿足此類(lèi)場(chǎng)景下的圖片清洗需求,EasyData上線了高級(jí)清洗功能,將無(wú)人臉、無(wú)人體出現(xiàn)的數(shù)據(jù)進(jìn)行過(guò)濾。EasyData聯(lián)動(dòng)百度大腦AI開(kāi)放平臺(tái)提供的前沿技術(shù)能力,用戶僅需在百度智能云上開(kāi)通相應(yīng)的服務(wù)(人臉檢測(cè)和人體檢測(cè)都可以免費(fèi)試用),就可以通過(guò)簡(jiǎn)單的配置,在EasyData平臺(tái)上直接使用這些功能進(jìn)行自動(dòng)數(shù)據(jù)清洗。

1、過(guò)濾無(wú)人臉圖片

如果以前沒(méi)有用過(guò)百度智能云的人臉檢測(cè)服務(wù),第一次使用高級(jí)清洗的功能會(huì)提示“申請(qǐng)免費(fèi)試用”,點(diǎn)擊鏈接會(huì)進(jìn)入百度智能云人臉檢測(cè)的頁(yè)面,按照提示,開(kāi)通服務(wù)后,再回到EasyData的頁(yè)面就可以正常使用了。

和基礎(chǔ)的數(shù)據(jù)清洗服務(wù)一樣,過(guò)濾無(wú)人臉圖片也是以數(shù)據(jù)集為單位的。在數(shù)據(jù)清洗頁(yè)面選擇過(guò)濾無(wú)人臉圖片,點(diǎn)擊保存,提交任務(wù)就可以進(jìn)行清洗。如果勾選了“保留標(biāo)簽”,那么不僅會(huì)把沒(méi)有人臉的圖片過(guò)濾,還會(huì)將人臉畫(huà)框同步至清洗后的數(shù)據(jù)集。

例如下圖,清洗前的數(shù)據(jù)集除了人臉圖片,還有一些風(fēng)景照、車(chē)輛等其他物體的照片,人臉過(guò)濾會(huì)把這些沒(méi)有人臉的圖片過(guò)濾,保留下來(lái)包含人臉的圖片,包括戴口罩、被遮擋的人臉也可以識(shí)別出來(lái)。

過(guò)濾無(wú)人體圖片同樣會(huì)用到百度智能云的人體檢測(cè)能力,在使用之前需要在百度智能云上開(kāi)通相應(yīng)的服務(wù)。過(guò)濾無(wú)人體圖片會(huì)用到兩個(gè)接口,人體檢測(cè)和屬性分析(https://ai.baidu.com/tech/body/attr)和人像分割(https://ai.baidu.com/tech/body/seg)。數(shù)據(jù)集模板為圖像分類(lèi)和物體檢測(cè)的數(shù)據(jù)集會(huì)調(diào)用人體檢測(cè)和屬性分析接口,數(shù)據(jù)集模板為圖像分割的數(shù)據(jù)集會(huì)調(diào)用人像分割接口。百度智能云上的人像分割接口返回的是人像圖片對(duì)應(yīng)的二值圖片(人像為1,背景為0),在后端會(huì)執(zhí)行相應(yīng)的標(biāo)簽轉(zhuǎn)換,返回的二值圖片轉(zhuǎn)換成對(duì)應(yīng)的標(biāo)簽。

關(guān)注廣泛需求,提供多種基礎(chǔ)數(shù)據(jù)清洗功能

1、去相似圖片

用攝像頭自動(dòng)采集圖片的時(shí)候,由于長(zhǎng)時(shí)間在同一個(gè)場(chǎng)景下,即使做了抽幀處理,還是會(huì)有大量的相似圖片。大量的相似圖片,數(shù)據(jù)價(jià)值低,而且占用了大量的存儲(chǔ)空間,而人工篩選,耗時(shí)費(fèi)力,容易出錯(cuò)。EasyData平臺(tái)推出的去相似圖片利用圖片的相似檢索特征,計(jì)算圖片的兩兩相關(guān)性,可以自動(dòng)地判斷相似圖片、保留不相似的圖片,具體操作也十分簡(jiǎn)便。

如下圖所示,去相似前的數(shù)據(jù)集里有8張圖片,根據(jù)圖片的相似度,圖片可以分成3類(lèi)。清洗完成后的數(shù)據(jù)集中有3張圖片,分別是清洗前的3類(lèi)圖片中的一張。

2、去模糊圖片

相機(jī)抖動(dòng)、物體快速移動(dòng)都會(huì)造成拍出來(lái)的圖片不清晰、產(chǎn)生低質(zhì)圖片。通過(guò)人工挑選的方法去除模糊圖片缺乏統(tǒng)一的標(biāo)準(zhǔn),容易漏刪或多刪。利用EasyData的去模糊圖片,可以輕易地去除模糊圖片。

以示例圖片為例,清洗前有5張圖片,畫(huà)質(zhì)不一,清洗后保留下來(lái)兩張高質(zhì)量的圖片。此外,如果用戶認(rèn)為有部分模糊圖片沒(méi)有去除,或者高質(zhì)量的圖片沒(méi)有保留下來(lái),可以考慮調(diào)整清晰度的分值,重新清洗。

對(duì)于普通清洗,可以在一個(gè)清洗任務(wù)中提交多個(gè)清洗操作,例如同時(shí)勾選去相似、去模糊功能,即可同時(shí)去除相似和模糊的圖片。

目前的數(shù)據(jù)清洗服務(wù)所能支持的最大數(shù)據(jù)集大小是5萬(wàn)張圖片。基于EasyData平臺(tái)的大數(shù)據(jù)處理平臺(tái),對(duì)于基礎(chǔ)清洗服務(wù),2萬(wàn)張圖片的數(shù)據(jù)集,僅需1小時(shí)可以完成清洗;5萬(wàn)張圖片的數(shù)據(jù)集,只需2小時(shí)即可完成清洗。對(duì)于高級(jí)清洗服務(wù)來(lái)說(shuō),清洗效率也可以通過(guò)配置QPS靈活調(diào)整清洗效率,更方便快捷。

考慮到智能園區(qū)管理等場(chǎng)景中,有對(duì)視頻進(jìn)行截幀、自動(dòng)上傳的需求,EasyData平臺(tái)也免費(fèi)提供SDK,供用戶進(jìn)行下載,可以將SDK接入業(yè)務(wù)現(xiàn)場(chǎng)的數(shù)據(jù)采集終端,在平臺(tái)設(shè)置截幀時(shí)間與間隔,自動(dòng)將原始視頻數(shù)據(jù)截為圖片數(shù)據(jù)并上傳至EasyData平臺(tái)進(jìn)行后續(xù)處理。

EasyData是百度大腦推出的業(yè)內(nèi)首個(gè)提供軟硬一體、端云協(xié)同的智能數(shù)據(jù)采集與處理平臺(tái),支持圖片、文本、音頻和視頻四類(lèi)數(shù)據(jù)的處理,其中圖片數(shù)據(jù)支持了采集、清洗、標(biāo)注一站式處理,覆蓋模型開(kāi)發(fā)中的各類(lèi)數(shù)據(jù)管理需求。EasyData處理后的數(shù)據(jù)可直接應(yīng)用于EasyDL模型訓(xùn)練,通過(guò)EasyDL預(yù)訓(xùn)練模型和自動(dòng)遷移學(xué)習(xí)機(jī)制,高效開(kāi)發(fā)AI模型。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40278

    瀏覽量

    301874
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2380

    瀏覽量

    95054
  • 人臉識(shí)別
    +關(guān)注

    關(guān)注

    77

    文章

    4127

    瀏覽量

    88589
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1518

    瀏覽量

    36312
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度智能云推出全球首款手機(jī)龍蝦應(yīng)用

    昨天,百度智能云發(fā)布了一款即開(kāi)即用的零部署服務(wù)DuClaw。目前,DuClaw網(wǎng)頁(yè)端服務(wù)已上線,能夠?qū)崿F(xiàn)零門(mén)檻“養(yǎng)蝦”。DuClaw來(lái)了!零門(mén)檻開(kāi)啟自由“養(yǎng)蝦”
    的頭像 發(fā)表于 03-13 11:38 ?440次閱讀

    百度地圖開(kāi)放平臺(tái)助力商用車(chē)與兩輪車(chē)智能出行

    智能出行加速滲透的今天,商用車(chē)與兩輪車(chē)已成為智慧交通體系中不可或缺的組成部分。百度地圖開(kāi)放平臺(tái)憑借其領(lǐng)先的數(shù)據(jù)能力、產(chǎn)品技術(shù)與開(kāi)放生態(tài),正攜手生態(tài)伙伴深入行業(yè)場(chǎng)景,共同推動(dòng)從“導(dǎo)航工
    的頭像 發(fā)表于 01-28 09:44 ?437次閱讀

    百度地圖開(kāi)放平臺(tái)與400萬(wàn)開(kāi)發(fā)者共赴智能時(shí)空新未來(lái)

    二十年星辰大海,十五載開(kāi)放引航。2025年,百度地圖迎來(lái)服務(wù)用戶的二十周年,其開(kāi)放平臺(tái)亦走過(guò)了與開(kāi)發(fā)者并肩同行的十五個(gè)春秋。在近期舉行的“2025百度地圖開(kāi)發(fā)者盛典”上,
    的頭像 發(fā)表于 01-23 09:03 ?779次閱讀
    <b class='flag-5'>百度</b>地圖開(kāi)放<b class='flag-5'>平臺(tái)</b>與400萬(wàn)開(kāi)發(fā)者共赴<b class='flag-5'>智能</b>時(shí)空新未來(lái)

    百度世界大會(huì)亮點(diǎn) 五年五芯 百度宣布打造最硬AI云

    自2006年以來(lái),百度世界大會(huì)已連續(xù)舉辦近20屆,百度世界大會(huì)是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級(jí)別盛事,作為百度年度最重要
    的頭像 發(fā)表于 11-13 15:47 ?1748次閱讀

    百度世界2025進(jìn)行中 百度昆侖芯超節(jié)點(diǎn)亮相 性能巨幅提升

    百度世界大會(huì)是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級(jí)別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會(huì),自2006年以來(lái)已連續(xù)舉辦19年,持續(xù)為行業(yè)搭建起交流前沿技術(shù)、碰
    的頭像 發(fā)表于 11-13 11:51 ?1350次閱讀

    珠海泰芯半導(dǎo)體攜手百度共筑智能硬件產(chǎn)業(yè)新生態(tài)

    2025年8月29日,北京國(guó)際會(huì)議中心二期迎來(lái)科技行業(yè)年度盛會(huì)。由百度智能云與極客公園聯(lián)合主辦的百度云智大會(huì)AI+智能硬件專(zhuān)場(chǎng)論壇圓滿舉行,珠海泰芯半導(dǎo)體有限公司總經(jīng)理唐振中作為特邀嘉
    的頭像 發(fā)表于 09-01 17:46 ?1131次閱讀

    百度智能云全面升級(jí)舸5.0和千帆4.0

    大會(huì)上,百度智能云全面升級(jí)舸AI計(jì)算平臺(tái)5.0、千帆企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)4.0兩大AI基礎(chǔ)設(shè)施,幫助企業(yè)以更低成本、更高效率部署和開(kāi)發(fā)AI產(chǎn)
    的頭像 發(fā)表于 08-30 09:18 ?1871次閱讀

    百度智能云亮相第二十二屆ChinaJoy

    百度智能云亮相第二十二屆ChinaJoy 8月1日,第二十二屆中國(guó)國(guó)際數(shù)碼互動(dòng)娛樂(lè)展覽會(huì)(ChinaJoy)在上海開(kāi)幕。大會(huì)期間,百度全景展示了百度
    的頭像 發(fā)表于 08-05 09:47 ?849次閱讀

    65%央企大模型落地首選百度智能

    今天,很榮幸地分享一個(gè)好消息,百度智能云已牽手65%的央企,共同推進(jìn)大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,百度聯(lián)合眾多央國(guó)企伙伴,針對(duì)各類(lèi)不同業(yè)務(wù)場(chǎng)景,打造了一大批可推廣、可復(fù)制的標(biāo)桿案例。
    的頭像 發(fā)表于 06-11 15:44 ?944次閱讀

    百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)

    近日,在WGDC25全球時(shí)空智能大會(huì)上,百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開(kāi)放,向開(kāi)發(fā)者
    的頭像 發(fā)表于 05-26 11:26 ?1836次閱讀

    百度智能云兩大基礎(chǔ)設(shè)施再升級(jí)

    近日,在Create2025百度AI開(kāi)發(fā)者大會(huì)上,沈抖分享了百度智能云在智能基礎(chǔ)設(shè)施建設(shè)方面的最新成果,并在算力、模型及應(yīng)用等方面發(fā)布一系列全新產(chǎn)品。
    的頭像 發(fā)表于 04-30 10:20 ?1178次閱讀

    上汽大眾與百度地圖達(dá)成戰(zhàn)略合作

    近日,上海國(guó)際車(chē)展期間,百度地圖與上汽大眾舉行科技X生態(tài)戰(zhàn)略合作伙伴簽約儀式,雙方將基于百度領(lǐng)先的車(chē)道級(jí)地圖產(chǎn)品,為上汽大眾千萬(wàn)車(chē)主打造更安全、高效的智能化出行體驗(yàn)。上汽大眾總經(jīng)理陶海龍、百度
    的頭像 發(fā)表于 04-29 17:28 ?1275次閱讀

    格靈深瞳與百度智能云達(dá)成戰(zhàn)略合作,共筑AI算力新基建

    4月25日,在Create2025百度AI開(kāi)發(fā)者大會(huì)期間,百度智能云與格靈深瞳正式簽署戰(zhàn)略合作協(xié)議。雙方將以“技術(shù)互補(bǔ)、生態(tài)共建、價(jià)值共生”為原則,聚焦大模型與行業(yè)場(chǎng)景深度融合,共同構(gòu)建國(guó)產(chǎn)化AI算
    的頭像 發(fā)表于 04-27 10:20 ?1479次閱讀

    百度地圖與雅迪推出組合屏智能導(dǎo)航解決方案

    近日,百度地圖與雅迪正式達(dá)成合作,共同推出組合屏智能導(dǎo)航解決方案,重新定義出行體驗(yàn),實(shí)現(xiàn)“所見(jiàn)即所達(dá)”。
    的頭像 發(fā)表于 04-08 15:22 ?1211次閱讀

    百度地圖在汽車(chē)智能化領(lǐng)域的應(yīng)用實(shí)踐

    進(jìn)一步加速,智駕是絕對(duì)的競(jìng)爭(zhēng)焦點(diǎn)。百度地圖基于覆蓋全國(guó)的車(chē)道級(jí)地圖數(shù)據(jù)(簡(jiǎn)稱LD),經(jīng)多家頭部車(chē)企實(shí)踐,在提升智駕安全性和效率上具有顯著價(jià)值。百度地圖LD是真正為全民智駕而生!”
    的頭像 發(fā)表于 04-03 15:02 ?2451次閱讀