91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌宣布開放Open Images V4數(shù)據(jù)集

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-05-02 14:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,谷歌宣布開放Open Images V4數(shù)據(jù)集,包含190萬張圖片,共計(jì)600個(gè)類別,共標(biāo)記了1540萬個(gè)邊界框,這是迄今的有對象位置注釋的最大數(shù)據(jù)集?;诖藬?shù)據(jù)集,谷歌將在ECCV 2018舉辦大型圖像挑戰(zhàn)賽。

2016年,谷歌推出一個(gè)包含900萬張圖片的聯(lián)合發(fā)布數(shù)據(jù)庫:Open Images,其中標(biāo)注了成千上萬個(gè)對象類別。從它發(fā)布以來,谷歌的工程師一直在努力更新和重新整理數(shù)據(jù)集,以為計(jì)算機(jī)視覺研究領(lǐng)域提供有用的資源來開發(fā)新的模型。

今天,谷歌宣布開放Open Images V4,其中包含190萬張圖片,共計(jì)600個(gè)類別,共標(biāo)記了1540萬個(gè)邊界框。這個(gè)數(shù)據(jù)集成為現(xiàn)有的帶有對象位置注釋的最大數(shù)據(jù)集。這些邊界框大部分是由專業(yè)的注釋人員手工繪制的,以確保準(zhǔn)確性和一致性。這些圖像非常多樣,通常包含有幾個(gè)對象的復(fù)雜場景(平均每個(gè)圖像包含8個(gè)邊界框)。

谷歌發(fā)起大型開放圖像挑戰(zhàn)賽

與此同時(shí),谷歌還推出Open Image Challenge(開放圖像挑戰(zhàn)賽),這是一項(xiàng)新的目標(biāo)檢測挑戰(zhàn),將在2018年歐洲計(jì)算機(jī)視覺會(huì)議(ECCV 2018)上舉行。Open Image Challenge遵循了PASCAL VOC、ImageNet和COCO的傳統(tǒng),但規(guī)??涨埃?/p>

在170萬張訓(xùn)練圖片中,有1220萬個(gè)有框注釋,共500個(gè)類別。

比以前的檢測挑戰(zhàn)更廣泛,包括諸如“fedora”和“snowman”之類的新對象。

除了對象檢測這個(gè)任務(wù)之外,挑戰(zhàn)還包括一個(gè)視覺關(guān)系檢測跟蹤人物,即在特定關(guān)系中檢測對象的配對情況,例如“女人彈吉他”。

訓(xùn)練集現(xiàn)在已經(jīng)可以使用了。一組包含10萬個(gè)圖像的測試集將于2018年7月1日由Kaggle發(fā)布。提交結(jié)果的截止日期是2018年9月1日。我們希望這些大型的訓(xùn)練集能夠激發(fā)對更精密的探測模型的研究,這些模型將超過目前最先進(jìn)的性能,并且500個(gè)類別將能夠更精確地評估不同的探測器在哪里表現(xiàn)得最好。此外,有大量的圖像和許多對象的注釋使我們能夠探索視覺關(guān)系檢測,這是一個(gè)正在發(fā)展的分支領(lǐng)域的熱門話題。

除此之外,Open Images V4還包含3010萬的人工驗(yàn)證的圖像級標(biāo)簽,共計(jì)19794個(gè)類別,這并不是挑戰(zhàn)的一部分。該數(shù)據(jù)集包括550萬個(gè)圖像級標(biāo)簽,由來自世界各地的成千上萬的用戶在crowdsource.google.com上生成。

Open Images V4數(shù)據(jù)集

Open Images是一個(gè)由900萬張圖片組成的數(shù)據(jù)集,這些圖像被標(biāo)注為圖像級標(biāo)簽和對象邊界框。V4的訓(xùn)練集包含了600對象類的1460萬個(gè)圖像,其中共標(biāo)記了174萬個(gè)標(biāo)記目標(biāo),這使得它成為現(xiàn)有的最大包含對象位置注釋的數(shù)據(jù)集。這些物體的邊界框大部分是由專業(yè)的注釋器手工繪制的,以確保準(zhǔn)確性和一致性。這些圖像非常多樣,通常包含有多個(gè)對象的復(fù)雜場景(平均每個(gè)圖像有8.4個(gè)標(biāo)記)。此外,數(shù)據(jù)集還帶有數(shù)千個(gè)類的圖像級標(biāo)簽。

數(shù)據(jù)組織結(jié)構(gòu)

數(shù)據(jù)集被分割為一個(gè)訓(xùn)練集(9,011,219圖像),一個(gè)驗(yàn)證集(41620個(gè)圖像)和一個(gè)測試集(125,436張圖片)。這些圖像被標(biāo)注了圖像級標(biāo)簽和邊界框,如下所述。

表1

表1顯示了數(shù)據(jù)集的所有子集中的圖像級標(biāo)簽的概述。所有的圖像都有機(jī)器生成的圖像級標(biāo)簽,這些標(biāo)簽是由類似于Google Cloud Vision API的計(jì)算機(jī)視覺模型自動(dòng)生成的。這些自動(dòng)生成的標(biāo)簽有一個(gè)很大的假正率。

此外,驗(yàn)證和測試集,以及部分訓(xùn)練集都包含經(jīng)過人工驗(yàn)證的圖像級標(biāo)簽。大多數(shù)驗(yàn)證都是由Google內(nèi)部的注釋者完成的。更小的部分是通過圖片標(biāo)簽軟件來完成的,如Crowdsource app, g.co/imagelabeler。這個(gè)驗(yàn)證過程實(shí)際上消除了假陽性(但不是傳統(tǒng)意義上的假陰性,這種方式會(huì)導(dǎo)致一些標(biāo)簽可能在圖像中丟失)。由此產(chǎn)生的標(biāo)簽在很大程度上是正確的,我們建議使用這些標(biāo)簽來訓(xùn)練計(jì)算機(jī)視覺模型。使用多個(gè)計(jì)算機(jī)視覺模型來生成樣本,這樣做是保證在訓(xùn)練時(shí)不僅僅用機(jī)器生成的標(biāo)簽數(shù)據(jù),這就是為什么詞匯表被顯著擴(kuò)展的原因,如表一所示。

總的來說,有19995個(gè)不同的類和圖像級標(biāo)簽。請注意,這個(gè)數(shù)字略高于上表中人工驗(yàn)證的標(biāo)簽的數(shù)量。原因是在機(jī)器生成的數(shù)據(jù)集中有少量的標(biāo)簽并沒有出現(xiàn)在人工驗(yàn)證的集合中??捎?xùn)練的類是那些在V4訓(xùn)練集中至少有100個(gè)正例的人工驗(yàn)證類?;谶@個(gè)定義,7186個(gè)類被認(rèn)為是可訓(xùn)練的。

邊界框

表2

表2顯示了數(shù)據(jù)集的所有分割中邊界框注釋的概述,它包含了600個(gè)對象類。這些服務(wù)提供的范圍比ILSVRC和COCO探測挑戰(zhàn)的范圍更廣,包括諸如“fedora”和“snowman”之類的新對象。

對于訓(xùn)練集,我們在174 萬的圖像中標(biāo)注了方框,用于可用的陽性人工標(biāo)記的圖像級標(biāo)簽。我們關(guān)注最具體的標(biāo)簽。例如,如果一個(gè)圖像包含汽車、豪華轎車、螺絲刀,我們?yōu)楹廊A轎車和螺絲刀提供帶注釋的標(biāo)注方框。對于圖像中的每一個(gè)標(biāo)簽,我們詳盡地注釋了圖像中的對象類的每個(gè)實(shí)例。數(shù)據(jù)集共包含1460萬個(gè)的邊界框。平均每個(gè)圖像有8.4個(gè)標(biāo)記對象。

對于驗(yàn)證和測試集,針對所有可用的正圖像級標(biāo)簽,我們提供了所有對象實(shí)例詳盡的邊界框注釋。所有的邊界框都是手工繪制的。我們有意地嘗試在語義層次結(jié)構(gòu)中盡可能詳盡地標(biāo)注注釋框。平均來說,在驗(yàn)證和測試集中,每個(gè)圖像標(biāo)記了5個(gè)邊界框。

在所有的子集中,包括訓(xùn)練集、驗(yàn)證集和測試集中,注釋器還為每個(gè)邊界框標(biāo)記了一組屬性,例如指出該對象是否被遮擋。

類定義(Class definitions)

類別由MIDs(機(jī)器生成的id)標(biāo)識,可以在Freebase或Google知識圖的API中找到。每個(gè)類的簡短描述都可以在類中CSV中找到。

統(tǒng)計(jì)和數(shù)據(jù)分析

600個(gè)可標(biāo)記類的層次結(jié)構(gòu)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111599
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42359
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1238

    瀏覽量

    26226

原文標(biāo)題:谷歌發(fā)布迄今最大注釋圖像數(shù)據(jù)集,190萬圖像目標(biāo)檢測挑戰(zhàn)賽啟動(dòng)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    直擊英偉達(dá)腹地?谷歌TPU v7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了一套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七代 TPU v7(代號 Ironwood)將在后續(xù)幾周大規(guī)模上市。與此消息同步出來的還有:允許客戶在自有
    的頭像 發(fā)表于 11-27 08:53 ?9429次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b>TPU <b class='flag-5'>v</b>7<b class='flag-5'>開放</b>部署,催生OCS產(chǎn)業(yè)鏈紅利

    2026開放原子園區(qū)行上海站開源數(shù)據(jù)專場圓滿落幕

    3月16日,開放原子園區(qū)行(上海站)開源數(shù)據(jù)專場活動(dòng)在上海市徐匯區(qū)順利舉辦。本次活動(dòng)以激活數(shù)據(jù)價(jià)值、共筑開源生態(tài)為核心,聚焦人工智能開源數(shù)據(jù)
    的頭像 發(fā)表于 03-18 09:15 ?526次閱讀

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世標(biāo)志著開放翻譯領(lǐng)域邁出了重要一步,它可幫助人
    的頭像 發(fā)表于 02-26 10:22 ?606次閱讀

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    開放原子開源基金會(huì)發(fā)布2025中國高校開源育人案例

    11月21日,在2025開放原子開發(fā)者大會(huì)開幕式上,開放原子開源基金會(huì)正式發(fā)布《2025中國高校開源育人案例》(簡稱“《案例》”),涵蓋29所高校和科研機(jī)構(gòu)的35個(gè)開源育人優(yōu)秀案例
    的頭像 發(fā)表于 11-25 17:30 ?855次閱讀

    risc-v P擴(kuò)展(一) P指令簡介

    解碼、醫(yī)學(xué)成像、計(jì)算機(jī)視覺、嵌入式控制、機(jī)器人技術(shù)、人機(jī)界面等。 P指令擴(kuò)展提高了RISC-V CPU IP產(chǎn)品的DSP算法處理能力。隨著RISC-V P指令擴(kuò)展的增加,RISC-
    發(fā)表于 10-23 07:40

    RISC-V V擴(kuò)展的指令代碼

    1.指令V擴(kuò)展的主要內(nèi)容: 矢量指令:針對數(shù)據(jù)并行性,增加了一系列新的矢量指令,可以同時(shí)對多個(gè)數(shù)據(jù)進(jìn)行操作,提高了計(jì)算效率。浮點(diǎn)指令:新增了一些浮點(diǎn)指令,支持更高精度的計(jì)算,提高了
    發(fā)表于 10-21 13:11

    Arm獲任開放計(jì)算項(xiàng)目董事會(huì)成員

    Arm 控股有限公司(納斯達(dá)克股票代碼:ARM)近日宣布,公司已與 AMD、NVIDIA 一同獲任開放計(jì)算項(xiàng)目 (Open Compute Project, OCP) 董事會(huì)成員。此次任命彰顯了
    的頭像 發(fā)表于 10-18 14:49 ?1692次閱讀

    中科天機(jī)開放共享全球高分辨率氣象數(shù)據(jù)

    大模型、AI算力、數(shù)據(jù)是推動(dòng)新一代人工智能快速發(fā)展的三大關(guān)鍵要素。在大模型走向開源開放,AI算力實(shí)現(xiàn)普惠平權(quán)的同時(shí),發(fā)展高質(zhì)量的數(shù)據(jù),并
    的頭像 發(fā)表于 09-24 09:41 ?704次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)與模型

    新發(fā)布的 Granary 數(shù)據(jù)包含約 100 萬小時(shí)音頻,可用于訓(xùn)練高精度、高吞吐量的 AI 音頻轉(zhuǎn)錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?1007次閱讀

    HMI-4G套裝,輕松搞定“數(shù)據(jù)上云+異地遠(yuǎn)程運(yùn)維”

    工業(yè)現(xiàn)場設(shè)備分散、環(huán)境復(fù)雜、網(wǎng)絡(luò)難部署?宏 HMI-4G 套裝一站搞定!輕松打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)上云與遠(yuǎn)程運(yùn)維。文末附有真實(shí)客戶案例,歡迎查閱參考。
    的頭像 發(fā)表于 08-14 16:46 ?1113次閱讀
    宏<b class='flag-5'>集</b>HMI-<b class='flag-5'>4</b>G套裝,輕松搞定“<b class='flag-5'>數(shù)據(jù)</b>上云+異地遠(yuǎn)程運(yùn)維”

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    Efinity debuger常見問題總結(jié)-v4

    ; (3)安裝驅(qū)動(dòng); 在完成以上操作之后,可以按照下面的步驟進(jìn)行操作。 (1)打開open Debuger (2)點(diǎn)擊perspectives下的profile editor菜單 (3)點(diǎn)擊import
    的頭像 發(fā)表于 06-10 10:43 ?1381次閱讀
    Efinity debuger常見問題總結(jié)-<b class='flag-5'>v4</b>

    WPP Media發(fā)布業(yè)內(nèi)首個(gè)「大營銷模型」Open Intelligence

    全新數(shù)據(jù)解決方案和開創(chuàng)性「大營銷模型」,通過預(yù)測性智能提升營銷表現(xiàn),驅(qū)動(dòng)業(yè)務(wù)增長 上海?2025年6月4日?/美通社/ --?今天,WPP Media正式推出 Open Intelligence
    的頭像 發(fā)表于 06-04 16:12 ?757次閱讀
    WPP Media發(fā)布業(yè)內(nèi)首個(gè)「大營銷模型」<b class='flag-5'>Open</b> Intelligence

    關(guān)于CCG5 platform Flash問題,在燒寫images時(shí),如何保留產(chǎn)線校準(zhǔn)數(shù)據(jù)

    和板卡信息丟失 2. PSoC Programmermer沒法擦除指定flash,都是整個(gè)128K擦除,例如在flash中分配一個(gè)row來存儲(chǔ)產(chǎn)線校準(zhǔn)數(shù)據(jù),如何保證在燒寫images后,保留產(chǎn)線校準(zhǔn)數(shù)據(jù)呢?謝謝
    發(fā)表于 05-30 07:50