91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究機(jī)器學(xué)習(xí) (ML) 模型的性能

Tensorflowers ? 來源:TensorFlow ? 作者:Lora Aroyo 和 Pravee ? 2021-04-13 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí) (ML) 模型的性能既取決于學(xué)習(xí)算法,也取決于用于訓(xùn)練和評估的數(shù)據(jù)。算法的作用已經(jīng)得到充分研究,也是眾多挑戰(zhàn)(如 SQuAD、GLUE、ImageNet 等)的焦點(diǎn)。此外,數(shù)據(jù)也已經(jīng)過改進(jìn),包括一系列應(yīng)對 ML 評估問題的研討會。相比之下,專注于 - 用于評估 ML 模型的數(shù)據(jù)的研究和挑戰(zhàn)并不常見。

此外,許多評估數(shù)據(jù)集包含容易評估的項(xiàng)目,例如帶有易于識別的主題的照片,因此錯過了真實(shí)世界環(huán)境的自然歧義。評估中缺少模糊的真實(shí)世界樣本,削弱了可靠地測試機(jī)器學(xué)習(xí)性能的能力,這使 ML 模型容易形成“弱點(diǎn)”,即模型難以或無法準(zhǔn)確評估的樣本的類別,因?yàn)樵u估集中缺少這一類樣本。

SQuAD

https://rajpurkar.github.io/SQuAD-explorer/

GLUE

https://gluebenchmark.com/leaderboard

ImageNet

https://kobiso.github.io/Computer-Vision-Leaderboard/imagenet

為了解決識別 ML 模型中這些弱點(diǎn)的問題,我們最近在 HCOMP 2020 上發(fā)起了眾包機(jī)器學(xué)習(xí)不良測試集 (CATS4ML) 數(shù)據(jù)挑戰(zhàn)賽(面向全球研究人員和開發(fā)者開放至 2021 年 4 月 30 日)。挑戰(zhàn)的目標(biāo)是提高 ML 評估集的標(biāo)準(zhǔn),并盡可能多地找到使算法處理起來會有困惑或其他問題的樣本。CATS4ML 依靠人們的能力和直覺來發(fā)現(xiàn)機(jī)器學(xué)習(xí)具有信心但實(shí)際上卻分類錯誤的新數(shù)據(jù)樣本。

眾包機(jī)器學(xué)習(xí)不良測試集

https://cats4ml.humancomputation.com/

什么是 ML 的“弱點(diǎn)”?

弱點(diǎn)有兩類:已知的未知(Known Unknowns)未知的未知(Unknown Unknowns)。已知的未知是指模型對正確分類沒有把握的樣本。研究界在被稱為主動學(xué)習(xí)的領(lǐng)域研究這一問題,并發(fā)現(xiàn)了解決方法,用很籠統(tǒng)的話來說就是,在不確定的樣本上向人們交互式地征集新的標(biāo)簽。例如,如果模型不確定一張照片的主題是否是貓,會要求人員進(jìn)行驗(yàn)證;但如果系統(tǒng)確定,則不會要求人員驗(yàn)證。雖然這方面還有改進(jìn)的空間,但令人欣慰的是,模型的置信度與其性能相關(guān),也就是說,人們可以看到模型不知道的東西。

主動學(xué)習(xí)

http://digital.library.wisc.edu/1793/60660

另一方面,未知的未知是指模型對其答案充滿信心,但實(shí)際上是錯誤的樣本。主動發(fā)現(xiàn)未知的未知的研究(例如,Attenberg 2015 和 Crawford 2019)已經(jīng)幫助發(fā)現(xiàn)了大量的非預(yù)期機(jī)器行為。與這類發(fā)現(xiàn)未知的未知方法相比,生成對抗網(wǎng)絡(luò) (GAN) 以計(jì)算機(jī)光學(xué)錯覺的形式為圖像識別模型生成未知的未知,導(dǎo)致深度學(xué)習(xí)模型犯下人類無法感知的錯誤。雖然 GAN 在有意操縱的情況下會發(fā)現(xiàn)模型漏洞,但真實(shí)世界樣本可以更好地突出模型在日常性能中的失敗。這些真實(shí)世界樣本是 CATS4ML 感興趣的未知的未知 - 挑戰(zhàn)的目的是收集人類可以可靠地解釋但許多 ML 模型會自信地不同意的未經(jīng)操作的樣本。

Attenberg 2015

https://dl.acm.org/doi/10.1145/2700832

Crawford 2019

https://excavating.ai

示例說明由對抗噪聲引起的計(jì)算機(jī)視覺錯覺如何幫助發(fā)現(xiàn) ML 模型的機(jī)器操作未知的未知(基于 Brown 2018)

Brown 2018

https://ai.googleblog.com/2018/09/introducing-unrestricted-adversarial.html

CATS4ML 數(shù)據(jù)挑戰(zhàn)賽第一版:

Open Images 數(shù)據(jù)集

CATS4ML 數(shù)據(jù)挑戰(zhàn)賽側(cè)重于視覺識別,使用Open Images 數(shù)據(jù)集的圖像和標(biāo)簽。挑戰(zhàn)賽的目標(biāo)圖像選自 Open Images 數(shù)據(jù)集,以及來自同一數(shù)據(jù)集的一組 24 個目標(biāo)標(biāo)簽。挑戰(zhàn)賽的參與者被邀請發(fā)明新的創(chuàng)造性方法探索這個現(xiàn)有的公開可用數(shù)據(jù)集,并以預(yù)先選擇的目標(biāo)標(biāo)簽列表為中心,為 ML 模型發(fā)現(xiàn)未知的未知樣本。

CATS4ML 數(shù)據(jù)挑戰(zhàn)賽

https://cats4ml.humancomputation.com/

CATS4ML 是對 FAIR 最近推出的 DynaBench 動態(tài)數(shù)據(jù)收集研究平臺的補(bǔ)充。DynaBench 使用 ML 模型在人類參與下解決靜態(tài)基準(zhǔn)問題,而 CATS4ML 則專注于通過鼓勵探索現(xiàn)有 ML 基準(zhǔn)有無可能屬于未知的未知不利樣本改善 ML 評估數(shù)據(jù)集。結(jié)果將有助于檢測和避免未來的錯誤,也將對模型的可解釋性提供見解。

FAIR

https://ai.facebook.com/tools/dynabench/

DynaBench

https://dynabench.org/

CATS4ML 旨在由此通過提供數(shù)據(jù)集資源來提高人們對這個問題的認(rèn)識,開發(fā)者可以利用這些資源發(fā)現(xiàn)算法弱點(diǎn)。這也將讓研究人員了解如何為機(jī)器學(xué)習(xí)創(chuàng)建更平衡、更多樣化、更具有社會意識的基準(zhǔn)數(shù)據(jù)集。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94801
  • GLUE
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    7569
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136981

原文標(biāo)題:探索機(jī)器學(xué)習(xí)中的未解之謎

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?499次閱讀

    強(qiáng)化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機(jī)器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會把每一步的“正確答案”都告訴
    的頭像 發(fā)表于 01-31 09:34 ?653次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛<b class='flag-5'>模型</b><b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?204次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機(jī)器學(xué)習(xí)模型部署到量產(chǎn)ECU

    AI在汽車行業(yè)的應(yīng)用日益深化,如何將機(jī)器學(xué)習(xí)領(lǐng)域的先進(jìn)模型(如虛擬傳感器)集成到ECU軟件中,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?6122次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>部署到量產(chǎn)ECU

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    如果你關(guān)注最新進(jìn)展,可能已經(jīng)知道 Nordic Semiconductor 收購了 Neuton.AI。 Neuton 是一家邊緣 AI 公司,致力于使機(jī)器學(xué)習(xí)模型更易于訪問。它創(chuàng)建的模型
    發(fā)表于 08-31 20:54

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2903次閱讀

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個關(guān)鍵挑戰(zhàn):機(jī)器人需要大量的訓(xùn)練
    的頭像 發(fā)表于 07-14 11:49 ?1098次閱讀
    通過NVIDIA Cosmos<b class='flag-5'>模型</b>增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    邊緣計(jì)算中的機(jī)器學(xué)習(xí):基于 Linux 系統(tǒng)的實(shí)時(shí)推理模型部署與工業(yè)集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機(jī)器學(xué)習(xí)模型(神經(jīng)網(wǎng)絡(luò))部署到邊緣設(shè)備上,利用從ModbusTCP寄存器獲取的實(shí)時(shí)數(shù)據(jù)來預(yù)測一臺復(fù)古音頻放大器的當(dāng)前健康狀況。你將
    的頭像 發(fā)表于 06-11 17:22 ?1007次閱讀
    邊緣計(jì)算中的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>:基于 Linux 系統(tǒng)的實(shí)時(shí)推理<b class='flag-5'>模型</b>部署與工業(yè)集成!

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能
    的頭像 發(fā)表于 06-04 17:15 ?2003次閱讀
    數(shù)據(jù)標(biāo)注與大<b class='flag-5'>模型</b>的雙向賦能:效率與<b class='flag-5'>性能</b>的躍升

    NanoEdge AI Studio 面向STM32開發(fā)人員機(jī)器學(xué)習(xí)ML)技術(shù)

    NanoEdge? AI Studio*(NanoEdgeAIStudio)是一種新型機(jī)器學(xué)習(xí)ML)技術(shù),可以讓終端用戶輕松享有真正的創(chuàng)新成果。只需幾步,開發(fā)人員便可基于最少量的數(shù)據(jù)為其項(xiàng)目創(chuàng)建
    的頭像 發(fā)表于 04-22 11:09 ?1351次閱讀
    NanoEdge AI Studio 面向STM32開發(fā)人員<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>(<b class='flag-5'>ML</b>)技術(shù)

    國產(chǎn)地物光譜儀在“高光譜-機(jī)器學(xué)習(xí)模型構(gòu)建中的表現(xiàn)

    在遙感應(yīng)用和環(huán)境監(jiān)測日益精細(xì)化的今天,“高光譜 + 機(jī)器學(xué)習(xí)”的組合已成為地物識別、礦產(chǎn)探測、農(nóng)業(yè)監(jiān)測等領(lǐng)域的重要技術(shù)手段。而作為獲取高光譜數(shù)據(jù)的前端工具,地物光譜儀的性能直接影響到后續(xù)模型
    的頭像 發(fā)表于 04-18 16:15 ?748次閱讀
    國產(chǎn)地物光譜儀在“高光譜-<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>”<b class='flag-5'>模型</b>構(gòu)建中的表現(xiàn)

    AI和ML如何重塑電子制造業(yè)

    隨著工業(yè)4.0的到來,人工智能(AI)和機(jī)器學(xué)習(xí)ML)不僅僅是流行詞,它們正在重塑制造業(yè)。這場科技的浪潮,特別在電子制造領(lǐng)域,帶來了令人驚嘆的突破和機(jī)遇。在以數(shù)據(jù)驅(qū)動決策,以人為本理念的推動下,先進(jìn)的制造技術(shù)使電子制造業(yè)正變得
    的頭像 發(fā)表于 04-17 14:49 ?1059次閱讀

    十大鮮為人知卻功能強(qiáng)大的機(jī)器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機(jī)器學(xué)習(xí)時(shí),線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強(qiáng)大的算法,它們能夠以驚人的效率
    的頭像 發(fā)表于 04-02 14:10 ?1098次閱讀
    十大鮮為人知卻功能強(qiáng)大的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>

    Raspberry Pi Pico 2 上實(shí)現(xiàn):實(shí)時(shí)機(jī)器學(xué)習(xí)ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應(yīng)用于麥克風(fēng)輸入。機(jī)器學(xué)習(xí)ML)技術(shù)徹底改變了許多軟件應(yīng)用
    的頭像 發(fā)表于 03-25 09:46 ?1229次閱讀
    Raspberry Pi Pico 2 上實(shí)現(xiàn):實(shí)時(shí)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>(<b class='flag-5'>ML</b>)音頻噪音抑制功能