91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ICLR 2018和ICRA 2018兩個(gè)會(huì)議進(jìn)行比較

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者Alex Irpan是Google Brain機(jī)器人團(tuán)隊(duì)的軟件工程師,他在不到一個(gè)月的時(shí)間里參加了兩個(gè)學(xué)術(shù)會(huì)議:ICLR 2018和ICRA 2018,前者是一個(gè)深度學(xué)習(xí)會(huì)議,后者是機(jī)器人領(lǐng)域的會(huì)議。作者將這兩個(gè)會(huì)議進(jìn)行了比較。

ICLR 2018

從研究的角度來看,今年ICLR的一大重點(diǎn)是對(duì)抗性學(xué)習(xí)。

深度學(xué)習(xí)領(lǐng)域中最受歡迎的是生成對(duì)抗網(wǎng)絡(luò)。不過,我在這里關(guān)注的更廣,包括對(duì)抗樣本和智能體競(jìng)爭(zhēng)的環(huán)境。實(shí)際上,任何形式的極小極大優(yōu)化問題都可以算作對(duì)抗性學(xué)習(xí)。

我不知道GAN是否真的很受歡迎,或者我的記憶帶有選擇性的偏見,因?yàn)槲覍?duì)這些方法很感興趣。GAN給人的感覺很強(qiáng)大。評(píng)估GAN的一種方法是,你通過使用學(xué)習(xí)隱式成本而不是人為定義的成本來學(xué)習(xí)生成器。這使你能夠適應(yīng)生成器的能力,并可以定義手動(dòng)解釋可能很麻煩的成本。

當(dāng)然,這會(huì)讓你的問題更加復(fù)雜。但是如果你有足夠強(qiáng)的優(yōu)化和建模能力,那么隱式學(xué)習(xí)的成本將比其他方法能提供更清晰的圖像。使用學(xué)習(xí)的組件替換一部分系統(tǒng)的一個(gè)好處是,優(yōu)化和建模能力的進(jìn)步適用于問題的更多方面。你正在提高學(xué)習(xí)成本函數(shù)的能力和最小化這些學(xué)習(xí)成本的能力。

從抽象點(diǎn)的觀點(diǎn)來看,這涉及到具有表現(xiàn)力的、可優(yōu)化的函數(shù)家族的能力,例如神經(jīng)網(wǎng)絡(luò)。Minimax優(yōu)化不是一個(gè)新的想法。它已經(jīng)存在很久了。新的東西是,深度學(xué)習(xí)可以讓你在高維數(shù)據(jù)上建模和學(xué)習(xí)復(fù)雜的成本函數(shù)。對(duì)我來說,GAN的有趣之處不是圖像生成,而是它們?cè)趶?fù)雜的數(shù)據(jù)(比如圖像)上的概念證明。這個(gè)框架并不要求使用圖像數(shù)據(jù)。

學(xué)習(xí)過程中還有其他部分可以用學(xué)習(xí)方法來替代,而不是用人為定義的方法,深度學(xué)習(xí)就是這樣一種方法。這樣做有意義嗎?也許有。問題是,你用深度學(xué)習(xí)方法越多,就越難讓每件事情都可以學(xué)習(xí)(learnable)。

最近Quanta Magazine上有一篇文章,Judea Pearl在上面表達(dá)了他的失望:深度學(xué)習(xí)只是學(xué)習(xí)相關(guān)性和曲線擬合,而這并不涵蓋所有的智能。我同意Judea Pearl的觀點(diǎn),但作為深度學(xué)習(xí)的擁護(hù)者,我認(rèn)為如果你把一個(gè)足夠大的神經(jīng)網(wǎng)絡(luò)足夠好地進(jìn)行優(yōu)化,你可能會(huì)學(xué)到一些看起來很像因果推理的東西,或者其他可以算作智能的東西。但這就接近哲學(xué)的領(lǐng)域了,所以我就講到這里。

從與會(huì)者的角度來看,我喜歡這次會(huì)議有很多海報(bào)展示。這是我第一次參加ICLR。我之前參加過的ML會(huì)議是NIPS,NIPS給我的感覺是非常大。在NIPS上仔細(xì)閱讀每一張海報(bào)感覺不太可行。在ICLR閱讀完所有海報(bào)是可能的,盡管你不一定真想這樣做。

我也很欣賞ICLR上企業(yè)招聘不像NIPS那樣荒謬。在NIPS,有些公司會(huì)送奇怪的指尖陀螺和彈簧玩具.......在ICLR,我得到的最奇怪的東西是一雙襪子,雖然奇怪,但也不是特別奇怪。

ICRA 2018

ICRA 2018是我參加的第一個(gè)機(jī)器人會(huì)議。我不知道該期待什么。我一開始做的是ML研究,后來轉(zhuǎn)去研究機(jī)器人,所以我的興趣更接近于學(xué)習(xí)控制,而不是制造新的機(jī)器人。我的理想設(shè)定是,我可以將真實(shí)世界的硬件視為抽象的。

再加上我對(duì)控制理論的貧乏理解,我對(duì)會(huì)議上的許多話題都不熟悉。盡管如此,還是有很多學(xué)習(xí)領(lǐng)域的論文,很高興我去參加了這個(gè)會(huì)。

在我確實(shí)了解的研究中,我很驚訝有這么多的強(qiáng)化學(xué)習(xí)論文。看到它們中幾乎沒有人使用純粹的無模型的RL,有點(diǎn)有趣。對(duì)于ICRA,如果你的論文提出的模型在真實(shí)世界的機(jī)器人上運(yùn)行過,那么你被接受的可能性會(huì)大得多。這就迫使作者關(guān)注數(shù)據(jù)效率,因此對(duì)只做無模型的RL有極大的偏見。當(dāng)我四處聽演講時(shí),我不斷地聽到“我們將無模型強(qiáng)化學(xué)習(xí)與X結(jié)合在一起”,其中X是基于模型的RL,或者從人類的演示中學(xué)習(xí),或者從運(yùn)動(dòng)規(guī)劃中學(xué)習(xí),或者從任何可以幫助探索問題的東西中學(xué)習(xí)。

從更廣泛的層面看,這次會(huì)議是有實(shí)用性的。它雖然是一個(gè)研究會(huì)議,很多內(nèi)容仍然是很推測(cè)性的,但它也覺得人們可以接受狹窄的、有針對(duì)性的解決方案。我認(rèn)為這是不得不使用真正的硬件造成的另一個(gè)后果。如果需要實(shí)時(shí)運(yùn)行模型,就不能忽略推理時(shí)間。如果需要從真正的機(jī)器人那里收集數(shù)據(jù),就不能忽略數(shù)據(jù)效率。真正的硬件并不關(guān)心你的問題是什么。

(1)網(wǎng)絡(luò)必須能夠運(yùn)行。

(2)無論您做何努力,賦于其何種優(yōu)先級(jí),都無法提高光的速度。

——RFC 1925

這讓和我交談過的許多ML研究人員感到驚訝,但這個(gè)機(jī)器人技術(shù)的會(huì)議并沒有像NIPS / ICLR / ICML的人那樣完全接受ML,部分原因是ML并不總是有效的。機(jī)器學(xué)習(xí)是一個(gè)解決方案,但它不能保證有意義。我的印象是,ICRA中只有少數(shù)人積極地希望ML失敗。只要ML能證明有用,其他人都很樂意使用ML。在某些領(lǐng)域,它已經(jīng)證明了自己。我看到的每一篇跟感知相關(guān)的論文都以這樣或那樣的方式使用CNN。但是很少有人用深度學(xué)習(xí)來進(jìn)行控制,因?yàn)榭刂剖怯泻芏嗖淮_定因素的。

像ICLR一樣, ICRA上也有很多公司舉行招聘或擺設(shè)攤位。跟ICLR不同的是,這里的攤位顯得更有趣。大多數(shù)公司都帶了機(jī)器人來演示,這當(dāng)然比聽招聘演說更有趣。

在去年的NIPS上,我注意到ML公司的展位讓我想起了Berkeley的職業(yè)招聘會(huì)。每一家科技公司都想招到Berkeley的應(yīng)屆畢業(yè)生。這就像一場(chǎng)軍備競(jìng)賽,看誰能提供最好的東西和最好的免費(fèi)食物。感覺他們的目標(biāo)是盡可能地讓自己看起來是最酷的公司,而不告訴你他們真正想雇傭你來做什么。機(jī)器人技術(shù)還沒有走得很遠(yuǎn)。它在增長(zhǎng),但沒有太多的宣傳。

我參加了幾個(gè)workshop,在那里人們談?wù)撍麄內(nèi)绾卧诂F(xiàn)實(shí)世界中使用機(jī)器人,都很有趣。研究性會(huì)議傾向于集中討論研究和網(wǎng)絡(luò),這使得人們很容易忘記研究可以有明確的、直接的經(jīng)濟(jì)價(jià)值。有一個(gè)農(nóng)業(yè)機(jī)器人相關(guān)的,談到使用計(jì)算機(jī)視覺來檢測(cè)雜草以及噴灑除草劑,這聽起來是好事。使用更少除草劑,殺死更少作物,同時(shí)減緩除草劑抗性的發(fā)生。

Rodney Brooks也有一個(gè)類似的精彩演講,他以Roomba為例,談到了將機(jī)器人技術(shù)轉(zhuǎn)化為消費(fèi)產(chǎn)品所需的東西。他說,在設(shè)計(jì)Roomba時(shí),他們先定了一個(gè)價(jià)格,然后將所有的功能控制在這個(gè)價(jià)格里面。結(jié)果是,幾百美元的價(jià)格讓你在傳感器和硬件的選擇上只有很小的余地,這就使得在設(shè)備上進(jìn)行推斷的能力有嚴(yán)格的限制。

組織方面,做得很好。會(huì)議中心緊鄰印刷店,所以在注冊(cè)時(shí),組織者說,如果你在特定期限內(nèi)用電子郵件發(fā)送PDF文件,他們會(huì)處理剩下的所有流程。你所要做的就是在網(wǎng)上為你的海報(bào)付錢,然后在會(huì)議上拿出來。所有的演示都是在演示室中進(jìn)行的,每個(gè)演示室都配有白板和一個(gè)架子,你可以在上面放置筆記本電腦來播放視頻。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:谷歌大腦工程師給2018學(xué)術(shù)頂會(huì)劃重點(diǎn):對(duì)抗性學(xué)習(xí)+強(qiáng)化學(xué)習(xí)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FreeRTOS_SMP_Example_S32K358_2xCores示例配置并實(shí)現(xiàn)了一個(gè)SMP項(xiàng)目,兩個(gè)核心的中斷頻率比較高時(shí)報(bào)故障,怎么解決?

    我參考FreeRTOS_SMP_Example_S32K358_2xCores示例配置并實(shí)現(xiàn)了一個(gè) SMP 項(xiàng)目。RTD6.0.0但是,當(dāng)我的兩個(gè)核心的中斷頻率比較高時(shí),會(huì)出現(xiàn)種故障
    發(fā)表于 03-30 08:23

    圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI

    labview中,圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI
    發(fā)表于 03-16 14:03

    西井科技攜手同濟(jì)大學(xué) 三篇AI研究成果入選頂會(huì)ICLR 2026

    近日,國際頂級(jí)人工智能會(huì)議?ICLR 2026(International Conference on Learning Representations,國際表征學(xué)習(xí)大會(huì))公布論文接收結(jié)果。西井
    的頭像 發(fā)表于 02-12 17:42 ?1w次閱讀
    西井科技攜手同濟(jì)大學(xué) 三篇AI研究成果入選頂會(huì)<b class='flag-5'>ICLR</b> 2026

    兩個(gè)RS485-Modbus主站如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個(gè)主站之間的互相讀通信難題。
    發(fā)表于 02-08 15:32 ?0次下載

    曙光存儲(chǔ)連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近期,曙光存儲(chǔ)連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng),自研技術(shù)產(chǎn)品在國產(chǎn)突破、AI行業(yè)應(yīng)用等方面的成果獲得廣泛關(guān)注。
    的頭像 發(fā)表于 01-15 16:28 ?2641次閱讀

    Labview 2018反復(fù)下載DAQ18.6報(bào)錯(cuò)

    本人用的labview2018,下載過DAQ18.6,但DAQ被刪過,我重新下載過,后面能正常下載但運(yùn)行程序會(huì)報(bào)錯(cuò)“可能原因 NI-DAQmx檢測(cè)到損壞的安裝。請(qǐng)重新安裝NI-DAQmx。如仍顯示
    發(fā)表于 11-22 13:26

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash?

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash,有一個(gè)norflash被模擬成U盤,會(huì)在中斷中操作spi。
    發(fā)表于 09-26 06:18

    基本半導(dǎo)體連獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近日,基本半導(dǎo)體憑借在碳化硅模塊領(lǐng)域的突出表現(xiàn),連獲“國產(chǎn)SiC模塊TOP企業(yè)獎(jiǎng)”和“年度優(yōu)秀功率器件產(chǎn)品獎(jiǎng)”兩個(gè)行業(yè)獎(jiǎng)項(xiàng)。
    的頭像 發(fā)表于 09-05 16:31 ?1165次閱讀

    請(qǐng)問一個(gè)藍(lán)牙芯片可以同時(shí)傳輸兩個(gè)不同的數(shù)據(jù)嗎?

    現(xiàn)在有兩個(gè)不同的數(shù)據(jù),想用一個(gè)藍(lán)牙芯片進(jìn)行傳輸,可以做到嗎?求解
    發(fā)表于 07-07 06:28

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來檢測(cè)這個(gè)干簧管通斷呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來檢測(cè)這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-17 06:30

    看到STM8L152用兩個(gè)IO用兩個(gè)或非門檢測(cè)兩個(gè)通斷,是什么原理呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來檢測(cè)這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-12 06:25

    NVIDIA在ICRA 2025展示多項(xiàng)最新研究成果

    在亞特蘭大舉行的國際機(jī)器人與自動(dòng)化大會(huì) (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項(xiàng)研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?1499次閱讀

    ADAU1787四個(gè)ADC、兩個(gè)DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊(cè)

    ADAU1787 是一款具有四個(gè)輸入和兩個(gè)輸出的編解碼器,其中整合了兩個(gè)數(shù)字信號(hào)處理器 (DSP)。從模擬輸入到 DSP 內(nèi)核再到模擬輸出的路徑已針對(duì)低延遲進(jìn)行優(yōu)化,適用于噪聲消除耳機(jī)
    的頭像 發(fā)表于 05-12 14:57 ?1622次閱讀
    ADAU1787四<b class='flag-5'>個(gè)</b>ADC、<b class='flag-5'>兩個(gè)</b>DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊(cè)

    TLV6710 采用集成基準(zhǔn)的低功耗高電壓窗口比較器技術(shù)手冊(cè)

    TLV6710 是一款高電壓窗口比較器,工作電壓范圍為 1.8V 至 36V。此器件具有兩個(gè)內(nèi)部基準(zhǔn)電壓為 400mV 的高精度比較器和兩個(gè)額定電壓為 25V 的開漏輸出TLV6710
    的頭像 發(fā)表于 04-18 09:54 ?1123次閱讀
    TLV6710 采用集成基準(zhǔn)的低功耗高電壓窗口<b class='flag-5'>比較</b>器技術(shù)手冊(cè)

    TLV6700 采用集成基準(zhǔn)的低功耗窗口比較器技術(shù)手冊(cè)

    TLV6700 是一個(gè)工作電壓范圍為 1.8V 至 18V 的高電壓窗口比較器。該器件擁有兩個(gè)內(nèi)部基準(zhǔn)電壓為 400mV 的高精度比較器和兩個(gè)
    的頭像 發(fā)表于 04-18 09:39 ?976次閱讀
    TLV6700 采用集成基準(zhǔn)的低功耗窗口<b class='flag-5'>比較</b>器技術(shù)手冊(cè)