91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CapsNet再升級!堆棧式膠囊自編碼器面世

深度學習自然語言處理 ? 來源:YXQ ? 2019-06-24 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017 年,Geoffrey Hinton 在論文《Dynamic Routing Between Capsules》中提出 CapsNet 引起了極大的關注,同時也提供了一個全新的研究的方向。今日,CapsNet 的作者 Sara Sabour、Hinton 老爺子聯(lián)合牛津大學的研究者提出了膠囊網(wǎng)絡的改進版本——堆棧式膠囊自編碼器。這種膠囊自編碼器可以無監(jiān)督地學習圖像中的特征,并在無監(jiān)督分類任務取得最佳或接近最佳的表現(xiàn)。這也是膠囊網(wǎng)絡第一次在無監(jiān)督領域取得新的突破。

綜述

一個目標可以被看做是一組相互關聯(lián)的部件按照幾何學形式組合的結果。利用這種幾何關系去重建目標的系統(tǒng)應當對視點的變化具有魯棒性,因為其本質的幾何關系不應隨著觀察視角的變化而發(fā)生改變。

本文中,研究人員描述了一種無監(jiān)督的膠囊網(wǎng)絡。其中,觀察組成目標所有部件的神經(jīng)編碼器被用來推斷目標膠囊的存在和姿態(tài)。編碼器通過解碼器的反向傳播方法訓練。

訓練中,解碼器使用姿態(tài)預測來預測每個已發(fā)現(xiàn)部件的姿態(tài)。這些部件是直接從圖像中被發(fā)現(xiàn)的,同樣也是使用神經(jīng)編碼器,該編碼器推斷這些部件及它們的仿射變換。

而對應的解碼器將每個圖像像素建模為由仿射變換部件做出的預測混合。研究人員從目標和目標部件的膠囊中學習無標簽數(shù)據(jù),然后將這些目標膠囊的存在向量進行聚類。

得知這些聚類的名稱時,研究人員在 SVHN 和 MNIST 數(shù)據(jù)集上獲得了當前最佳的無監(jiān)督分類結果,準確率分別為 55% 和 98.5%。

本文提出了堆棧式膠囊自編碼器(SCAE),該編碼器包含兩個階段。在第一階段,部件膠囊自編碼器(PCAE)將圖像分割為組成部分,推斷其姿態(tài),并將每個圖像像素重建為變換組件模板的像素混合。

在第二階段,目標膠囊自編碼器(OCAE)嘗試將發(fā)現(xiàn)的部件及其姿態(tài)安排在一個更小的目標集合中。這個目標集合對每個部件進行預測,從而解釋每個部件的姿態(tài)。通過將它們的姿態(tài)——目標-觀察者關系(OV)和相關的目標-部件關系(OP)相乘,每個目標膠囊都會貢獻這些混合的一部分。

堆棧式膠囊自編碼器的工作原理

堆棧式膠囊自編碼器在使用未標注數(shù)據(jù)訓練時捕捉所有目標和它們部件之間的空間關系。目標膠囊存在概率的向量傾向于組成緊密的聚類。

當給每個聚類一個分類時,其可以在無監(jiān)督分類任務上達到當前最佳效果,如 SVHN 數(shù)據(jù)集上的 55% 和 MNIST 數(shù)據(jù)集上的 98.5%。以上結果還可以分別提升到 67% 和 99%,而且只需學習不到 300 個參數(shù)。

模型架構

堆棧式膠囊自編碼器的結構

堆棧式膠囊自編碼器的兩個組成部分為:部件膠囊自編碼器(PCAE)和目標膠囊自編碼器(OCAE)。在下文中,論文首先介紹了集群自編碼器(CCAE),通過一系列數(shù)學公式說明自編碼器如何分解圖像中的部件的過程,然后由此引出堆棧式膠囊自編碼器的兩個組成部分。

集群自編碼器

圖 2:使用集群自編碼器對不同形狀的點進行聚類的示意圖。

論文首先介紹了集群自編碼器,通過這種結構的數(shù)學原理,引出堆棧式膠囊自編碼器的結構。令 {x_m | m = 1, . . . , M } 為一組二維的輸入點,每個點屬于一個集群(見圖2)。首先使用Set Transformer將所有的輸入點(相當于部件膠囊)編碼進k個目標膠囊中,Set Transformer是一種基于注意力機制的、有置換不變性的編碼器h^cap (Lee et al., 2019) 。

一個目標膠囊 k 包括一個膠囊特征向量 c_k(其存在概率 a_k ∈ [0, 1])和一個 3 × 3 的目標-觀察者(OV)關系矩陣。關系矩陣代表著目標(集群)和觀察者之間關系的仿射變換。

需要注意的是,每個目標膠囊每次只能代表一個目標。每個目標膠囊都使用一個獨立的多層感知機 h_k^part 從膠囊特征向量 c_k 中預測 N ≤ M 個候選部件。

每個候選由條件概率 a_k,n ∈ [0, 1] (當其存在),一個關聯(lián)標量的標準差λ_k,n,以及一個 3 × 3 的目標-部件(OP)關系矩陣組成。這些代表著目標膠囊和候選部件的仿射變換。

候選預測 μ_k,n 根據(jù)目標膠囊 OV 和候選 OP 矩陣相乘得來。然后,研究人員將每個輸入部件建模為高斯混合模型,其中μ_k,n 和 λ_k,n 是各向同性組件的中心和標準差。其標準公式如下:

集群膠囊編碼器的公式。論文通過舉出集群膠囊編碼器的例子,用于說明目標膠囊編碼器和它的區(qū)別。

部件膠囊自編碼器

如果要將圖像分解為組成部件的集合關系,就需要首先推斷圖像是由哪些部件組成的,同時也需要了解觀察者和這些部件之間的關系(稱之為他們的姿態(tài))。

在本研究中,每個部件膠囊都有六個維度的自由姿態(tài),一個存在變量,和一個獨特的特征。研究人員把部件發(fā)現(xiàn)問題視為自編碼:編碼器學習去推斷不同部件膠囊的姿態(tài)和存在,而解碼器學習每個部件的圖像模板。

模板對應的部件是使用其姿態(tài)的仿射變換,而這些變換過的模板的像素點被用來為每個圖像像素創(chuàng)建單獨的混合模型。在部件膠囊自編碼器后是目標膠囊自編碼器。

令 y ∈ [0, 1]^h×w×c 為圖像。研究人員將部件膠囊的數(shù)量限定在 M 之內。對于每個部件膠囊,他們使用一個編碼器去推斷姿態(tài) x_m ∈ R^6,存在概率 d_m ∈ [0, 1],以及特殊特征 z_m ∈ R^c_z。

雖然后者不會直接參與圖像重建,但是會將對應部件的特殊信息提供給目標膠囊自編碼器。他們會通過目標膠囊自編碼器使用反向傳播微分的方式訓練。

當前條件下,不允許圖像中同一種類型的部件多次出現(xiàn),從而導致部件膠囊不會在空間中被復制(盡管它們可能會)。然而,確實需要分辨出所有出現(xiàn)在圖像中的部件,因此編碼器會采用帶有從下到上(bottom-up)注意力機制的卷積神經(jīng)網(wǎng)絡。

對于每個膠囊 k,其預測一個特征矩陣 e^k,特征矩陣是 6(姿態(tài))+1(存在)+c_z(特殊特征)的膠囊參數(shù),其空間維度是 h_e × w_e,以及一個單通道注意力層 a_k。

最終,該膠囊的參數(shù)計算公式是。softmax 是對空間維度上的計算。這種計算有點類似于全局平均池化,但是允許一些空間點比其他點對最終結果的權重影響更大。研究人員將其稱為注意力池化(attention-based pooling)。

圖像的像素點被建模為獨立的高斯混合模型。對于每個像素點,研究人員采用其對應的變換模板,并將其視為有著恒定方差的各向同性高斯組件的中心點。其混合概率對部件膠囊的存在概率和在該位置的色值函數(shù)(c 指的是圖像的通道數(shù))都是成比例的。

部件膠囊自編碼器的公式推導過程

目標膠囊自編碼器(OCAE)

下一步是從已經(jīng)發(fā)現(xiàn)的部件中尋找目標。因此,需要使用相連的姿態(tài) x_m,特殊特征 z_m,以及平滑化的模板 T_m(通過將部件膠囊的特征進行轉化)。這些將會成為目標膠囊自編碼器的輸入,這里和集群自編碼器有一些不同。

首先,研究人員將部件膠囊的存在概率 d_m 輸入目標膠囊自編碼器——由于平衡注意力機制,避免將缺失點考慮在內。

其次,d_m 同時用于衡量部件膠囊的對數(shù)似然 cf。另外,除了特殊特征外,不對其他目標膠囊自編碼器的輸入計算梯度,以便提升訓練的穩(wěn)定性,并避免隱變量崩潰。

最后,通過部件膠囊自編碼器發(fā)現(xiàn)的部件有著獨立的特征(模板和特殊特征)。因此,每個部件姿態(tài)都可以被解釋為是目標膠囊預測的獨立混合——即每個目標膠囊都做出 M 個候選預測 V_k,1:M,或者對每個部件做出一個候選預測。

最終,部件膠囊的似然公式是:

圖 3:從MNIST(左)和SVHN(中)和CIFAR 10(右)學習到的模板。

圖 4:展示了膠囊自編碼器對MNIST數(shù)據(jù)集的重建過程。a)MNIST圖像;b)紅色的部件膠囊和綠色的目標膠囊在重建中的組合;c)實際參與重建的被激活膠囊;d)根據(jù)圖像捕捉到的信息;e)部件的仿射變換,用于展示其重建圖像的過程。

模型性能評估

堆棧式膠囊自編碼器使用仿射變換,這樣可以使編碼器的輸入由一組較小的變換目標或部件解釋。

無監(jiān)督分類評價

研究人員在 MNIST、SVHN 和 CIFAR 10 數(shù)據(jù)集上進行了測試,并將目標膠囊的存在打上類別標簽。他們使用了多種評價方法。

在部件膠囊編碼器上,研究人員在 MNIST 數(shù)據(jù)集上使用了 24 個單通道,11 × 11 的模板,在 SVHN 和 CIFAR 10 上則分別使用了 32 個 3 通道,14 × 14 的模板。

對于后兩個數(shù)據(jù)集的圖像,研究人員進行了 Sobel 過濾,作為重建的目標。對于目標膠囊編碼器,研究則分別使用了 24、32 和 64 個目標膠囊。

表 1:運行五次后取平均的無監(jiān)督分類結果和標準差。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3956

    瀏覽量

    142731
  • 無監(jiān)督學習

    關注

    1

    文章

    17

    瀏覽量

    2891

原文標題:Hinton老爺子CapsNet再升級,結合無監(jiān)督,接近當前最佳效果

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    磁性編碼器磁環(huán)的作用有哪些?

    磁性編碼器是一種利用磁場變化來檢測轉軸角度、轉速或位移的傳感裝置,其中磁環(huán)是關鍵的感應元件。磁環(huán)通過與磁敏傳感的配合,實現(xiàn)高精度、非接觸的信號采集。它不僅決定了編碼器的測量精度和穩(wěn)
    的頭像 發(fā)表于 01-14 16:01 ?225次閱讀
    磁性<b class='flag-5'>編碼器</b>磁環(huán)的作用有哪些?

    探索AEDR - 9930EL:三通道反射增量線性編碼器的卓越性能

    探索AEDR - 9930EL:三通道反射增量線性編碼器的卓越性能 在電子工程領域,編碼器是實現(xiàn)精確運動控制和位置檢測的關鍵組件。今天,我們將深入探討博通(Broadcom)的AEDR
    的頭像 發(fā)表于 12-30 15:40 ?302次閱讀

    探索Broadcom AEAT - 901B系列增量編碼器:特性、參數(shù)與應用

    探索Broadcom AEAT - 901B系列增量編碼器:特性、參數(shù)與應用 在電子工程師的日常設計工作中,編碼器猶如一雙雙“電子眼睛”,為設備的運動控制和位置檢測提供關鍵信息。今天,我們就來
    的頭像 發(fā)表于 12-30 14:05 ?347次閱讀

    探索AEAT - 901B系列增量編碼器:特性、應用與設計要點

    探索AEAT - 901B系列增量編碼器:特性、應用與設計要點 在電子工程師的日常設計工作中,編碼器是實現(xiàn)精確運動控制和角度檢測不可或缺的關鍵組件。今天,我們就來深入探討一下Broadcom
    的頭像 發(fā)表于 12-30 11:50 ?466次閱讀

    高精度絕對編碼器:工業(yè)自動化的“智慧之眼”

    在智能制造的浪潮中,高精度絕對編碼器猶如工業(yè)自動化的“智慧之眼”,以其精準、可靠、智能的特性,為高端裝備賦予了感知與定位的靈魂,成為推動產(chǎn)業(yè)升級的核心力量。 絕對定位,精準無虞 傳統(tǒng)增量
    的頭像 發(fā)表于 12-10 08:40 ?446次閱讀
    高精度絕對<b class='flag-5'>式</b><b class='flag-5'>編碼器</b>:工業(yè)自動化的“智慧之眼”

    相對編碼器:工業(yè)自動化領域的“性價比之王”

    在工業(yè)自動化浪潮席卷全球的今天,編碼器作為機械運動與數(shù)字信號的“翻譯官”,正扮演著愈發(fā)關鍵的角色。而在眾多編碼器類型中,相對編碼器憑借其獨特的優(yōu)勢,成為眾多工業(yè)場景中的“性價比之王”
    的頭像 發(fā)表于 11-24 08:52 ?325次閱讀
    相對<b class='flag-5'>式</b><b class='flag-5'>編碼器</b>:工業(yè)自動化領域的“性價比之王”

    雷恩PRECILEC重載編碼器:重載工況,精準穩(wěn)定#編碼器

    編碼器
    開地電子
    發(fā)布于 :2025年10月31日 16:18:04

    增量編碼器工作原理是什么?

    增量編碼器工作原理是什么?增量編碼器是一種通過輸出脈沖信號來反映旋轉位置變化的傳感,廣泛應用于電機測速、位置控制等領域。其工作原理可從
    的頭像 發(fā)表于 09-29 11:00 ?2183次閱讀
    增量<b class='flag-5'>式</b><b class='flag-5'>編碼器</b>工作原理是什么?

    絕對值編碼器與增量編碼器相比有哪些優(yōu)勢?

    絕對值編碼器與增量編碼器相比有哪些優(yōu)勢?核心功能:斷電后位置信息不丟失,絕對值編碼器:通過機械結構或電子存儲(如電池備份),能實時輸出當前位置的唯一絕對值
    的頭像 發(fā)表于 08-11 13:57 ?1672次閱讀
    絕對值<b class='flag-5'>編碼器</b>與增量<b class='flag-5'>式</b><b class='flag-5'>編碼器</b>相比有哪些優(yōu)勢?

    增量型編碼器與絕對值型編碼器怎么選擇?

    在選擇增量型編碼器與絕對值型編碼器時,需要考慮多個因素,包括應用需求、成本、精度、可靠性以及環(huán)境適應性等。以下是對兩種編碼器的詳細比較及選擇建議: 一、增量型編碼器 1. 優(yōu)點: ?
    的頭像 發(fā)表于 07-10 10:34 ?1408次閱讀

    Bourns 擴展增量編碼器產(chǎn)品線,旋轉壽命功能升級

    組件領導制造供貨商,宣布擴展其 PEC11J 增量編碼器產(chǎn)品系列,新增功能可提升裝置的旋轉壽命。設計人員現(xiàn)在可選擇每 360° 旋轉 24 脈沖的產(chǎn)品,并可選配無定位點選項。旋轉脈沖功能可滿足日益多樣化的客戶應用需求,而無定位點設計則提供更平順、連續(xù)的操作體驗,適用于需
    發(fā)表于 06-10 14:56 ?1610次閱讀
    Bourns 擴展增量<b class='flag-5'>式</b><b class='flag-5'>編碼器</b>產(chǎn)品線,旋轉壽命功能<b class='flag-5'>再</b><b class='flag-5'>升級</b>

    一文讀懂什么是磁性編碼器

    。 ? ? ? 一般來說,磁性編碼器可以分為兩類:絕對和增量。 ? ? ? 絕對磁性編碼器可以提供準確的絕對位置信息。它們通常由一個磁
    的頭像 發(fā)表于 04-27 17:18 ?1093次閱讀

    精準感應,盡在掌握 —— 電感編碼器

    在現(xiàn)代工業(yè)的精密控制領域中,每一個微小的動作和變化都可能決定產(chǎn)品的質量和生產(chǎn)的效率。而在這一片繁忙與精準的交織中,電感編碼器以其卓越的性能和穩(wěn)定性,成為了眾多工業(yè)設備中的核心部件。它不僅代表著技術
    的頭像 發(fā)表于 04-01 08:40 ?1707次閱讀

    編碼器與無軸承編碼器,到底如何選擇?

    在選擇軸編碼器與無軸承編碼器時,需要根據(jù)具體的應用場景、性能需求、環(huán)境條件和成本預算等因素進行綜合考慮。以下是對兩者的詳細對比,以幫助做出合適的選擇: 一、工作原理與結構 1. 軸編碼器
    的頭像 發(fā)表于 03-11 15:33 ?1341次閱讀
    軸<b class='flag-5'>編碼器</b>與無軸承<b class='flag-5'>編碼器</b>,到底如何選擇?

    伺服電機編碼器怎么選型

    伺服電機編碼器的選型是一個綜合性的過程,需要考慮多個因素以確保所選編碼器能夠滿足系統(tǒng)的性能要求。以下是一些關鍵的選型步驟和考慮因素: 一、明確應用需求 首先,需要明確伺服電機編碼器的應用需求,包括
    的頭像 發(fā)表于 03-11 12:01 ?2072次閱讀
    伺服電機<b class='flag-5'>編碼器</b>怎么選型