最新色片一区二区,老鸭窝成年视频在线网,亚欧精品视频国产区更新在线

在過去的幾年中，神經(jīng)網(wǎng)絡(luò)的興起與應(yīng)用成功推動了模式識別和數(shù)據(jù)挖掘的研究。許多曾經(jīng)嚴(yán)重依賴于手工提取特征的機(jī)器學(xué)習(xí)任務(wù)（如目標(biāo)檢測、機(jī)器翻譯和語音識別），如今都已被各種端到端的深度學(xué)習(xí)范式（例如卷積神經(jīng)網(wǎng)絡(luò)（CNN）、長短期記憶（LSTM）和自動編碼器）徹底改變了。曾有學(xué)者將本次人工智能浪潮的興起歸因于三個條件，分別是：

·計算資源的快速發(fā)展（如GPU）

·大量訓(xùn)練數(shù)據(jù)的可用性

·深度學(xué)習(xí)從歐氏空間數(shù)據(jù)中提取潛在特征的有效性

盡管傳統(tǒng)的深度學(xué)習(xí)方法被應(yīng)用在提取歐氏空間數(shù)據(jù)的特征方面取得了巨大的成功，但許多實際應(yīng)用場景中的數(shù)據(jù)是從非歐式空間生成的，傳統(tǒng)的深度學(xué)習(xí)方法在處理非歐式空間數(shù)據(jù)上的表現(xiàn)卻仍難以使人滿意。例如，在電子商務(wù)中，一個基于圖（Graph）的學(xué)習(xí)系統(tǒng)能夠利用用戶和產(chǎn)品之間的交互來做出非常準(zhǔn)確的推薦，但圖的復(fù)雜性使得現(xiàn)有的深度學(xué)習(xí)算法在處理時面臨著巨大的挑戰(zhàn)。這是因為圖是不規(guī)則的，每個圖都有一個大小可變的無序節(jié)點，圖中的每個節(jié)點都有不同數(shù)量的相鄰節(jié)點，導(dǎo)致一些重要的操作（例如卷積）在圖像（Image）上很容易計算，但不再適合直接用于圖。此外，現(xiàn)有深度學(xué)習(xí)算法的一個核心假設(shè)是數(shù)據(jù)樣本之間彼此獨立。然而，對于圖來說，情況并非如此，圖中的每個數(shù)據(jù)樣本（節(jié)點）都會有邊與圖中其他實數(shù)據(jù)樣本（節(jié)點）相關(guān)，這些信息可用于捕獲實例之間的相互依賴關(guān)系。

近年來，人們對深度學(xué)習(xí)方法在圖上的擴(kuò)展越來越感興趣。在多方因素的成功推動下，研究人員借鑒了卷積網(wǎng)絡(luò)、循環(huán)網(wǎng)絡(luò)和深度自動編碼器的思想，定義和設(shè)計了用于處理圖數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，由此一個新的研究熱點——“圖神經(jīng)網(wǎng)絡(luò)（Graph Neural Networks，GNN）”應(yīng)運(yùn)而生

近期看了關(guān)于Transformer的信息

來簡述一下Transformer結(jié)構(gòu)

Transformer 整體結(jié)構(gòu)

首先介紹 Transformer 的整體結(jié)構(gòu)，下圖是 Transformer 用于中英文翻譯的整體結(jié)構(gòu)：

Transformer 的整體結(jié)構(gòu)，左圖Encoder和右圖Decoder

可以看到Transformer 由 Encoder 和 Decoder 兩個部分組成，Encoder 和 Decoder 都包含 6 個 block。Transformer 的工作流程大體如下：

第一步：獲取輸入句子的每一個單詞的表示向量X，X由單詞的 Embedding（Embedding就是從原始數(shù)據(jù)提取出來的Feature）和單詞位置的 Embedding 相加得到。

Transformer 的輸入表示

第二步：將得到的單詞表示向量矩陣 (如上圖所示，每一行是一個單詞的表示x) 傳入 Encoder 中，經(jīng)過 6 個 Encoder block 后可以得到句子所有單詞的編碼信息矩陣C，如下圖。單詞向量矩陣用Xn×d表示， n 是句子中單詞個數(shù)，d 是表示向量的維度 (論文中 d=512)。每一個 Encoder block 輸出的矩陣維度與輸入完全一致。

Transformer Encoder 編碼句子信息

第三步：將 Encoder 輸出的編碼信息矩陣C傳遞到 Decoder 中，Decoder 依次會根據(jù)當(dāng)前翻譯過的單詞 1~ i 翻譯下一個單詞 i+1，如下圖所示。在使用的過程中，翻譯到單詞 i+1 的時候需要通過Mask (掩蓋)操作遮蓋住 i+1 之后的單詞。

Transofrmer Decoder 預(yù)測

上圖 Decoder 接收了 Encoder 的編碼矩陣C，然后首先輸入一個翻譯開始符 ""，預(yù)測第一個單詞 "I"；然后輸入翻譯開始符 "" 和單詞 "I"，預(yù)測單詞 "have"，以此類推。這是 Transformer 使用時候的大致流程。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4838

瀏覽量
107859
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5599

瀏覽量
124420
Transformer

Transformer

+關(guān)注

關(guān)注
0

文章
156

瀏覽量
6939

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

深度學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分享：Transformer

評論