91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習從社交媒體中為你發(fā)掘最美穿搭

nlfO_thejiangme ? 來源:lq ? 2019-10-01 16:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

穿衣搭配不僅反映個人的審美同時也與出席的場合、文化傳統(tǒng)息息相關。在一個時尚場景中,通常會包含三個要素:場合、個體和衣著。這些時尚信息和知識對于衣著推薦搭配等應用十分重要。而當今高度發(fā)展的社交媒體為時尚知識提供了豐富的資源,從朋友圈到微博從推特到Ins,人們在不同場合的穿搭圖像、文字和多媒體信息構(gòu)成了龐大的信息資源。

來自新加坡國立大學的研究人員們利用深度學習集成多種方法來從社交媒體中抽取時尚三要素,以實現(xiàn)時尚知識的自動化抽取和學習,同時還構(gòu)建了以用戶為中心時尚知識抽取數(shù)據(jù)集FashionKE。

時尚時尚最時尚

隨著生活水平的不斷提高,人們的時尚需求不斷增加,對于不同場合的衣著搭配也有著更為精細化的需求。面對這個萬億級的時尚市場,如何將機器學習與深度學習更有效的應用于時尚知識的學習、穿搭推薦甚至是知識級別的構(gòu)建是科技巨頭和研究人員們的研究熱點。

目前對于時尚知識級別的研究工作還比較有限,如何有效的穿衣搭配涉及到場景、主體和衣著三個關鍵因素。在日常生活有很多固定的經(jīng)驗和模式幫助人們進行有效的穿搭,但研究人員希望將這些模式總結(jié)成更為凝練的知識以指導不同的人在對應的場合進行最適宜的穿搭。在這一過程中,需要面對的第一個問題就是,從哪里去獲取這些知識呢?如何獲取這些知識呢?新加坡國立大學的研究人員給出了自己的答案。

他們將目光放到了各大社交媒體平臺,從中進行以用戶為中心的自動化時尚知識抽取,來幫助實現(xiàn)這一目標。為什么呢?社交媒體的龐大用戶規(guī)模保證了多模態(tài)數(shù)據(jù)的豐富和質(zhì)量,不僅包含了世界各地、各個場景中用戶的照片,同時也包含了包括性別在內(nèi)的個人屬性,而且還緊跟時尚潮流更新迅速。但有些利用這些數(shù)據(jù)還面臨著一系列挑戰(zhàn)。

首先時尚知識的抽取很大程度上決定于時尚概念和屬性抽取器的表現(xiàn),包括對于場景、衣著和飾品的識別檢測。雖然現(xiàn)在在學術界有很多研究成果,但大多集中于簡單干凈的背景上,而現(xiàn)實中面對的卻是豐富多樣的自然場景,使得屬性檢測變得十分困難。第一個需要解決的挑戰(zhàn)就是需要實現(xiàn)自然場景和背景的時尚概念和屬性檢測。

其次社交媒體雖然豐富,但基本上缺乏時尚概念的標注,但這對時尚知識的構(gòu)建十分重要。時尚知識自動獲取的質(zhì)量極大地依賴于語義級的時尚概念學習。手工標記如此龐大的數(shù)據(jù)是不現(xiàn)實的,而現(xiàn)存的電子商務數(shù)據(jù)主要集中于衣著屬性,缺乏人物和場景屬性的標注。 如何解決這兩個問題成為了實現(xiàn)知識抽取的關鍵。

時尚知識自動化抽取

為了解決這兩個問題,研究人員提出了一種基于弱標記數(shù)據(jù)的時尚概念聯(lián)合檢測方法。這種基于上下文的時尚概念學習模塊可以有效捕捉不同時尚概念間的聯(lián)系和相關性,通過場景、衣著分類和屬性來輔助時尚知識抽取。其中弱標記數(shù)據(jù)則有效應對了缺乏標記數(shù)據(jù)的困擾,在標記遷移矩陣幫助下,通過機器標記數(shù)據(jù)和干凈數(shù)據(jù)的結(jié)合可有效控制學習過程中的噪聲。

這一研究的目標在于從社交媒體中抽取用戶為中心的時尚知識數(shù)據(jù),得到場景對應穿著的結(jié)構(gòu)化數(shù)據(jù)為下游任務提供應用基礎。

研究人員將時尚知識定義為個體、衣著和場合三元組合K={P,C,O},其中個體包括了人的屬性:性別、年齡、身材;服裝則包括了衣著的屬性和分類,用于定義特定類型的服飾,例如:一條深藍色的露肩長裙;場景則包含了各種主體出席的場合、包括舞會、約會、會議、聚會等等及其相關的時間地點元數(shù)據(jù)。

研究人員的任務就是要從某個po出的社交媒體信息{V(圖像),T(文字),M(元數(shù)據(jù))}中抽取出上面的信息構(gòu)成時尚知識{P,C.Q}。這一任務自然包含了三個子任務:人體屬性檢測、衣著分類和屬性檢測、場景檢測。

人體檢測框架目前很成熟,所以研究人員致力于后兩個子任務的開發(fā),從社交媒體數(shù)據(jù)中聯(lián)合檢測出主體所處的場景和服裝分類屬性。

為了有效檢測場景及其主體的衣著分類屬性,研究人員設計了一套統(tǒng)一的框架來獲取其屬性及相關性。這套基于上下文時尚概念的學習模型包含了兩個雙邊回歸神經(jīng)網(wǎng)絡來捕捉場景、衣著間的聯(lián)系。

對于某篇包含圖像V和文字T社交媒體來說,這一模型首先將衣著檢測模型檢測圖像中一系列的服飾區(qū)域。隨后針對圖像預測出對應的場景標簽,針對每個服裝區(qū)域預測出對應的服裝類別和屬性標簽。為了有效的預測出這三者之間的相關性,研究人員利用基于上下文的方式來從中得到不同屬性間的關系以便抽取知識。為了有效抽取知識,需要對服裝分類、場景和服裝屬性的表示進行學習。

分類表達。模型的第一步是學習服裝區(qū)域的上下文表示用于分類預測和整幅圖像的場景預測。研究人員首先利用與訓練的CNN來抽取全圖和每個服裝區(qū)域的特征表示,隨后利用雙邊LSTM來編碼所有服裝區(qū)域間的相關性,并最終得到服裝區(qū)域的分類表達。

場景表達。為了更好的表達整幅圖像,研究人員將第一步中整幅圖像的CNN特征、上一步Bi-LSTM的最后隱含狀態(tài)及TextCNN抽取文字描述特征結(jié)合為新的特征,來實現(xiàn)場景表達學習;

屬性表達。最后,由于每種服裝有包括顏色、長短、外形等多個不同特征,所以需要屬性預測模塊來預測屬性。研究人員利用多分支的結(jié)構(gòu)來對不同種類的服飾進行屬性預測,每個分支輸出層的神經(jīng)元數(shù)量代表了對應的屬性數(shù)目。

隨后為了捕捉不同服飾屬性和服飾分類間的依賴關系,研究人員使用了第二個雙邊LSTM來編碼屬性和分類間的依賴關系,并最終通過全連接轉(zhuǎn)換為屬性表達。最終通過標準的分類器將得到場景、服裝分類和屬性的預測分數(shù)。

為了對這一模型進行訓練,研究人員構(gòu)建自己的數(shù)據(jù)集FashionKE,其中包含了80629張圖像,可以容易辨認出時尚知識的三要素。同時對每張圖片進行了場景標注(十種主要場景);而針對服裝屬性和分類標注,由于社交媒體數(shù)據(jù)過于龐大,對于每一個圖像和文字數(shù)據(jù)進行多種屬性的手工標注是不現(xiàn)實的。只有30%的數(shù)據(jù)進行了人工核對,其他數(shù)據(jù)都利用時尚標簽工具進行機器標注。

機器標注的數(shù)據(jù)很廉價,但是卻包含很多的噪聲,使得模型的訓練容易出現(xiàn)過擬合。為了充分利用機器標注的數(shù)據(jù)和少量人類標記數(shù)據(jù),研究人員引入了弱標記建模的方法來處理機器標記數(shù)據(jù)中的噪聲。其基本思想是在模型中添加一個標簽校正層,在預測層后利用估計出的標簽轉(zhuǎn)換矩陣來實現(xiàn),使得預測與弱標記的數(shù)據(jù)分布相匹配。這一轉(zhuǎn)換矩陣將通過與主干任務協(xié)同訓練的線性層來得到。

實驗和結(jié)果

研究人員在實驗中發(fā)現(xiàn)新提出的框架和策略有效的實現(xiàn)了時尚概念的預測。通過與DARN、FashionNet和EITree的比較本文的方法在多個指標上都超過了先前的方法。

一方面,由于本方法充分使用了機器標注的模型并通過弱標記建模模塊抑制了標注噪聲的影響,從而得到了額外的增益。這一模型將場景、服裝分類和屬性間的依賴性和相關性進行了考量,為時尚概念的識別提供了額外辨別能力。這些依賴性和相關性表明時尚知識的存在以及對于相關應用的積極作用。

另一方面,這一方法還通過文字信息進一步提升了性能,特別是在場景分類中很多社交媒體的問題信息包含了豐富的場景信息,有助于時尚信息的抽取。

此外通過消融性分析,研究人員發(fā)現(xiàn)第一個Bi-LSTM通過學習出不同服裝區(qū)域間的相關性來提升了分類性能,并通過將隱含層的加入來替身了場景預測性能;第二個Bi-LSTM則通過不同屬性表達和分類表達間的依賴性建模來提升性能;同時兩個LSTM間的協(xié)同作用也將顯著加強模型知識抽取能力。

最后通過不同比例的噪聲數(shù)據(jù)對模型訓練也顯示出弱標記建模對于知識抽取能力的提升。

最后研究人員們還展示了基于這一模型在不同領域的應用。

從時尚概念抽取時尚知識,圖中展示了一部分結(jié)構(gòu)化的時尚知識

不同場景下人們的穿著服飾分析,包括國家、場合和季節(jié)都有著明顯的區(qū)分。

時尚知識分析,包含了不同季節(jié)和不同地區(qū)不同場合的穿著。

下圖還顯示了不同場合中最流行的服飾,包括了其中縱軸是男性女性對應的十種場景、橫軸是對應的流行穿著??梢钥吹綍h中男性傾向于穿著夾克外套、舞會中女性則喜愛各種連衣裙。

同時研究人員們還分析了不同屬性和分類間的相關性,圖中的節(jié)點大小代表了服飾的數(shù)量,邊的寬度代表了相關性的強弱??梢钥吹脚W醒澓鸵r衫T恤都是大家的最愛搭配。而不同屬性間的相關性中可以看到長款衣服還是主流,長袖長褲是主流搭配。

在未來研究人員們還將探索包括時尚穿搭推薦的不同領域的應用,并對更加細粒度的知識進行抽取,同時加入不同的視覺概念來實現(xiàn)包括交叉模態(tài)檢索和人體檢索等更多的檢索任務。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關注

    關注

    7

    文章

    2842

    瀏覽量

    53354
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4839

    瀏覽量

    107958
  • 深度學習
    +關注

    關注

    73

    文章

    5600

    瀏覽量

    124477

原文標題:對面的女孩看過來,深度學習從社交媒體中為你發(fā)掘最美穿搭

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    汽中心融媒體中心正式揭牌成立

    2026年1月15-16日,汽中心在首屆媒體開放日活動期間,正式揭牌啟動融媒體中心,標志著汽中心在“十五五”開局之際邁入“數(shù)智融媒”全新發(fā)展階段,
    的頭像 發(fā)表于 01-20 13:13 ?541次閱讀

    機器學習深度學習需避免的 7 個常見錯誤與局限性

    無論是剛?cè)腴T還是已經(jīng)從事人工智能模型相關工作一段時間,機器學習深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關注
    的頭像 發(fā)表于 01-07 15:37 ?251次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>中</b>需避免的 7 個常見錯誤與局限性

    穿孔機頂頭檢測儀 機器視覺深度學習

    ,能適用惡劣工況,在粉塵、高溫、氧化皮等惡劣環(huán)境均可正常工作。 測量原理 利用頂頭與周圍的物質(zhì)(水、空氣、導盤等)紅外輻射能量的差異,用熱成像相機拍攝出清晰的圖片,再通過深度學習短時間內(nèi)深度
    發(fā)表于 12-22 14:33

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    ,形成\"傳統(tǒng)視覺算法→深度學習建?!I(yè)級部署\"的完整技術鏈,幫助學員掌握0到1搭建缺陷檢測系統(tǒng)的能力,響應制造業(yè)\"提質(zhì)降本增效\"的核心需求。 團購課程
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    ,形成\"傳統(tǒng)視覺算法→深度學習建?!I(yè)級部署\"的完整技術鏈,幫助學員掌握0到1搭建缺陷檢測系統(tǒng)的能力,響應制造業(yè)\"提質(zhì)降本增效\"的核心需求。 團購課程
    發(fā)表于 12-03 13:50

    【社區(qū)之星】歐小龍——保護的好奇心:它是所有創(chuàng)造力的源泉

    技術,更是鍛煉了分析問題、排查故障、追求極致的方法論。這種“深潛”的能力是可以遷移到其他領域的。當你未來學習新技術時,會自然而然地用這種深度思維去
    發(fā)表于 11-26 16:31

    學習強國深度報道 RT-Thread“1+X+N”戰(zhàn)略,國產(chǎn)操作系統(tǒng)賦能高端制造引關注|媒體視角

    近日,國產(chǎn)嵌入式操作系統(tǒng)領軍企業(yè)RT-Thread睿賽德在工博會發(fā)布的“1+X+N”戰(zhàn)略體系,獲得了國家級權(quán)威媒體平臺“學習強國”的重點報道。該報道產(chǎn)業(yè)高度深入剖析了RT-Thread睿賽德以自主
    的頭像 發(fā)表于 09-29 17:37 ?1252次閱讀
    <b class='flag-5'>學習</b>強國<b class='flag-5'>深度</b>報道 RT-Thread“1+X+N”戰(zhàn)略,國產(chǎn)操作系統(tǒng)賦能高端制造引關注|<b class='flag-5'>媒體</b>視角

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術機器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?946次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經(jīng)網(wǎng)絡

    深度學習對工業(yè)物聯(lián)網(wǎng)有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經(jīng)網(wǎng)絡的層級結(jié)構(gòu),能夠自動海量工業(yè)數(shù)據(jù)中提取復雜特征,工業(yè)物聯(lián)網(wǎng)(IIoT)提供了數(shù)據(jù)感
    的頭像 發(fā)表于 08-20 14:56 ?1085次閱讀

    自動駕駛Transformer大模型會取代深度學習嗎?

    持續(xù)討論。特別是在自動駕駛領域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學習是否已過時”的激烈爭論。然而,技術原理、算力成本、安全需求與實際落地路徑等維度來看,Transforme
    的頭像 發(fā)表于 08-13 09:15 ?4250次閱讀
    自動駕駛<b class='flag-5'>中</b>Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    明達MR30分布式IO在紡織行業(yè)穿經(jīng)機的應用

    在紡織行業(yè)的織造前道工序,穿經(jīng)機如同一位精密的 “紡織裁縫”,將數(shù)百至數(shù)千根纖細經(jīng)紗精準穿入停經(jīng)片、綜絲和鋼筘,后續(xù)織造環(huán)節(jié)奠定基礎。然而,傳統(tǒng)穿經(jīng)機的控制方式常因信號傳輸距離遠、
    的頭像 發(fā)表于 08-01 16:27 ?863次閱讀
    明達MR30分布式IO在紡織行業(yè)<b class='flag-5'>穿</b>經(jīng)機的應用

    深度學習遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術的迅猛發(fā)展,深度學習(Deep Learning)成為最熱門的研究領域之一。在語音識別、圖像識別、自然語言處理等領域,深度學習取得了顯著成果。
    發(fā)表于 07-14 14:50 ?1268次閱讀
    當<b class='flag-5'>深度</b><b class='flag-5'>學習</b>遇上嵌入式資源困境,特征空間如何破局?

    解鎖多軸直線電機模組的高效接方法

    在自動化設備領域,多軸直線模組憑借其高精度、高速度和高靈活性的特點,成為實現(xiàn)復雜運動控制的核心組件。3C產(chǎn)品組裝到數(shù)控機床加工,物流分揀到醫(yī)療設備運作,再到半導體制造設備,多軸直線模組
    的頭像 發(fā)表于 06-27 11:21 ?907次閱讀
    解鎖多軸直線電機模組的高效<b class='flag-5'>搭</b>接方法

    嵌入式AI技術之深度學習:數(shù)據(jù)樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡實現(xiàn)機器學習,網(wǎng)絡的每個層都將對輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡構(gòu)成深度學習的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。
    的頭像 發(fā)表于 04-02 18:21 ?1558次閱讀