91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用人工智能的多模態(tài)通用技術(shù)

姚小熊27 ? 來(lái)源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-02-04 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)有的大多數(shù)人工智能模型和方法仍屬于窄人工智能,也被稱為弱人工智能(weak artificial intelligence)。相對(duì)而言,強(qiáng)人工智能(strong artificial intelligence)期望機(jī)器能像人一樣思考、推理,能處理各種任務(wù),比肩人類的智能水平(human-like or human-level intelligence)。與強(qiáng)人工智能相比,現(xiàn)有通用人工智能更加強(qiáng)調(diào)機(jī)器的“泛 化”能力,包括場(chǎng)景泛化(即模型從單一場(chǎng)景泛化 至多個(gè)場(chǎng)景)、模態(tài)泛化(即一個(gè)模型適用于多種 模態(tài)的任務(wù))、任務(wù)泛化(即一個(gè)模型可以處理多種類型的任務(wù))等。

通用人工智能目前仍然處于發(fā)展初期,是對(duì)現(xiàn)有窄/弱人工智能的反思、補(bǔ)充和改進(jìn),也是通往強(qiáng)人工智能道路上的重要路線。通用人工智能所研究的是一個(gè)智能系統(tǒng)應(yīng)該具備哪些能力,并且運(yùn)用這些能力解決各式各樣的復(fù)雜問(wèn)題。

通用人工智能的多模態(tài)通用技術(shù)

現(xiàn)實(shí)生活中,人類接收的信息模態(tài)多種多樣,如視覺(jué)、聲音、文字、嗅覺(jué)、觸覺(jué)等。人類可以綜合運(yùn)用多種模態(tài)的信息對(duì)事物進(jìn)行理解和推理。多模態(tài)學(xué)習(xí)是通用智能需要解決的關(guān)鍵問(wèn)題之一,其任務(wù)可以歸結(jié)為兩個(gè)基本類:多模態(tài)表征學(xué)習(xí)和模態(tài)轉(zhuǎn)換。需要指出的是,這兩個(gè)問(wèn)題并非不相關(guān),比如表征可以用來(lái)做模態(tài)轉(zhuǎn)換。下面介紹幾種典型的多模態(tài)學(xué)習(xí)任務(wù)。

多模態(tài)表征學(xué)習(xí)和融合

多模態(tài)表征學(xué)習(xí)指的是學(xué)習(xí)包含多個(gè)模態(tài)的樣本表征,比如視頻里可能包含的視覺(jué)信息、聲音信息等,使得表征能夠反映所包含的多個(gè)模態(tài)信息,以幫助理解識(shí)別等任務(wù)。最直接的方法是分別處理各個(gè)模態(tài),得到每個(gè)模態(tài)的表征,再將其直接拼接起來(lái)作為最后的表征;也可以最終只產(chǎn)生一個(gè)表征,把不同模態(tài)的表征融合成一個(gè)表征;也可以繼續(xù)把融合的表征做進(jìn)一步處理,以生成更強(qiáng)的表征;還可以在產(chǎn)生表征的過(guò)程中,不停地進(jìn)行模態(tài)之間的信息交互或者融合,以增強(qiáng)每個(gè)模態(tài)的表征。

多模態(tài)協(xié)同學(xué)習(xí)

多模態(tài)協(xié)同學(xué)習(xí)指的是利用模態(tài)之間的關(guān)聯(lián),借助其他一個(gè)或者多個(gè)模態(tài),來(lái)幫助某一模態(tài)或者多個(gè)模態(tài)建模和學(xué)習(xí)。模態(tài)之間的關(guān)聯(lián)信息非常常見(jiàn),比如人在說(shuō)話的時(shí)候,既有聲音模態(tài),也有視覺(jué)(唇語(yǔ))模態(tài),如人臉表情或者行為動(dòng)作;比如互聯(lián)網(wǎng)上的圖片,通常有文件名等;比如在視頻中,視頻幀可能有相應(yīng)的聲音(語(yǔ)音或者音樂(lè)),也可能有文字腳本。人類對(duì)單一模態(tài)的理解,也是通過(guò)聯(lián)合其他模態(tài)信息進(jìn)行分析的。多模態(tài)協(xié)同學(xué)習(xí)的要領(lǐng)在于把關(guān)聯(lián)轉(zhuǎn)換成合適的約束,以及從各個(gè)模態(tài)獲取合適的信息形成約束。例如圖像和文本(比如圖像及其文件名)有一一對(duì)應(yīng)關(guān)系。

借助于物體的屬性描述來(lái)幫助圖像識(shí)別建模,在某種意義上也是多模態(tài)協(xié)同學(xué)習(xí)。例如,對(duì)狗的識(shí)別,我們都清楚地了解狗是由哪些部分組成的,具有怎樣的屬性特征,比如它有4條腿、尾巴、毛發(fā)等。但是在目前主流的物體識(shí)別中,這種信息沒(méi)有被加進(jìn)去,“狗”只是作為一個(gè)標(biāo)簽。而人類從圖像里識(shí)別狗的時(shí)候,頭腦中有很多狗的圖像認(rèn)知信息,同時(shí)也從別的渠道獲得狗的其他知識(shí),如組成方式等。所以,建模時(shí)需要把關(guān)于狗的額外知識(shí)信息加進(jìn)去,來(lái)提升建模識(shí)別性能,也會(huì)提升模型的魯棒性。

多模態(tài)統(tǒng)一表征學(xué)習(xí)

多模態(tài)統(tǒng)一表征學(xué)習(xí)指的是把不同模態(tài)映射到 同一個(gè)特征空間,使得不同模態(tài)在這個(gè)特征空間里可以直接比較(比如歐氏距離),比較的時(shí)候不用 區(qū)分特征來(lái)自什么模態(tài)。多模態(tài)任務(wù)可以是把一幅圖片轉(zhuǎn)變成一段文字或者一首詩(shī),或者將文字轉(zhuǎn)化成一幅圖像;以及在文字、圖片或者視頻搜索中,如果圖像和文本的特征都轉(zhuǎn)換到同一個(gè)空間中,那我們就可以進(jìn)行統(tǒng)一的搜索,而不再區(qū)分不同的模態(tài)。

人類具有在不同模態(tài)之間快速映射的能力,比如看到一個(gè)場(chǎng)景,我們的頭腦會(huì)快速“搜索”到應(yīng)景的一首歌、一段文字或者一首詩(shī)。多模態(tài)統(tǒng)一表示是模擬人類這個(gè)能力的一種實(shí)現(xiàn)方法。多模態(tài)統(tǒng)一表征問(wèn)題的主要研究點(diǎn)在于如何定義關(guān)系保持和尋找合適的映射,以及對(duì)大規(guī)模數(shù)據(jù)和實(shí)際問(wèn)題的探索。目前已經(jīng)有了實(shí)際系統(tǒng)的探索,如“小冰寫詩(shī)”。


責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265295
  • 通用技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    7318
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的人工智能。 超
    的頭像 發(fā)表于 02-22 08:24 ?115次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    聲智科技助力第一屆產(chǎn)學(xué)結(jié)合高校通用人工智能大賽決賽圓滿落幕

    當(dāng)通用人工智能(AGI)浪潮席卷全球,如何縮短前沿算法與產(chǎn)業(yè)應(yīng)用之間的距離?本周一,第一屆產(chǎn)學(xué)結(jié)合高校通用人工智能大賽(AGIUC)決賽圓滿落幕。作為賽事官方支持單位,聲智科技深度參與賽題設(shè)計(jì)、算力
    的頭像 發(fā)表于 02-01 10:27 ?798次閱讀

    云知聲榮獲2025人工智能治理示范案例

    10月30日,2025國(guó)際前瞻人工智能安全與治理大會(huì)(FAISG 2025)在北京成功召開(kāi)。作為落實(shí)《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃2.0》的重要舉措,由北京人工智能產(chǎn)業(yè)聯(lián)盟與北京軟件和信息
    的頭像 發(fā)表于 11-10 17:28 ?975次閱讀

    四維圖新亮相2025國(guó)際前瞻人工智能安全與治理大會(huì)

    日前,2025國(guó)際前瞻人工智能安全與治理大會(huì)在北京舉行。作為數(shù)據(jù)治理領(lǐng)域的典型代表,四維圖新打造的“‘車云’數(shù)據(jù)協(xié)同治理,賦能車企高質(zhì)量發(fā)展”案例(以下簡(jiǎn)稱案例),入選《人工智能治理案例集》,并納入《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙
    的頭像 發(fā)表于 11-08 17:20 ?1401次閱讀

    航天宏圖人工智能技術(shù)深度賦能社會(huì)治理現(xiàn)代化

    航天宏圖多年來(lái)持續(xù)重點(diǎn)投入技術(shù)研發(fā),尤其專注人工智能深度探索。航天宏圖多以自主研發(fā)“天權(quán)大模型” 是一款基于模態(tài)大模型技術(shù)的遙感解譯專用A
    的頭像 發(fā)表于 09-06 10:35 ?1163次閱讀
    航天宏圖<b class='flag-5'>人工智能技術(shù)</b>深度賦能社會(huì)治理現(xiàn)代化

    淺析模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

    ?在人工智能邁向AGI通用智能的關(guān)鍵道路上,大模型正從單一的文本理解者,演進(jìn)為能同時(shí)看、聽(tīng)、讀、想的“多面手”。驅(qū)動(dòng)這一進(jìn)化的核心燃料,正是高質(zhì)量的
    的頭像 發(fā)表于 09-05 13:49 ?2242次閱讀

    云天勵(lì)飛亮相2025深圳通用人工智能大會(huì)

    近日,以“模驅(qū)具身?智啟未來(lái)”為主題的2025 AGIC深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)(以下簡(jiǎn)稱大會(huì))在深圳國(guó)際會(huì)展中心(寶安)開(kāi)幕。
    的頭像 發(fā)表于 09-01 14:09 ?924次閱讀

    勇藝達(dá)亮相2025深圳通用人工智能大會(huì)

    2025 年 8 月 27 日,以 “模驅(qū)具身?智啟未來(lái)” 為主題的深圳(國(guó)際)通用人工智能大會(huì)(AGIC)在深圳國(guó)際會(huì)展中心盛大開(kāi)幕。國(guó)內(nèi)領(lǐng)先的機(jī)器人企業(yè)勇藝達(dá)精彩亮相,現(xiàn)場(chǎng)展示了其明星產(chǎn)品小勇 T1 型服務(wù)機(jī)器人及全場(chǎng)景機(jī)器人落地方案,引發(fā)行業(yè)廣泛關(guān)注。
    的頭像 發(fā)表于 08-28 17:24 ?1015次閱讀

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時(shí)間是最好的試金石,AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí),商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路徑。
    的頭像 發(fā)表于 08-14 09:33 ?1183次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)?b class='flag-5'>技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)?b class='flag-5'>技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:23

    聚焦前沿,賦能AI教學(xué)!華清遠(yuǎn)見(jiàn)第32屆全國(guó)高校人工智能師資班(模態(tài)大模型與具身智能)圓滿落幕!

    云端,共同探索AI教育前沿,充分展現(xiàn)了高校教育對(duì)人工智能方向的持續(xù)火熱與迫切需求。本次暑期師資班聚焦“模態(tài)大模型+具身智能”這一AI前沿技術(shù)
    的頭像 發(fā)表于 07-30 15:06 ?1279次閱讀
    聚焦前沿,賦能AI教學(xué)!華清遠(yuǎn)見(jiàn)第32屆全國(guó)高校<b class='flag-5'>人工智能</b>師資班(<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型與具身<b class='flag-5'>智能</b>)圓滿落幕!

    世界模型:模態(tài)融合+因果推理,解鎖AI認(rèn)知邊界

    ,自然地學(xué)習(xí)世界運(yùn)作方式的知識(shí)。深度學(xué)習(xí)之父 Yann LeCun 認(rèn)為,世界模型是通往通用人工智能(AGI)的重要路徑之一。 ? 世界模型 的 關(guān)鍵技術(shù) 和應(yīng)用場(chǎng)景 ? 世界模型是智能體對(duì)環(huán)境的內(nèi)部表征,其核心在于通過(guò)多
    的頭像 發(fā)表于 06-23 04:49 ?4049次閱讀

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)?;瘮?shù)據(jù)平臺(tái)

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過(guò)構(gòu)建大規(guī)模、模態(tài)的真實(shí)世界數(shù)據(jù)集與
    的頭像 發(fā)表于 03-12 11:42 ?1983次閱讀
    AgiBot World Colosseo:構(gòu)建<b class='flag-5'>通用</b>機(jī)器人<b class='flag-5'>智能</b>的規(guī)?;瘮?shù)據(jù)平臺(tái)

    智慧路燈如何應(yīng)用人工智能技術(shù)

    叁仟智慧路燈通過(guò)整合人工智能(AI)技術(shù),顯著提升了城市的智能化程度,為城市管理工作帶來(lái)了諸多便利。以下將詳細(xì)闡述叁仟智慧路燈在應(yīng)用人工智能技術(shù)方面的幾個(gè)關(guān)鍵領(lǐng)域: 一、
    的頭像 發(fā)表于 03-07 09:18 ?997次閱讀
    智慧路燈如何應(yīng)<b class='flag-5'>用人工智能技術(shù)</b>