91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DALL-E 2的錯誤揭示出人工智能的局限性

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 作者:Eliza Strickland ? 2022-11-16 15:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI的文字圖像轉(zhuǎn)換器與文本、科學(xué)和偏見作斗爭。

在2022年4月,人工智能(AI)研究實驗室OpenAI繼2021年推出的DALL-E后,又推出了DALL-E 2。這兩個人工智能系統(tǒng)都可以根據(jù)自然語言的文本描述來生成令人驚奇的圖像,包括照片、插圖、繪畫、動畫和其他能用語言表達藝術(shù)風(fēng)格的幾乎任何圖片(見下圖)。DALL-E 2的分辨率更高,處理速度更快,增加的編輯功能能夠讓用戶僅使用文本命令修改已生成圖像,例如“把那個花瓶換成植物”或“讓狗的鼻子更大一點”。

對于DALL-E 2,全球最初的反應(yīng)是震驚和欣慰。它可以在幾秒鐘之內(nèi)把任何物體和生物組合在一起,可以模仿任何藝術(shù)風(fēng)格,還能描繪任何地點,并且可以刻畫各種照明條件。比如說,看到宇航員騎著一匹馬的安迪?沃霍爾(Andy Warhol)風(fēng)格圖片,誰能不被感動?不過,隨著人們列出可以被這種技術(shù)輕易擾亂的行業(yè),也難免出現(xiàn)了一絲擔憂。

OpenAI尚未向公眾、商業(yè)實體乃至整個人工智能社區(qū)發(fā)布相關(guān)技術(shù)。OpenAI的研究員馬克?陳(Mark Chen):“我們和大家一樣擔心濫用的問題,而且非常重視這件事?!痹摴敬_實邀請了一些人,針對DALL-E 2進行實驗。過去幾個月出現(xiàn)的研究結(jié)果充分說明了現(xiàn)今深度學(xué)習(xí)技術(shù)的局限性,也給我們打開了一個窗口,了解對于人類世界,人工智能有哪些能夠理解,又有哪些完全沒有理解。

工作原理

OpenAI在論文預(yù)印本網(wǎng)站ArXiv上發(fā)布的一篇論文表明,DALL-E 2接受了從互聯(lián)網(wǎng)上截取的約6.5億個圖像-文本對的訓(xùn)練。通過這個龐大的數(shù)據(jù)集,它學(xué)習(xí)圖像與描述這些圖像的文字之間的關(guān)系。OpenAI在訓(xùn)練之前對數(shù)據(jù)集進行篩選,移除了包含明顯暴力、色情和其他惡劣內(nèi)容的圖片?!澳P蜎]有暴露這些概念之下?!标愓f,“所以它生成未見過內(nèi)容的可能性非常非常低?!钡芯咳藛T明確指出,這種過濾有局限性,DALL-E 2仍然有可能生成有害的內(nèi)容。

一旦這種“編碼器”模型經(jīng)過訓(xùn)練,可理解文本和圖片之間的關(guān)系,OpenAI就將它與一個可根據(jù)文本提示生成圖片的解碼器配對,使用一種名為“擴散”的方法,從隨機的點圖案開始,慢慢改變圖案,生成圖像。此外,該公司集成了一些過濾器,以便生成的圖像符合內(nèi)容政策,并承諾了不斷進行更新??赡墚a(chǎn)生禁止內(nèi)容的改變會被阻止,而且為了防止深度偽造,它無法準確地再現(xiàn)在訓(xùn)練過程中見過的面孔(這可部分解釋為什么它通常會產(chǎn)生超現(xiàn)實的面孔)。到目前為止,OpenAI還采用了人工審查員檢查被標記為可能有問題的圖像。

由于DALL-E 2明顯有可能被濫用,OpenAI最初授權(quán)使用的只有幾百人,大多是人工智能研究人員和藝術(shù)家。與該實驗室的語言生成模型GPT-3不同,即便是有限的商業(yè)應(yīng)用,DALL-E 2 也尚不具備,而且OpenAI也未公開討論相關(guān)計劃。不過,瀏覽DALL-E 2用戶創(chuàng)建并發(fā)布在Reddit等論壇上的圖像,可以發(fā)現(xiàn)有些專業(yè)應(yīng)用確實應(yīng)該引起擔憂,例如DALL-E 2擅長的美食攝影、公司手冊和網(wǎng)站的圖片庫,以及適用于宿舍海報或雜志封面上的插圖。

問題所在

熱心的實驗者生成的圖像表明,盡管DALL-E 2有很多優(yōu)勢,但關(guān)于這個世界,它還需要學(xué)習(xí)很多東西。以下是3個最明顯、最引人關(guān)注的錯誤。

文本: DALL-E 2雖然擅長理解生成圖像的文本提示,卻很難將可理解的文本放入圖像,這一點令人感到費解。用戶發(fā)現(xiàn),要求放入任意類型的文本都會產(chǎn)出一堆混亂的字母。珍妮爾?肖恩(Janelle Shane)喜歡在自己的人工智能博客里利用該系統(tǒng)創(chuàng)建公司的徽標,并觀察由此產(chǎn)生的混亂。不過,未來的版本可能會糾正該問題,因為OpenAI的GPT-3團隊有著豐富的文本生成專業(yè)知識。肖恩:“最終,DALL-E的后繼者將能夠拼寫‘松餅屋’(Waffle House),那一天我一定會很傷心的。我還得換一種不同方式來擾亂它、找樂子?!?/p>

科學(xué):你可以說DALL-E 2理解一些科學(xué)定律,因為它可以輕松地描繪掉落的物體或漂浮在太空中的宇航員。但要求它生成解剖圖、X光圖、數(shù)學(xué)證明或藍圖時,它生成的圖像看似正確,而實際上卻是完全錯誤的。例如,要求DALL-E 2“按比例繪制太陽系圖解插圖”,在得到的結(jié)果圖像中,地球非常奇怪,而且有太多假設(shè)的太陽系鄰居?!癉ALL-E不懂什么是科學(xué)。它只知道怎樣閱讀文字說明,然后繪圖?!監(jiān)penAI的研究院阿迪蒂亞?拉梅什(Aditya Ramesh)說,“因此它不理解其中的含義,而試著編造一些看起來相似的東西?!?/p>

3a5af20c-64d7-11ed-8abf-dac502259ad0.jpg

偏見:DALL-E 2被認為是一種接受圖片和文本訓(xùn)練的多模態(tài)人工智能系統(tǒng),會表現(xiàn)出某種形式的多模態(tài)偏見。例如,如果用戶要求它生成一名首席執(zhí)行官、一名建筑工人或者一名技術(shù)記者的圖片,它通常會根據(jù)其在訓(xùn)練數(shù)據(jù)中看到的圖片-文本對來提供男性的圖片。在發(fā)布DALL-E 2之前,OpenAI要求從事該領(lǐng)域相關(guān)工作的外部研究員來充當“紅隊”,他們的見解有助于OpenAI評估該系統(tǒng)的風(fēng)險和局限性。他們發(fā)現(xiàn),除了表現(xiàn)有關(guān)性別的社會成見,該系統(tǒng)會過多地表現(xiàn)白人和西方傳統(tǒng)與環(huán)境。

陳認為“我們可以采取某些機器學(xué)習(xí)緩解措施”來糾正這些偏見,該團隊已經(jīng)采取了一些措施,例如,在訓(xùn)練期間他們發(fā)現(xiàn),由于在訓(xùn)練數(shù)據(jù)中消除了的色情內(nèi)容,在建立的數(shù)據(jù)集中男性要多于女性,這導(dǎo)致DALL-E 2生成更多男性的圖像?!八晕覀冋{(diào)整了訓(xùn)練方法,并提高了女性圖像的權(quán)重,使其更有可能生成女性圖像?!标惤忉尩?。為了幫助DALL-E 2產(chǎn)生更多樣化的結(jié)果,用戶還可以使用“女性宇航員”或“印度婚禮”等指定性別、種族或地理位置的提示。

總之,DALL-E 2團隊表示,他們渴望看到早期用戶在測試系統(tǒng)時發(fā)現(xiàn)的問題和故障,他們也已經(jīng)在考慮接下來的工作?!拔覀兎浅S信d趣提高系統(tǒng)的整體智能。”拉梅什說,并補充說該團隊希望能在“DALL-E中加深對語言及其與世界關(guān)系的理解”。他指出OpenAI的文本生成工具GPT-3對普通常識、科學(xué)和人類行為有著非常驚人的理解。“一個充滿希望的目標是嘗試通過DALL-E將GPT-3的知識與圖像領(lǐng)域聯(lián)系起來。”拉梅什說。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265581
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124422
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10117

原文標題:DALL-E 2的錯誤揭示出人工智能的局限性

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淺談人工智能2

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?159次閱讀
    淺談<b class='flag-5'>人工智能</b>(<b class='flag-5'>2</b>)

    開發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能生成合成內(nèi)容標識 “
    發(fā)表于 02-07 11:44

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?211次閱讀
    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見<b class='flag-5'>錯誤</b>與<b class='flag-5'>局限性</b>

    嵌入式系統(tǒng)中的人工智能

    本文編譯自ElectronicDesign人工智能(AI)正徹底變革嵌入式系統(tǒng),改變技術(shù)融入日常生活的方式。如今的人工智能不再局限于執(zhí)行基礎(chǔ)任務(wù),它還被應(yīng)用于智能汽車、工業(yè)自動化、醫(yī)療
    的頭像 發(fā)表于 12-18 11:49 ?1049次閱讀
    嵌入式系統(tǒng)中的<b class='flag-5'>人工智能</b>

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    (Agentic AI)技術(shù)的行業(yè)影響,以及未來跨界合作的前景。此次圓桌討論不僅展現(xiàn)了雙方的戰(zhàn)略協(xié)同,以及他們在開發(fā)市場領(lǐng)先解決方案方面的共同努力,也勾勒出人工智能是如何驅(qū)動工程、電信、制藥等行業(yè)變革的新藍圖。
    的頭像 發(fā)表于 11-30 09:48 ?418次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    RVSP線纜有哪些缺點或者局限性

    RVSP線纜雖然具有抗干擾能力強、柔軟易彎曲等優(yōu)點,但在實際應(yīng)用中也存在一些缺點和局限性,以下是詳細分析: 一、機械性能局限性 抗拉強度不足 RVSP線纜的銅芯導(dǎo)體較細,且采用軟銅線結(jié)構(gòu),雖然提高了
    的頭像 發(fā)表于 08-22 09:53 ?737次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    UPS電源—UPS電源優(yōu)化電力質(zhì)量局限大揭秘

    在工業(yè)自動化及眾多關(guān)鍵領(lǐng)域,UPS(不間斷電源)作為電力保障的重要設(shè)備,對于提升電力質(zhì)量起到了至關(guān)重要的作用。然而,任何技術(shù)都有其局限性,UPS電源在優(yōu)化電力質(zhì)量方面也不例外。以下是對UPS電源優(yōu)化電力質(zhì)量局限性的詳細分析.
    的頭像 發(fā)表于 08-05 19:51 ?792次閱讀
    UPS電源—UPS電源優(yōu)化電力質(zhì)量<b class='flag-5'>局限</b>大揭秘

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    智能導(dǎo)視:引領(lǐng)未來導(dǎo)航的創(chuàng)新力量

    一、定義與背景 智能導(dǎo)視系統(tǒng)是融合人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等先進技術(shù)的綜合性導(dǎo)航解決方案。該系統(tǒng)突破傳統(tǒng)導(dǎo)視系統(tǒng)靜態(tài)展示的局限性,高度重視互動性、精準性、有效性與趣味性。用戶可借助交互式觸摸屏、手機
    的頭像 發(fā)表于 04-27 17:19 ?809次閱讀
    <b class='flag-5'>智能</b>導(dǎo)視:引領(lǐng)未來導(dǎo)航的創(chuàng)新力量

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應(yīng)/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55

    樹莓派 也能搞 AI 藝術(shù)?樹莓派遇上DALL-E,開啟你的 AI 藝術(shù)創(chuàng)作之旅!

    本教程將向你展示如何使用DALL-EAPI從你的RaspberryPi上生成隨機的AI藝術(shù)。近年來,人工智能(AI)是一個取得了巨大飛躍的領(lǐng)域,這在很大程度上要歸功于OpenAI等團隊的努力。這些
    的頭像 發(fā)表于 03-25 09:29 ?936次閱讀
    樹莓派 也能搞 AI 藝術(shù)?樹莓派遇上<b class='flag-5'>DALL-E</b>,開啟你的 AI 藝術(shù)創(chuàng)作之旅!