AI新模型可將文本轉(zhuǎn)換為生動(dòng)的圖像

如今人工智能越來(lái)越強(qiáng)大，比如可以實(shí)現(xiàn)生成音樂(lè)、改變圖片藝術(shù)風(fēng)格等等。最近，人工智能非營(yíng)利組織OpenAI發(fā)布了一個(gè)名為DALL-E的神經(jīng)網(wǎng)絡(luò)，可以將文本轉(zhuǎn)換成與內(nèi)容相關(guān)的圖像。

比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶：

OpenAI在一篇博文中表示，該系統(tǒng)是具有里程碑意義的GPT-3語(yǔ)言模型的120億參數(shù)版本。

DALL-E模型具有多種功能，包括創(chuàng)建動(dòng)物和物體的擬物化版本，以合理的方式展示相關(guān)的概念，渲染文本，以及對(duì)現(xiàn)有圖像進(jìn)行轉(zhuǎn)換。

比如在該模型中選定“與貓有關(guān)的文本關(guān)鍵詞”，同時(shí)選擇給定的其中一種貓類型，最終系統(tǒng)會(huì)自動(dòng)生成一系列與貓主題有關(guān)的圖像，并且風(fēng)格呈現(xiàn)多樣化。

訓(xùn)練該模型的數(shù)據(jù)集主要基于互聯(lián)網(wǎng)大量文本-圖像。這使得它能夠通過(guò)探索提示的結(jié)構(gòu)來(lái)創(chuàng)造出全新的圖片。比如生成一些令人印象深刻的地標(biāo)、位置、雜交動(dòng)物和不同年代設(shè)計(jì)的圖像。但是OpenAI承認(rèn)并不是所有的結(jié)果都是成功的。

不過(guò)，OpenAI承認(rèn)并不是所有生成的結(jié)果都是成功的。該公司表示，DALL-E系統(tǒng)有時(shí)無(wú)法繪制出某些特定的項(xiàng)目，混淆了對(duì)象與其特定屬性之間的關(guān)系。

通常，提示DALL-E寫的字符串越長(zhǎng)，成功率越低。測(cè)試中發(fā)現(xiàn)，重復(fù)部分文本內(nèi)容，準(zhǔn)確率有所提高。

當(dāng)回答有關(guān)地理方面的問(wèn)題時(shí)，比如旗幟、菜肴和當(dāng)?shù)匾吧鷦?dòng)物，DALL-E也經(jīng)常反映出膚淺的刻板印象。考慮到人們?cè)絹?lái)越關(guān)注人工智能算法偏見(jiàn)的問(wèn)題，這個(gè)缺點(diǎn)尤為明顯。

OpenAI表示，它計(jì)劃分析DALL-E等模特的社會(huì)影響，但該公司認(rèn)為，該系統(tǒng)表明“通過(guò)語(yǔ)言操縱視覺(jué)概念現(xiàn)在已經(jīng)觸手可及?！?/p>

感興趣的小伙伴可以在OpenAI網(wǎng)站上查看更多DALL-E模型生成的圖像。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像處理

圖像處理

+關(guān)注

關(guān)注
29

文章
1342

瀏覽量
59566
AI

AI

+關(guān)注

關(guān)注
91

文章
39856

瀏覽量
301506
模型

模型

+關(guān)注

關(guān)注
1

文章
3756

瀏覽量
52125

評(píng)論

精選推薦
更多

文章

資料

帖子

恒溫晶振技術(shù)參數(shù)指標(biāo)怎么看？

saisi
2小時(shí)前

134 閱讀

AI需求爆發(fā)，高端MLCC轉(zhuǎn)賣方市場(chǎng)，國(guó)產(chǎn)廠商如何接招抓住風(fēng)口

海闊天空的專欄
2小時(shí)前

192 閱讀

納芯微智能隔離柵極驅(qū)動(dòng)NSI67x0助力電驅(qū)小型化與高可靠設(shè)計(jì)

米芯微電子
2小時(shí)前

162 閱讀

企業(yè)級(jí)AI Agent王炸! 英偉達(dá)GTC將開(kāi)源 NemoClaw

章鷹觀察
4小時(shí)前

408 閱讀

CRA合規(guī)必備！飛凌嵌入式獲IEC 62443雙認(rèn)證，為企業(yè)出海開(kāi)啟綠色通道

飛凌嵌入式
1天前

1075 閱讀

pci e PCB設(shè)計(jì)規(guī)范

我只是路過(guò)
555

免費(fèi)

0下載

Android開(kāi)發(fā)指南中文版

z764234131
786

免費(fèi)

0下載

人工智能（AI）學(xué)習(xí)：如何講解BP（反向傳播）流程

ah此生不換
6.00 MB

1積分

0下載

TinyPNG4Mac專注png圖片壓縮的工具

李名揚(yáng)
0.60 MB

免費(fèi)

0下載

WeChat TFCC微信云端深度學(xué)習(xí)推理框架

youyoulan
1.38 MB

2積分

1下載

在昉·星光開(kāi)發(fā)板上通舵機(jī)控制板實(shí)現(xiàn)機(jī)器人舵機(jī)控制

感謝相遇
1天前

217 閱讀

使用 VisionFive 2 上的氣壓傳感器測(cè)量高度

大連云港
1天前

217 閱讀

【瑞薩AI挑戰(zhàn)賽】階段一：基于RA8P1的人臉識(shí)別模型轉(zhuǎn)換和部署

Zerolinr
1天前

649 閱讀

【飛凌嵌入式RV1126B開(kāi)發(fā)板】+基本功能測(cè)試篇（1）

jennyzhaojie
5天前

2019 閱讀

【飛凌嵌入式RV1126B開(kāi)發(fā)板】+初識(shí)篇

jennyzhaojie
6天前

2064 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

AI新模型可將文本轉(zhuǎn)換為生動(dòng)的圖像

評(píng)論