91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI新模型可將文本轉(zhuǎn)換為生動(dòng)的圖像

如意 ? 來(lái)源:站長(zhǎng)之家 ? 作者:站長(zhǎng)之家 ? 2021-01-07 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如今人工智能越來(lái)越強(qiáng)大,比如可以實(shí)現(xiàn)生成音樂(lè)、改變圖片藝術(shù)風(fēng)格等等。最近,人工智能非營(yíng)利組織OpenAI發(fā)布了一個(gè)名為DALL-E的神經(jīng)網(wǎng)絡(luò),可以將文本轉(zhuǎn)換成與內(nèi)容相關(guān)的圖像。

比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶:

OpenAI在一篇博文中表示,該系統(tǒng)是具有里程碑意義的GPT-3語(yǔ)言模型的120億參數(shù)版本。

DALL-E模型具有多種功能,包括創(chuàng)建動(dòng)物和物體的擬物化版本,以合理的方式展示相關(guān)的概念,渲染文本,以及對(duì)現(xiàn)有圖像進(jìn)行轉(zhuǎn)換。

比如在該模型中選定“與貓有關(guān)的文本關(guān)鍵詞”,同時(shí)選擇給定的其中一種貓類型,最終系統(tǒng)會(huì)自動(dòng)生成一系列與貓主題有關(guān)的圖像,并且風(fēng)格呈現(xiàn)多樣化。

訓(xùn)練該模型的數(shù)據(jù)集主要基于互聯(lián)網(wǎng)大量文本-圖像。這使得它能夠通過(guò)探索提示的結(jié)構(gòu)來(lái)創(chuàng)造出全新的圖片。比如生成一些令人印象深刻的地標(biāo)、位置、雜交動(dòng)物和不同年代設(shè)計(jì)的圖像。但是OpenAI承認(rèn)并不是所有的結(jié)果都是成功的。

不過(guò),OpenAI承認(rèn)并不是所有生成的結(jié)果都是成功的。該公司表示,DALL-E系統(tǒng)有時(shí)無(wú)法繪制出某些特定的項(xiàng)目,混淆了對(duì)象與其特定屬性之間的關(guān)系。

通常,提示DALL-E寫的字符串越長(zhǎng),成功率越低。測(cè)試中發(fā)現(xiàn),重復(fù)部分文本內(nèi)容,準(zhǔn)確率有所提高。

當(dāng)回答有關(guān)地理方面的問(wèn)題時(shí),比如旗幟、菜肴和當(dāng)?shù)匾吧鷦?dòng)物,DALL-E也經(jīng)常反映出膚淺的刻板印象。考慮到人們?cè)絹?lái)越關(guān)注人工智能算法偏見(jiàn)的問(wèn)題,這個(gè)缺點(diǎn)尤為明顯。

OpenAI表示,它計(jì)劃分析DALL-E等模特的社會(huì)影響,但該公司認(rèn)為,該系統(tǒng)表明“通過(guò)語(yǔ)言操縱視覺(jué)概念現(xiàn)在已經(jīng)觸手可及?!?/p>

感興趣的小伙伴可以在OpenAI網(wǎng)站上查看更多DALL-E模型生成的圖像。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    29

    文章

    1342

    瀏覽量

    59566
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39856

    瀏覽量

    301506
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3756

    瀏覽量

    52125
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一文了解語(yǔ)音AI的運(yùn)作方式

    語(yǔ)音 AI 是對(duì)話式 AI 的一個(gè)子集,包括可將人類語(yǔ)音轉(zhuǎn)換為文本的自動(dòng)語(yǔ)音識(shí)別 (ASR) 和文本
    的頭像 發(fā)表于 02-27 16:10 ?345次閱讀
    一文了解語(yǔ)音<b class='flag-5'>AI</b>的運(yùn)作方式

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負(fù)載。[Axon NPU 技術(shù)頁(yè)] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存
    發(fā)表于 01-31 23:16

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    2)滲透式AI的優(yōu)勢(shì) 5、大型多模態(tài)模型 多模態(tài)模型(LMM)可以被理解成大模型的更高級(jí)版本,不僅可以處理文本,還可以處理和理解多種類型的
    發(fā)表于 09-18 15:31

    如何將圖像文件轉(zhuǎn)換為二進(jìn)制文件?

    如何將圖像文件轉(zhuǎn)換為二進(jìn)制文件
    發(fā)表于 09-05 08:28

    【Sipeed MaixCAM Pro開(kāi)發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    能夠有效捕捉AI生成圖像與真實(shí)手繪掃描圖像在紋理、筆觸、光影、全局一致性等方面的細(xì)微差異。 邊緣端部署:將模型量化、編譯,最終高效運(yùn)行在算力有限的MaixCAM-Pro開(kāi)發(fā)板上。 實(shí)時(shí)
    發(fā)表于 08-21 13:59

    在K230中,如何使用AI Demo中的object_detect_yolov8n,YOLOV8多目標(biāo)檢測(cè)模型?

    在K230的AI開(kāi)發(fā)教程文檔中,可以看到有源碼的AI Demo,其中包括yolov8n模型,在倉(cāng)庫(kù)里可以看到源碼 我想請(qǐng)問(wèn)各位大佬,如何使用這個(gè)程序?如何更改程序,替換為我自己的
    發(fā)表于 08-07 06:48

    無(wú)法將Tensorflow Lite模型轉(zhuǎn)換為OpenVINO?格式怎么處理?

    將 Tensorflow Lite 模型轉(zhuǎn)換為 OpenVINO? 格式。 遇到的錯(cuò)誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    發(fā)表于 06-25 08:27

    將Whisper大型v3 fp32模型轉(zhuǎn)換為較低精度后,推理時(shí)間增加,怎么解決?

    將 openai/whisper-large-v3 FP32 模型轉(zhuǎn)換為 FP16、INT8 和 INT4。 推理所花費(fèi)的時(shí)間比在 FP32 上花費(fèi)的時(shí)間要多
    發(fā)表于 06-24 06:23

    2.0.0版本的ST Edge AI Core在linux平臺(tái)上可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯(cuò),缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺(tái)上應(yīng)該是可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯(cuò),缺少文件。
    發(fā)表于 06-17 06:29

    AI技術(shù)助力全球野生動(dòng)植物保護(hù)

    下面讓我們進(jìn)一步了解正在使用 NVIDIA AI 和加速計(jì)算保護(hù)野生動(dòng)物和自然棲息地的領(lǐng)先非營(yíng)利組織與初創(chuàng)企業(yè)。
    的頭像 發(fā)表于 04-29 11:28 ?998次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無(wú)界”為主題召開(kāi)天璣開(kāi)發(fā)者大會(huì)2025(MDDC 2025),不僅聚合了全球生態(tài)資源,還
    發(fā)表于 04-13 19:52

    把樹(shù)莓派打造成識(shí)別文本的“神器”!

    在許多項(xiàng)目中,RaspberryPi被用作監(jiān)控?cái)z像頭或執(zhí)行機(jī)器學(xué)習(xí)任務(wù)。在這些場(chǎng)景中,圖像中經(jīng)常包含應(yīng)用程序感興趣的文本信息。我們希望提取這些信息并將其轉(zhuǎn)換,以便通過(guò)程序分析文本
    的頭像 發(fā)表于 03-25 09:30 ?989次閱讀
    把樹(shù)莓派打造成識(shí)別<b class='flag-5'>文本</b>的“神器”!

    使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無(wú)奇的文本提示詞轉(zhuǎn)換為令人驚艷的視覺(jué)效果。
    的頭像 發(fā)表于 03-12 13:49 ?1899次閱讀
    使用OpenVINO GenAI和LoRA適配器進(jìn)行<b class='flag-5'>圖像</b>生成