91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)操: 如何在AirBox上跑Stable Diffusion 3

算能開發(fā)者社區(qū) ? 2024-07-23 08:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于Radxa ,作者瑞莎

Stable Diffusion 3 Medium 是一種多模態(tài)擴(kuò)散變換器 (MMDiT) 文本到圖像模型,在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。

目前瑞莎團(tuán)隊(duì)使用 Stable Diffusion 3 Medium 開源模型,通過 SOPHON SDK 移植到 SG2300X 處理器系列產(chǎn)品上進(jìn)行本地 TPU 硬件加速推理,實(shí)現(xiàn)在 radxa Airbox 上離線快速生成特色風(fēng)格且?guī)逦谋镜膱D片。

有關(guān) Stable Diffusion 3 Medium 更多技術(shù)細(xì)節(jié),請參閱官方網(wǎng)站和研究論文。

5895cb40-488b-11ef-817b-92fbcf53809c.png

Stable diffusion 3 模型架構(gòu)

環(huán)境準(zhǔn)備

硬件準(zhǔn)備

  • Airbox + 65W的配套電源
  • 網(wǎng)線
  • 在局域網(wǎng)內(nèi)可使用瀏覽器訪問PC
  • Type-C 數(shù)據(jù)線(可選)

將網(wǎng)線根據(jù)您的網(wǎng)絡(luò)環(huán)境選擇插入 WAN 口(推薦接入廣域網(wǎng))或者 LAN 口(接入局域網(wǎng)),根據(jù)您的使用習(xí)慣可選將 Type-C 數(shù)據(jù)線 C 口端插入 Airbox Debug 口, A 口端插入至您的 PC,最后插入電源上電自動開機(jī),更多詳細(xì)關(guān)于硬件準(zhǔn)備工作請參考這里

軟件環(huán)境準(zhǔn)備

針對熟練度不同的 Linux 開發(fā)者,可以選擇兩種方式進(jìn)行環(huán)境準(zhǔn)備。因 Airbox 鏡像已經(jīng)預(yù)裝 CasaOS,所以本文以 CasaOS 命令行模式為例子進(jìn)行部署 Stable Diffusion 3

  • 終端命令行模式
  • CasaOS 命令行模式(新手推薦)

開啟終端

待 Airbox 開機(jī)后,通過您的 PC 瀏覽器訪問 Airbox 的 IP 地址的 81 端口便可登錄 CasaOS,如何獲取 Airbox IP 地址?請參考這里

CasaOS 用戶名和密碼

Username:radxaPassword: radxa

Airbox 系統(tǒng)終端用戶名和密碼

Username: linaroPassword: linaro

點(diǎn)擊 CasaOS 左上角第三個(gè)圖標(biāo)登陸 Airbox 系統(tǒng)終端

58dff940-488b-11ef-817b-92fbcf53809c.pngCasaOS 終端登陸界面

代碼環(huán)境準(zhǔn)備

終端打開后,接下來就直接復(fù)制提供的命令就好

克隆 SD3-Medium-TPU 代碼倉庫

cd /datagit clone https://github.com/zifeng-radxa/SD3-Medium-TPU.git && cd SD3-Medium-TPU

配置運(yùn)行環(huán)境(僅需運(yùn)行一次) 此腳本會自動配置所需運(yùn)行依賴的庫,請耐心等待安裝

source env.sh

下載 radxa 提供好的 Stable Diffusion 3 bmodel 格式模型

如果您可以流暢訪問 github, 可直接運(yùn)行 run.sh 腳本, 這會自動從 github 上下載模型后并啟動程序

bash run.sh

如果你出現(xiàn)下載的壓縮包 md5 比對不過可以通過模型下載腳本重新下載

bash tar_downloader.sh

如果您無法使用 github 下載,radxa 提供百度云鏈接,請將下載好的 models 文件夾拷貝到 Airbox 上 SD-Medium-TPU/python_demo 文件夾中,您可以直接通過 CasaOS 文件管理器中直接上傳至 Airbox

啟動 Stable Diffusion 3 Gradio 服務(wù)確保下載好模型好啟動服務(wù)

bash run.sh

啟動后在您的 PC 瀏覽器訪問 Airbox IP 的 8999 端口即可訪問 Stable Diffusion3 Gradio 服務(wù)

58f33438-488b-11ef-817b-92fbcf53809c.png

Stable Diffusion3 Gradio 服務(wù)界面

使用示例

點(diǎn)擊右上角 Load Model 加載模型

因?yàn)槟P徒咏?10G 如果您的模型存放在 emmc 中,加載速度會比較慢,可以選擇存放在 SSD 中

在 CasaOS 終端中可以看到各個(gè)模型的加載細(xì)節(jié), SSD 中加載模型需要 37 秒

read file models/mmdit.bmodel, size 100000, duration 0.000318, speed 0.292869 GB/s[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/mmdit.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_g.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 14[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_l.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 34[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/t5.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/vae_decoder.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 1Youset`add_prefix_space`.Thetokenizerneedstobeconvertedfromtheslowtokenizers

填入Prompt信息

  • 在 Prompt 填入英文提示詞,比如

A cat with a sign text Welcome to radxa!

  • 可選填入 Negative Prompt 反向提示詞(輸入不想出現(xiàn)的物體)

deformed, lowres, bad anatomy, error, extra digit, fewer digits, cropped, worst quality, low quality, jpeg artifacts, signature, watermark, username, blurry, artist name

選擇合理的步數(shù)和 CFG值,可選 clip skip(跳過模型推理的最后層數(shù),建議為0)和隨機(jī)種子,最后點(diǎn)擊 Submit 按鈕開始生成任務(wù),生成的圖片結(jié)果會直接顯示在右邊,點(diǎn)擊下載圖標(biāo)可自行下載


終端中會打印運(yùn)行進(jìn)度,可見平均每個(gè) step 需要 2.93s

set seed to: 15>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%|████████████████████████████████████████████████████████████████████|28/28[01:22<00:00,??2.93s/it]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2166

    瀏覽量

    112539
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42344
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3757

    瀏覽量

    52131
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RK3588開發(fā)板(armsom-w3)之PWM實(shí)

    RK3588開發(fā)板(armsom-w3) 之 PWM實(shí)
    的頭像 發(fā)表于 06-10 10:38 ?4055次閱讀
    RK3588開發(fā)板(armsom-w<b class='flag-5'>3</b>)之PWM<b class='flag-5'>實(shí)</b><b class='flag-5'>操</b>

    Stable Diffusion的完整指南:核心基礎(chǔ)知識、制作AI數(shù)字人視頻和本地部署要求

    的,其目的是消除對訓(xùn)練圖像的連續(xù)應(yīng)用高斯噪聲,可以將其視為一系列去噪自編碼器。Stable Diffusion3個(gè)部分組成:變分自編碼器(VAE)、U-Net和一個(gè)文本編碼器。添加和去除高斯噪聲的過程被
    的頭像 發(fā)表于 09-18 10:06 ?4945次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識、制作AI數(shù)字人視頻和本地部署要求

    電工操作實(shí)

    ZN-890Q電工操作實(shí)柜(單面雙組型)一、概述ZN-890Q電工操作實(shí)柜(單面雙組型)由鋼板作制作的多功能安裝板(網(wǎng)孔板)實(shí)訓(xùn)臺和電源
    發(fā)表于 07-02 07:14

    Stability AI開源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經(jīng)公開發(fā)布了生成圖像的樣例,Stability AI 的首席開發(fā)者 Katherine Crowson 在推特分享了許多圖像?;?AI 的圖像合成可能會對藝術(shù)家和藝術(shù)領(lǐng)域帶來一定
    的頭像 發(fā)表于 09-21 15:37 ?3757次閱讀

    大腦視覺信號被Stable Diffusion復(fù)現(xiàn)圖像!“人類的謀略和謊言不存在了”

    它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡單線性映射關(guān)系就行。
    的頭像 發(fā)表于 03-08 10:21 ?1640次閱讀

    大腦視覺信號被Stable Diffusion復(fù)現(xiàn)圖像!

    它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡單線性映射關(guān)系就行。
    的頭像 發(fā)表于 03-16 10:26 ?1320次閱讀

    使用OpenVINO?在算力魔方加速stable diffusion模型

    Stable Diffusion 是 stability.ai 開源的 AI 圖像生成模型,實(shí)現(xiàn)輸入文字,生成圖像的功能。Stable Diffusion 將 AI 圖像生成提升到了全
    的頭像 發(fā)表于 05-12 09:10 ?2395次閱讀
    使用OpenVINO?在算力魔方<b class='flag-5'>上</b>加速<b class='flag-5'>stable</b> <b class='flag-5'>diffusion</b>模型

    優(yōu)化 Stable Diffusion 在 GKE 的啟動體驗(yàn)

    Diffusion 等應(yīng)運(yùn)而生。Stable Diffusion 是一個(gè)文字生成圖像的 Diffusion 模型,它能夠根據(jù)給定任何文本輸入生成逼真的圖像。我們在 GitHub Re
    的頭像 發(fā)表于 06-03 08:35 ?1688次閱讀

    iPhone兩秒出圖,目前已知的最快移動端Stable Diffusion模型來了

    近日,Snap 研究院推出最新高性能 Stable Diffusion 模型,通過對網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練流程、損失函數(shù)全方位進(jìn)行優(yōu)化,在 iPhone 14 Pro 實(shí)現(xiàn) 2 秒出圖(512x512
    的頭像 發(fā)表于 06-12 15:25 ?1829次閱讀
    iPhone兩秒出圖,目前已知的最快移動端<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>模型來了

    使用OpenVINO在Stable Diffusion V2.1實(shí)現(xiàn)AI硬件加速的方法

    隨著 AIGC 模型越來越強(qiáng)大,并取得了更驚人的結(jié)果,任意運(yùn)行 AIGC 模型, 比如 Stable Diffusion,對于開發(fā)人員來說仍然面臨一些挑戰(zhàn)。首先,GPU 的安裝設(shè)置需要我們處理復(fù)雜
    的頭像 發(fā)表于 07-21 11:47 ?4878次閱讀
    使用OpenVINO在<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> V2.1<b class='flag-5'>上</b>實(shí)現(xiàn)AI硬件加速的方法

    樹莓派能跑Stable Diffusion了?

    Stable Diffusion是一種文本到圖像生成的大型深度學(xué)習(xí)模型,它可以根據(jù)文本的描述生成詳細(xì)的圖像,也可以用于其他任務(wù),如圖像修復(fù)、圖像擴(kuò)展、圖像翻譯等。
    的頭像 發(fā)表于 07-26 11:46 ?2466次閱讀

    Stable Diffusion的完整指南:核心基礎(chǔ)知識、制作AI數(shù)字人視頻和本地部署要求

    13400;i3 12100;i7 12700 ;i9 12900? 在當(dāng)今的數(shù)字時(shí)代,人工智能正在逐步改變?nèi)藗兊纳詈凸ぷ鞣绞?。其?Stable Diffusion作為一種深度學(xué)習(xí)技術(shù),受到廣泛關(guān)注。它能夠通過對圖像或視頻
    的頭像 發(fā)表于 09-07 14:12 ?4781次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識、制作AI數(shù)字人視頻和本地部署要求

    PCB設(shè)計(jì)如何在實(shí)中規(guī)范的布局

    作為PCB設(shè)計(jì)的重點(diǎn),布局是布線的基礎(chǔ),一個(gè)完美的布局開端,直接使得布線工作量事半功倍。 本次就來說一下如何在真實(shí)的實(shí)當(dāng)中規(guī)范的布局。 對于Altium Designer軟件,相比于其他軟件,它
    的頭像 發(fā)表于 11-06 15:24 ?1369次閱讀
    PCB設(shè)計(jì)如<b class='flag-5'>何在</b><b class='flag-5'>實(shí)</b><b class='flag-5'>操</b>中規(guī)范的布局

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發(fā)表于 12-11 20:13 ?1320次閱讀
    如何開啟<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> WebUI模型推理部署

    本地部署Stable Diffusion實(shí)現(xiàn)AI文字生成高質(zhì)量矢量圖片應(yīng)用于電子商務(wù)

    本地部署Stable Diffusion
    的頭像 發(fā)表于 11-28 07:19 ?750次閱讀