Stable Diffusion 3.5 Large : Colab / ComfyUI による高品質な画像生成

Stable Diffusion 3.5 Large モデルが10月22日に公開されました。今回は SD3.5 Large モデルを使用して Google Colab 上 ComfyUI で高品質な画像を生成してみます。

Stable Diffusion 3.5 Large : Colab / ComfyUI による高品質な画像生成

作成 : Masashi Okumura (@ClassCat)
作成日時 : 10/23/2024

* 本記事の作成には ja.stability.ai/blog 及び comfyanonymous.github.io/ComfyUI_examples の以下のページを参考にしています :

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス ⭐️ リニューアルしました 😉

クラスキャット は人工知能に関する各種サービスを提供しています。お気軽にご相談ください :

  • 人工知能導入個別相談会(無償)実施中! [詳細]

  • 人工知能研究開発支援 [詳細]
    1. 自社特有情報を含むチャットボット構築支援
    2. 画像認識 (医療系含む) / 画像生成

  • PoC(概念実証)を失敗させないための支援 [詳細]

お問合せ : 本件に関するお問合せは下記までお願いします。

  • クラスキャット セールス・インフォメーション
  • sales-info@classcat.com
  • ClassCatJP

 

 

SD3 Medium : Colab / ComfyUI による高品質な画像生成

Stable Diffusion 3.5 Large モデルが10月22日に公開されました : Stable Diffusion 3.5 のご紹介

今回は SD3.5 Large モデルを使用して Google Colab 上 ComfyUI で高品質な画像を生成してみます。
ComfyUI_examples の ComfyUI_examples : SD3 Examples : SD3.5 に従っています。

 

環境構築

Colab 上で ComfyUI を利用するには以下に従うだけです。SD3.5 Large モデルの配備については後述します :

 

sd3.5_large

必要なファイルは HuggingFace Hub : stabilityai/stable-diffusion-3.5-large でダウンロード可能です。

sd3.5_large.safetensor ファイルは ComfyUI/models/checkpoints/ ディレクトリに配置します。

sd3.5_large.safetensors ファイルにはテキストエンコーダー/CLIP 重みが含まれていません。そのため、別途 “text_encoders” ディレクトリから以下をダウンロードする必要があります :

  • clip_g.safetensors
  • clip_l.safetensors
  • t5xxl_fp16.safetensors または t5xxl_fp8_e4m3fn.safetensors

これらは ComfyUI/models/clip/ ディレクトリに配置する必要がありますので、注意してください。

ワークフローは以下のようなものです :

 

サンプリング

ワークフローをそのまま使用してサンプリングすると次のような画像が得られます :

 

以上