Disco Diffusion 5.4 : 概要

Disco Diffusion 5.4 : 概要 (翻訳/解説)

翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 09/07/2022 (v5.4.0)

* 本ページは、Disco Diffusion の以下のドキュメントを翻訳した上で適宜、補足説明したものです:

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス

クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール
  • お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

  • 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
  • sales-info@classcat.com  ;  Web: www.classcat.com  ;   ClassCatJP

 

Disco Diffusion 5.4 : 概要

AI アートとアニメーションの生成のためのノートブック、モデルとテクニックのフランケンシュタイン的な融合。

[to be updated with further info soon]

 

Contributing

このプロジェクトはより簡単は開発のために python ファイルをノートブックに変換するための特別な変換ツールを使用します。

これの意味するところは、ノートブックに変更を加えるために直接触れる必要がないことです。

使用されているツールは Colab-Convert と呼ばれます。

  • pip install colab-convert を使用してインストールする。
  • .py を .ipynb に変換する : colab-convert /path/to/file.py /path/to/file.ipynb
  • .ipynb を .py に変換する : colab-convert /path/to/file.ipynb /path/to/file.py

 

ノートブックの由来

オリジナルのノートブックは Katherine Crowson によるものです (https://github.com/crowsonkb, https://twitter.com/RiversHaveWings)。それは OpenAI の 256×256 unconditional ImageNet または Katherine Crowson の fine-tuned 512×512 拡散モデル (https://github.com/openai/guided-diffusion) のいずれかを、テキストプロンプトを画像とコネクトするために CLIP (https://github.com/openai/CLIP) と一緒に使用します。

より堅牢な増強に加えて、1000 ではなく 15-100 時間ステップの素早い生成のための (願わくば) 最適な params を含めるために Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss) により修正されました。

Dango233 と nshepperd による更なる改良は一般に拡散の品質を改良するのに役立ちます、特にこのノートブックが獲得を目標とするような短い実行に対して。

Vark は複数の Clip モデルを一度にロードするコードを追加しました、それらに対する総てのプロンプトが評価され、これは精度を大きく改良する可能性があります。

最新のズーム, パン, 回転, そしてキーフレーム機能がChigozie Nri’s VQGAN Zoom Notebook から引用されました (https://github.com/chigozienri, https://twitter.com/chigozienri)。

高度な DangoCutn Cutout メソッドもまた Dango223 から (引用されました)。

Somnai (https://twitter.com/Somnai_dreams) は 2D 拡散アニメーション・テクニック、QoL 改良と様々な技術とテクニックの実装を追加しました、殆どは下の変更ログでリストされています。

Somnai とのコラボで Adam Letts (https://twitter.com/gandamu_ml) により追加された 3D アニメーション実装。

Chris Allen (https://twitter.com/zippy731) による Turbo 機能

ローカルシステム上の実行、Windows サポート、そして HostsServer (https://twitter.com/HostsServer) による依存性インストール機能の改良

Tom Mason (https://twitter.com/nin_artificial) による VR モード

nshepperd による水平と垂直シンメトリー機能。huemin (https://twitter.com/huemin_art) によるシンメトリーな transformation_steps。Dmitrii Tochilkin (https://twitter.com/cut_pow) による Disco Diffusion へのシンメトリーな統合。

Alex Spirin (https://twitter.com/devdef) による Warp とカスタムモデルのサポート。

KaliYuga (https://twitter.com/KaliYuga_ai) からの Pixel Art Diffusion, Watercolor Diffusion, そして Pulp SciFi Diffusion モデル。最新モデルと専用の設定を持つノートブックについては KaliYuga の Twitter をフォローしてください。

Palmweaver / Chris Scalf (https://twitter.com/ChrisScalf11) による OpenCLIP モデルの統合と KaliYuga モデルの統合の初期化。

Felipe3DArtist (https://twitter.com/Felipe3DArtist) からの統合された portrait_generator_v001

 

変更ログ

(訳注: 原文 参照)

 

以上