Disco Diffusion 5.4 : 概要 (翻訳/解説)
翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 09/07/2022 (v5.4.0)
* 本ページは、Disco Diffusion の以下のドキュメントを翻訳した上で適宜、補足説明したものです:
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP
Disco Diffusion 5.4 : 概要
AI アートとアニメーションの生成のためのノートブック、モデルとテクニックのフランケンシュタイン的な融合。
[to be updated with further info soon]
Contributing
このプロジェクトはより簡単は開発のために python ファイルをノートブックに変換するための特別な変換ツールを使用します。
これの意味するところは、ノートブックに変更を加えるために直接触れる必要がないことです。
使用されているツールは Colab-Convert と呼ばれます。
- pip install colab-convert を使用してインストールする。
- .py を .ipynb に変換する : colab-convert /path/to/file.py /path/to/file.ipynb
- .ipynb を .py に変換する : colab-convert /path/to/file.ipynb /path/to/file.py
ノートブックの由来
オリジナルのノートブックは Katherine Crowson によるものです (https://github.com/crowsonkb, https://twitter.com/RiversHaveWings)。それは OpenAI の 256×256 unconditional ImageNet または Katherine Crowson の fine-tuned 512×512 拡散モデル (https://github.com/openai/guided-diffusion) のいずれかを、テキストプロンプトを画像とコネクトするために CLIP (https://github.com/openai/CLIP) と一緒に使用します。
より堅牢な増強に加えて、1000 ではなく 15-100 時間ステップの素早い生成のための (願わくば) 最適な params を含めるために Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss) により修正されました。
Dango233 と nshepperd による更なる改良は一般に拡散の品質を改良するのに役立ちます、特にこのノートブックが獲得を目標とするような短い実行に対して。
Vark は複数の Clip モデルを一度にロードするコードを追加しました、それらに対する総てのプロンプトが評価され、これは精度を大きく改良する可能性があります。
最新のズーム, パン, 回転, そしてキーフレーム機能がChigozie Nri’s VQGAN Zoom Notebook から引用されました (https://github.com/chigozienri, https://twitter.com/chigozienri)。
高度な DangoCutn Cutout メソッドもまた Dango223 から (引用されました)。
—
Somnai (https://twitter.com/Somnai_dreams) は 2D 拡散アニメーション・テクニック、QoL 改良と様々な技術とテクニックの実装を追加しました、殆どは下の変更ログでリストされています。
Somnai とのコラボで Adam Letts (https://twitter.com/gandamu_ml) により追加された 3D アニメーション実装。
Chris Allen (https://twitter.com/zippy731) による Turbo 機能
ローカルシステム上の実行、Windows サポート、そして HostsServer (https://twitter.com/HostsServer) による依存性インストール機能の改良
Tom Mason (https://twitter.com/nin_artificial) による VR モード
nshepperd による水平と垂直シンメトリー機能。huemin (https://twitter.com/huemin_art) によるシンメトリーな transformation_steps。Dmitrii Tochilkin (https://twitter.com/cut_pow) による Disco Diffusion へのシンメトリーな統合。
Alex Spirin (https://twitter.com/devdef) による Warp とカスタムモデルのサポート。
KaliYuga (https://twitter.com/KaliYuga_ai) からの Pixel Art Diffusion, Watercolor Diffusion, そして Pulp SciFi Diffusion モデル。最新モデルと専用の設定を持つノートブックについては KaliYuga の Twitter をフォローしてください。
Palmweaver / Chris Scalf (https://twitter.com/ChrisScalf11) による OpenCLIP モデルの統合と KaliYuga モデルの統合の初期化。
Felipe3DArtist (https://twitter.com/Felipe3DArtist) からの統合された portrait_generator_v001
変更ログ
(訳注: 原文 参照)
以上