Disco Diffusion 5.4 : 概要 (翻訳/解説)

翻訳 : (株)クラスキャットセールスインフォメーション
作成日時 : 09/07/2022 (v5.4.0)

* 本ページは、Disco Diffusion の以下のドキュメントを翻訳した上で適宜、補足説明したものです：

README.md

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

クラスキャット人工知能研究開発支援サービス

◆ クラスキャットは人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

人工知能研究開発支援
1. 人工知能研修サービス(経営者層向けオンサイト研修)
2. テクニカルコンサルティングサービス
3. 実証実験(プロトタイプ構築)
4. アプリケーションへの実装
人工知能研修サービス
PoC(概念実証)を失敗させないための支援

◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。

お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

株式会社クラスキャット セールス・マーケティング本部セールス・インフォメーション
sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP

Disco Diffusion 5.4 : 概要

AI アートとアニメーションの生成のためのノートブック、モデルとテクニックのフランケンシュタイン的な融合。

[to be updated with further info soon]

Contributing

このプロジェクトはより簡単は開発のために python ファイルをノートブックに変換するための特別な変換ツールを使用します。

これの意味するところは、ノートブックに変更を加えるために直接触れる必要がないことです。

使用されているツールは Colab-Convert と呼ばれます。

pip install colab-convert を使用してインストールする。
.py を .ipynb に変換する : colab-convert /path/to/file.py /path/to/file.ipynb
.ipynb を .py に変換する : colab-convert /path/to/file.ipynb /path/to/file.py

ノートブックの由来

オリジナルのノートブックは Katherine Crowson によるものです (https://github.com/crowsonkb, https://twitter.com/RiversHaveWings)。それは OpenAI の 256×256 unconditional ImageNet または Katherine Crowson の fine-tuned 512×512 拡散モデル (https://github.com/openai/guided-diffusion) のいずれかを、テキストプロンプトを画像とコネクトするために CLIP (https://github.com/openai/CLIP) と一緒に使用します。

より堅牢な増強に加えて、1000 ではなく 15-100 時間ステップの素早い生成のための (願わくば) 最適な params を含めるために Daniel Russell (https://github.com/russelldc, https://twitter.com/danielrussruss) により修正されました。

Dango233 と nshepperd による更なる改良は一般に拡散の品質を改良するのに役立ちます、特にこのノートブックが獲得を目標とするような短い実行に対して。

Vark は複数の Clip モデルを一度にロードするコードを追加しました、それらに対する総てのプロンプトが評価され、これは精度を大きく改良する可能性があります。

最新のズーム, パン, 回転, そしてキーフレーム機能がChigozie Nri’s VQGAN Zoom Notebook から引用されました (https://github.com/chigozienri, https://twitter.com/chigozienri)。

高度な DangoCutn Cutout メソッドもまた Dango223 から (引用されました)。

—

Somnai (https://twitter.com/Somnai_dreams) は 2D 拡散アニメーション・テクニック、QoL 改良と様々な技術とテクニックの実装を追加しました、殆どは下の変更ログでリストされています。

Somnai とのコラボで Adam Letts (https://twitter.com/gandamu_ml) により追加された 3D アニメーション実装。

Chris Allen (https://twitter.com/zippy731) による Turbo 機能

ローカルシステム上の実行、Windows サポート、そして HostsServer (https://twitter.com/HostsServer) による依存性インストール機能の改良

Tom Mason (https://twitter.com/nin_artificial) による VR モード

nshepperd による水平と垂直シンメトリー機能。huemin (https://twitter.com/huemin_art) によるシンメトリーな transformation_steps。Dmitrii Tochilkin (https://twitter.com/cut_pow) による Disco Diffusion へのシンメトリーな統合。

Alex Spirin (https://twitter.com/devdef) による Warp とカスタムモデルのサポート。

KaliYuga (https://twitter.com/KaliYuga_ai) からの Pixel Art Diffusion, Watercolor Diffusion, そして Pulp SciFi Diffusion モデル。最新モデルと専用の設定を持つノートブックについては KaliYuga の Twitter をフォローしてください。

Palmweaver / Chris Scalf (https://twitter.com/ChrisScalf11) による OpenCLIP モデルの統合と KaliYuga モデルの統合の初期化。

Felipe3DArtist (https://twitter.com/Felipe3DArtist) からの統合された portrait_generator_v001

変更ログ

(訳注: 原文参照)

以上

月	火	水	木	金	土	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30