Open-Assistant v0.0.3 : 概要

Open-Assistant v0.0.3 : 概要 (翻訳/解説)

翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 06/16/2023 (v0.0.3-alpha32)

* 本ページは、LAION-AI / Open-Assistant の以下のドキュメントを翻訳した上で適宜、補足説明したものです:

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス

クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール
  • お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

  • 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
  • sales-info@classcat.com  ;  Web: www.classcat.com  ;   ClassCatJP

 
Open-Assistant   

 

Open-Assistant v0.0.3 : 概要

What is Open Assistant?

Open Assistant は、誰にも素晴らしいチャットベースの大規模言語モデルへのアクセスを与えることを意図したプロジェクトです。

私たちはこれを行なうことが言語の技術革新において革命を起こせることを確信しています。stable-diffusion が世界中の人々が芸術や画像を新しい方法で作成するのに役立ったのと同じように、Open Assistant が言語自体を改良することで世界を改良するのに役立てることを望みます。

 

有用なリンク

 

試す方法

AI とチャット

チャットのフロントエンドは現在 こちら で公開されています。ログインしてチャットを始めましょう!チャットするときアシスタントのレスポンスに対してサムズアップかダウンで反応してみてください。

 

データコレクションへの貢献

データコレクションのフロントエンドは現在 こちら で公開されています。ログインしてタスクを引き受けるのを開始しましょう!私たちは大量の質の高いデータを収集したいです。モデルのプロンプトとレスポンスを提出し、ランク付けし、そしてラベル付けすることにより、Open Assistant の能力を改良するのに直接役立ちます。

 

開発セットアップのローカル実行 (チャットなし)

開発プロセスに貢献しているのでなければ、プロジェクトをローカルで実行する必要はありません。上記の web サイトのリンクが公開されている web サイトへ導きます、そこではデータコレクション app とチャットが利用できます。

開発用にデータコレクション app をローカルで実行したい場合、web サイト、バックエンド、そして関連する依存サービスを含む、Open-Assistant を実行するために必要なスタック全体を Docker によりセットアップすることができます。

デモを開始するには、リポジトリのルートディレクトリでこれを実行します (問題があれば この FAQ を確認してください) :

docker compose --profile ci up --build --attach-dependencies

そして、http://localhost:3000 にナビゲートして (ブートアップに少し時間がかかるかもしれません) web サイトと相互作用してください。

Note :

  • ビルドで問題が起きれば、FAQ に向かい Docker に関するエントリを確認してください。
  • 電子メール経由でログインするときは、マジック電子メールログイン・リンクを取得するために http://localhost:1080 にナビゲートしてください。
  • これを ローカルで vscode を使用して標準化された開発環境 (” devcontainer “) で実行するか、GitHub Codespaces を使用して web ブラウザで実行したい場合には、提供された .devcontainer フォルダを使用できます。

 

チャット用の開発セットアップのローカル実行

開発プロセスに貢献しているのでなければ、プロジェクトをローカルで実行する必要はありません。上記の web サイトのリンクが公開されている web サイトへ導きます、そこではデータコレクション app とチャットが利用できます。

ローカルセットアップは開発のためだけで、貴方が何をしているか分からないのであれば、ローカルチャットボットとして使用されることは想定していないことにも注意してください。

何を知っているか分かっているのであれば、推論システムを起動して実行するための inference フォルダを見るか、上記のコマンドで –profile ci に加えて –profile inference を見てください。

 

構想 (ビジョン)

私たちは ChatGPT を再現するところで停止はしません。未来のアシスタントを構築することを望んでおり、誰でもパーソナライズして拡張する機能を持ち、電子メールやカバーレターを書けるだけではなく、有意義な仕事をして、API を使用し、動的に情報を調査し、等々を可能にするのです。そしてこれをオープンでアクセス可能な方法で行うことを望み、つまり素晴らしいアシスタントを構築するだけでなく、コンシューマ用ハードウェアで十分に実行できるように小さくて効率的であるようにします。

 

計画

InstructGPT 論文 で概説されている 3 ステップに従ってできるだけ早く初期 MVP に到達することを望んでいます :

  1. 高品質な人間が生成した指示実行 (プロンプト + レスポンス) サンプルの収集、目標 >50k。私たちはプロンプトを集めてレビューするクラウドソースなプロセスを設計しています。氾濫する/有害な (toxic)/スパム/ジャンク/個人情報データ上で訓練することは望みません。コミュニティを動機付けるために進捗と最も活発なユーザを示すリーダーボードを用意します。トップコントリビューターには良いグッズ (swag) が与えられます。

  2. 収集されたプロンプトの各々に対して、複数の完了 (completions) をサンプリングします。そして一つのプロンプトの完了がランダムにユーザに示されてベストからワーストまでランク付けされます。再度これはクラウドソースで行われる必要があります、例えば信頼できない潜在的に悪意のあるユーザに対処する必要があります。全体的な同意を測るために少なくとも独立したユーザによる複数の投票を集める必要があります。集められたランキングデータは報酬モデルを訓練するために使用されます。

  3. 次にプロンプトと報酬モデルに基づいて RLHF 訓練フェイズに従います。

そして結果としてのモデルを利用して次の反復のために完了サンプリングステップ 2 を続けることができます。

 

スライドデッキ

 

How You Can Help

(訳注: 原文 参照)

 

以上