Agno 2.x : エージェント – OpenAI モデレーション・ガードレール

OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。
OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。

Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール

作成 : クラスキャット・セールスインフォメーション
作成日時 : 11/04/2025
バージョン : Agno 2.2.6

* 本記事は docs.agno.com の以下のページを独自に翻訳した上で、補足説明を加えてまとめ直しています。スニペットはできる限り日本語を使用しています :

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット AI 研究開発支援サービス ⭐️ 創立30周年(30th Anniversary)🎉💐

クラスキャット は AI に関する各種サービスを提供しています。お気軽にご相談ください :

  • AI 研究開発支援 [詳細]

    1. AI エージェント構築支援
    2. 画像認識 (医療系含む) / 画像生成

  • AI 導入個別相談会(無償)実施中! [詳細]

  • PoC(概念実証)を失敗させないための支援 [詳細]

お問合せ : 下記までお願いします。

  • クラスキャット セールス・インフォメーション
  • sales-info@classcat.com
  • ClassCatJP

 

 

Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール

OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。

OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。

これは、OpenAI のコンテンツ・ポリシーに違反したコンテンツを (失敗する) APIリクエストを送らずに高速に検出するのに役立ちます。

それはまた、異なるプロバイダーを使用していて OpenAI モデレーションガイドを使用したい場合にも役立ちます。

 

使用方法

OpenAI モデレーション・ガードレールを使用するには、それをインポートして pre_hooks パラメータでエージェントに渡す必要があります :

from agno.guardrails import OpenAIModerationGuardrail
from agno.agent import Agent
from agno.models.openai import OpenAIChat

openai_moderation_guardrail = OpenAIModerationGuardrail()

agent = Agent(
    name="OpenAI Moderation Guardrail Agent",
    model=OpenAIChat(id="gpt-5-mini"),
    pre_hooks=[openai_moderation_guardrail],
)

 

モデレーション・モデル

デフォルトでは、OpenAI モデレーション・ガードレールは OpenAI の omni-moderation-latest モデルを使用します。

moderation_model パラメータを提供することで、モデレーション向けにどのモデルを使用するか調整できます :

openai_moderation_guardrail = OpenAIModerationGuardrail(
    moderation_model="omni-moderation-latest",
)

 

モデレーション・カテゴリー

ガードレールがチェックするカテゴリーを指定できます。

デフォルトでは、ガードレールはすべての既存のモデレーション・カテゴリーを考慮します。OpenAI のドキュメント でカテゴリーのリストを確認できます。

raise_for_categories パラメータを使用して、モデレーション・カテゴリーのデフォルトのリストを上書きできます :

openai_moderation_guardrail = OpenAIModerationGuardrail(
    raise_for_categories=["violence", "hate"],
)

 

以上