OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。
OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。
Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール
作成 : クラスキャット・セールスインフォメーション
作成日時 : 11/04/2025
バージョン : Agno 2.2.6
* 本記事は docs.agno.com の以下のページを独自に翻訳した上で、補足説明を加えてまとめ直しています。スニペットはできる限り日本語を使用しています :
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
◆ お問合せ : 下記までお願いします。
- クラスキャット セールス・インフォメーション
 - sales-info@classcat.com
 - ClassCatJP
 
 

Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール
OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。
OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。
これは、OpenAI のコンテンツ・ポリシーに違反したコンテンツを (失敗する) APIリクエストを送らずに高速に検出するのに役立ちます。
それはまた、異なるプロバイダーを使用していて OpenAI モデレーションガイドを使用したい場合にも役立ちます。
使用方法
OpenAI モデレーション・ガードレールを使用するには、それをインポートして pre_hooks パラメータでエージェントに渡す必要があります :
from agno.guardrails import OpenAIModerationGuardrail
from agno.agent import Agent
from agno.models.openai import OpenAIChat
openai_moderation_guardrail = OpenAIModerationGuardrail()
agent = Agent(
    name="OpenAI Moderation Guardrail Agent",
    model=OpenAIChat(id="gpt-5-mini"),
    pre_hooks=[openai_moderation_guardrail],
)
モデレーション・モデル
デフォルトでは、OpenAI モデレーション・ガードレールは OpenAI の omni-moderation-latest モデルを使用します。
moderation_model パラメータを提供することで、モデレーション向けにどのモデルを使用するか調整できます :
openai_moderation_guardrail = OpenAIModerationGuardrail(
    moderation_model="omni-moderation-latest",
)
モデレーション・カテゴリー
ガードレールがチェックするカテゴリーを指定できます。
デフォルトでは、ガードレールはすべての既存のモデレーション・カテゴリーを考慮します。OpenAI のドキュメント でカテゴリーのリストを確認できます。
raise_for_categories パラメータを使用して、モデレーション・カテゴリーのデフォルトのリストを上書きできます :
openai_moderation_guardrail = OpenAIModerationGuardrail(
    raise_for_categories=["violence", "hate"],
)
以上
