OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。
OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。

Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール

作成 : クラスキャット・セールスインフォメーション
作成日時 : 11/04/2025
バージョン : Agno 2.2.6

* 本記事は docs.agno.com の以下のページを独自に翻訳した上で、補足説明を加えてまとめ直しています。スニペットはできる限り日本語を使用しています :

Learn : Agents – Guardrails : OpenAI Moderation Guardrail

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

クラスキャット AI 研究開発支援サービス ⭐️ 創立30周年（30th Anniversary）🎉💐

◆ クラスキャットは AI に関する各種サービスを提供しています。お気軽にご相談ください :

AI 研究開発支援 [詳細]
1. AI エージェント構築支援
2. 画像認識 (医療系含む) / 画像生成
AI 導入個別相談会(無償)実施中！ [詳細]
PoC(概念実証)を失敗させないための支援 [詳細]

◆ お問合せ : 下記までお願いします。

クラスキャット セールス・インフォメーション
sales-info@classcat.com
ClassCatJP

Agno 2.x : Learn : エージェント – ガードレール : OpenAI モデレーション・ガードレール

OpenAI モデレーション・ガードレールについて、そしてエージェントでの使用方法について学習します。

OpenAI モデレーション・ガードレールは、エージェントへの入力内の OpenAI のコンテンツ・ポリシーに違反したコンテンツを検出する組み込みのガードレールです。

これは、OpenAI のコンテンツ・ポリシーに違反したコンテンツを (失敗する) APIリクエストを送らずに高速に検出するのに役立ちます。

それはまた、異なるプロバイダーを使用していて OpenAI モデレーションガイドを使用したい場合にも役立ちます。

使用方法

OpenAI モデレーション・ガードレールを使用するには、それをインポートして pre_hooks パラメータでエージェントに渡す必要があります :

from agno.guardrails import OpenAIModerationGuardrail
from agno.agent import Agent
from agno.models.openai import OpenAIChat

openai_moderation_guardrail = OpenAIModerationGuardrail()

agent = Agent(
    name="OpenAI Moderation Guardrail Agent",
    model=OpenAIChat(id="gpt-5-mini"),
    pre_hooks=[openai_moderation_guardrail],
)

モデレーション・モデル

デフォルトでは、OpenAI モデレーション・ガードレールは OpenAI の omni-moderation-latest モデルを使用します。

moderation_model パラメータを提供することで、モデレーション向けにどのモデルを使用するか調整できます :

openai_moderation_guardrail = OpenAIModerationGuardrail(
    moderation_model="omni-moderation-latest",
)

モデレーション・カテゴリー

ガードレールがチェックするカテゴリーを指定できます。

デフォルトでは、ガードレールはすべての既存のモデレーション・カテゴリーを考慮します。OpenAI のドキュメントでカテゴリーのリストを確認できます。

raise_for_categories パラメータを使用して、モデレーション・カテゴリーのデフォルトのリストを上書きできます :

openai_moderation_guardrail = OpenAIModerationGuardrail(
    raise_for_categories=["violence", "hate"],
)

以上

月	火	水	木	金	土	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30