Skip to content

非官方翻译 - 此文档为非官方中文翻译版本，仅供参考。如有疑问请以英文官方文档为准。

护栏

护栏通过拦截和评估用户提示和模型响应中的有害内容，帮助您安全地部署 AI 应用程序。作为您的应用程序和模型提供商（如 OpenAI、Anthropic、DeepSeek 等）之间的代理，AI 网关的护栏确保在您的整个 AI 生态系统中提供一致且安全的体验。

护栏主动监控用户和 AI 模型之间的交互，为您提供：

一致的内容审核：跨模型和提供商工作的统一审核层。
增强的安全性和用户信任：主动保护用户免受有害或不当交互的影响。
对允许内容的灵活性和控制：指定要监控的类别，并在标记或直接阻止之间进行选择。
审计和合规能力：接收不断演变的监管要求的更新，以及用户提示、模型响应和强制执行的护栏日志。

视频演示

护栏的工作原理

AI 网关通过根据预定义的安全参数评估内容来实时检查所有交互。护栏的工作原理是：

拦截交互： AI 网关代理请求和响应，位于用户和 AI 模型之间。
检查内容：
- 用户提示：AI 网关根据安全参数（例如，暴力、仇恨或性内容）检查提示。根据您的设置，提示可以在到达模型之前被标记或阻止。
- 模型响应：处理后，检查 AI 模型响应。如果检测到危险内容，可以在传递给用户之前标记或阻止。
应用操作：根据您的配置，标记的内容被记录以供审查，而被阻止的内容被阻止继续进行。

相关资源

Cloudflare 博客：使用 AI 网关中的护栏保持 AI 交互安全且无风险 ↗

社区
YouTube
GitHub

@2025 Cloudflare Ubitools
Cf Repo