Skip to content
Cloudflare Docs
非官方翻译 - 此文档为非官方中文翻译版本,仅供参考。如有疑问请以 英文官方文档 为准。

护栏

护栏通过拦截和评估用户提示和模型响应中的有害内容,帮助您安全地部署 AI 应用程序。作为您的应用程序和模型提供商(如 OpenAI、Anthropic、DeepSeek 等)之间的代理,AI 网关的护栏确保在您的整个 AI 生态系统中提供一致且安全的体验。

护栏主动监控用户和 AI 模型之间的交互,为您提供:

  • 一致的内容审核:跨模型和提供商工作的统一审核层。
  • 增强的安全性和用户信任:主动保护用户免受有害或不当交互的影响。
  • 对允许内容的灵活性和控制:指定要监控的类别,并在标记或直接阻止之间进行选择。
  • 审计和合规能力:接收不断演变的监管要求的更新,以及用户提示、模型响应和强制执行的护栏日志。

视频演示

护栏的工作原理

AI 网关通过根据预定义的安全参数评估内容来实时检查所有交互。护栏的工作原理是:

  1. 拦截交互: AI 网关代理请求和响应,位于用户和 AI 模型之间。

  2. 检查内容:

    • 用户提示:AI 网关根据安全参数(例如,暴力、仇恨或性内容)检查提示。根据您的设置,提示可以在到达模型之前被标记或阻止。
    • 模型响应:处理后,检查 AI 模型响应。如果检测到危险内容,可以在传递给用户之前标记或阻止。
  3. 应用操作: 根据您的配置,标记的内容被记录以供审查,而被阻止的内容被阻止继续进行。

相关资源