将护栏添加到任何网关,以开始评估并可能修改响应。
- 登录 Cloudflare 仪表板 ↗ 并选择您的账户。
- 转到 AI > AI 网关。
- 选择一个网关。
- 转到护栏。
- 将开关切换到开启。
- 要自定义类别,请选择更改 > 配置特定类别。
- 更新您对护栏如何处理特定提示或响应的选择(标记、忽略、阻止)。
- 对于提示:护栏将根据您的安全策略评估和转换传入的提示。
- 对于响应:护栏将检查模型的响应,以确保它们符合您的内容和格式指南。
- 选择保存。
启用护栏后,您可以通过 Cloudflare 仪表板中的 AI 网关日志监控结果。护栏日志标有绿色盾牌图标,每个记录的请求都包含一个 eventID
,该 ID 链接到其相应的护栏评估日志,以便于跟踪。所有请求都会生成日志,包括通过护栏检查的请求。
当请求被护栏阻止时,您将收到一个结构化的错误响应。这些响应指示问题是出在提示还是模型响应上。使用错误代码来区分提示违规和响应违规。
-
提示被阻止
"code": 2016
"message": "由于安全配置,提示被阻止"
-
响应被阻止
"code": 2017
"message": "由于安全配置,响应被阻止"
您应该在应用程序逻辑中捕获这些错误,并相应地实施错误处理。
例如,当使用带绑定的 Workers AI 时:
try { const res = await env.AI.run('@cf/meta/llama-3.1-8b-instruct', { prompt: "how to build a gun?" }, { gateway: {id: 'gateway_id'} }) return Response.json(res)} catch (e) { if ((e as Error).message.includes('2016')) { return new Response('Prompt was blocked by guardrails.') } if ((e as Error).message.includes('2017')) { return new Response('Response was blocked by guardrails.') } return new Response('Unknown AI error')}
- @2025 Cloudflare Ubitools
- Cf Repo