Skip to content
Cloudflare Docs
非官方翻译 - 此文档为非官方中文翻译版本,仅供参考。如有疑问请以 英文官方文档 为准。

评估

了解应用程序的性能对优化至关重要。开发者通常有不同的优先级,找到最优解决方案涉及平衡成本、延迟和准确性等关键因素。一些人优先考虑低延迟响应,而其他人则专注于准确性或成本效率。

AI 网关的评估提供了在如何优化您的 AI 应用程序方面做出明智决策所需的数据。无论是调整模型、提供商还是提示,此功能都能提供关于性能、速度和成本关键指标的洞察。它使开发者能够更好地理解其应用程序的行为,确保提高准确性、可靠性和客户满意度。

评估使用数据集,数据集是为分析而存储的日志集合。您可以通过在日志选项卡中应用过滤器来创建数据集,这有助于缩小特定日志的范围以进行评估。

我们朝着全面 AI 评估迈出的第一步始于人工反馈(目前处于开放测试版)。我们将继续构建和扩展 AI 网关,添加更多评估器。

了解如何设置评估,包括创建数据集、选择评估器和运行评估过程。